Versi terdahulu Grok-3, sebuah model bahasa besar AI (LLM), telah mengalahkan sistem AI pesaing dari Google, OpenAI, dan DeepSeek dalam evaluasi buta yang didorong oleh komunitas.

Pada 18 Februari, Elon Musk mengumumkan rilis model AI terbaru xAI, Grok-3, dalam sebuah siaran langsung di X. Dalam diskusi tersebut, tim xAI mengungkapkan bahwa mereka telah merilis versi awal Grok-3 di LMarena dengan nama samaran "cokelat" untuk pengujian komunitas.

Sumber: LMArena

Dukungan bulat untuk kemampuan Grok-3

Uji buta LLM oleh Chatbot Arena memungkinkan pengguna untuk bertanya kepada dua chatbot AI anonim dan memberi peringkat berdasarkan respons mereka. Uji coba tersebut telah mencatat lebih dari satu juta suara dari komunitas.

Menurut perbandingan internal xAI terhadap model AI, Grok-3 mencetak setidaknya 10 poin lebih tinggi daripada pesaing terbesarnya - ChatGPT o3mini, o1, Deepseek-R1, dan Gemini-2 Flash Thinking - dalam matematika, ilmu pengetahuan, dan pemrograman.

Bot, Amerika Serikat, Luar Angkasa, Elon Musk

Perbandingan antara Grok-3 dan model AI lainnya. Sumber: xAI

Grok-3 mendominasi chatbot AI di semua kategori

LMArena juga mencatat bahwa model Grok-3 versi awal saat ini menempati peringkat pertama di semua kategori, termasuk secara keseluruhan dengan kontrol gaya, petunjuk sulit, dan petunjuk sulit dengan kontrol gaya, pemrograman, matematika, menulis kreatif, mengikuti instruksi, pertanyaan yang lebih panjang, dan multi-turn.

Kinerja Grok-3 di semua kategori teratas. Sumber: LMArena

Musk dan tim xAI menegaskan temuan LMArena bahwa model Grok-3 versi awal - dengan kode nama cokelat - mencapai rekor skor 1400. "Dan skornya terus naik. Jadi kita harus terus memperbarui. Skornya 1400 dan terus naik," kata Musk.

Elon Musk mempersiapkan Tesla Bot yang didukung oleh Grok untuk eksplorasi luar angkasa

Lebih lanjut dalam pengumuman tersebut, Musk mengungkapkan rencana untuk mengirimkan Tesla Bot, yang didukung oleh model kecerdasan buatan Grok dari xAI, dalam misi Mars berikutnya SpaceX pada akhir 2026.

Dalam sebuah diskusi, dia mengungkapkan bahwa sebagian besar proyek SpaceX untuk eksplorasi Mars direncanakan sekitar kuartal keempat 2026.

Dia menjelaskan bahwa jendela transit Bumi-Mars terjadi setiap 26 bulan, sehingga November 2026 menjadi kesempatan ideal berikutnya untuk peluncuran roket ke Planet Merah.

Sumber: xAI

Musk juga mengatakan bahwa dia mungkin akan mengirimkan Tesla Bot dan Grok dalam misi Mars:

"Jika semuanya berjalan lancar, SpaceX akan mengirimkan roket Starship ke Mars dengan robot Optimus dan Grok."

Insinyur Grok-3 keluar setelah ultimatum

Pada 12 Februari, seorang insinyur xAI mengundurkan diri setelah sebuah postingan di X di mana dia menempatkan peringkat Grok-3 lebih rendah daripada ChatGPT, membagikan pendapat pribadinya sebelum rilis model tersebut.

Sumber: Benjamin DeKraker

"Saya harus menghapus postingan yang dikutip di bawah ini atau menghadapi pemecatan," tulis DeKraker, menambahkan:

"Setelah meninjau semuanya dan memikirkan dengan matang, saya memutuskan bahwa saya tidak akan menghapus postingan tersebut - yang jelas merupakan pendapat pribadi yang tidak berbahaya."

Majalah: Korea akan mencabut larangan kripto perusahaan, waspadai HD penambangan kripto: Asia Express