Pencipta ChatGPT, OpenAI telah mengumumkan model AI terbaru mereka, GPT-4o, seorang chatbot AI yang lebih ramah dan menyerupai manusia, yang dapat menginterpretasikan audio dan video pengguna dan memberikan respons secara real-time.
Satu siri tunjuk cara yang dikeluarkan oleh firma itu menunjukkan GPT-4 Omni membantu bakal pengguna dengan perkara seperti penyediaan temu duga — dengan memastikan mereka kelihatan rapi untuk temu duga — serta menghubungi ejen perkhidmatan pelanggan untuk mendapatkan iPhone pengganti.
Demo lain menunjukkan ia boleh berkongsi jenaka ayah, menterjemah perbualan dwibahasa dalam masa nyata, menjadi hakim pada perlawanan gunting kertas batu antara dua pengguna dan membalas dengan sindiran apabila ditanya. Satu demo juga menunjukkan cara ChatGPT bertindak balas apabila diperkenalkan kepada anak anjing pengguna buat kali pertama.
"Hai, Bowser! Apakah kamu bukanlah makhluk kecil yang paling menggemaskan?" seru chatbot tersebut.
Salam kenal GPT-4o, model andalan baru kami yang dapat berpikir melalui audio, visi, dan teks secara real-time: https://t.co/MYHZB79UqN
â OpenAI (@OpenAI) 13 Mei 2024
Input teks dan gambar diluncurkan hari ini dalam API dan ChatGPT dengan suara dan video dalam beberapa minggu mendatang. pic.twitter.com/uuthKZyzYx
"Rasanya seperti AI dalam film; dan masih sedikit mengejutkan bagi saya bahwa ini nyata," kata CEO perusahaan, Sam Altman, dalam sebuah posting blog pada 13 Mei.
"Mencapai waktu respons dan ekspresivitas tingkat manusia ternyata merupakan perubahan besar."
Versi input hanya teks dan gambar diluncurkan pada 13 Mei, dengan versi lengkap akan diluncurkan dalam beberapa minggu mendatang, kata OpenAI dalam sebuah posting terbaru di X.
GPT-4o akan tersedia bagi pengguna ChatGPT berbayar dan gratis, dan dapat diakses melalui API ChatGPT.
OpenAI mengatakan bahwa huruf "o" dalam GPT-4o melambangkan "omni" - yang bertujuan untuk menjadi langkah menuju interaksi manusia-komputer yang lebih alami.
Perkenalkan GPT-4o, model baru kami yang dapat berpikir melalui teks, audio, dan video secara real-time.
â Greg Brockman (@gdb) 13 Mei 2024
Model ini sangat serbaguna, menyenangkan untuk dimainkan, dan merupakan langkah menuju bentuk interaksi manusia-komputer yang lebih alami (bahkan interaksi manusia-komputer-komputer): pic.twitter.com/VLG7TJ1JQx
Kemampuan GPT-4o untuk memproses teks, audio, dan gambar secara bersamaan merupakan kemajuan yang signifikan dibandingkan dengan alat AI sebelumnya dari OpenAI, seperti ChatGPT-4, yang sering "kehilangan banyak informasi" ketika dipaksa untuk melakukan banyak tugas sekaligus.
Terkait: Apple menyelesaikan kesepakatan dengan OpenAI untuk integrasi ChatGPT di iPhone: Laporan
OpenAI mengatakan bahwa "GPT-4o jauh lebih baik dalam pemahaman visi dan audio dibandingkan dengan model-model yang ada," bahkan termasuk dalam menangkap emosi dan pola pernapasan pengguna.
Ini juga "jauh lebih cepat" dan "50% lebih murah" daripada GPT-4 Turbo dalam API OpenAI.
Alat AI baru ini dapat merespons input audio dalam waktu secepat 2,3 detik, dengan waktu rata-rata 3,2 detik, menurut klaim OpenAI, yang dikatakan serupa dengan waktu respons manusia dalam percakapan biasa.
Majalah: ââCara menghentikan kehancuran kecerdasan buatan: David Brin, penulis Uplift