OpenAI telah melancarkan ejen baru untuk produk kecerdasan buatan utamanya, ChatGPT yang dipanggil "kajian mendalam," yang boleh merungkai internet untuk mendapatkan maklumat dan mencipta laporan "pada tahap seorang analis penyelidikan."
OpenAI menyatakan dalam catatan blog pada 2 Februari bahawa kajian mendalam ini "dibina untuk orang yang melakukan kerja pengetahuan intensif dalam bidang seperti kewangan, sains, dasar, dan kejuruteraan dan memerlukan penyelidikan yang teliti, tepat, dan boleh dipercayai."
Syarikat itu menambah bahawa ia juga berguna untuk penyelidikan sebelum membeli barangan besar seperti kereta atau peralatan, dan hasilnya - yang boleh mengambil masa antara 5 hingga 30 minit - "dokumentasi sepenuhnya, dengan rujukan yang jelas dan ringkasan pemikirannya."
Contoh mod "kajian mendalam" ChatGPT yang menunjukkan kemajuannya dan rujukan. Sumber: OpenAI
Ejen terkini ini mengikuti pelancaran Operator oleh OpenAI pada 23 Januari, seorang ejen ChatGPT yang boleh menggunakan internet untuk menyelesaikan tugas seperti memesan barang kelengkapan dan tempahan lawatan percutian.
Ia juga berlaku kira-kira seminggu selepas ruang AI dan saham teknologi AS digoncang oleh model AI baru dari DeepSeek yang berpangkalan di China yang dilaporkan berfungsi dengan baik seperti ChatGPT tetapi dibangunkan dengan kos yang jauh lebih rendah.
Microsoft dan OpenAI dilaporkan sedang menyiasat sama ada data dari API ChatGPT telah diperoleh secara tidak sah oleh kumpulan yang berkaitan dengan DeepSeek.
OpenAI menyatakan ejen kajian mendalamnya mencapai prestasi tertinggi dalam penilaian AI yang dipanggil Humanity's Last Exam, yang mempunyai 3,000 soalan peringkat pakar mengenai lebih daripada 100 topik, dengan ketepatan 26.6% berbanding dengan skor 9.4% untuk DeepSeek-R-1 dan 3.3% untuk model GPT-4o miliknya sendiri.
Berkaitan: Kebimbangan privasi DeepSeek menimbulkan kebimbangan antarabangsa
Ejen ini dikuasakan oleh model OpenAI o3 tetapi "dioptimumkan untuk pelayar web dan analisis data." OpenAI o3 adalah model "penalaran" terkini syarikat tersebut, yang cuba memeriksa fakta-fakta sendiri untuk mengelakkan kesilapan fakta atau menghasilkan maklumat palsu.
OpenAI memberi amaran bahawa kajian mendalam "kadang-kadang boleh menghasilkan fakta-fakta yang tidak wujud dalam respons atau membuat inferens yang salah" dan boleh "menghadapi kesulitan dalam membezakan maklumat yang berwibawa daripada desas-desus."
Bulan lalu, Google mengumumkan bahawa ia akan melancarkan ciri serupa, juga dipanggil "Kajian Mendalam" untuk model AI Gemini pada awal 2025, sementara OpenAI menyatakan ejennya kini tersedia dalam pelan Pro bulanan seharga $200, dengan had 100 pertanyaan sebulan.