Tristan Greene
Ditulis oleh Tristan Greene,Bekas Penulis Staf
Bryan O'Shea
Disemak oleh Bryan O'Shea,Editor Staf

Eksperimen AI yang melibatkan 'kesahan sementara' mungkin mempunyai implikasi yang ketara untuk fintech

Mengajar AI untuk memahami kepentingan ketepatan waktu boleh membawa kepada model ramalan yang lebih baik.

Eksperimen AI yang melibatkan 'kesahan sementara' mungkin mempunyai implikasi yang ketara untuk fintech
Berita

Sebuah pasangan penyelidik dari Universiti Innsbruck di Austria telah membangunkan kaedah untuk menentukan sejauh mana sistem kecerdasan buatan (AI) memahami 'kebolehpercayaan temporal,' satu penanda aras yang boleh mempunyai implikasi penting bagi penggunaan produk AI generatif seperti ChatGPT dalam sektor fintech.

Kebolehpercayaan temporal merujuk kepada sejauh mana kenyataan yang diberikan berkaitan dengan kenyataan lain dari segi masa. Pada dasarnya, ia merujuk kepada nilai berdasarkan masa bagi kenyataan yang dipasangkan. Sebuah AI yang dinilai berdasarkan keupayaannya untuk meramalkan kebolehpercayaan temporal akan diberikan set kenyataan dan diminta untuk memilih yang paling berkaitan melalui masa.

Dalam kertas penyelidikan pra-cetak yang baru-baru ini diterbitkan mereka yang bertajuk "Ramalan Perubahan Kesahan Temporal," Georg Wenzel dan Adam Jatowt menggunakan contoh kenyataan di mana seseorang dinyatakan sedang membaca buku dalam bas.

Dalam contoh di atas, kenyataan konteks yang paling sah adalah "Saya hanya tinggal beberapa muka surat lagi, kemudian saya selesai." Memandangkan kenyataan sasaran menunjukkan penumpang bas sedang membaca buku, dua kenyataan lain adalah tidak relevan berbanding dengannya. Sumber imej: Wenzel, Jatowt 2024.

Para penyelidik mencipta satu set data latihan yang diberi label yang kemudiannya digunakan untuk membina tugas penilaian bagi model bahasa besar (LLM). Mereka memilih ChatGPT sebagai model asas untuk pengujian kerana popularitinya di kalangan pengguna akhir dan mendapati ia tidak berkinerja dengan baik berbanding dengan model yang kurang umum.

CHATGPT berada di antara model yang berkinerja rendah, yang konsisten dengan kajian lain tentang pemahaman TCS. Kelemahan-kelemahannya mungkin disebabkan oleh pendekatan pembelajaran few-shot dan kurangnya pengetahuan tentang ciri-ciri dataset yang spesifik."

Ini menunjukkan bahawa situasi di mana kebolehpercayaan temporal memainkan peranan dalam menentukan kegunaan atau ketepatan - seperti dalam menghasilkan artikel berita atau menilai pasaran kewangan - kemungkinan akan ditangani dengan lebih baik oleh model AI yang ditargetkan daripada perkhidmatan yang lebih umum seperti ChatGPT.

Para penyelidik juga menunjukkan bahawa bereksperimen dengan ramalan perubahan nilai temporal semasa kitaran latihan LLM berpotensi menghasilkan skor yang lebih tinggi dalam tugas penilaian perubahan temporal.

Berkaitan: Melihat ke hadapan: Insiders industri meramalkan cabaran undang-undang AI 2024

Walaupun kertas penyelidikan ini tidak membincangkan implikasi di luar eksperimen itu sendiri, salah satu kelemahan sistem AI generatif kini adalah ketidak mampuannya untuk membezakan antara peristiwa masa lalu dan masa kini dalam satu kumpulan literatur.

Mengajar sistem-sistem ini bagaimana untuk menentukan kenyataan yang paling relevan dalam korpus, dengan faktor keaktifan masa menjadi penentu, boleh mengubah cara model AI membuat ramalan masa nyata yang kuat dalam sektor-sektor berskala besar seperti mata wang kripto dan pasaran saham.

Cointelegraph komited terhadap kewartawanan yang bebas dan telus. Artikel berita ini dihasilkan selaras dengan Dasar Editorial Cointelegraph dan bertujuan untuk menyediakan maklumat yang tepat serta tepat pada masanya. Pembaca digalakkan untuk mengesahkan maklumat secara bebas. Baca Dasar Editorial kami https://my.cointelegraph.com/editorial-policy