Foto: Ars Technica
Teknologi.id - Model bahasa (language models) seperti ChatGPT telah merevolusi bagian pemrosesan bahasa alami, namun memang tetap kudu dikembangkan lagi pada bagian dasar seperti aritmatika dan pemeriksaan fakta.
Peneliti dari Meta belum lama ini mengungkapkan Toolformer, model bahasa AI nan dapat mengajarkan dirinya sendiri untuk menggunakan perangkat eksternal seperti mesin telusur, kalkulator, dan almanak tanpa mengorbankan keahlian pemodelan bahasa intinya. Kunci dari Toolformer adalah kemampuannya menggunakan API (application programming interfaces). API merupakan seperangkat protokol nan memungkinkan beragam aplikasi untuk berkomunikasi satu sama lain secara otomatis.
Selama pelatihan, peneliti memberi Toolformer sekumpulan mini contoh tulisan manusia nan mendemonstrasikan gimana setiap API digunakan dan kemudian menizinkannya untuk membikin catatan kumpulan informasi pemodelan bahasa besar dengan potensi panggilan API. Semua perihal tesebut dilakukan dengan langkah "self-supervised", nan berfaedah Toolformer dapat belajar tanpa memerlukan pengarahan manusia nan eksplisit.
Baca juga: PNS Singapura Bakal Dibantu Chat GPT untuk Bikin Pidato dan Laporan
Model bahasa ini belajar untuk memprediksi setiap panggilan API berbasis teks seolah-olah itu adalah corak teks lainnya. Saat beraksi menghasilkan teks sebagai hasil input manusia, model bahasa ini dapat menyisipkan panggilan jika diperlukan. Selain itu, Toolformer juga dapat memutuskan sendiri perangkat mana nan bakal digunakan untuk kontek nan tepat dan langkah menggunakannya.
Ilustrasi nan menunjukkan contoh Toolformer membikin panggilan API ke aplikasi kalender. Foto: Ars Technica
Kemampuan pemanggilan API ini memungkinakan Toolformer menggunakan perangkat perangkat lunak (software) eksternal seperti mesin telusur, kalkulator, translator bahasa, dan referensi faktual. Sebagai contoh penggunaan, berbeda dengan Large Language Models (LLM) nan terkenal tidak pandai matematika, Toolformer dapat mengatasi batas tersebut dengan menggunakan kalkulator. Atau jika seseorang menginginkan asisten berbasis LLM untuk menambahkan tanggal ke almanak mereka, Toolformer dapat menangani tugas tersebut dengan menggunakan tautan API ke aplikasi kalender.
Toolformer didasarkan pada model GPT-J terlatih dengan 6,7 miliar parameter. Eksperimen nan dilakukan oleh para peneliti pada beragam tugas penggunaan perangkat tampaknya menunjukkan bahwa Toolformer mencapai kinerja jauh lebih kuat daripada model GPT-3 nan berisi 175 miliar parameter.
Baca juga: Sudah Tau Belum? Begini Cara Irit Bensin Pakai Google Maps
Ini bukan pertama kalinya para peneliti berupaya mengatasi keterbatasan dalam model bahasa, Faktanya, model Bing Chat baru-baru ini menjadi buletin nan ramai dibicarakan lantaran dapat melakukan pencarian web sendiri saat dibutuhkan, dan nan lain juga mencoba berintergrasi dengan browser, kalkulator, dan mesin pencari.
Menurut para peneliti Meta, sebagian besar pendekatan untuk mengintegrasikan perangkat ke dalam model bahasa mengandalkan sejumlah besar catatan manusia alias terbatas pada pengaturan unik tugas tertentu. Sebaliknya, Toolformer dapat belajar menggunakan beragam perangkat dengan langkah umum nan tidak memerlukan training unik untuk tugas tertentu.
Dengan tekni nan ditemukan di Toolformer, peneliti memandang potensi masa depan di mana LLM ditambah dengan keahlian untuk menggunakan aplikasi eksternal bakal menjadi asisten nan jauh lebih elastis dan andal. Namun memang, keahlian untuk melakukan panggilan API juga dapat meningkatkan keahlian LLM untuk menyebabkan kerusakan pada informasi pengguna alias membikin masalah saat memberikan jawaban.
(cta)