Meta Luncurkan Model AI yang Bisa Belajar dari AI Lain Tanpa Bantuan Manusia

Meta Luncurkan Model AI yang Bisa Belajar dari AI Lain Tanpa Bantuan Manusia

Terkini | okezone | Minggu, 20 Oktober 2024 - 19:05
share

PEMILIK Facebook, Meta merilis sejumlah model AI baru dari divisi penelitiannya, termasuk "Evaluator Otodidak" yang mungkin menawarkan jalan menuju pengurangan keterlibatan manusia dalam proses pengembangan AI.

Peluncuran ini mengikuti perkenalan alat ini oleh Meta dalam sebuah makalah pada Agustus, yang merinci bagaimana alat ini bergantung pada teknik "rantai pemikiran" yang sama yang digunakan oleh model o1 OpenAI yang baru-baru ini dirilis agar dapat membuat penilaian yang andal tentang respons model.

Teknik tersebut melibatkan pemecahan masalah kompleks menjadi langkah-langkah logis yang lebih kecil dan tampaknya meningkatkan keakuratan respons terhadap masalah-masalah menantang dalam mata pelajaran seperti sains, pengkodean, dan matematika.

Para peneliti Meta menggunakan seluruh data yang dihasilkan AI untuk melatih model evaluator, dan juga menghilangkan masukan manusia pada tahap tersebut.

Kemampuan menggunakan AI untuk mengevaluasi AI secara andal memberikan gambaran sekilas tentang kemungkinan jalur menuju pembangunan agen AI otonom yang dapat belajar dari kesalahan mereka sendiri, kata dua peneliti Meta di balik proyek tersebut kepada Reuters.

Banyak orang di bidang AI membayangkan agen seperti itu sebagai asisten digital yang cukup cerdas untuk melakukan beragam tugas tanpa campur tangan manusia.

Model yang dapat dikembangkan sendiri dapat menghilangkan kebutuhan akan proses yang seringkali mahal dan tidak efisien yang digunakan saat ini yang disebut Pembelajaran Penguatan dari Umpan Balik Manusia, yang memerlukan masukan dari anotator manusia yang harus memiliki keahlian khusus untuk memberi label pada data secara akurat dan memverifikasi jawaban yang benar atas pertanyaan matematika dan penulisan yang rumit.

 

“Kami berharap, ketika AI semakin menjadi manusia super, ia akan semakin baik dalam memeriksa pekerjaannya, sehingga ia benar-benar lebih baik daripada manusia pada umumnya,” kata Jason Weston, salah satu peneliti, sebagaimana dilansir Gadgets360.

“Gagasan untuk menjadi otodidak dan mampu mengevaluasi diri pada dasarnya penting untuk mencapai gagasan mencapai tingkat manusia super dalam AI,” katanya.

Perusahaan lain termasuk Google dan Anthropic juga telah menerbitkan penelitian tentang konsep RLAIF, atau Reinforcement Learning from AI Feedback. Berbeda dengan Meta, perusahaan-perusahaan tersebut cenderung tidak merilis model mereka untuk kepentingan umum.

Alat AI lainnya yang dirilis oleh Meta pada hari Jumat termasuk pembaruan pada model identifikasi gambar Segmen Apapun milik perusahaan, alat yang mempercepat waktu pembuatan respons LLM dan kumpulan data yang dapat digunakan untuk membantu penemuan bahan anorganik baru.

Topik Menarik