Makin Cerdas dan Mirip Manusia. Chatbot AI Kini Telah Berhasil Lulus Tes Turing

Makin Cerdas dan Mirip Manusia. Chatbot AI Kini Telah Berhasil Lulus Tes Turing

Teknologi | okezone | Senin, 7 April 2025 - 08:17
share

JAKARTA - Chatbot kecerdasan buatan (AI) seperti ChatGPT yang telah dirancang untuk meniru ucapan manusia membuatnya semakin sulit untuk dibedakan dengan pengguna asli. Dan kini, ilmuwan telah mengungkapkan bahwa dua chatbot populer telah berhasil lulus dari tes Turing.

Dirancang oleh pemecah kode Perang Dunia II asal Inggris Alan Turing pada 1950, tes Turing atau 'permainan imitasi' adalah ukuran standar untuk menguji kecerdasan dalam sebuah mesin. AI lulus uji ketika manusia tidak dapat membedakan dengan benar antara respons dari manusia lain dan respons dari AI.

Lulus dengan Skor Tinggi

Para ilmuwan di University of California San Diego (UCSD) kini telah mengungkapkan bahwa ChatGPT milik OpenAI, maupun LlaMa dari Meta, telah lulus tes Turing.

“Hasilnya merupakan bukti empiris pertama bahwa sistem buatan apa pun lulus uji Turing tiga pihak standar,” kata para ilmuwan UCSD, sebagaimana dilansir Daily Mail.

“Jika interogator tidak dapat membedakan dengan andal antara manusia dan mesin, maka mesin tersebut dikatakan telah lulus."

Peneliti menggunakan empat model AI – GPT-4.5, yang dirilis pada Februari, iterasi sebelumnya yang disebut GPT-4o, model andalan Meta LLaMa, dan program chat era 1960-an yang disebut ELIZA.

Tiga yang pertama adalah 'model bahasa besar' (LLM) – algoritma pembelajaran mendalam yang dapat mengenali dan menghasilkan teks berdasarkan pengetahuan yang diperoleh dari kumpulan data besar.

Para ahli merekrut 126 mahasiswa sarjana dari University of California San Diego dan 158 orang dari kumpulan data daring Prolific.

Peserta melakukan percakapan daring selama lima menit secara bersamaan dengan peserta manusia lain dan salah satu AI – tetapi mereka tidak tahu yang mana yang mana dan mereka harus menilai mana yang menurut mereka manusia.

Ketika diminta untuk mengadopsi persona seperti manusia, GPT-4.5 dinilai sebagai manusia sebanyak 73 persen dari waktu – lebih sering daripada peserta manusia yang sebenarnya dipilih. Persentase yang tinggi tersebut menunjukkan bahwa manusia lebih unggul daripada peluang dalam menentukan apakah GPT-4.5 adalah manusia atau mesin.

 

Sementara itu, LLaMa-3.1 milik Meta, ketika juga diminta untuk mengadopsi kepribadian seperti manusia, dinilai sebagai manusia sebanyak 56 persen dari waktu.

Hal ini 'tidak lebih sering atau lebih jarang dibandingkan manusia yang dibandingkan dengan mereka', tim tersebut menegaskan – tetapi masih dianggap lulus.

Terakhir, model dasar (ELIZA dan GPT-4o) mencapai tingkat keberhasilan yang jauh di bawah peluang – masing-masing 23 persen dan 21 persen.

Masih Butuh Perintah Terperinci

Para peneliti juga mencoba memberikan perintah yang lebih mendasar kepada model, tanpa instruksi terperinci yang memberi tahu mereka untuk mengadopsi persona seperti manusia.

Seperti yang diantisipasi, model AI berkinerja jauh lebih buruk dalam kondisi ini – menyoroti pentingnya memberi perintah kepada chatbot terlebih dahulu.

Tim mengatakan studi baru mereka, yang diterbitkan sebagai pracetak, adalah 'bukti kuat' bahwa bot OpenAI dan Meta telah lulus uji Turing.

“Ini harus dievaluasi sebagai salah satu dari banyak bukti lain untuk jenis kecerdasan yang ditampilkan LLM,” kata penulis utama penelitian Cameron Jones dalam utas X.

Jones mengakui bahwa AI berkinerja paling baik ketika diberi pengarahan sebelumnya untuk meniru manusia – tetapi ini tidak berarti GPT-4.5 dan LLaMa belum lulus uji Turing.

“Apakah LLM benar-benar lulus jika mereka membutuhkan perintah? "Itu pertanyaan yang bagus," katanya di utas tersebut.

“Tanpa petunjuk apa pun, LLM akan gagal karena alasan-alasan sepele (seperti mengakui bahwa mereka adalah AI) dan mereka dapat dengan mudah disetel untuk berperilaku seperti yang mereka lakukan saat diminta, jadi saya pikir adil untuk mengatakan bahwa LLM lulus.'

Karena GPT-4.5 kini telah memperoleh skor 73 persen, hal baru ini menunjukkan bahwa model ChatGPT semakin baik dalam meniru manusia.

 

Hal ini terjadi 75 tahun setelah Alan Turing memperkenalkan ujian akhir kecerdasan komputer dalam makalah pentingnya Computing Machinery and Intelligence.

Turing membayangkan bahwa seorang peserta manusia akan duduk di depan layar dan berbicara dengan manusia atau komputer melalui antarmuka teks saja. Jika komputer tidak dapat dibedakan dari manusia dalam berbagai topik yang memungkinkan, Turing beralasan bahwa kita harus mengakui bahwa komputer sama cerdasnya dengan manusia.

Versi uji coba yang meminta pengguna membedakan antara manusia dan AI, dapat diakses di turingtest.live.

Sementara itu, makalah pracetak penelitian ini diterbitkan di server daring arXiv dan saat ini sedang dalam peninjauan sejawat.

Topik Menarik