Sebuah studi terbaru menemukan lebih dari 10% tautan sumber dalam fitur Google AI Overview (AIO) kemungkinan besar berasal dari konten yang dibuat oleh kecerdasan buatan (AI).
Temuan ini menambah kekhawatiran tentang risiko feedback loop atau “AI belajar dari AI,” yang berpotensi menurunkan kualitas informasi di internet.
AI Overview sendiri merupakan fitur baru di mesin pencari Google yang menggunakan kecerdasan buatan alias AI generatif untuk langsung memberikan jawaban ringkas di bagian atas hasil pencarian. Jika dulu Google hanya menampilkan daftar link, artikel, atau situs, dengan AI Overview, pengguna langsung mendapatkan ringkasan jawaban yang diambil dari berbagai sumber.
Melansir dari Techspot (8/9), penelitian dilakukan oleh Originality.ai, perusahaan yang mengembangkan perangkat lunak pendeteksi konten AI. Mereka menganalisis 29.000 pencarian Google dengan topik Google bertema Your Money or Your Life (YMYL), yakni jenis topik penting seperti kesehatan, keuangan, dan keselamatan.
Dari situ, tim melihat tautan apa saja yang ditampilkan Google di AI Overview dan membandingkannya dengan 100 hasil pencarian biasa.
Dari analisis tautan yang muncul dalam AIO dan 100 hasil organik teratas, Originality.ai menggunakan model AI Detection Lite 1.0.1. Hasilnya:
- 10,4% sumber di AI Overview diduga konten AI.
- 74,4% konten manusia.
- 15,2% tidak bisa diklasifikasi (tautan rusak, teks sedikit, atau berupa video/PDF).
Selain itu, ditemukan lebih dari setengah sumber di AI Overview (52%) tidak muncul di 100 besar hasil pencarian biasa. Dari kelompok ini, 12,8% ternyata juga konten AI, jumlah yang lebih tinggi dibanding rata-rata.
Fenomena ini disebut berisiko menimbulkan model collapse. Istilah ini merujuk pada kerusakan kualitas model akibat terlalu sering dilatih dengan data buatan AI, sebagaimana dijelaskan dalam makalah riset 2023 berjudul The Curse of Recursion oleh tim peneliti dari Inggris dan Kanada. Studi tersebut menyebut efek ini dapat menyebabkan cacat yang tak dapat diperbaiki.
Originality.ai menilai bahwa meski AIO sendiri tidak menjadi bagian dari data pelatihan, kehadiran sumber AI di dalamnya meningkatkan visibilitas konten tersebut, sehingga berpotensi masuk ke set pelatihan model di masa mendatang.
Dengan kata lain, meski AIO bukan sumber data pelatihan langsung, dengan menampilkan konten AI, Google ikut mendorong konten tersebut menjadi seolah lebih resmi dan lebih mungkin dipakai lagi untuk melatih AI lain. Jika ini terus terjadi, risiko “AI belajar dari AI” makin besar, yang bisa menurunkan kualitas informasi secara keseluruhan.
Google membantah hasil penelitian ini. Seorang juru bicara perusahaan mengatakan studi tersebut tidak akurat karena bergantung pada teknologi pendeteksi yang masih belum terbukti andal.
“Ini adalah studi yang cacat karena mengandalkan data parsial dan teknologi yang tidak dapat diandalkan. Detektor AI belum terbukti efektif mendeteksi konten AI dan banyak di antaranya terbukti rawan kesalahan,” ujar perwakilan Google seperti dikutip dari Techspot (8/9).
Meski begitu, Originality.ai menyebut perangkatnya telah melalui pengujian independen dengan tingkat akurasi yang tinggi.