Membumikan LLM dan Menambatkan Informasi
Sebelumnya saya mengupas ide bahwa LLM itu emang kerjanya halusinasi mulu karena kerjaannya memang “mengarang indah”.
Supaya karangannya lebih membumi (“grounding”), perlu konteks tambahan yang bisa yang bisa juga didapat melalui alat-alat bantu (“tools”). Bagaimana memakai teknik ini di ChatGPT, Gemini, Mistral, dll? Mari kita jabarkan bersama.
BTW supaya pemikiran kita sama, kalau belum baca, silakan simak dulu lihat tulisan sebelumnya, LLM: Si Paling Halu. Baru lanjut ke sini lagi.
ChatGPT dapat mendeteksi jenis pertanyaan yang memerlukan rujukan dan langsung berinisiatif mencarinya sendiri. Contohnya, untuk pertanyaan “Current population of Jakarta”, akan nampak informasi status “Searching the web..”. Begitu datanya dapat, ChatGPT akan meringkaskan jawabannya.
Perhatikan bahwa ChatGPT menyisipkan tautan (link) ke rujukan yang dipakai untuk merumuskan jawaban. Inilah yang dinamakan “grounding”. Kita pun bisa lebih yakin akan keakuratan jawaban tersebut.
Bagaimana kalau ChatGPT lebih memilih mengarang indah dari ingatannya? Di sini kita bisa sundul dengan instruksi tambahan, contoh “Search the web: the future capital of Indonesia”. Karena ada perintah tersebut, ChatGPT berburu keterangan tambahan dari web (“search tool”) sehingga jawaban yang disajikan lumayan lengkap, sama seperti kalau riset sendiri secara manual.
Untuk Gemini, ubah dikit supaya ada permintaan (eksplisit) untuk menunjukkan sumber rujukan.
Buat pecinta Mistral, dari antarmukanya sudah ada pilihan “Web search”. Pastikan tombol ini dipencet dulu, dan nanti jawabannya akan diramu berlandaskan hasil pencarian di web. Sumbernya juga dicantumkan dengan lengkap sebagai “Sources”.
Ternyata kombinasi antara LLM dan alat bantu pencarian informasi (via Google, lewat Wikipedia, dll) bisa jauh lebih dahsyat!
Trik ini sebelumnya telah saya hadirkan di Threads.