Pada zaman modern, AI telah menjadi bagian yang sangat penting dalam kehidupan sehari-hari. AI bisa digunakan untuk memperoleh informasi dengan cepat, meringkas teks yang panjang, ataupun melakukan riset yang lebih mendalam. Walaupun tadinya AI hanya bisa digunakan oleh programmer dan data scientist, dengan adanya website seperti ChatGPT, Gemini, dan Perplexity, AI telah menjadi hal yang lebih mudah diakses, bahkan oleh kalangan pelajar.
Akses ini telah menjadi hal yang cukup kontroversial. Walaupun AI biasanya digunakan untuk melakukan hal yang positif, AI juga bisa dipakai untuk melakukan tindakan tidak jujur. Yakni, menyontek. Seiring berjalannya waktu, penggunaan AI untuk menulis teks akademik telah meningkat. Dalam menulis, AI bisa digunakan dalam tahap riset, menulis, ataupun revisi. Bahkan sudah ada makalah-makalah yang ditulis secara keseluruhan oleh AI. Keterlibatan AI ini berdampak negatif tidak hanya kepada penulisnya yang bertindak tidak jujur, tetapi juga pembaca yang menerima informasi yang tidak tepat. Contohnya adalah kasus dimana AI mengarang istilah "vegetative electron microscopy". "Vegetative electron microscopy"Â bukan sebuah fenomena yang nyata, melainkan karangan dari AI. Namun, karena istilah ini muncul di beberapa makalah, istilah ini mulai menyebar bahkan sampai digunakan sebagai sumber. Ini menyebarkan mis-informasi untuk pembaca serta peneliti lain yang membaca karyanya pelajar.
Karena lebih banyak penelitian sudah mulai memakai AI, perlu ada sebuah alat lain yang bisa mendeteksi ketika AI dipakai untuk menulis sebuah teks. Masuklah AI Checker. Digunakan oleh sebagian besar guru dan penguji, AI Checker adalah jawaban zaman modern kepada teks yang ditulis oleh AI. AI Checker membaca teks yang di-input dan mencari frasa, pola atau struktur kalimat yang digunakan oleh AI tetapi tidak digunakan oleh manusia. Salah satu contoh pola yang biasanya digunakan oleh AI adalah menggunakan kata berulang kali atau menggunakan struktur kalimat yang sama berkali-kali dalam satu paragraf. Dengan membuat observasi seperti ini, AI Checker seperti GPTZero dan ZeroGPT bisa mendeteksi bagian mana teks yang ditulis oleh AI dan bagian mana teks yang ditulis oleh manusia.
Teknologi ini sangat berguna untuk lomba di mana keterampilan peserta untuk menulis diuji dan dinilai. Selain itu, teknologi ini juga bisa digunakan oleh guru untuk melihat kejujuran siswanya. Oleh karena itu, teknologi AI Checker telah berkembang dengan sangat pesat, berjalan bersamaan dengan progres AI. Namun, ada masalah yang cukup besar yang telah muncul di dalam ranah AI checker. Masalah ini adalah masalah terdeteksinya false positive dalam tulisan manusia. Dalam arti kata yang lain, teks yang ditulis oleh manusia mulai dianggap sebagai 'tulisan AI' oleh AI Checker, bahkan menilainya sebagai 100% AI. Ada beberapa alasan mengapa ini terjadi.
Alasan pertama adalah munculnya 'AI Humanizer' di internet. Website 'AI Humanizer' dibuat dengan tujuan menipu AI Checker. Mekanismenya sederhana. Seorang siswa bisa meng-input teks yang ditulis oleh AI ke website AI Humanizer. Lalu, website AI Humanizer akan mengembalikan tulisan yang, jika dimasukkan ke AI Checker, memberi persentase '0% AI'. Fenomena ini cukup berbahaya bagi AI Checker karena alat ini membuat AI Checker tidak berguna lagi. Sebagian besar orang bisa sekedar masukkan teks mereka ke AI Humanizer, lalu tulisan mereka tidak akan terdeteksi AI.Â
Permasalahan besar ini menimbulkan solusi yang sederhan: Â membuat pemeriksaan yang lebih ketat lagi. Tidak hanya pola sederhana a yang dicek tetapi juga pola yang dibuat oleh AI Humanizer. Dengan cara ini, mereka membuat AI Checker relevan lagi setelah mengalami rintangan dalam bentuk 'AI Humanizer'. Namun, karena AI Humanizer menulis seperti manusia, ini justru membuat banyak orang biasa yang menulis tanpa AI mendapatkan skor 80 - 90% AI, meskipun mereka tidak menggunakannya untuk menulis ataupun meriset.
Alasan kedua ini terjadi adalah batasan bahasa. Secara sederhana, AI Checker didesain untuk menemukan penggunaan AI di teks Bahasa Inggris. Ini terjadi karena ChatGPT, Gemini, dan model-model lain semuanya menggunakan Bahasa Inggris sebagai bahasa utamanya. Bahkan model yang dari Cina, Deepseek, juga bisa menggunakan Bahasa Inggris. Oleh karena itu, sebagian besar dari kode yang digunakan untuk membuat AI Checker dibuat khusus untuk mencari kesalahan dalam bahasa Inggris. Ketika ada bahasa lain yang terlibat seperti Bahasa Indonesia, AI Checker tidak efektif.
Mereka tidak efektif untuk alasan yang cukup sederhana, yaitu karena data mereka tidak cukup. Karena sebagian besar pengguna internet memakai Bahasa Inggris, ,mayoritas data yang diberi ke model AI Checker ini berupa data dari Bahasa Inggris. Data dari bahasa lain lebih sedikit. Selain itu, pola-pola yang biasanya ditemukan oleh model sebagai 'pola yang umumnya digunakan oleh AI' mungkin tidak se-relevan di bahasa lain, di mana ada banyak frasa yang sering diulangi. Perbedaan bahasa inilah yang membuat AI Checker bingung, dan mendeklarasikan teks Bahasa Indonesia yang ditulis oleh manusia sebagai teks yang ditulis oleh AI. Gagasan ini didukung oleh sebuah penelitian yang dilakukan oleh Stanford, di mana 89 dari 91 esai untuk tes Bahasa Inggris TOEFL ditandai sebagai AI karena bahasanya yang 'kaku'.Â
Ini sangat berbahaya. Jika AI Checker mulai mengidentifikasi tulisan yang ditulis oleh manusia sebagai 'AI', pasti akan ada waktu di mana parameter akan saking ketatnya bahwa mereka akan mengidentifikasi tulisan AI sebagai lebih 'manusia' daripada tulisan manusia. Dalam masa depan itu, apakah kita, manusia yang sebenarnya, akan dianggap sebagai lebih 'AI' daripada AI sendiri?
