Diskriminasi Bahasa dalam Penulisan Kecerdasan Buatan

17 Mei 2023

Ditulis oleh:


Dr. Wee Hin Boo


Felo Penyelidik

Institut Perubahan Iklim,

Universiti Kebangsaan Malaysia

Kecerdasan Buatan (Artificial Intelligence, AI) adalah teknologi terbaru yang dapat membantu dalam melakukan keputusan melalui pemprosesan maklumat dan pengecaman corak. Salah satu model bahasa AI yang popular adalah Generative Pre-trained Transformer (GPT), yang menggunakan Pembelajaran Dalam (Deep Learning) untuk menghasilkan maklumbalas dalam bahasa alami. Namun, terdapat risiko salahguna GPT (atau alat serupa dengannya) untuk menjada penulisan dengan cepat dan mudah, tanpa mempertimbangkan masalah keaslian dan plagiat. Selain itu, dengan peningkatan isu maklumat palsu di laman internet untuk melatih GPT, maka kejituan maklumat yang dijana dalam penulisan oleh AI akan terancam. Beberapa alat perisian telah dibangunkan untuk mengatasi dan mengesan penulisan/karangan yang dihasilkan oleh AI, tetapi masih ada persoalan tentang keberkesanan alat-alat tersebut dalam aplikasi bahasa selain bahasa Inggeris. Selain daripada itu, persoalan kejituan juga dibangkitkan kepada penulisan yang separa bantuan AI (seperti penterjemahan and parafrasa). Ini amatlah penting bagi pihak akademik untuk membahas implikasi dan etika penggunaan AI dalam proses penulisan.


       Sebuah kajian baru-baru ini (Wee et al., 2023) telah membandingkan kejituan dalam mengesan penulisan/karangan yang ditulis oleh manusia dengan yang dihasilkan oleh ChatGPT menggunakan alat perisian pengensanan atas talian. Empat karangan dihasilkan menggunakan ChatGPT dalam bahasa Inggeris, Melayu, Mandarin, dan Jepun. Selain itu, dua karangan ditulis secara manual oleh manusia dalam bahasa Inggeris dan Melayu. Karangan bukan berbahasa Inggeris diterjemahkan ke dalam bahasa Inggeris dan kemudian melalui proses parafrasa dengan perisian tersedia di pasaran. Sebanyak 16 karangan telah dijana melalui proses tersebut, dan kesemua karangan dinilai oleh alat perisian mengesanan AI.


       Hasil menunjukkan bahawa karangan yang ditulis oleh manusia secara konsisten lulus penilaian keaslian, dan karangan yang dihasilkan oleh GPT dikesan tidak asli, terutama dalam Bahasa Inggeris. Namun, bahasa asli karangan yang dihasilkan oleh AI dalam bahasa bukan Inggeris dapat menghindari pengesanan oleh alat persian. Selain itu, karangan yang dihasilkan oleh AI yang melalui proses terjemahan dan parafrasa gagal penilaian keaslian. Tambahan pula, proses penterjemahan dan parafrasa menunjukkan menyuntik jejak AI dengan mengurangkan keaslian karangan tulisan manusia yang melalui proses tersebut. Kajian tersebut menyarankan bahawa alat pengesanan AI cekap mengesan penulisan yang dihasilkan oleh AI, terutamanya dalam bahasa Inggeris. 

       Masa kini, alat perisian pengesanan GPT yang tersedia ada boleh mengesan penulisan Bahasa Inggeris yang dihasilkan oleh AI dengan cekap, tetapi tidak sebaliknya bagi bahasa lain. Ini kerana hampir semua alat perisian tersebut dilatih melalui lama sesawang terbuka di internet yang dikuasai Bahasa Inggeris. Walau bagaimanapun, parafrasa karangan yang dihasilkan oleh GPT tidak meningkatkan nilai keaslian penulisan tersebut. Dengan itu, pengguna harus sedar tentang isu ini ketika menggunakan alat perisian parafrasa pada masa depan jika perisian pengesanan AI disertakan dalam alat perisian pemeriksaan yang digunapakai oleh institusi saintifik dan akademik.


       Memang tidak dinafikan penggunaan AI semakin rancak dan menjadi pilihan utama para pengarang bagi menghasilkan sebuah karangan lengkap atau mencari idea awal bagi memulakan karangan mereka. Bertambah pula dengan sokongan perisian penterjemahan dan parafrasa, ini semua banyak memudahkan proses penghasilan sesebuah karangan. Namun, penggunaan perisian penterjemahan dan parafasa yang semakin meluas sebagai pembantu ketika penulisan dilakukan boleh menimbulkan kebimbangan etika berkenaan tahap keterlibatan AI dalam penulisan. Perisian pengesanan AI boleh mengesan penggunaan perisian terjemahan dan parafasa yang dibantu oleh AI dalam penulisan. Ini membangkitkan kebimbangan tentang peningkatan kebergantungan pada perisian AI dalam penulisan, terutamanya bagi penulis dan pihak akademik bukan penutur asli bahasa Inggeris. Implikasi etika penggunaan alat AI dalam penulisan perlu dibincangkan, dan had yang munasabah terhadap penggunaannya perlu ditakrifkan untuk memastikan ketepatan dan keaslian maklumat dijamin. Perbincangan ini dapat membantu melakarkan piawai di masa depan yang boleh disertakan ke dalam alat perisian plagiat yang penting dalam dunia akademik.


       Selain kebimbangan mengenai pengesanan keaslian dan plagiat, isu etika lain dalam penulisan dengan AI adalah ketepatan maklumat, terutamanya dalam konteks maklumat palsu. Budaya maklumat terbuka kini telah dicemari oleh penyebaran maklumat palsu. ChatGPT (dan perisian serupanya) yang menggunakan internet terbuka untuk Latihan model boleh menyumbang kepada masalah ini dengan mencipta polarisasi maklumat. Ini boleh berlaku jika maklumat palsu tidak disemak semasa proses latihan, dan menyebabkan perwakilan maklumat yang tidak tepat. Oleh itu, pentingnya untuk memperluaskan perbincangan melampaui batasan penggunaan AI dalam penulisan dan juga mempertimbangkan penggunaan AI dalam mengesan maklumat palsu.


       ChatGPT (dan perisian serupanya) merupakan alat perisian yang amat berguna untuk meningkatkan penguasaan pengetahuan, tetapi penggunaannya yang berlebihan boleh mengancam keaslian maklumat, termasuk dalam bidang sains. Walaupun terdapat alat pengesan yang cekap, ia hanya terhad kepada penulisan dalam Bahasa Inggeris sahaja. Alat perisian terjemahan dan parafrasa juga boleh menimbulkan isu di mana penulisan yang dibantu AI akan dinilai sebagai tidak asli. Soalan etika berkaitan had AI dalam penulisan perlu dibincangkan, terutamanya bagi penulis dan akademik yang bukan penutur asli Bahasa Inggeris. Situasi semasa masih terkawal, tetapi sejauh mana?