Menggunakan AI Untuk Mendeteksi Berita Palsu


Teknologi / Wednesday, March 21st, 2018

Cacingcau – Anda mungkin telah memperhatikan: Ini adalah saat yang aneh untuk fakta. Di satu sisi, meski meremas-remas isi dunia pasca kebenaran kita, fakta masih ada. Di sisi lain, sangat sulit untuk mengeruk mereka dari selokan informasi yang keliru, propaganda, dan berita palsu.1 Entah itu obat penghilang rasa sakit yang mengandung virus, 3 juta suara ilegal masuk dalam pemilihan presiden 2016, atau mainan anak-anak baru yang disebut My First Vape, kiriman palsu menyumbat internet.

Fakta-checker dan jurnalis mencoba yang terbaik untuk mengemukakan fakta, tapi ada terlalu banyak kebohongan dan terlalu sedikit dari kita. Seberapa sering rata-rata warga jatuh untuk berita palsu tidak jelas. Tapi ada banyak kesempatan untuk terpapar. Pew Research Center melaporkan tahun lalu bahwa lebih dari dua pertiga orang dewasa Amerika mendapatkan berita di media sosial, di mana informasi yang keliru terjadi. Kami juga mencarinya. Pada bulan Desember, ilmuwan politik dari Universitas Princeton, Dartmouth College, dan University of Exeter melaporkan bahwa 1 dari 4 orang Amerika mengunjungi sebuah situs berita palsu – kebanyakan dengan mengklik mereka melalui Facebook – seputar pemilihan 2016.

Sebagai pendukung, pakar, dan bahkan pemerintah membuat informasi untuk mengeksploitasi perbedaan regional, jenis kelamin, dan etnis kita, perusahaan teknologi besar seperti Facebook, Google, dan Twitter berada di bawah tekanan untuk mundur. Startups dan perusahaan besar telah meluncurkan usaha untuk menerapkan algoritma dan kecerdasan buatan untuk memeriksa berita digital secara nyata. Bangun perangkat lunak cerdas, pemikirannya berjalan, dan kebenaran telah ditembak. “Di masa lalu, ada media berita yang menyaring hal-hal yang tidak akurat dan gila,” kata Bill Adair, seorang profesor jurnalisme di Duke University yang mengarahkan satu usaha semacam itu, Duke Tech & Check Cooperative. “Tapi sekarang tidak ada filter. Konsumen membutuhkan alat baru untuk bisa mengetahui apa yang akurat dan mana yang tidak. ”

Dengan dana $ 1,2 juta, termasuk $ 200.000 dari Proyek Jurnalisme Facebook, co-op ini mendukung pengembangan alat pengecekan fakta virtual. Sejauh ini, ini termasuk ClaimBuster, yang memindai berita berita digital atau transkrip pidato dan memeriksanya terhadap database fakta yang diketahui; pelacak titik-bicara, yang menandai klaim politisi dan pakar; dan Truth Goggles, yang membuat informasi yang kredibel lebih cocok untuk pembaca yang bias. Banyak kelompok lain mencoba membuat alat serupa.

Sebagai jurnalis dan pemeriksa fakta, saya berharap algoritma terbaik. Kami yakin bisa menggunakan bantuannya. Tapi saya skeptis. Bukan karena saya takut robot mengejar pekerjaan saya, tapi karena saya tahu apa yang mereka hadapi. Saya menulis buku tentang pengecekan fakta (tidak, sungguh, ini disebut The Chicago Guide to Fact-Checking2). Saya juga menjadi tuan rumah Metode podcast, yang membahas bagaimana jurnalis, ilmuwan, dan pencari kebenaran profesional mengetahui apa yang mereka ketahui. Dari pengalaman ini, saya dapat mengatakan bahwa kebenaran itu rumit dan licin. Otak manusia dapat mengenali konteks dan nuansa, yang keduanya penting dalam memverifikasi informasi. Kita bisa melihat sarkasme. Kami tahu ironi. Kami mengerti bahwa sintaks bisa bergeser meski pesan dasar tetap ada. Dan terkadang kita masih salah. Dapatkah mesin bahkan mendekati?

Media telah memberitakan cakupan penuh harapan tentang bagaimana upaya AI dapat menyelamatkan kita dari berita utama palsu. Tetapi apa yang ada di dalam otak digital itu? Bagaimana algoritme akan melakukan pekerjaannya? Kecerdasan buatan, bagaimanapun juga, berkinerja terbaik saat mengikuti peraturan Pokercc ketat. Jadi ya, kita bisa mengajar komputer bermain catur atau Go. Tapi karena fakta licin, Cathy O’Neil, ilmuwan data dan penulis Weapons of Math Destruction: Seberapa Besar Data Meningkatkan Ketidaksetaraan dan Mengancam Demokrasi, bukanlah optimis AI. “Konsep algoritma pengecekan fakta, setidaknya pada blush pertama, adalah membandingkan pernyataan dengan kebenaran yang diketahui,” katanya. “Karena tidak ada model algoritmik buatan untuk kebenaran, itu tidak akan berhasil.”

Itu berarti para ilmuwan komputer harus membangunnya. Jadi bagaimana mereka membangun tentara pemeriksa fakta virtual mereka? Apa model kebenaran mereka? Dan seberapa dekat kita mempercayakan algoritme mereka untuk memalsukan berita palsu? Untuk mengetahui, para editor di Popular Science meminta saya untuk mencoba pemeriksa fakta otomatis, menggunakan berita palsu, dan membandingkannya dengan proses saya sendiri. Hasilnya dicampur, tapi mungkin bukan karena alasan Anda (atau setidaknya saya) pasti berpikir.

Chengkai Li adalah seorang ilmuwan komputer di University of Texas di Arlington. Dia adalah peneliti utama untuk ClaimBuster, yang, pada tulisan ini, adalah satu-satunya alat pemeriksa fakta AI yang tersedia untuk umum (walaupun masih dalam proses penyelesaian). Dimulai pada akhir 2014, Li dan timnya membangun ClaimBuster kurang lebih sepanjang jalur pemeriksa fakta otomatis lainnya dalam pembangunan. Pertama, mereka menciptakan sebuah algoritma, kode komputer yang bisa memecahkan masalah dengan mengikuti seperangkat aturan. Mereka kemudian mengajarkan kode mereka untuk mengidentifikasi sebuah klaim – sebuah pernyataan atau ungkapan yang dinyatakan sebagai kebenaran dalam sebuah berita atau pidato politik – dengan memberi banyak hukuman, dan memberitahukannya yang membuat klaim dan mana yang tidak. Karena tim Li awalnya merancang alat mereka untuk menangkap pernyataan politik, kata-kata yang mereka berikan itu berasal dari 30 atau lebih dari debat presiden A.S. yang lalu, yang berjumlah sekitar 20.000 klaim. “Kami menargetkan pada pemilihan 2016,” kata Li. “Kami berpikir sebaiknya menggunakan ClaimBuster saat calon presiden diperdebatkan.”

Selanjutnya, tim tersebut mengajarkan kode ke komputer untuk membandingkan klaim dengan seperangkat fakta yang diketahui. Algoritma tidak memiliki fitur intrinsik untuk mengidentifikasi fakta; manusia harus menyediakannya Kami melakukan ini dengan membangun apa yang akan saya sebut database kebenaran. Untuk bekerja, database ini harus berisi informasi yang berkualitas tinggi dan luas. Tim Li menggunakan beberapa ribu artikel pengecekan fakta dan posting blog yang ditulis oleh petugas pemeriksa fakta dan jurnalis profesional, yang dimaksudkan untuk memperbaiki catatan klaim yang meragukan – ditarik dari situs berita terkemuka seperti PolitiFact, Snopes, factcheck .org, dan The Washington Post .

Saya ingin melihat apakah ClaimBuster bisa mendeteksi berita sains palsu dari seorang penjaja terkenal dari poster yang ditantang fakta: infowars.com. Aku bertanya kepada Li apa pendapatnya. Dia mengatakan sementara sistem akan paling berhasil dalam cerita politik, ini mungkin berhasil. “Saya pikir sebuah halaman dari Infowars terdengar menarik,” katanya. “Mengapa tidak mencobanya dan beritahu kami apa yang Anda temukan?”

Untuk membuat pertarungan yang adil, editor saya dan saya menyetujui dua peraturan: Saya tidak dapat memilih berita palsu itu sendiri, dan saya tidak dapat menguji AI sampai setelah saya menyelesaikan pemeriksaan fakta saya sendiri. Pemeriksa fakta lama di Popular Science menarik tujuh kisah sains palsu dari Infowars, dari mana editor saya dan saya menyetujui satu dengan topik yang dipolitisasi: perubahan iklim.

Karena Li tidak memiliki anggaran untuk memperbarui database kebenaran ClaimBuster sejak akhir 2016, kami memilih sebuah artikel yang diterbitkan sebelum itu: “Blockbuster Iklim: Data NASA Baru Menunjukkan Es Kutub Belum Pulih Sejak 1979,” mulai Mei 2015.

Pengunduran perubahan iklim dan penulis berita palsu sering kali salah menggambarkan penelitian nyata untuk mendukung klaim mereka. Dalam memeriksa laporan, saya mengandalkan fakta yang hanya tersedia pada periode tersebut.

Untuk tetap singkat, kami menggunakan 300 kata pertama dari akun Infowars. 5 Untuk bagian percobaan manusia, saya memeriksa pilihannya seperti artikel lainnya: baris demi baris. Saya mengidentifikasi pernyataan berbasis fakta – yang pada dasarnya terdiri dari setiap kalimat – dan mencari bukti pendukung atau kontradiksi dari sumber utama, seperti ilmuwan iklim dan jurnal akademis. Saya juga mengikuti tautan dalam kisah Infowars untuk menilai kualitas mereka dan untuk melihat apakah mereka mendukung argumen tersebut. (Contoh pemeriksaan fakta saya ada di sini.)

Ambil contoh kalimat pertama: “NASA telah memperbarui datanya dari pembacaan satelit, mengungkapkan bahwa tutupan es kutub planet tersebut belum mundur secara signifikan sejak tahun 1979, ketika pengukuran dimulai.” Online, kata-kata “data dari pembacaan satelit” telah sebuah hyperlink Untuk melihat data yang direferensikan, saya mengklik link tersebut, yang mengarah ke situs University of Illinois yang tidak berfungsi, Cryosphere Today. Jalan buntu. Saya mengirim email ke sekolah tersebut. Kepala Departemen Ilmu Atmosfer universitas memberi saya alamat email untuk seorang peneliti yang pernah bekerja di lokasi tersebut: John Walsh, sekarang menjadi ilmuwan utama Pusat Riset Arktik Internasional di Alaska, yang kemudian saya wawancarai melalui telepon.