Techopit.xyz ~ Captcha (Completely Automated Public Turing) adalah suatu
bentuk uji tantangan yang digunakan dalam komputer untuk memastikan bahwa
jawaban adalah hasil manusia dan bukan tidak dihasilkan oleh sebuah komputer
(bot).
Sejarah Captcha
Captcha pertama kali diciptakan oleh Luis von Ahn, Manuel Blum, Nicholas J.
Hopper (berasal dari Carnegie Mellon University), dan John Langford (dari IBM).
‘Captcha’ dalam bahasa inggris ‘capture’ yang berarti menangkap. Istilah ini
adalah akronim bahasa inggris dari ‘Uji Turing Publik Terotomatisasi Penuh
untuk membedakan Komputer dan Manusia (Completely Automated Public Turing test
to tell Computers and Humans Apart)’.
Carnegie Mellon University berusaha mematenkannya, namun upaya ini
dibatalkan pada 21 April 2008.
Tujuan Captcha
CAPTCHA yang menjengkelkan itu sebenarnya digunakan untuk membantu
digitalisasi beberapa dekade teks lama - buku, majalah, dan surat kabar - yang
sulit diuraikan oleh program pemindaian.
Internet Archive sendiri merupakan rumah bagi lebih dari 200.000 eksemplar
buku klasik yang dipindai. Beberapa di antaranya dibuat dengan indah, tetapi
gaya yang mewah atau terlalu indah (ex : font) dapat menyulitkan komputer untuk
menerjemahkan buku-buku tersebut menjadi teks digital yang dapat diindeks.
Sama seperti aplikasi Mechanical Turk, ReCaptcha menggunakan manusia untuk
menerjemahkan gambar kata yang dipindai yang tidak dapat dipahami oleh
komputer.
Kata-kata yang dipindai ditempatkan di samping widget captcha normal
sehingga pengguna memecahkan kode kedua kata pada saat yang sama. Kata ini
dapat dijalankan oleh banyak orang untuk mengurangi kesalahan. Captcha juga
menawarkan kesempatan untuk mengonversi banyak kata.
Pendiri ReCaptcha, Luis von Ahn dan Ben Maurer memperkirakan bahwa sekitar
60 juta CAPTCHA diselesaikan setiap hari. Dengan asumsi bahwa setiap CAPTCHA
membutuhkan waktu 10 detik untuk menyelesaikannya, ini adalah lebih dari
160.000 jam manusia per hari (sekitar 19 tahun).
Alasan kata-kata itu kabur atau bengkok bukan untuk menguji kesabaran Anda;
ini diambil dari teks yang dipindai, yang sering salah diterjemahkan oleh
program digitasi otomatis - atau perangkat lunak pengenalan karakter optik
(OCR).
Melalui penggunaan CAPTCHA, manusia di seluruh dunia mendigitalkan New York
Times senilai 20 tahun yang kembali hanya dalam beberapa bulan. Dalam tahun
pertama, 440 juta kata telah diuraikan: setara dengan 17.600 buku.
Google membeli teknologi itu pada tahun 2009, dan menggunakannya sebagai
landasan proyek Google Books yang ambisius, yang mendigitalkan karya-karya
kuno, langka, dan tidak dicetak dan menawarkannya secara gratis.
Awalnya CAPTCHA akan bekerja dengan menawarkan serangkaian kata yang campur
aduk dan sengaja membengkokkannya sehingga manusia bisa dengan mudah membacanya
tetapi robot tidak bisa. Dalam kasus perusahaan tiket, ini akan menghentikan
perangkat lunak yang dikembangkan oleh calo untuk secara otomatis membeli
beberapa tiket.
Tetapi cacat inheren yang sama yang memungkinkan CAPTCHA untuk menjebak
robot juga berarti bahwa program OCR sering gagal untuk secara akurat
menguraikan teks yang dipindai dengan ketidaksempurnaan.
Memudar, kerusakan pada kertas, dan kekurangan pencetakan berarti bahwa
perangkat lunak OCR salah membaca sekitar 20 persen kata, sebuah jumlah yang
tidak dapat diterima oleh standar apa pun.
Program memperbaiki ini dengan memasangkan kata yang tidak dapat diuraikan
oleh perangkat lunak OCR dengan kata kontrol. Jika cukup banyak orang mengetik
kedua kata, program dapat menganggap keduanya benar.
Baca Juga: Gladys West, Wanita Penemu Sistem GPS
Perhatikan bahwa kedua kata tersebut dibengkokkan lebih lanjut oleh program
untuk mengurangi kemungkinan bahwa program OCR lain - yang pada dasarnya
digunakan untuk serangan cyber - juga dapat membaca teks.
Jika tidak, ini akan mengalahkan tujuan awal CAPTCHA - untuk menghentikan
serangan otomatis tersebut. Lembaga CyLab di Carnegie Mellon University, yang
mengembangkan perangkat lunak, melaporkan tingkat akurasi 99,1 persen dengan
program ini, keberhasilan yang mereka klaim ‘sebanding dengan layanan
transkripsi profesional manusia terbaik’.
Anda mungkin juga melihat foto-foto nomor yang muncul di CAPTCHA Anda. Ini
adalah rencana yang lebih ambisius: untuk mendigitalkan nomor jalan yang
dipindai oleh Google Street View.
Tentu saja, ini adalah upaya yang kurang altruistik daripada pelestarian
literatur penting dari masa lalu, dan penerapan sistem reCAPTCHA ini mungkin
lebih cocok dengan pandangan kritis bahwa ini hanyalah Google yang menggunakan
tenaga kerja gratis untuk tujuan komersialnya sendiri.
Posting Komentar