Software OCR Â adalah penggunaan teknologi untuk membedakan karakter teks cetak atau tulisan tangan di dalam gambar digital dokumen fisik, seperti dokumen kertas yang dipindai. Software OCR singkatan dari (optical character recognition ) dengan proses dasar OCR melibatkan pemeriksaan teks dokumen dan menerjemahkan karakter menjadi kode yang dapat digunakan untuk pemrosesan data. OCR terkadang juga disebut sebagai pengenalan teks.
Sistem OCR terdiri dari kombinasi perangkat keras dan perangkat lunak yang digunakan untuk mengubah dokumen fisik menjadi teks yang dapat dibaca mesin. Perangkat keras, seperti pemindai optik atau papan sirkuit khusus digunakan untuk menyalin atau membaca teks sementara perangkat lunak biasanya menangani pemrosesan lanjutan. Perangkat lunak juga dapat memanfaatkan kecerdasan buatan (AI) untuk menerapkan metode pengenalan karakter cerdas (ICR) yang lebih canggih, seperti mengidentifikasi bahasa atau gaya tulisan tangan.
Proses OCR paling sering digunakan untuk mengubah dokumen legal atau bersejarah dalam bentuk cetak menjadi PDF. Setelah ditempatkan dalam soft copy ini, pengguna dapat mengedit, memformat, dan mencari dokumen seolah-olah dibuat dengan pengolah kata.
Cara kerja pengenalan karakter optik
Langkah pertama OCR adalah menggunakan scanner untuk mengolah bentuk fisik suatu dokumen. Setelah semua halaman disalin, perangkat lunak OCR mengubah dokumen menjadi versi dua warna, atau hitam dan putih. Gambar yang dipindai atau bitmap dianalisis untuk area terang dan gelap, di mana area gelap diidentifikasi sebagai karakter yang perlu dikenali dan area terang diidentifikasi sebagai latar belakang.
Area gelap tersebut kemudian diproses lebih lanjut untuk mencari huruf alfabet atau angka numerik. Program OCR dapat bervariasi dalam tekniknya, tetapi biasanya melibatkan penargetan satu karakter, kata, atau blok teks pada satu waktu. Karakter kemudian diidentifikasi menggunakan salah satu dari dua algoritma:
Pengenalan pola- Program OCR diberi contoh teks dalam berbagai font dan format yang kemudian digunakan untuk membandingkan, dan mengenali, karakter dalam dokumen yang dipindai.
Deteksi fitur- Program OCR menerapkan aturan mengenai fitur huruf atau angka tertentu untuk mengenali karakter dalam dokumen yang dipindai. Fitur dapat mencakup jumlah garis miring, garis bersilangan atau kurva dalam karakter untuk perbandingan. Misalnya, huruf kapital "A" dapat disimpan sebagai dua garis diagonal yang bertemu dengan garis horizontal di tengahnya.
Ketika sebuah karakter diidentifikasi, itu diubah menjadi kode ASCII yang dapat digunakan oleh sistem komputer untuk menangani manipulasi lebih lanjut. Pengguna harus memperbaiki kesalahan dasar, mengoreksi dan memastikan tata letak yang kompleks ditangani dengan benar sebelum menyimpan dokumen untuk digunakan di masa mendatang.
Manfaat Software OCR Adalah
Keuntungan utama dari teknologi OCR adalah menghemat waktu, sangat berbeda dengan software ERP terbaik di Indonesia karena software OCR dapat mengurangi kesalahan dan meminimalkan usaha. Ini juga memungkinkan tindakan yang tidak dapat dilakukan dengan salinan fisik seperti mengompresi ke dalam file ZIP, menyorot kata kunci, memasukkan ke dalam situs web dan melampirkan ke email.
Saat mengambil gambar dokumen memungkinkan mereka untuk diarsipkan secara digital, OCR menyediakan fungsionalitas tambahan untuk dapat mengedit dan mencari dokumen tersebut.Â
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H