Mohon tunggu...
Yopi Andry Lesnussa
Yopi Andry Lesnussa Mohon Tunggu... Dosen - Dosen

Nyong Ambon yang senang membaca dan menulis

Selanjutnya

Tutup

Artificial intelligence Pilihan

ArtificiaI Intelligence (AI) Pada Pelestarian Bahasa Daerah

27 Agustus 2023   20:41 Diperbarui: 27 Agustus 2023   22:49 1068
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Pengembangan aplikasi penerjemahan Bahasa Indonesia ke Bahasa Seram (Geser) ini menggunakan pemograman Phyton dan Google Colab. Python adalah bahasa pemrograman tingkat tinggi yang sering digunakan dalam pengembangan perangkat lunak, pemrosesan data, kecerdasan buatan, pengembangan web, dan bidang lainnya. 

Python merupakan bahasa pemrograman yang sangat populer saat ini, yang dibuat oleh Guido van Rossum pada tahun 1991. Python memiliki banyak kegunaan yang luas diantaranya pengembangan web (sisi server), pengembangan perangkat lunak, pemecahan persamaan matematika, pembuatan skrip sistem, dan pemrograman mikrokontroler dengan menggunakan MicroPython.

Google Colab adalah platform cloud yang didukung oleh Google yang memungkinkan pengguna untuk menjalankan dan mengembangkan kode Python di lingkungan yang terintegrasi dengan sumber daya komputasi yang kuat. 

Dengan menggunakan Google Colab, para pengembang dan peneliti dapat dengan mudah mengakses sumber daya komputasi yang besar, termasuk pemrosesan grafis (GPU) dan pemrosesan Tensor Unit (TPU), tanpa perlu menginstal atau mengatur infrastruktur lokal.

Salah satu keunggulan utama Google Colab adalah kemampuannya untuk membuat dan berbagi notebook interaktif yang menggabungkan kode, teks, dan visualisasi. Pengguna dapat membuat notebook Colab untuk mengembangkan, memecahkan, atau menyajikan masalah atau proyek tertentu dengan cara yang intuitif dan terstruktur. 

Data yang digunakan dalam penelitian ini berupa Korpus paralel. Menurut Christopher Manning dan Hinrich Schtze korpus paralel adalah koleksi dokumen yang berisi teks yang diterjemahkan secara paralel antara dua atau lebih bahasa. 

Biasanya, teks dalam korpus paralel terdiri dari kalimat atau frasa yang bersesuaian satu sama lain dalam bahasa yang berbeda. Kualitas dan jumlah korpus paralel sangat penting untuk kinerja sistem penerjemahan mesin. Sebuah korpus paralel yang besar memungkinkan untuk pelatihan model yang lebih kuat dan akurat, sementara korpus paralel yang kecil menyebabkan penerjemahan yang kurang akurat dan kurang lancar.

Bahasa seram (Geser) adalah salah satu bahasa dengan resource yang sangat terbatas. Hal ini dikarenakan penggalan kalimat atau kata dari bahasa Seram (Geser) sangat sulit untuk ditemukan di internet, tidak ada situs website, rekaman, ataupun video yang benar-benar menjelaskan ataupun termuat dalam bahasa Seram (Geser). 

Satu-satunya cara untuk mengumpulkan data bahasa daerah Geser adalah melakukan wawancara dengan penutur asli dari Bahasa Seram (Geser). Jumlah data atau korpus paralel yang dikumpulkan dari hasil wawancara dengan masyarakat asli pulau geser sangat banyak sekitar 10 ribuan, namun setelah dilakukan proses seleksi hanya sekitar 3538 korpus parallel bahasa Indonesia yang di terjemahkan ke Bahasa Seram (Geser) yang memenuhi dan digunakan dalam penelitian ini. 

Dari hasil perhitungan BLUE Score (Metrik untuk mengukur tingkat akurasi penerjemahan mesin penerjemah), diperoleh nilai BLUE Score dari korpus paralel Indonesia -- Geser telah mencapai nilai 0.90518992895191 atau 90.518%: Tabel berikut merupakan data Korpus Paralel dari Bahasa Indonesia -- Geser.

Dok pribadi
Dok pribadi

HALAMAN :
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
Mohon tunggu...

Lihat Konten Artificial intelligence Selengkapnya
Lihat Artificial intelligence Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun