Mohon tunggu...
L. T. Handoko
L. T. Handoko Mohon Tunggu... Ilmuwan - Periset

Saya hanya seorang peneliti biasa yang penuh dengan rasa keingintahuan dan obsesi untuk membuat aneka invensi dalam riset bersama grup kecil saya di LIPI yang kemudian diintegrasikan ke BRIN. Info detail silahkan kunjungi http://lt.handoko.id.

Selanjutnya

Tutup

Pendidikan

Algoritma pohon batang untuk robot pemanen informasi daring

28 Mei 2011   15:57 Diperbarui: 26 Juni 2015   05:06 158
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Gadget. Sumber ilustrasi: PEXELS/ThisIsEngineering

Untuk itu kami melakukan penyempurnaan atas algoritma pohon DOM. Penyempurnaan utamanya dilakukan pada :


  1. Penyusunan pohon DOM tidak hanya dari level teratas, tetapi juga dari level terbawah secara simultan. Ini memastikan pengenalan dini perubahan pohon dari sebuah halaman situs secara akurat.
  2. Karakterisasi pohon DOM tidak hanya secara vertikal, tetapi juga horisontal. Sehingga tidak hanya kedalaman tetapi juga lebar dari pohon DOM turut diperhitungkan. Kesemuanya direpresentasikan dengan algoritma matematis dan digambarkan dalam bentuk diagram batang seperti pada gambar.


Algoritma ini kemudian disebut sebagai algoritma bar tree (pohon batang). Penyempurnaan ini memungkinkan tidak hanya pengenalan perubahan pohon di semua level, tetapi juga tidak terpengaruh oleh penambahan iklan dsb selama terjadi di level kedalaman yang sama.

Hasil

Dari hasil percobaan yang dilakukan oleh Z. Akbar untuk memanen data-data terkait iptek dari aneka situs di Indonesia, diperoleh hasil yang cukup mengesankan dengan tingkat akurasi mencapai rata-rata diatas 95 persen [4].

Algoritma dan sistem yang telah diaplikasikan di ISI secara prinsip dengan mudah bisa diimplementasikan untuk aneka kasus yang lain. Lebih jauh, sistem ini telah dirilis sebagai open source (sumber terbuka) di SourceForge.net [7]. Dilain pihak algoritma ini telah terdaftar hak ciptanya sejak 2010 [8] dan terpilih menjadi salah satu dari 101 Inovasi Indonesia Paling Prospektif tahun 2009 [9].

Lebih jauh lagi, saat ini algoritma kami juga telah diimplementasikan secara global, salah satunya adalah Slovak Environmental Index di NESIS Project Eropa.

Referensi


  1. Z. Akbar, L.T. Handoko, "Pattern discovery for semi-structured web pages using bar-tree representation", International Journal of Computer Theory and Engineering 3 (2011) 261-269.
  2. Z. Akbar, L.T. Handoko, "Reverse method for labeling the information from semi-structured web pages", Proceeding of the International Conference on Signal Processing Systems (2009) pp. 551-555 (DOI 10.1109/ICSPS.2009.86).
  3. Hadiyanto, L.T. Handoko, "Database Riset, Ilmu pengetahuan dan Teknologi - DBRIpTek", http://dbriptek.lipi.go.id (2007).
  4. Z. Akbar, L.T. Handoko, "Indonesian Scientific Index - ISI", http://www.isi.lipi.go.id (2009).
  5. W3 Consortium, "The Document Object Model", http://www.w3.org/DOM/ (2005).
  6. Contoh : J. Wang, F.H. Lochovsky, "Data extraction and label assignment for web databases", Proceedings of the 12th international conference on World Wide Web (2003) pp. 187-196.
  7. Z. Akbar, L.T. Handoko, "openISI" http://sourceforge.net/projects/openisi/ (2008).
  8. Z. Akbar, L.T. Handoko, "Integrasi Data dengan Algoritma Pemanenan Web Terfokus", Hak Cipta no. 045143 (25 Januari 2010).
  9. Z. Akbar, I. Firmansyah, B. Hermanto, L.T. Handoko, "Aplikasi TI Publik Berbasis Komputasi dan Data Terdistribusi", 101 Inovasi Indonesia Paling Prospektif (2009).

Sumber : Blog Sivitas LIPI

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Pendidikan Selengkapnya
Lihat Pendidikan Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun