No image available for this title

Proyek Akhir

Ekstraksi tabel html di web menggunakan algoritma depth first search (dfs) sebagai metode penelusuran pemodelan pohon document object model (dom)



ABSTRAK
Data di web dapat tersaji dalam berbagai format, salah satunya
adalah tabel dalam bentuk HTML. Suatu ekstraksi pada tabel
dibutuhkan untuk mengambil data. Hal ini dapat dilakukan
dengan cara menyalin data dan menaruhnya ditempat lain. Hal ini
ternyata tidak efektif karena data menjadi tidak beraturan dan
pekerjaan berulang untuk melakukannya. Dari masalah tersebut
telah dibangun sebuah aplikasi menggunakan bahasa pemrograman
Visual Basic untuk membantu dalam proses ekstraksi tabel HTML
secara otomatis dan mengubahnya dalam bentuk csv. Proses yang
dilakukan adalah menggunakan pemodelan pohon Document Object
Model (DOM). Metode ini digunakan untuk dapat menelusuri setiap
tag-tag HTML menggunakan algoritma Depth First Search (DFS).
Sehingga dihasilkan sebuah aplikasi dengan masukan berupa alamat
web atau source code HTML. Aplikasi telah diujikan pada beberapa
halaman web dengan beragam parameter yang diperhatikan meliputi
jumlah tabel, ukuran tabel, orientasi tabel, dan kondisi merged-cell
pada tabel. Berdasarkan hasil pengujian tersebut, aplikasi berhasil
menampilkan hasil ekstraksi dengan beberapa kondisi tabel yang
dapat ditangani, meliputi join table, column wise table, row wise
table, dan nested table.
Kata kunci: Ekstraksi Tabel, DFS, DOM, HTML, Website.


Ketersediaan

PA1255301016Perpustakaan PCR (Rak R)Tersedia namun tidak untuk dipinjamkan - No Loan

Informasi Detil

Judul Seri
-
No. Panggil
PA TI
Penerbit Pustaka Politeknik Caltex Riau : Pekanbaru.,
Deskripsi Fisik
Jumlah Halaman : 52 | Ukuran : 20x15
Bahasa
Indonesia
ISBN/ISSN
-
Klasifikasi
PA TI
Tipe Isi
text
Tipe Media
-
Tipe Pembawa
-
Edisi
1
Subyek
Info Detil Spesifik
-
Pernyataan Tanggungjawab

Versi lain/terkait

Tidak tersedia versi lain


Lampiran Berkas



Informasi


DETAIL CANTUMAN


Kembali ke sebelumnyaXML DetailCite this