KINERJA WEB CRAWLER MENGGUNAKAN METODE HTML DOM

Isi Artikel Utama

Muhammad Takdir Muslihi

Abstrak

Penelitian yang dilakukan untuk menerapkan Web Crawler ke dalam sistem informasi untuk mencari dan memperlihatkan daftar link dari website yang isinya relevan terhadap data dosen di dalam sistem informasi akademik. Algoritma yang akan digunakan adalah algoritma BFS, Backlink dan Pagerank. Hasil dari penelitian ini adalah Web Crawler sukses mendapatkan 187 daftar link yang berkaitan dengan dosen pada sistem informasi akademik.Dilihat dari sisi algoritma yang digunakan dalam web crawler, algoritma Pagerank dan BFS bekerja lebih efisien dalam menemukan link dalam sebuah website dibandingkan algoritma BFS.

Rincian Artikel

Bagian
Vol.6, No.2 (November 2021)

Referensi

Ahuja M. (2014). Web Crawler : Extracting the Web Data. International Journal of Computer Applications, 13(3):132-137.

Giles C & Councill I. (2010). Measuring the web crawler ethics. Proceedings of the 19th International Conference on World Wide Web - WWW ,19(10): 1101.

Gupta G. (2012). Increasing The Efficiency Of Crawler Using Costumized Sitemap. International Journal of Computing and Business Research (IJCBR) ISSN (Online) : 2229-6166.

Hasbullah. (2013). Pengembangan Sistem Informasi Akreditasi yang Terintegrasi Dengan SIAKA FT-UH (Skripsi). Makassar: Universitas Hasanuddin.

Jain A & Agrawal C. (2014). Sourfey of web crawler algorithm. International Journal of Computing and Business Research , 1(2): 7–14.

Mishra S., Jain A., & Sachan, D. (2011). A Query based Approach to Reduce the Web Crawler Traffic using HTTP Get Request and Dynamic Web Page. International Journal of Computer Applications. 14(3): 8–14.

Muslihi M.T & Hutomy A.(2013). Pengembangan Sistem Informasi Akreditasi. (Skripsi). Makassar: Universitas Hasanuddin.

Rosmala D & Syafei R. (2012). Implementasi Web Crawler pada Social Media Monitoring. Jurnal informatika, 2(5):57–68.

Tamara G., Brett W., & Kenny J. (2005). Higher-Order Web Link Analysis Using Multilinear Algebra. Albuquerque: Sandia National Laboratories.

Zuliarso E & Mustofa K. (2009). Crawling Web berdasarkan Ontology. Jurnal Teknologi Informasi DINAMIK, XIV(2): 105–112.

##plugins.generic.recommendByAuthor.heading##