SISTEM REKOMENDASI TAG PADA DOKUMEN BLOG MENGGUNAKAN LATENT SEMANTIC INDEXING
Abstract
Sebagian besar dokumen web memiliki bentuk berupa blog. Pelabelan dokumen web dengan tag membutuhkan waktu lebih lama karena banyaknya tag di dalamnya. Oleh karena itu, pada penelitian ini dimaksudkan untuk membuat sistem rekomendasi pemberian tag yang berfungsi sebagai navigasi dan titik temu hasil pencarian dokumen. Adapun metode yang digunakan adalah Latent Semantic Indexing (LSI) dengan menggunakan pendekatan matematis sehingga mendapatkan hubungan yang tidak nampak antara kata kunci yang terdapat pada teks dokumen, yaitu Tag-In (TI) dan kata kunci yang tidak terdapat pada teks dokumen, yaitu Tag-Out (TO). Ekstraksi dari TI pada dokumen didapatkan dengan menghitung bobot kata. Dari sejumlah TI yang memiliki bobot tertinggi, didapatkan TO yang muncul bersama sejumlah TI tersebut dari graf data latih. Kemudian dibentuk sebuah matriks yang berisi nilai co-occurrence antara TI dan TO yang telah diperoleh. Matriks tersebut didekomposisi menggunakan Singular Value Decomposition (SVD). Hasil dekomposisi yang merupakan vektor masing-masing TO dihitung kedekatannya dengan vektor query dan diambil jarak yang terdekat. Hasil pengujian menunjukkan nilai recall terbaik dicapai pada saat TI=3 dan TO=6, yaitu 0.69, dimana jumlah rata-rata tag tiap dokumen uji adalah 5 tag. Nilai k yang tepat dan menghasilkan akurasi terbaik bergantung pada rank matriks dengan F-Measure terbaik untuk rank = 2.
Full Text:
PDFReferences
LEE, S. O., & CHUN, A. H. 2008. Automatic Tag Recommendation for Web 2.0 Blogosphere by Extracting Keywords from Similar Blogs. http://www.wseas.us/elibrary/ conferences/2008/hangzhou/acacos/51-586- 352.pdf tanggal akses : 11 Februari 2011
Uzun, Y. 2008. Keyword Extraction Using Naïve Bayes. www.cs.bilkent.edu.tr/~guvenir/courses/cs550/Wor kshop/Yasin_Uzun.pdf tanggal akses : 22 Februari 2011
Mihalcea, R., & Tarau, P. 2004. TextRank: Bringing Order into Texts. http://acl.ldc.upenn.edu/acl2004/emnlp/pdf/Mihalc ea.pdf tanggal akses : 16 Februari 2011
Moldovan, A., Bot, R. I., & Wanka, G. 2008. Latent Semantic Indexing for Patent Documents. http://www-user.tu-chemnitz.de/~rabot/pdf/jour05- 04.pdf tanggal akses : 18 Februari 2011
Liu, Y., Liu, M., Xiang, L., Yang, Q., & Chen, X. 2008. Automatic Tag Recommendation for Weblogs.www.nlpr-eb.ia.ac.cn/2009papers/ gjhy/gh64.pdf tanggal akses : 05 Januari 2011
Chirita, P. A., Costache, S., Handschuh, S., & Nejdl, W. 2007. PTAG: Large Scale Automatic Generation of Personalized Annotation TAGs for the Web. http://www2007.org/papers/paper481.pdf tanggal akses : 11 Februari 2011
Song, Y., Zhang, L., & Giles, C. L. 2008. Automatic Tag Recommendation Algorithms for Social Recommender Systems. ACM Transactions on Computational Logic
Garcia, E. 2005. SVD and LSI Tutorial 3 Computing the Full SVD of a Matrix. http://www.miislita.com/information-retrievaltutorial/ svd-lsi-tutorial-3-full-svd.html tanggal akses :7 Januari 2011
Garcia, E. 2005. SVD and LSI Tutorial 4: Latent Semantic Indexing (LSI) How-to Calculations. http://www.miislita.com/information-retrievaltutorial/ svd-lsi-tutorial-4-lsi-howtocalculations. html tanggal akses :7 Januari 2011
Refbacks
- There are currently no refbacks.