SINONIM UNTUK EKSTRAKSI KATA KUNCI PADA PENGELOMPOKAN DOKUMEN MENGGUNAKAN FUZZY ASSOCIATION RULE MINING

Fahrur Rozi1, Rikie Kartadie

Abstract


Pertumbuhan dunia digital dalam dokumen tekstual terutama di World Wide Web mengalami pertumbuhan pesat. Peningkatan dokumen tekstual ini menyebabkan terjadinya penumpukan informasi, sehingga diperlukan sebuah pengorganisasian yang efisien untuk pengelolaan dokumen tekstual. Salah satu metode yang dapat mengelompokkan dokumen dengan tepat adalah menggunakan fuzzy association rule. Tahap ekstraksi kata kunci serta tipe fuzzy yang digunakan berpengaruh terhadap kualitas pengelompokan dokumen. Penggunaan sinonim dalam ekstraksi kata kunci untuk mendapatkan suatu klaster label dapat memperluas makna dari klaster label, sehingga dapat diperoleh suatu meaningful klaster label, selain itu ambiguitas dan uncertainties yang terjadi di dalam aturan fuzzy logic systems (FLS) tipe-1 dapat diatasi dengan fuzzy set tipe- 2. Penelitian ini mengusulkan sebuah metode yaitu sinonim untuk ekstraksi kata kunci pada pengelompokan dokumen menggunakan fuzzy association rule mining. Metode ini terdiri dari empat tahap, yaitu : preprocessing dokumen, ekstraksi key terms dari sinonim, ekstraksi kandidat klaster, dan konstruksi klaster tree. Pengujian terhadap metode ini dilakukan dengan tiga jenis data berbeda, yaitu Classic, Reuters, dan 20 Newsgroup. Pengujian dilakukan dengan membandingkan nilai overall f-measure dari metode tanpa semantic (non semantic), hipernim, dan sinonim. Berdasarkan pengujian didapatkan bahwa penggunaan sinonim dalam ektraksi kata kunci tidak mampu menghasilkan rata-rata overall f-measure yang lebih baik dibanding non semantic dan hipernim dengan nilai rata – rata overall f-measures sebesar 0.5372 untuk data classic, 0.3561 untuk data reuters, dan 0.5316 untuk data 20 newsgroup 


Full Text:

PDF

References


Congnan Luo, Yanjun Li, and Soon M. Chung, "Text document clustering based on neighbors," Data & Knowledge Engineering, vol. 68, no. 1, pp. 1271-1288, Juli 2009.

Chun Lieng Chien, Frank S.C Tseng, and Tyne Liang, "An Integration of WordNet and fuzzy association rule mining for multi-label document clustering," Data & Knowledge Engineering, vol. 69, no. 1, pp. 1208-1226, September 2010.

Ridvan Saracoglu, Kemal Tutuncu, and Novruz Allahverdi, "A new approach on search for similiar documents with multiple categories using fuzzy clustering," Expert Systems with Applications, pp. 2545-2554, 2008.

Florian Beil, Martin Ester, and Xiaowei Xu, "Frequent Term- Based Text Clustering," Proc. of Int'l Conf. on knowledge Discovery and Data Mining, pp. 436-442, 2002.

B.C.M Fung, K. Wang, and M. Ester, "Hierarchical document clustering using frequent itemset," Simon Fraser University, 2002.

Ling Chun Chen, Frank S.C Tseng, and Tyne Liang, "Mining fuzzy frequent itemset for hierarchical document clustering," Information Processing and Management, vol. 46, pp. 193-211, Oktober 2010.

Susiana Sari, "Clustering berbasis dokumen secara hierarki barbasis fuzzy set tipe-2 trapezoidal dan triangular dari frequent itemset," Institut Teknologi Sepuluh Nopember, 2012.

Yuen Hsien Tseng, "Generic title labeling for clustered documents," Expert Systems with Applications, vol. 37, pp. 2247- 2254, 2010.

Fahrur Rozi, Chastine Fatichah, and Diana Purwitasari, "Ektraksi Kata Kunci Berdasarkan Hipernim dengan Inisialisasi Klaster Menggunakan Fuzzy Association Rule Mining pada Pengelompokan Dokumen ," Jurnal Teknologi Informasi (JUTI), vol. 13, no. 2, pp. 190-197, July 2015.

Rekha Baghel and Renu Dhir, "A Frequent Concepts Based Document Clustering Algorithm," International Journal of Computer Applications, vol. 4, no. 5, pp. 6-12, July 2010.

G. Bharathi and D. Venkatesan, "Improving Information Retreival Using Document Cluster and Semantic Synoym Extraction," Journal of Theoretical and Applied Information Technology, vol. 36, no. 2, pp. 167-173, February 2012.

Jerry M. Mendel and Robert I. Bob John, "Type-2 Fuzzy Sets Made Simple," IEEE Transactions on Fuzzy System, pp. 117-127, 2002.

Janusz T. Starczewski, "Centroid of triangular and Gaussian type- 2 fuzzy sets," Information Sciences, vol. 280, pp. 289-306, Mei 2014.

Cengiz Kahraman, Basar Oztaysi, Irem Ucal Sari, and Ebru Turanoglu, "Fuzzy analytic hierarchy process with interval type-2 fuzzy sets," Knowledge-Based Systems, vol. 59, pp. 48-57, Februari 2014.

Janusz T. Starczewski, "Efficient triangular type-2 fuzzy logic systems," International Journal of Approximate Reasoning, pp. 799-811, 2009.


Refbacks

  • There are currently no refbacks.