CLUSTERING DOKUMEN DENGAN SEMANTIC WORD HOLONIM DAN FUZZY ASSOCIATION RULE MINING

Fahrur Rozi, Rikie Kartadie

Abstract


Meningkatnya penggunaan dokumen teks berimbas pada semakin menumpuknya file dokumen teks sehingga memerlukanpengorganisasian terhadap file dokumen teks tersebut.  Salah satu metode  yang dapat mengelompokkan dokumen dengan tepat adalah menggunakan fuzzy association rule. Tahap mendapatkan keyword  serta tipe fuzzy yang digunakan berpengaruh terhadap kualitas pengelompokan dokumen. Penggunaan  holonim untuk mendapatkan keyword  yang selanjutnya digunakan untuk membentuk suatu klaster label dapat memperluas makna dari klaster label, sehingga dapat diperoleh suatu meaningful klaster labe. Penelitian ini mengusulkan sebuah metode yaitu clustering dokumen menggunakan semantic word holonim dan  fuzzy association rule mining. Metode ini terdiri dari empat tahap, yaitu : preprocessing dokumen, ekstraksi key terms dari  holonim, ekstraksi kandidat klaster, dan konstruksi klaster tree. Pengujian terhadap metode ini dilakukan dengan tiga jenis data berbeda, yaitu Classic, Reuters, dan 20 Newsgroup. Pengujian dilakukan dengan membandingkan nilai overall f-measure dari metode tanpa  semantic (non semantic), dan holonim

Full Text:

PDF

References


C. Lou, L. Yanjun, and S. M. Chung, “Text document clustering based on neighbors,” Text Doc. Clust. based neighbors, vol. 68, no. 1, pp. 1271–1288, 2009.

C. L. Chien, F. S. C. Tseng, and T. Liang, “An Integration of WordNet and fuzzy association rule mining for multi-label document clustering,” Data Knowl. Eng., vol. 69, no. 1, pp. 1208–1226, 2010.

R. Saracoglu, K. Tutuncu, and N. Allahverdi, “A new approach on search for similiar documents with multiple categories using fuzzy clustering,” Expert Syst. Appl., pp. 2545–2554, 2008.

F. Sukmana and J. L. Bulaili, “Rekomendasi Solusi pada Computer Maintenance Management System Menggunakan Association Rule, Koefisien Korelasi Phi dan Chi-Square,” in Prosiding Seminar Nasional Manajemen Teknologi XXII, 2015, pp. 1–8.

B. C. M. Fung, K. Wang, and M. Ester, “Hierarchical document clustering using frequent itemset,” in Simon Fraser University, 2002.

F. Rozi and F. Sukmana, “Metode Siklis dan Adaptive Neuro Fuzzy Inference System untuk Peramalan Cuaca,” J. Ilm. Penelit. dan Pembelajaran Inform., vol. 1, no. 1, pp. 7–13, 2016.

C. Chen, F. S. C. Tseng, and T. Liang, “Mining fuzzy frequent itemset for hierarchical document clustering,” Inf. Process. Manag., vol. 46, pp. 193–211, 2010.

F. Beil, M. Ester, and X. Xu, “Frequent Term-Based Text Clustering,” in Proc. of Int’l Conf. on knowledge Discovery and Data Mining, 2002, pp. 436–442.

S. Sari, “Clustering berbasis dokumen secara hierarki barbasis fuzzy set tipe-2 trapezoidal dan triangular dari frequent itemset,” in Institut Teknologi Sepuluh Nopember, 2012.

Y. H. Tseng, “Generic title labeling for clustered documents,” Generic title labeling Clust. Doc., vol. 37, pp. 2247–2254, 2010.

F. Rozi, S. H. Wijoyo, S. A. Isanta, Y. Azhar, and D. Purwitasari, “Pelabelan Klaster Fitur Secara Otomatis pada Perbandingan Review Produk,” J. Teknol. Inf. dan Ilmu Komput., vol. 1, no. 2, pp. 55–61, 2014.

F. Rozi, C. Fatichah, and D. Purwitasari, “Ektraksi Kata Kunci Berdasarkan Hipernim dengan Inisialisasi Klaster Menggunakan Fuzzy Association Rule Mining pada Pengelompokan Dokumen,” J. Teknol. Inf., vol. 13, no. 2, pp. 190–197, 2015.

F. Rozi and R. Kartadie, “Sinonim untuk Ekstraksi Kata Kunci Pada Pengelompokan Dokumen Menggunakan Fuzzy Associotion Rule Mining,” Semnasteknomedia, vol. 4, no. 1, 2016.

R. Baghel and R. Dhir, “A Frequent Concepts Based Document Clustering Algorithm,” Int. J. Comput. Appl., vol. 4, no. 5, pp. 6–12, 2010.

G. Bharati and G. Venkatesan, “Improving Information Retreival Using Document Cluster and Semantic Synoym Extraction,” J. Theor. Appl. Inf. Technol., vol. 36, no. 2, pp. 167–173, 2012.


Refbacks

  • There are currently no refbacks.