IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING
Abstract
Clustering memiliki permasalahan terhadap hasil yang dicapai apakah sudah sesuai dengan kebutuhan. Salah satu pilihan adalah agglomertive hierarchical clustering(AHC). Pada AHC ada dua hal penting yaitu pemilihan jenis pengukuran similarity dan teknik linkage. Pada beberapa kasus, penggunaan AHC yang berbasis single linkage menunjukkan hasil yang baik pada berbagai himpunan dataset dengan variasi jumlah dan bentuk. Namun, algoritma ini masih dapat menimbulkan masalah kepekaan pada adanya outlier dan fluktuasi kepadatan data. Juga tidak memungkinkan untuk menentukan jumlah klaster secara otomatis. Untuk mengatasi ini, diperlukan pendekatan untuk mendeteksi outlier dan secara otomatis menentukan jumlah klaster yang dibutuhkan secara tepat. Pendekatan ini merupakan pengembangan dari AHC yang dapat mendeteksi adanya outlier. Hasil uji coba menunjukkan bahwa modifikasi HCA lebih unggul dalam penanganan outlier.
Full Text:
PDFReferences
Tang, Pang-Ning, Steinbach, Michael dan Kumar, Vipin, 2006, CSE User Home Pages. Introduction To Data Mining. [Dikutip:15 Oktober 2010] http://www-users.cs.umn.edu /~kumar/dmbook/index.php.
Guha, Sudipto, Rastogi, Rajeev dan Shim, Kyuseok, 1998, CURE: An Efficient Clustering Algorithm for Large Databases. Stanford : SIGMOD, Vol. 27.
Almeida, J.A.S., et al., 2007, Improving hierarchical cluster analysis: A new method with outlier detection and automatic clustering. Coimbra : Science Direct, Chemometrics and Intelligent Laboratory Systems, hal. 208-217.
Wikipedia. k-d tree. Wikipedia. [Online] Wikipedia, 2011. [Dikutip: 10 Februari 2011.] http://en.wikipedia.org/wiki/K-d_tree.
Chandran, Sharat, 2002, Data Structures: Spring. Department of Computer Science. [Online] 2002. [Dikutip: 22 Maret 2011.] http://www.cs.umd.edu/class/spring2002/cmsc420 -0401/.
Cormen, Thomas H., et al, 2001, Introduction to Algorithms, Second Edition. s.l. : The MIT Press, 2001. ISBN:0262032937.
Kovacs, Ferenc, Legany, Csaba dan Babos, Attila, 2005, Cluster Validity Measurement Techniques. Budapest : Department of Automation and Applied Informatics Budapest University of Technology and Economics.
Refbacks
- There are currently no refbacks.