IMPLEMENTASI METODE HIERARCHICAL CLUSTERING PADA DATA GENETIK MIKROARRAY

Humasak T.A. Simanjuntak

Abstract


Teknologi Mikroarray menghasilkan data genetik mikroarray, yang jumlahnya akan semakin banyak dari hari ke hari. Jika dikelola dengan baik, data genetik mikroarray yang dihasilkan akan sangat bermanfaat dalam bidang kesehatan. Namun, jumlah data yang terus bertambah akan mempersulit dalam pengambilan informasi yang berguna. Pada kajian ini, data genetik mikroarray dikelola dengan menggunakan metoda Agglomerative Hierarchical Clustering. Dengan metoda ini, data genetik mikroarray dikelompokkan ke dalam clusteringclustering. Gen-gen dengan ekspresi gen yang mirip akan dikelompokkan ke dalam satu clustering. Hasil metoda Agglomerative Hierarchical Clustering adalah dendogram yang menggambarkan clustering-clustering dan hubungan antar clustering tersebut. Algoritma yang digunakan pada Hierarchical Clustering adalah Hierarchical Clustering Algorithm. Pada algoritma ini dibutuhkan Proximity Matrix yang menyajikan jarak antar gen. Jarak antar gen dapat dihitung dengan menggunakan tiga fungsi yaitu Euclidean Distance, Manhattan Distance dan Pearson Correlation. Gen–gen dengan jarak terdekat akan digabungkan dalam satu clustering. Untuk menghitung jarak antar cluster yang baru terbentuk dengan gen-gen lain dapat digunakan tiga algoritma yaitu Single Linkage, Complete Linkage dan Average Linkage. Clustering yang dihasilkan dengan menggunakan algoritma penghitungan jarak antar clustering yang berbeda, akan mempengaruhi kepadatan hasil clustering dan kesamaan hasil clustering.


Full Text:

PDF

References


http://compbio1.utmem.edu/MSCI814/Module10.htm, Yan Cui: “Module 10: Microarray Data Analysis I”, 27 Februari 2009

J. Han and K Micheline, Data Mining Concepts and Technique, Morgan Kaufmann, 2001.

L, Rosni, Studi dan Implementasi Teknik Clusteringing untuk Data Genetik Microarray, Institut Teknologi Bandung, 2007.

http://home.dei.polimi.it/matteucc/Clustering/,S.C.Johnson: “Hierarchical Clustering Algorithm”, 23 Maret 2009.

http://www.improvedoutcomes.com/index.html/: “Euclidean”, 6 Mei 2009.

Korol Abraham: ”Microarray Cluster Analysis and Application”, 2009.

http://www.improvedoutcomes.com/index.html/ : “Pearson Correlation and Pearson Squared”, 6 Mei 2009.


Refbacks

  • There are currently no refbacks.