EKSTRAKSI TF-IDF N-GRAM DARI KOMENTAR PELANGGAN PRODUK SMARTPHONE PADA WEBSITE E-COMMERCE

Sulis Mardianti, Muhammad Zidny Naf’an, Indra Hidayatulloh

Abstract


Jumlah pengguna internet di Indonesia meningkat pada tahun 2017 dengan jumlah 132,7 juta. Hal tersebut juga meningkatkan belanja online masyarakat Indonesia. Tingginya jumlah belanja online smartphone pada e-commerce dapat disebabkan karena fitur-fitur yang ada pada e-commerce, diantaranya adalah fitur komentar. Sebagian besar menyatakan memerlukan ringkasan fitur komentar yang berisi kriteria-kriteria smartphone sehingga memudahkan pelanggan menilai positif dan negatif kualitas produk yang akan dibeli. Ringkasan komentar yang digunakan adalah ringkasan komentar bahasa Indonesia yang berisi spesifikasi dari smartphone. Untuk mendapatkan kualitas komentar  yang baik maka dilakukan teknik preprocessing. Teknik preprosesing digunakan untuk menghilangkan noise data komentar yang sudah diperoleh. Cara untuk mengetahui jumlah term pada komentar adalah melalui proses perhitungan tf idf. Penggunaan fitur tf idf dapat memberikan informasi seberapa banyak kata tersebut muncul dalam dokumen yang sudah memiliki klasifikasi positif, negatif, dan netral pada masing-masing kriteria. Untuk memudahkan dalam melakukan perhitungan serta mengindari adanya kesalahan pada ekstrasi tf idf, maka digunakan N-Gram. Penggunaan N-Gram memberikan keuntungan karena hasil yang diperoleh menjadi lebih akurat dan lebih efektif.

 

Kata kunci: Bahasa Indonesia, Komentar, N-Gram, Preprocessing, Smartphone, TF IDF


Full Text:

PDF

References


A. H. Pratama, “Pertumbuhan Pengguna Internet di Indonesia Tahun 2016,” 2017. [Online]. Available: https://id.techinasia.com/pertumbuhan-pengguna-internet-di-indonesia-tahun-2016. [Accessed: 02-May-2017].

Kominfo, “klasifikasi produk yang dibeli secara online,” 2015. [Online]. Available: https://statistik.kominfo.go.id/site/data?idtree=430&iddoc=1457. [Accessed: 01-Jan-2017].

A. Buche, D. M. B. Chandak, and A. Zadgaonkar, “Opinion Mining and Analysis: A survey,” Int. J. Nat. Lang. Comput., vol. 2, no. 3, pp. 39–48, 2013.

R. Socher, J. Pennington, E. H. Huang, A. Y. Ng, and C. D. Manning, “Semi-Supervised Recursive Autoencoders for Predicting Sentiment Distributions,” no. ii, pp. 151–161, 2011.

B. Lu et al., “Multi-aspect Sentiment Analysis with Topic Models,” Proc. - IEEE Int. Conf. Data Min., pp. 81–88, 2011.

W. P. Singh V, Piryani R, Uddin A, “Sentiment analysis of movie reviews : A new feature-based heuristic for aspect-level sentiment classification Sentiment Analysis of Movie Reviews,” Proc. - 2013 IEEE Int. Multi Conf. Autom. Comput. Control. Commun. Compress. Sens., no. March, pp. 712–717, 2013.

A. F. Hidayatullah and A. Sn, “Analisis Sentimen dan Klasifikasi Kategori Terhadap Tokoh Publik Pada Twitter,” Semin. Nas. Inform. 2014, vol. 2014, no. August 2013, pp. 0–8, 2014.

E. Indrayuni, M. Wahyudi, S. Informasi, J. Selatan, I. Komputer, and J. Selatan, “Penerapan Character N-Gram Untuk Sentiment Analysis Review Hotel Menggunakan Algoritma Naive Bayes,” pp. 88–93, 2015.

I. Hidayatulloh and M. Z. Naf’an, “Metode MOORA dengan Pendekatan Price-Quality Ratio untuk Rekomendasi Pemilihan Smartphone,” Semin. Nas. Teknol. Inf. dan Apl. Komput., pp. 62–68, 2017.

W. Crawler, “Pentingnya Web Crawling sebagai Cara Pengumpulan Data di Era Big Data.”

A. Fauzi, “Text-Pre-Processing-v2,” 2016. [Online]. Available: malifauzi.lecture.ub.ac.id/files/2016/02/Text-Mining-and-IR.pptx. [Accessed: 08-May-2017].

Y. V. Yosnaningsih, “Klasifikasi Dokumen Bahasa Jawa Menggunakan Metode Naive Bayes,” Sanata Dharma University, 2015.


Refbacks

  • There are currently no refbacks.