ARTICLE AD BOX
Zhafira, Nabila Hasna and Dwi Ayu Lusia, S.Si., M.Si (2024) “Perbandingan Klasifikasi Support Vector Machine dengan Pembobotan dan Tanpa Pembobotan Variabel Rekomendasi Pembenahan Terhadap Sentimen Toba Caldera Global Geopark”. Sarjana thesis, Universitas Brawijaya.
Abstract
Support Vector Machine (SVM) merupakan model klasifikasi yang dapat digunakan memodelkan analisis sentimen. SVM mampu mengolah data teks setelah dilakukan ekstraksi fitur menjadi representasi vektor numerik. Penelitian ini bertujuan untuk mengetahui hasil pelabelan sentimen dan kinerja klasifikasi dari model SVM berdasarkan dua model ekstraksi fitur yaitu tanpa pembobotan dan Term Frequency-Inverse Document Frequency (TF-IDF). Analisis dilakukan terhadap ulasan yang memenuhi setidaknya 1 dari 4 variabel saran pembenahan dari UNESCO untuk Toba Caldera UNESCO Global Geopark. Hasil pelabelan sentimen dengan VADER Lexicon menunjukkan imbalanced data dengan sentimen positif lebih dominan yaitu sebesar 89% dari seluruh ulasan sehingga dilakukan penanganan data sebelum membentuk model SVM. Evaluasi performa Model SVM tanpa TF-IDF menghasilkan akurasi sebesar 80% sedangkan dengan TFIDF sebesar 79.5%. Hal ini menunjukkan bahwa SVM tanpa pembobotan lebih tepat untuk data dengan fitur sedikit. Penelitian ini dapat memberikan wawasan bagi pengelola geopark untuk melakukan perbaikan berdasarkan data opini pengunjung dan penelitian lain dapat mempertimbangkan metode klasifikasi sentimen yang lebih efektif untuk penerapan di masa mendatang.
English Abstract
Support Vector Machine (SVM) is a classification model that can be used for sentiment analysis. SVM capable of processing text data type after feature extraction to represent it in numerical vector form. This study aims to gain knowledge about sentiment label and the classification performance of the SVM model based on two feature extraction models: one without term weighting and the other using Term Frequency-Inverse Document Frequency (TFIDF). The analysis focuses on reviews that meet at least one of the four UNESCO improvement criteria for the Toba Caldera UNESCO Global Geopark. Sentiment labeling using the VADER Lexicon shows imbalanced data with positive sentiment dominating at 89% of all reviews, prompting data handling before building the SVM model. The performance evaluation of the SVM model without TF-IDF achieved an accuracy of 79.5%, while with TF-IDF, it achieved 80%. This study’s findings provide insights for geopark managers to make improvements based on visitor opinions, and future research can consider more effective sentiment classification methods for broader applications.
![]() |
Text (DALAM MASA EMBARGO)
Nabila Hasna Zhafira.pdf Restricted to Registered users only Download (8MB) |
Actions (login required)
![]() |
View Item |