Model Hybrid CNN dan LSTM Berbasis BERT untuk Analisis Sentimen Terhadap Calon Presiden Indonesia 2024

Sedang Trending 1 bulan yang lalu
ARTICLE AD BOX

Abshor, Hasyimi Ulil and Dr. Umu Sa’adah, M.Si., (2024) Model Hybrid CNN dan LSTM Berbasis BERT untuk Analisis Sentimen Terhadap Calon Presiden Indonesia 2024. Sarjana thesis, Universitas Brawijaya.

Abstract

Pemilihan presiden di Indonesia adalah pemilihan umum yang dilakukan untuk memilih Presiden dan Wakil Presiden Republik Indonesia setiap lima tahun sekali. Berbagai metode kampanye dilakukan oleh masing-masing tim sukses, termasuk kampanye melalui media sosial. Informasi dari media sosial menjadi data untuk melakukan analisis sentimen yang dapat membantu dalam memahami sikap publik terhadap kandidat calon presiden. Model hybrid deep learning kombinasi arsitektur Long-Short Term Memory (LSTM) dan Convolutional Neural Network (CNN) dengan representasi teks berbasis Bidirectional Encoder Representations from Transformers (BERT) dapat diterapkan untuk tugas analisis sentimen. Data teks berupa tweet dikenai prapemrosesan berupa modifikasi, pembersihan, hot encoding, normalisasi, dan pembagian data. Selanjutnya, data teks diubah menjadi representasi numerik berbentuk vektor menggunakan IndoBERTBASE P2 yang dioptimalkan untuk bahasa Indonesia. Vektor tersebut menjadi input bagi model LSTM-CNN dan CNN-LSTM yang dirancang dan dilatih menggunakan framework TensorFlow. Terakhir, model diuji sehingga mendapatkan hasil evaluasi untuk setiap model. Hasil pengujian diperoleh akurasi terbaik tertinggi adalah CNN-LSTM dengan nilai 82,17% pada dataset Prabowo. Model CNN-LSTM pada dataset Ganjar memiliki presisi terbaik tertinggi sebesar 84%. Pada metrik recall, model CNN-LSTM, LSTM-CNN, dan CNN pada dataset Prabowo mencatatkan nilai terbaik 82%. Model CNN-LSTM dan LSTM-CNN menunjukkan performa terbaik untuk metrik F1-score yakni sebesar 82% pada dataset Prabowo. Secara keseluruhan, dapat disimpulkan bahwa model hybrid menunjukkan performa yang lebih baik dibandingkan dengan model non-hybrid berdasarkan hasil evaluasi keseluruhan metrik evaluasi.

English Abstract

The presidential election in Indonesia is a general election held every five years to elect the President and Vice President of the Republic of Indonesia. Various campaign methods are employed by each campaign team, including campaigns through social media. Information from social media serves as data for sentiment analysis, which can help in understanding public outlooks toward presidential candidates. A hybrid deep learning model that combines Long-Short Term Memory (LSTM) and Convolutional Neural Network (CNN) architectures with text representation based on Bidirectional Encoder Representations from Transformers (BERT) can be applied to sentiment analysis tasks. Text data in the form of tweets undergoes preprocessing, including modification, cleaning, hot encoding, normalization, and data splitting. Next, the text data is transformed into a numerical vector representation using IndoBERTBASE P2 which optimized for the Indonesian language. These vectors become the input for the LSTM-CNN and CNN-LSTM models, which are designed and trained using the TensorFlow framework. Finally, the models are tested to obtain evaluation results for each model. The best accuracy achieved is from the CNN-LSTM model, with an accuracy of 82,17% on the Prabowo dataset. The CNN-LSTM model on the Ganjar dataset shows the highest precision, at 84%. In the recall metric, the CNN-LSTM, LSTM-CNN, and CNN models on the Prabowo dataset record the best score of 82%. The CNN-LSTM and LSTM-CNN models exhibit the best performance for the F1-score metric, achieving 82% on the Prabowo dataset. Overall, it can be concluded that the hybrid model demonstrates better performance compared to the non-hybrid model based on the evaluation metrics.

[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Hasyimi Ulil Abshor.pdf
Restricted to Registered users only

Download (6MB)

Actions (login required)

View Item View Item
Selengkapnya
Sumber Repository UB
Repository UB