Pada penelitian ini jumlah data dari aplikasi TikTok sebanyak 1742 data yang kami ambil dari Kaggle. Data tersebut telah kami lakukan tahap pre-processing data mengalami sedikit perubahan yakni sebanyak 1471 data. Hasil tersebut nantinya akan dilakukan tahapan pelatihan (training) dan pengujian (testing) untuk keperluan analisis sentimen menggunakan SVM.
Pada tahap pengkategorian data yang kami ambil dari kaggle sudah terdapat pemrosesan pelabelan data yang terdapat dua kategori diantaranya label positif dan negatif. Dari keseluruhan jumlah data, sebanyak 688 data memiliki nilai positif dan 774 data memiliki nilai negatif jika dihitung maka hasilnya 1462 data. Setelah di cleaning, data tersebut mengalami penghapusan dari 1472 data menjadi 1462 data. Maka, hasil dari analisis komentar TikTok terhadap kasus pembangunan IKN memperoleh nilai komentar negatif lebih banyak dibanding nilai positif. Berikut ini tampilan grafik diagram pada distribusi label.
Setelah dibuat visualisasi word cloud pada gambar Word Cloud positif dan gambar Word Cloud Negatif, banyaknya kata yang sering muncul untuk kategori positif ditemukan kata -kata seperti 'jokowi', 'ikn', 'indonesia', 'indah', menunjukkan adanya komentar positif dari masyarakat. Selanjutnya pada kategori negatif, terdapat kata -- kata 'ikn', '271 t', 'kalimantan' yang mengambarkan kecemasan dari masyarakat terhadap pembangunan IKN yang dianggap kurang perlu atau justru berkaitan dengan masalah korupsi negara.
Hasil dari pengklasifikasian data menjadi dua kategori, yaitu positif dan negatif, menunjukkan beberapa hal penting. Untuk kategori negatif, tingkat ketepatan prediksi (precision) adalah 0.78, yang berarti bahwa dari semua data yang diprediksi sebagai negatif oleh model, 78% Â di antaranya memang benar-benar negatif. Kemampuan model untuk menemukan semua data negatif yang sebenarnya (recall) adalah 0.85, menunjukkan bahwa model berhasil mengidentifikasi sebagian besar data negatif. Nilai F1-Score untuk kelas negatif adalah 0.81, yang merupakan gabungan antara precision dan recall, mengindikasikan keseimbangan yang baik dalam performa model untuk kategori negatif. Terdapat total 155 sampel dalam kelas negatif. Untuk kategori positif, tingkat ketepatan prediksi (precision) adalah 0.81, yang berarti bahwa 81% dari semua prediksi positif yang dibuat oleh model ternyata benar.
Kesimpulan
Dari hasil analisis mengenai Komentar TikTok kasus pembangunan proyek IKN yang berjumlah 1462 dapat diketahui bahwa mayoritas pandangan masyarakat memiliki hasil sentimen negatif lebih tinggi dengan persentase sekitar 52.94% dibanding dengan sentimen positif dengan persentase 46.95%, Pada model yang kami pakai menggunakan Support Vector Machine (SVM) menghasilkan tingkat akurasi mencapai 0.79 yang disertakan pada hasil precision 0.78, recall 0.85, dan f1-score 0.81 untuk label positif, sedangkan pada hasil precision 0.81, recall 0.72, dan f1-score 0.76 untuk label negatif. Hasil akurasi 79% ini diukur berdsarkan proses pengujian yang menggunakan rasio 80:20 menghasilkan 293 komentar yang memiliki 138 data positif dan 155 data negative. Sementara itu, model pada data latih tingkat akurasinya mencapai 95,3%.
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI