Abstract
Social media has evolved into a prominent public space for virtual criticism, particularly on platforms like Twitter, facilitated by widespread smartphone usage. Netizens utilize Twitter as an effective communication channel due to its accessibility and vast reach. This study focuses on sentiment analysis of comments from the public on Twitter, aiming to expedite the acquisition of accurate information about the general sentiment towards JNE (a logistics company). The K-Nearest Neighbor (KNN) classifier is employed, employing the TF-IDF weighting method to classify Indonesian language comments and assess the achieved accuracy.
Highlights:
- Study focused on sentiment analysis of Twitter comments concerning JNE services using the K-Nearest Neighbor (KNN) method with Indonesian language text.
- Employed the TF-IDF weighting to classify comments and achieved an impressive 90% accuracy in sentiment analysis.
- The obtained classification proves valuable in evaluating public perception of JNE's services based on feedback from the social media community on Twitter.
Pendahuluan
PT. Tiki Jalur Nugraha Eka Kurir atau biasa disebut JNE Express merupakan salah satu perusahaan penyedia jasa pengiriman barang terbesar dengan jaringan terluas di Indonesia. Lingkup bisnis yang di jalani oleh PT. JNE EXPRESS adalah pengiriman (courier), penyimpanan dan pendistribusian (logistic and distribution), transportasi (moving, trucking, air sea cargo), (custom clereance), penjemputan bandara (escort service), pengiriman uang (money transfer). Semakin banyaknya peminat pengguna layanan tersebut semakin banyak pula opini yang didapatkan dari masyarakat, baik itu tentang fasilitas ataupun lainnya.
Media sosial telah menjadi ruang publik tanpa batas ruang dan waktu yang ditandai dengan banyaknya penggunaan smartphone terutama Twitter. Netizen menggunakan sebagai sarana komunikasi yang efektif karena sangat mudah dalam penggunaannya. Sekali klik, jutaan netizen yang terhubung dapat melihat dengan mudah tanpa batas . Hasil opini masyarakat tersebut dapat digunakan sebagai data untuk analisa sentimen yang berupa komentar dan dijadikan bahan untuk analisa teks mining. Dengan data teks komentar tersebut terdapat berbagai macam opini yang diberikan oleh masyarakat melalui media sosial contohnya seperti di media sosial twitter. PT Tiki Jalur Nugraha Eka Kurir (JNE) memproyeksikan pertumbuhan pengiriman paket hingga akhir tahun 2022 dapat konsiten sekitar 30%-40%. Optimisme ini didukung oleh perkembangan e-commerce yang begitu signifikan, sehingga dapat turut meningkatkan permintaan pengiriman paket ke depan .
JNE mempunyai akun resmi di twitter yaitu bernama JNE Express, dalam akun tersebut terdapat berbagai tweet dan komentar masyarakat yang telah diberikan, sehingga perlu adanya teknologi yang tepat untuk melakukan analisa sentimen. Metode yang dapat digunakan untuk analisa sentimen adalah metode KNN. Keuntungan menggunakan metode ini yaitu tangguh terhadap training data yang noisy dan efektif apabila datanya besar serta metode yang mudah dipahami dan mudah diimplementasikan. Penelitian ini bertujuan untuk mempermudah dalam memperoleh informasi yang lebih akurat tentang mood media massa, dan hasil informasi tersebut lebih akurat jika layanan yang diberikan negatif, positif dan netral.
Berdasarkan latar belakang diatas, penulis mengusulkan penelitian yang akan dibahas yaitu tentang Analis Sentimen Komentar Terhadap JNE Menggunakan Metode K-Nearest Neighbor (KNN) pada Media Sosial Twitter menggunakan 100 data.
PT. Tiki Jalur Nugraha Eka Kurir didirikan oleh H. Soeprapto Suparno pada tanggal 26 November 1990. Perusahaan ini merupakan divisi dari PT Citra van Titipan Kilat (TIKI) yang bertugas untuk mengelola jaringan kurir internasional. Berawal dari delapan orang dan modal 100 juta rupiah, JNE memulai usahanya yang terpusat pada penanganan kegiatan kepabeanan, impor kiriman barang, dokumen serta pengantarannya dari luar negeri ke Indonesia .
Twitter merupakan sebuah layanan jejaring sosial dan bisa disebut juga microblog daring yang memungkinkan penggunanya untuk berkirim dan membaca pesan berbasis teks yang tidak lebih dari 280 karakter dalam sebuah tweet .
Analisa sentimen bagian dari opinion mining merupakan proses memahami, mengestrak dan mengelolah data tekstual yang secara otomatis untuk memperoleh sebuah informasi. Analisa sentimen sering disebut juga opinion mining (penambangan opini) adalah koputasi untuk mengenali dan mengekspresikan opini, sentimen evaluasi, sikap, emosi, subjektifitas, penilaian serta pandangan dalam suatu teks [6].
Database atau basis data adalah kumpulan dari beberapa informasi yang disimpan di dalam komputer secara sistematik sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi dari basis data tersebut [7].
Flowchart merupakan penggambaran secara grafik dari langkah-langkah dan urutan prosedur suatu program. Biasanya mempengaruhi penyelesaian masalah yang khusunya perlu dipelajari dan dievaluasi lebih lanjut [8].
Python merupakan salah satu bahasa pemrograman yang banyak digunakan oleh perusahaaan besar maupun para developer untuk mengembangkan berbagai macam aplikasi berbasis desktop, web dan mobile. Python diciptakan oleh Guido van Rossum di Belanda pada tahun 1990 dan namanya diambildari acara televisi kesukaan Guido Monty Python’s Flying Circus. Van Rossum mengembangkan Python sebagai hobi, kemudian Python menjadi bahasa pemrograman yang dipakai secara luas dalam industri dan pendidikan karena sederhana, ringkas, sintak sintuitif dan memiliki pustaka yang luas [9].
JNE
PT. Tiki Jalur Nugraha Eka Kurir didirikan oleh H. Soeprapto Suparno pada tanggal 26 November 1990. Perusahaan ini merupakan divisi dari PT Citra van Titipan Kilat (TIKI) yang bertugas untuk mengelola jaringan kurir internasional. Berawal dari delapan orang dan modal 100 juta rupiah, JNE memulai usahanya yang terpusat pada penanganan kegiatan kepabeanan, impor kiriman barang, dokumen serta pengantarannya dari luar negeri ke Indonesia [4].
Twitter merupakan sebuah layanan jejaring sosial dan bisa disebut juga microblog daring yang memungkinkan penggunanya untuk berkirim dan membaca pesan berbasis teks yang tidak lebih dari 280 karakter dalam sebuah tweet [5].
Analisa Sentimen
Analisa sentimen bagian dari opinion mining merupakan proses memahami, mengestrak dan mengelolah data tekstual yang secara otomatis untuk memperoleh sebuah informasi. Analisa sentimen sering disebut juga opinion mining (penambangan opini) adalah koputasi untuk mengenali dan mengekspresikan opini, sentimen evaluasi, sikap, emosi, subjektifitas, penilaian serta pandangan dalam suatu teks [6]
Database
Database atau basis data adalah kumpulan dari beberapa informasi yang disimpan di dalam komputer secara sistematik sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi dari basis data tersebut [7]
Flowchart
Flowchart merupakan penggambaran secara grafik dari langkah-langkah dan urutan prosedur suatu program. Biasanya mempengaruhi penyelesaian masalah yang khusunya perlu dipelajari dan dievaluasi lebih lanjut [8].
Python
Python merupakan salah satu bahasa pemrograman yang banyak digunakan oleh perusahaaan besar maupun para developer untuk mengembangkan berbagai macam aplikasi berbasis desktop, web dan mobile. Python diciptakan oleh Guido van Rossum di Belanda pada tahun 1990 dan namanya diambildari acara televisi kesukaan Guido Monty Python’s Flying Circus. Van Rossum mengembangkan Python sebagai hobi, kemudian Python menjadi bahasa pemrograman yang dipakai secara luas dalam industri dan pendidikan karena sederhana, ringkas, sintak sintuitif dan memiliki pustaka yang luas [9].
Text Mining
Text mining adalah sebuah proses yang digunakan untuk mengeksplorasi data berupa teks, dimana sumber data tersebut biasanya didapatkan dari dokumen [10]. Text Mining bertujuan untuk menemukan informasi berharga yang tersembunyi baik dari sumber informasi terstruktur dan tidak terstruktur. Text Mining merupakan suatu penemuan baru yang sebelumnya informasinya tidak diketahui. Informasi yang diekstrak dari berbagai sumber daya tertulis dilakukan secara otomatis. Elemen kuncinya adalah menghubungkan beberapa informasi yang diekstraksi menjadi satu sehingga dapat membentuk fakta baru atau hipotesis baru untuk dieksplorasi lebih lanjut [11]. Tugas text mining antara lain, pengkategorian teks (text categorization) dan pengelompokan teks (text clustering).
Metodologi Penelitian
Pengklasifikasi K-Nearest Neighbor (KNN) dapat di klasifikasikan dengan mempelajari “kumpulan dari model contoh dokumen yang sebelumnya diklasifikasikan” Dengan pembobotan TF-IDF dalam mengklasifikasikan komentar pada sebuah teks bahasa Indonesia dan mengetahui seberapa besar akurasi yang didapatkan.
Langkah-langkah proses analisis metode sentiment:
Data berupa teks sebanyak 100 komentar yang diambil dari akun resmi PT. Tiki Jalur Nugraha Eka Kurir (JNE) yang bersumber dari media sosial twitter.
Dalam table dibawah ini merupakan 10 contoh dokumen yang telah didapatkan peneliti dari twitter. Data ini telah peneliti klasifikasi secara manual sebagai contoh perhitungan manual:
No | Text | Klasifikasi |
---|---|---|
1. | ngirim pake jne trucking lama banget dah | Negatif |
2. | kami melayani kiriman anda sampai ke penjuru nusantara dan pelosok desa... percayakan pada JNE Juanda Depok saja yukk. | Positif |
3. | @JNECare Iya parah tuh, punya saya juga dr jakarta kr bandung, dr hari sdh 8 hari gk nyampe | Negatif |
4. | @JNECare Iya respon yanh menyatakan 3-6 hari? Padahal paket saya udah dari tanggal 5? Ini tanggalan JNE yang beda | Negatif |
5. | Manfaatkan layanan jemput gratis dari JNE Kalimantan Blitar, Mudah dan Praktis.#JNEBLITAR | Positif |
6. | Packing dirusak kek gini maksudnya apa ya? Mana barangnya diambil sendiri di gudang, dah 5hari ga diantar @JNE_ID | Negatif |
7. | @Audioford1 selamat siang kak, maaf atas ketidaknyamanannya. terkait kendala yang terjadi dibantu tim @JNECare ya kak | Positif |
8. | JNE lama dan tidak membantu, paket sudah 14 hari tidak bergerak tapi setiap hubungi CS selalu diminta tunggu | Negatif |
9. | Bila tim pick up JNE Juanda Depok kurang berkenan atau kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti,terima kasih | Positif |
10. | @JNECare tolong liat pesan saya ini email sy gk drespon,paket saya salah alamt krn jne salah input alamat ini gmnaa!! | Negatif |
Preprocessing
Tahap ini merupakan tahap membersihkan kata sebelum diolah lebih lanjut pada tahap berikutnya. Tahap preprocessing sangat penting, karena pada tahap ini semua perubahan kata akan memiliki nilai sendiri yang mempengaruhi akurasi sistem yang akan dibuat nantinya. Berikut tahapan Preprocessing:
Case Folding
Tahapan Case Folding merupakan sebuah proses yang digunakan untuk pengubahan teks yang berhuruf kapital menjadi huruf kecil dan hanya digunakan untuk huruf ‘a’ sampai dengan ‘z’ yang diterima. Selain karakter huruf dihilangkan dan dianggap pembatas.
No | Input | Output |
1. | ngirim pake jne trucking lama banget dah | ngirim pake jne trucking lama banget dah |
2. | kami melayani kiriman anda sampai ke penjuru nusantara dan pelosok desa... percayakan pada JNE Juanda Depok saja yukk. | kami melayani kiriman anda sampai ke penjuru nusantara dan pelosok desa... percayakan pada jne juanda depok saja yukk. |
3. | @JNECare Iya parah tuh, punya saya juga dr jakarta kr bandung, dr hari sdh 8 hari gk nyampe | @jnecare iya parah tuh, punya saya juga dr jakarta kr bandung, dr hari sdh 8 hari gk nyampe |
4. | @JNECare Iya respon yanh menyatakan 3-6 hari? Padahal paket saya udah dari tanggal 5? Ini tanggalan JNE yang beda | @jnecare iya respon yanh menyatakan 3-6 hari? padahal paket saya udah dari tanggal 5? ini tanggalan jne yang beda |
5. | Manfaatkan layanan jemput gratis dari JNE Kalimantan Blitar, Mudah dan Praktis.#JNEBLITAR | manfaatkan layanan jemput gratis dari jne kalimantan blitar, mudah dan praktis.#jneblitar |
6. | Packing dirusak kek gini maksudnya apa ya? Mana barangnya diambil sendiri di gudang, dah 5hari ga diantar @JNE_ID | packing dirusak kek gini maksudnya apa ya? mana barangnya diambil sendiri di gudang, dah 5hari ga diantar @jne_id |
7. | @Audioford1 selamat siang kak, maaf atas ketidaknyamanannya. terkait kendala yang terjadi dibantu tim @JNECare ya kak | @audioford1 selamat siang kak, maaf atas ketidaknyamanannya. terkait kendala yang terjadi dibantu tim @jnecare ya kak |
8. | JNE lama dan tidak membantu, paket sudah 14 hari tidak bergerak tapi setiap hubungi CS selalu diminta tunggu | jne lama dan tidak membantu, paket sudah 14 hari tidak bergerak tapi setiap hubungi cs selalu diminta tunggu |
9. | Bila tim pick up JNE Juanda Depok kurang berkenan atau kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti,terima kasih | bila tim pick up jne juanda depok kurang berkenan atau kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti,terima kasih |
10. | @JNECare tolong liat pesan saya ini email sy gk drespon,paket saya salah alamt krn jne salah input alamat ini gmnaa!! | @jnecare tolong liat pesan saya ini email sy gk drespon,paket saya salah alamt krn jne salah input alamat ini gmnaa!! |
Tokenizing
Tahapan tokenizing merupakan tahapan proes untuk menguraikan deskripsi yang semulanya berupa kalimat-kalimat menjadi kata-kata dan menghilangakan delimiter seperti tanda titik (.), koma (,) dan spasi pada karakter kata pada sebuah kalimat tersebut:
No | Input | Output |
1. | ngirim pake jne trucking lama banget dah | ngirim pake jne trucking lama banget dah |
2. | kami melayani kiriman anda sampai ke penjuru nusantara dan pelosok desa... percayakan pada jne juanda depok saja yukk. | kami melayani kiriman anda sampai ke penjuru nusantara dan pelosok desa percayakan pada jne juanda depok saja yukk |
3. | @jnecare iya parah tuh, punya saya juga dr jakarta kr bandung, dr hari sdh 8 hari gk nyampe | jnecare iya parah tuh punya saya juga dr jakarta kr bandung dr hari sdh 8 hari gk nyampe |
4. | @jnecare iya respon yanh menyatakan 3-6 hari? padahal paket saya udah dari tanggal 5? ini tanggalan jne yang beda | jnecare iya respon yanh menyatakan 36 hari padahal paket saya udah dari tanggal 5 ini tanggalan jne yang beda |
5. | manfaatkan layanan jemput gratis dari jne kalimantan blitar, mudah dan praktis.#jneblitar | manfaatkan layanan jemput gratis dari jne kalimantan blitar mudah dan praktis jneblitar |
6. | packing dirusak kek gini maksudnya apa ya? mana barangnya diambil sendiri di gudang, dah 5hari ga diantar @jne_id | packing dirusak kek gini maksudnya apa ya mana barangnya diambil sendiri di gudang dah 5hari ga diantar jneid |
7. | @audioford1 selamat siang kak, maaf atas ketidaknyamanannya. terkait kendala yang terjadi dibantu tim @jnecare ya kak | audioford1 selamat siang kak maaf atas ketidaknyamanannya terkait kendala yang terjadi dibantu tim jnecare ya kak |
8. | jne lama dan tidak membantu, paket sudah 14 hari tidak bergerak tapi setiap hubungi cs selalu diminta tunggu | jne lama dan tidak membantu paket sudah 14 hari tidak bergerak tapi setiap hubungi cs selalu diminta tunggu |
9. | bila tim pick up jne juanda depok kurang berkenan atau kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti,terima kasih | bila tim pick up jne juanda depok kurang berkenan atau kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti terima kasih |
10. | @jnecare tolong liat pesan saya ini email sy gk drespon,paket saya salah alamt krn jne salah input alamat ini gmnaa!! | jnecare tolong liat pesan saya ini email sy gk dresponpaket saya salah alamt krn jne salah input alamat ini gmnaa |
Filtering / Stopword Removal
Stopword Removal adalah proses menghilangkan kata yang tidak penting, guna merampingkan perhitungan terhadap suatu dokumen. Penghilangan kata pada tahap ini misalnya pada kata ‘di’, ‘ada’, ‘ketika’ dll. Karena dokumen pada twitter merupakan data yang sangat tidak terstruktur, sehingga untuk memproses bagian ini harus ditambahkan list kata tambahan. Berikut merupakan contoh table luaran proses stopword removal:
No | Input | Output |
1. | ngirim pake jne trucking lama banget dah | ngirim pake jne trucking lama banget |
2. | kami melayani kiriman anda sampai ke penjuru nusantara dan pelosok desa percayakan pada jne juanda depok saja yukk | kami melayani kiriman anda sampai penjuru nusantara pelosok desa percayakan jne juanda depok saja yukk |
3. | jnecare iya parah tuh punya saya juga dr jakarta kr bandung, dr hari sdh 8 hari gk nyampe | jnecare parah tuh punya saya juga dr jakarta kr bandung dr hari sdh 8 hari gk nyampe |
4. | jnecare iya respon yanh menyatakan 36 hari padahal paket saya udah dari tanggal 5 ini tanggalan jne yang beda | jnecare respon yanh menyatakan 36 hari padahal paket saya udah tanggal 5 tanggalan jne beda |
5. | manfaatkan layanan jemput gratis dari jne kalimantan blitar mudah dan praktis jneblitar | manfaatkan layanan jemput gratis jne kalimantan blitar mudah praktis jneblitar |
6. | packing dirusak kek gini maksudnya apa ya mana barangnya diambil sendiri di gudang dah 5hari ga diantar jneid | packing dirusak kek gini maksudnya mana barangnya diambil sendiri gudang dah 5hari ga diantar jneid |
7. | audioford1 selamat siang kak maaf atas ketidaknyamanannya terkait kendala yang terjadi dibantu tim jnecare ya kak | audioford1 selamat siang kak maaf atas ketidaknyamanannya terkait kendala terjadi dibantu tim jnecare kak |
8. | jne lama dan tidak membantu paket sudah 14 hari tidak bergerak tapi setiap hubungi cs selalu diminta tunggu | jne lama membantu paket sudah 14 hari bergerak tapi setiap hubungi cs selalu diminta tunggu |
9. | bila tim pick up jne juanda depok kurang berkenan atau kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti,terima kasih | bila tim pick up jne juanda depok kurang berkenan kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti terima kasih |
10. | jnecare tolong liat pesan saya ini email sy gk dresponpaket saya salah alamt krn jne salah input alamat ini gmnaa | jnecare tolong liat pesan saya email sy gk dresponpaket saya salah alamt krn jne salah input alamat gmnaa |
Stemming
Proses Stemming merupakan mengubah kata yang berimbuhan menjadi kata dasar, pada tahap ini peneliti menggunakan library dari sastrawi untuk melakukan perubahan pada kata berikut:
No | Input | Output |
1. | ngirim pake jne trucking lama banget | kirim pake jne trucking lama banget |
2. | kami melayani kiriman anda sampai penjuru nusantara pelosok desa percayakan jne juanda depok saja yukk | kami layan kirim anda sampai penjuru nusantara pelosok desa percaya jne juanda depok saja yukk |
3. | jnecare iya parah tuh punya saya juga dr jakarta kr bandung dr hari sdh 8 hari gk nyampe | jnecare parah tuh punya saya juga dr jakarta kr bandung dr hari sdh 8 hari gk nyampe |
4. | jnecare iya respon yanh menyatakan 36 hari padahal paket saya udah tanggal 5 tanggalan jne beda | jnecare respon yanh nyata 36 hari padahal paket saya udah tanggal 5 tanggal jne beda |
5. | manfaatkan layanan jemput gratis jne kalimantan blitar mudah praktis jneblitar | manfaat layan jemput gratis jne kalimantan blitar mudah praktis jneblitar |
6. | packing dirusak kek gini maksudnya mana barangnya diambil sendiri gudang dah 5hari ga diantar jneid | packing rusak kek gini maksud mana barang ambil sendiri gudang dah 5hari ga antar jneid |
7. | audioford1 selamat siang kak maaf atas ketidaknyamanannya terkait kendala terjadi dibantu tim jnecare kak | audioford1 selamat siang kak maaf atas tidak nyaman kait kendala jadi bantu tim jnecare kak |
8. | jne lama membantu paket sudah 14 hari bergerak tapi setiap hubungi cs selalu diminta tunggu | jne lama bantu paket sudah 14 hari gerak tapi tiap hubung cs selalu minta tunggu |
9. | bila tim pick up jne juanda depok kurang berkenan kurang sopan dalam pelayanannya bisa mention kami utk ditindak lanjuti terima kasih | bila tim pick up jne juanda depok kurang kenan kurang sopan dalam layan bisa mention kami utk tindak lanjut terima kasih |
10. | jnecare tolong liat pesan saya email sy gk dresponpaket saya salah alamt krn jne salah input alamat gmnaa | jnecare tolong liat pesan saya email sy gk dresponpaket saya salah alamt krn jne salah input alamat gmnaa |
Pembobotan TF/IDF
Pembobotan kata yang peneliti gunakan disini adalah pembobotan TF-IDF. Menentukan kata kunci terlebih dahulu sebelum melakukan perhitungan. Berikut ini merupakan contoh penerapan TF pada data testing di dokumen.
D9 | bila tim pick up jne juanda depok kurang kenan kurang sopan dalam layan bisa mention kami utk tindak lanjut terima kasih |
---|
Berikut ini merupakan bentuk pencarian TF pada data testing dengan mencari kata yang muncul dalam dokumen.
bila | 1 |
tim | 1 |
pick | 1 |
up | 1 |
jne | 1 |
juanda | 1 |
depok | 1 |
kurang | 1 |
sopan | 1 |
dalam | 1 |
layan | 1 |
bisa | 1 |
mention | 1 |
kami | 1 |
utk | 1 |
tindak | 1 |
lanjut | 1 |
terima | 1 |
kasih | 1 |
Berikut ini adalah pencarian nilai TF dan DF pada data training,. nilai TF merupakan kata yang sering muncul pada dokumen sedangkan DF merupakan jumlah kata yang muncul dari dokumen. Di bawah ini contoh pencarian TF dan DF pada data training.
Terdapat sebagai contoh kata “dapet” muncul 2 kali pada D2 berarti TF D2 = 2, sedangkan nilai DF = 1 di karenakan DF hanya akan menghitung jumlah kata yang mewakili setiap dokumen, buatkan menghitung jumlah kata yang muncul dalam dokumen.
Menghitung Nilai IDF
Proses perhitungan idf menggunakan rumus (2.1). Dimana D merupakan jumlah dokumen dan DF merupakan dokumen frekuensi atau jumlah kata yang akan muncul pada setiap dokumen. Untuk mencari IDF bisa menggunakan rumus Log(D/DF). Contoh pada kata “terima” yang memiliki adalah D9 dan DF = 1. Maka bisa dihitung seperti berikut :
Tahap Klasifikasi
Berdasarkan tabel di atas untuk menentukan nilai tf idf dengan cara mengkalikan nilai tf dengan dengan nilai idf. Berikut ini sebagai contoh
Tahap ini merupakan tahap lanjutan dari tahap pembobotan yaitu tahapan nilai similaritas atau nilai kemiripan antara data testing dengan data training mengunakan algoritma KNN. Algoritma ini harus menentukan nilai k dan mengambil nilai kemiripan yang paling tinggi. Kemudian menyesuaikan dengan hasil kemiripan yang sesuai dengan nilai k. Berikut ini contoh perkalian data testing dengan data training
Tahap selanjutnya yaitu mencari penjang vektor dengan cara mengkalikan akar jumlah data testing sudah dikudratkan dan akar jumlah data training yang sudah dikuadratkan.
Selanjutnya yaitu mencari nilai jarak kemiripan, seperti contoh dibawah ini:
Berdasarkan tabel di atas untuk perhitungan Consine Similarity bisa dilihat seperti contoh di bawah ini:
Setelah perhitungan Consine Similarity selesai, selanjutnya mengurutkan dokumen dari nilai terbesar ke terkecil. lalu menentukan nilai k. Disini peneliti menggunakan nilai k = 3 nilai yang paling tinggi kemiripan dengan data testing, berikut penjelasan hasil klasifikasi:
Hasil Klasifikasi | ||||||||
1 | 2 | 3 | 4 | 6 | 7 | 8 | 9 | 10 |
D2 | D5 | D8 | D1 |
Dengan hasil kemiripan tersebut dapat di klasifikasikan bahwa D9 termasuk kelas (positif). Berikut ini percobaan dengan menambahkan nilai k dengan batasan angka ganjil.
Jika k = 1, maka D9 masuk ke kelas C1 (positif), diwakili oleh dokumen D2
Jika k = 3, maka D9 masuk ke kelas C2 (negatif), diwakili oleh dokumen D2, D5 dan D8
Jika k=5, maka D9 masuk ke kelas C1 (positif), diwakili oleh dokumen D2,D5,D8, dan D1.
Hasil dan Pembahasan
Proses pengambilan data dari API Twitter sekaligus menampilkan hasil sentimen dari komentar netizen.
Penambahan kolom untuk pelabelan difungsikan untuk mempermudah mengkategorikan positif, netral, negatif.
Data training diambil beberapa sebagai contoh untuk menguji data tersebut.
Pengambilan data testing sebanyak 20% dari total data keseluruhan.
Tahap ini merupakan tahap membersihkan kata sebelum diolah lebih lanjut pada tahap berikutnya. Tahap preprocessing sangat penting, karena pada tahap ini semua perubahan kata akan memiliki nilai sendiri yang mempengaruhi akurasi system yang akan dibuat nantinya.
Tahapan tokenizing merupakan tahapan proes untuk menguraikan deskripsi yang awalnya berupa kalimat-kalimat menjadi kata-kata dan menghilangkan delimiter seperti underscore (_), titik dua (:) dan spasi pada karakter kata pada sebuah kalimat.
Stemming mengubah kata yang berimbuhan menjadi kata dasar, pada tahap ini menggunakan library dari sastrawi untuk melakukan perubahan kalimat.
Proses menghilangkan kata yang tidak penting, guna merampingkan perhitungan terhadap suatu dokumen.
Proses menghitung jumlah kata yang akan muncul pada setiap dokumen.
Klasifikasi
Kesimpulan
Berdasarkan hasil penelitian yang telah diuraikan, dapat disimpulkan bahwa metode Klasifikasi K-Nearest Neighbor (KNN) dengan pembobotan TF-IDF mampu menghasilkan analisis sentimen terhadap komentar-komentar di Twitter terkait pelayanan JNE dengan akurasi yang tinggi, mencapai 90%. Temuan ini membuktikan bahwa penggunaan data komentar dari media sosial dapat digunakan sebagai sumber informasi yang relevan untuk memahami pandangan publik terhadap layanan suatu perusahaan. Implikasi dari penelitian ini adalah penerapan metode analisis sentimen pada platform media sosial dapat menjadi alat yang efektif bagi perusahaan seperti JNE untuk memantau dan mengevaluasi persepsi pelanggan serta meningkatkan kualitas pelayanan berdasarkan umpan balik yang diterima. Namun, penelitian ini juga memperlihatkan adanya potensi untuk peningkatan lebih lanjut, misalnya dengan menggunakan metode-metode klasifikasi lainnya, memperluas sampel data, atau mempertimbangkan konteks budaya dalam analisis sentimen. Oleh karena itu, penelitian lebih lanjut di bidang ini diharapkan dapat mengoptimalkan penggunaan analisis sentimen untuk kepentingan perusahaan dan meningkatkan pemahaman tentang opini publik melalui media sosial.
References
- S. Paleon, H. Harcici, and Y. Septian, “Pengiriman Kargo Untuk Mendukung Transaksi Pengiriman Barang Untuk Peningkatan Transaksi Biaya Pengiriman Lebih Efisien,” db, vol. 1, no. 1, pp. 7–14, May 2020, doi: 10.46484/db.v1i1.189.
- M. Christin and L. Rahayu, “Kritik Sosial Pada Media Sosial (Analisis Semiotika Pada Youtube ‘TV, Jasamu Tiada…’),” J-IKA : Jurnal Ilmu Komunikasi Fakultas Ilmu Komunikasi Universitas BSI Bandung, vol. 4, no. 1, pp. 36–46, Apr. 2017, doi: 10.31294/kom.v4i1.1789.
- F. A. Prasetyo, “Analisis Perbandingan Service Quality Antara JNE dan J&T Ekpress,” Journal:eArticle, Petra Christian University, 2017.
- “JNE,” Wikipedia bahasa Indonesia, ensiklopedia bebas. Jul. 20, 2023. Accessed: Jul. 25, 2023. [Online]. Available: https://id.wikipedia.org/w/index.php?title=JNE&oldid=23878471.
- A. Fadly, “Evaluative Language in the Discourse of Cebong Vs Kampret (‘Tadpole Vs Microbats') on Twitter,” Bahtera, vol. 19, no. 1, pp. 1–14, Jan. 2020, doi: 10.21009/bahtera.191.01.
- M. A. Ramdhani and O. N. Rahim, “Analisis sentimen untuk mengukur popularitas tokoh publik berdasar data pada media sosial twitter menggunakan algoritma data mining dengan teknik klasifikasi,” Informasi, vol. VI, no. 2, pp. 1–15, 2014.
- E. Helmud, “Optimasi Basis Data Oracle Menggunakan Complex View Studi Kasus : PT. Berkat Optimis Sejahtera (PT.BOS) Pangkalpinang,” J. Informanika, vol. 7, no. 1, pp. 80–86, 2021.
- F. F. Mailoa, “Analisis Sentimen Data Twitter Menggunakan Metode Text Mining Tentang Masalah Obesitas di Indonesia,” JISPH, vol. 6, no. 1, pp. 44–51, 2021, doi: 10.22146/jisph.44455.
- M. Romzi and B. Kurniawan, “Pembelajaran Pemrograman Python Dengan Pendekatan Logika Algoritma,” JTIM J. Tek. Inform. Mahakarya, vol. 03, no. 2, pp. 37–44, 2020.
- H. Hartanto, “Text mining dan sentimen analisis twitter,” J. Psikol. Ilm., vol. 9, no. 1, pp. 18–25, 2017.
- A. Firdaus and W. I. Firdaus, “Text Mining Dan Pola Algoritma Dalam Penyelesaian Masalah Informasi : (Sebuah Ulasan),” J. JUPITER, vol. 13, no. 1, p. 66, 2021.