Login
Section Innovation in Computer Science

Predictive Classification of Online Gambling Impacts in North Sulawesi Using Naive Bayes

Klasifikasi Prediktif Dampak Judi Online di Sulawesi Utara Menggunakan Naive Bayes
Vol. 26 No. 4 (2025): October:

Vito Ernesto Tameo (1), Medi Hermanto Tinambunan (2), Gladly C. Rorimpandey (3)

(1) Department of Informatics Engineering, Universitas Negeri Manado, Indonesia
(2) Department of Informatics Engineering, Universitas Negeri Manado, Indonesia
(3) Department of Informatics Engineering, Universitas Negeri Manado, Indonesia

Abstract:

General background: Online gambling has become a growing societal issue in Indonesia, affecting various economic and social dimensions. Specific background: North Sulawesi is identified as one of the most vulnerable regions, with a high volume of gambling transactions and significant social consequences. Knowledge gap: Previous studies in Indonesia have focused mainly on behavioral, legal, or health aspects, with limited use of predictive modeling to map community vulnerability. Aims: This study aims to analyze the social, economic, and psychological impacts of online gambling and to develop a predictive model using the Naive Bayes algorithm to classify impact levels. Results: Based on data from 504 respondents, the model achieved an accuracy rate of 94.05% in classifying impacts into light, moderate, and severe categories. Precision and recall were highest for light and severe categories, while moderate categories showed lower performance. Novelty: This research introduces a data-driven predictive approach within a regional Indonesian context, which has been underexplored in prior studies. Implications: The findings provide a practical foundation for regional governments to design targeted interventions, ranging from digital literacy programs to psychological rehabilitation services, based on data-driven risk classification.


Highlight:




  • The model achieved 94.05% accuracy in classifying online gambling impacts.




  • Regional data provided structured insights into social, economic, and psychological consequences.




  • Findings support evidence-based policymaking for targeted local interventions.




Keyword:
Online Gambling, Predictive Classification, Naive Bayes Algorithm, Social and Economic Impacts, North Sulawesi

Downloads

Download data is not yet available.

I. Pendahuluan

Kemajuan dari ilmu pengetahuan dan teknologi yang berkembang pesat pada saat ini telah menyebabkan berbagai perubahan dalam kehidupan manusia. Dengan kehadiran internet di zaman ini masyarakat lebih dapat berkreasi, dan bertindak dapat diekspresikan di dalamnya, kapanpun dan dimanapun. Selain itu dengan kehadirannya ini dapat juga membawa dampak negatif bagi masyarakat, terlebih kaum remaja yang belum mampu menyaring segala arus globalisasi terutama pengunaan internet.[1]

Game online yang awalnya hanya berupa permainan saja, kemudian dikembangkan menjadi sebuah media permainan yang dapat menghasilkan uang atau yang sering disebut dengan judi online. Para pengguna biasa mengakses situs-situs judi online seperti kaisarpoker, neng4d dan lainnya. Situs-situs seperti itu juga biasa dipromosikan lewat iklan-iklan daring.[1]

Dengan adanya judi online ini secara sosial mengakibatkan terjadinya pergeseran aktivitas sosial. Para pengguna judi online banyak menghabiskan waktu di platform judi online dan menjadikan diri mereka seperti pribadi yang introvert yakni menjauh dari keramaian.Selain itu judi online dapat berdampak terhadap ekonomi seseorang, akibat buruk dari judi online menjadikan diri mereka tidak bisa mengatur keuangan, bahkan ada juga yang sampai terlilit hutang.[2]

Judi online merupakan sebuah ketergantungan, dimana awalnya hanya ingin mencoba-coba dan memperoleh keuntungan sehingga mempunyai keinginan untuk mengulanginya dengan taruhan yang lebih besar dengan pemikiran yang awalnya hanya ingin mencobanya menjadi ketergantungan.[3]

Faktor-faktor yang mempengaruhi seseorang untuk mencoba judi online diantaranya seperti faktor sosial , faktor ekonomi, dan juga faktor belajar. Banyak yang beranggapan perjudian dapat lebih mudah mendatangkan uang serta memenuhi keinginan pribadi mereka, selain itu ada juga yang hanya ingin mencoba, tetapi dirinya berkeyakinan bahwa dirinya akan mendapatkan kemenangan yang tinggi.[3]

Judi online memiliki dampak negatif yang signifikan terhadap aspek sosial, ekonomi, dan psikologis masyarakat di Indonesia.Kecanduan judi online menyebabkan penurunan kondisi ekonomi rumah tangga, konflik keluarga, serta masalah kesehatan mental seperti stres dan depresi.[4]

Dari sudut pandang makroeonomi, perputaran dana yang terjadia pada aktivitas judi online di Sulawesi Utara memberikan dampak yang cukup kompleks. Secara mominal, jumlah yang yang beredar melalui transaksi judi online memang tinggi, namun aliran dana tersebut tidak memberikan nilai tambah nbagi perekonomian daerah. Hal ini disebabkan karena sebagian besar dana yang dipakai pemain tersalurkan ke platform digital yang beroperasi di luar wilayah bahkan d luar negeri, sehigga tidak masuk kembali ke sector-sektor produktif local seperti perdagangan, jasa, maupun usaha kecil menengah. Akibatnya, perekonomian daerah kehilangan potensi sirkulasi dana yang seharusnya dapat memperkuat konsumsi masyarakat dan mendorong pertumbuhan sektor riil. Selain sisi ekonomi, muncul pula beban sosial-ekonomi yang menekan masyarakat. Individu yang terjerat judi online cenderung mengalami ketidakstabilan keuangan, menurunnya produktivitas, dan peningkatan risiko hutang. Kondisi tersebut berimbas pada keluarga dan lingkungan sekitar, yang kemudian menimbulkan masalah sosial seperti konflik rumah tangga, tindak kriminal, maupun gangguan kesehatan mental. Dalam skala yang lebih luas, hal ini menjadi beban tambahan bagi pemerintah daerah karena harus menyediakan program penanganan sosial, layanan rehabilitasi, hingga alokasi anggaran untuk penegakan hukum. Dengan demikian, judi online bukan hanya masalah perilaku individu, melainkan fenomena yang melemahkan daya tahan ekonomi daerah serta memperbesar tekanan sosial di masyarakat.

Untuk menentukan suatu sistem pendukung keputusan dengan penerapan metode yang tepat untuk menentukan judi online, Algoritma Naïve Bayes Classifier adalah teknik yang efektif dan banyak digunakan dalam analisis data untuk melakukan klasifikasi berdasarkan probabilitas dalam konteks penelitian, algoritma ini dapat diterapkan untuk memprediksi kategori atau label dari data baru dengan mengandalkan data pelatihan yang telah ada sebelumnya.[5]

Keunggulan dari algoritma ini adalah kemampuannya dalam menangani dataset besar dengan efisiensi tinggi serta kecepatan dalam melakukan klasifikasi.[6]

Penggunaan Naïve Bayes Classifier dalam analisis data sangat menguntungkan karena beberapa alasan. Pertama, algoritma ini memiliki dasar probabilitas yang sederhana, membuatnya mudah untuk dipahami dan diimplementasikan. Kedua, Naïve Bayes dapat memberikan hasil yang baik bahkan dengan asumsi independensi antar fitur yang mungkin tidak selalu berlaku dalam kenyataan ini berarti bahwa meskipun ada interaksi antara variabel, algoritma ini tetap dapat memberikan prediksi yang akurat. Selain itu, Naïve Bayes sangat efisien dalam hal komputasi dan memerlukan waktu pelatihan yang relatif singkat, sehingga cocok untuk digunakan pada dataset besar.[7]

Penelitian mengenai judi online di Indonesia umumnya masih berfokus pada aspek sosial, hukum, atau kesehatan masyarakat, sedangkan pendekatan berbasis pemodelan prediktif belum banyak digunakan. Beberapa studi terdahulu lebih menekankan pada dampak perilaku individu atau kebijakan penanggulangan, namun jarang yang mengkaji bagaimana data dapat diolah menggunakan algoritma kecerdasan buatan untuk memetakan potensi risiko sosial dan ekonomi. Oleh karena itu, penelitian ini menghadirkan kebaruan dengan memanfaatkan algoritma Naïve Bayes sebagai alat prediksi untuk mengidentifikasi pola dampak judi online dikalangan masyarakat Sulawesi Utara.

Tujuan utama penelitian ini adalah menganalisis seberapa besar pengaruh judi online terhadap kondisi social ekonomi masyarakat serta membangun model prediksi yang dapat memberikan gambaran lebih terukut mengenai tingkat kerentanan yang ditimbulkan. Dengan memadukan data empiris dan pendekatan komputasional, penelitian ini berupaya memberikan kontribusi baru dalam ranah akademis, khusunya pada kajian ekonomi digital dan masalah social. Kebaruan penelitian ini terletak pada penggunaan metode prediktif yang belum banyak diterapkan dikonteks Indonesia., sehingga diharapkan dapat memperluas perspektif penelitian mengenai judi online sekaligus menawarkan landasan praktis bagi pengambil kebijakan dalam merumuskan strategi pencegahan maupun penanganan. Keunggulan pendekatan ini terletak pada kemampuannya memberikan estimasi probabilistik yang dapat membantu pemetaan resiko pada kelompok masyarakat yang berbeda. Selain itu, penelitian ini dilakukan di konteks regional Sulawesi Utara yang selama ini relative jarang disentuh oleh kajian akademik, sehingga hasilnya dapat memperkaya pemahaman tentang fenomena judi online di liar wilayah pusat. Dengan demikian, temuan penelitian ini tidak hanya menambah sudut pandang baru dari sisi metodologi, tetapi juga memperluas cakupan geografis penelitian sebelumnya yang cenderung bersifat umum atau nasional.

Berdasarkan latar belakang diatas, penelitian ini diberi judul, “Analisis Dampak Judi Online Di Kalangan Masyarakat Sulawesi Utara Menggunakan Algoritma Naïve Bayes”.

II. Metode

Metode yang akan digunakan untuk memperkirakan probabilitas dalam mengklasifikasikan dampak yang dihasilkan oleh judi online di kalangan masyarakat sulawesi utara diperlihatkan seperti Gambar 1.

Figure 1. Tahapan Penelitian

1. Tahapan Penelitian

Berikut adalah tahapan-tahapan penelitian yang akan dilakukan selama proses ini berjalan :

a. Pengumpulan Data

Penulis menyebarkan kuesioner di beberapa daerah di sulawesi utara seperti Tondano, Tomohon, Manado melalui google form agar data tersebut bisa diolah melalui microsoft excel.

b. Proses Implementasi

Tahap preprocessing data perlu dilakukan terlebih dahulu.Tahapan preprocessing ini dapat digambarkan dalam alur yang meliputi beberapa langkah berikut seperti pembersihan data (data cleaning ), transformasi data, dan pembagian data.

c. Penerapan Algoritma Naïve Bayes

Penerapan model Naive Bayes Classifier dilakukan berdasarkan model yang telah dikembangkan sebelumnya untuk memprediksi atribut atau kelas dari suatu data baru yang atribut atau kelasnya belum diketahui sebelumnya. Dalam konteks penelitian, model ini digunakan untuk menentukan dampak yang dialami masyarakat baik itu dampak ekonomi, sosial, atau psikologis, berdasarkan data yang dikumpulkan dari responden.

d. Akurasi Dan Validasi

Penggunaan metode Naive Bayes digunakan untuk memprediksi kemungkinan seseorang terdampak secara sosial, ekonomi, atau psikologis berdasarkan variabel-variabel tertentu, seperti usia, frekuensi bermain, status pekerjaan, hingga tingkat pengeluaran. Metode ini dipilih karena kemampuannya yang efisien dalam mengolah data dengan jumlah fitur yang banyak.

e. Pengembangan Prototype

Pengembangan prototipe dilakukan untuk mempermudah representasi hasil klasifikasi dampak judi online di Sulawesi Utara. Awalnya, data diolah di Excel, lalu dimodelkan dengan R Studio dan divisualisasikan melalui Shinyapp.io. Selanjutnya, prototipe akan dikembangkan menggunakan Python di Google Colab untuk analisis data yang lebih besar dan interaktif.

2. Waktu dan Tempat Penelititan

a. Waktu Penelitian

Penelitian ini dilakukan dari tanggal 10 November sampai 10 December 2024. Waktu itu dipilih untuk mengadakan penelitian karena waktu tersebut paling efektif bagi peneliti untuk mengadakan penelitian ini dan lebih berfokus pada penelitian.

b. Tempat Penelitian

Penelitian ini dilaksanakan di beberapa daerah di Sulawesi Utara, termasuk Tondano, Manado, dan Tomohon. Tempat penelitian dipilih dengan mempertimbangkan faktor kemudahan akses dan keberagaman latar belakang sosial ekonomi masyarakat.

c. Alat Dan Bahan

1. Alat Penelitian

Alat- alat penelitian yang digunakan peneliti dalam penelitian ini adalah sebagai berikut :

a. Kuesioner Untuk Survei

Kuesioner dirancang untuk mengumpulkan data kuantitatif dari responden. Pertanyaan dalam kuesioner mencakup demografi, frekuensi perjudian, jenis permainan yang dimainkan, serta dampak sosial dan ekonomi yang dirasakan oleh responden.

b. Laptop

Laptop digunakan sebagai alat untuk menjalankan program analisa data berupa bahasa pemrograman Python yang dijalankan pada browser Chrome.

2. Bahan Penelitian

Bahan – bahan penelitian yang digunakan peneliti dalam penelitian ini adalah sebagai berikut:

a. Literatur Tentang Judi Online

Buku, artikel, dan jurnal yang membahas aspek-aspek judi online, termasuk dampaknya terhadap masyarakat, regulasi hukum, serta perilaku pengguna. Literatur ini akan memberikan landasan teori yang kuat untuk penelitian.[8]

b. Library Python

Dalam penelitian ini, beberapa library Python digunakan untuk memproses dan menganalisis data.[9] Pandas digunakan untuk manipulasi dan analisis data, seperti membuat DataFrame dan menghitung frekuensi kategori. Seaborn digunakan untuk visualidsasi data, khususnya dalam membuat heatmap untuk menampilkan frekuensi kategori variable. Matplotlib.pylot mendukung pembuatan plop dan pengaturan tampilan grafik. Sckit learn (sklearn) digunakan untuk membangun model klasifikasi Naïve Bayes dengan algortma GaussianNB dan evaluasi model menggunakan metrics seperti accuracy acore. [10] NumPy digunakan untuk komputasi ilmiah dan manipulasi array multidimensi, mendukung operasi numeric dan statistic dalam penelitian ini.

III. Hasil dan Pembahasan

1. Pengumpulan Data

a. Penyebaran Kuesioner

Penyebaran Kuesioner bertujuan untuk mengumpulkan data dari responden di Tondano, Tomohon, Manado, dan setelah dilakukan penyebaran kuesioner, data yang berhasil didapatkan yaitu 504 data. Pemilihan sampel sebanyak 504 responden didasarkan pada pertimbangan teoritis dan kebutuhan penelitian. Merujuk pada Sugiyono (2019), semakin besar sampel, semakin kecil potensi kesalahan generalisasi, sementara tabel Krejcie dan Morgan (1970) merekomendasikan minimal 384 responden untuk populasi di atas 100.000. Dengan jumlah 504, penelitian ini tidak hanya melampaui batas minimal, tetapi juga mendukung penerapan algoritma Naïve Bayes yang membutuhkan dataset besar agar hasil prediksi akurat. Berikut adalah distribusi dari responden.

Figure 2. Distribusi Responden Berdasarkan Pekerjaan

Distribusi responden kuesioner menunjukkan keberagaman status pekerjaan. Sebagian besar responden adalah karyawan (33,9%), yang mungkin merasakan dampak judi online terkait dengan keseimbangan antara kerja dan aktivitas online. Kelompok kedua terbesar adalah mahasiswa dan pelajar (30,6%), yang lebih rentan terhadap gangguan judi online yang mempengaruhi studi dan kehidupan sosial. Kelompok pengangguran (20,6%) juga signifikan, karena mereka memiliki lebih banyak waktu luang untuk berjudi, yang memengaruhi keuangan dan kesejahteraan mental. Kelompok "lainnya" (14,9%) mencakup wiraswasta atau pekerja lepas, yang juga terpengaruh oleh judi online. Secara keseluruhan, dampak 39 judi online dirasakan oleh berbagai kelompok masyarakat, tergantung pada status pekerjaan dan waktu luang mereka.

Figure 3. Distribusi kategori jawaban responden

Grafik Balloon Plot: Frekuensi Masing-masing Variabel Pernyataan menggambarkan distribusi responden terhadap pernyataan-pernyataan terkait judi online. Berdasarkan grafik, terlihat bahwa lebih banyak responden yang mengakui pernah terlibat dalam judi online, dengan jumlah yang sangat setuju (349 orang) lebih tinggi dibandingkan yang sangat tidak setuju (118 orang). Sebagian besar responden juga mengetahui judi online melalui lingkungan sekitar mereka, dengan mayoritas berada pada kategori "Setuju" (173 responden). Mengenai durasi terlibat dalam judi online, sebagian besar responden mengaku telah bermain lebih dari satu tahun, dengan dominasi pada kategori "Setuju" (173 orang).

Berikut ini total skor yang kemudian dikonversikan ke dalam kelas kategori berikut.

Total skor Kategori dampak Deskripsi
15 – 30 Ringan Tidak terdapat dampak berarti pada kehidupan. Responden tetap mampu mengelola waktu dan keuangan dengan baik.
31 – 45 Sedang Mulai muncul beberapa permasalahan sosial dan keuangan. Responden mengalami kesulitan dalam mengatur waktu dan anggaran.
46 – 60 Berat Dampaknya sangat merugikan, meliputi masalah keuangan yang berat, gangguan kesehatan mental, serta terganggunya pekerjaan atau hubungan sosial.
Table 1. Klasifikasi Dampak Berdasarkan Skor

Berdasarkan tabel klasifikasi dampak berdasarkan skor, responden dengan total skor 15-30 dikategorikan mengalami dampak ringan, yang berarti aktivitas judi online belum memberikan pengaruh signifikan terhadap kehidupan sehari-hari. Mereka masih dapat mengandalkan waktu, keuangan, serta hubungan social secara relative stabil. Responden dengan skor 31-45 termasuk kategori sedang, dimana mulai terlihat munculnya kesulitan dalam mengatur waktu dan keuangan, serta mulai timbul tanda-tanda gangguan social yang perlu diwaspadai. Sementara itu, skor 45-60 menunjukkan kategori berat, yang mengindikasikan bahwa responden mengalami dampak serius, seperti maslaha keuangan yang parah, tekanan psikologis, dan terganggunya produktivitas maupun relasi social. Hal ini memperlihatkan bahwa semakin tinggi skor yang diperoleh responden, semakin besar pula tingkat kerentnan dan konsekuensi negative yang dialami akibat keterlibatan dalam judi online

2. Proses Implementasi

a. Pembersihan Data (Data Cleaning)

Pada tahap pra-pemrosesan data, langkah pertama adalah menghapus duplikasi yang bisa terjadi karena responden mengisi kuesioner tidak lengkap atau kesalahan pengumpulan data. Selanjutnya, untuk menangani missing data, nilai hilang diisi dengan rata-rata untuk data numerik atau modus untuk data kategorikal. Jika missing data terlalu banyak, entri tersebut dihapus. Dari 518 data yang tercatat, setelah pembersihan, diperoleh 504 data yang valid.

b. Transformasi Data

Transformasi data dilakukan dengan mengubah jawaban responden yang menggunakan skala kategorikal menjadi format numerik[11]: 1 untuk "Sangat Tidak Setuju", 2 untuk "Tidak Setuju", 3 untuk "Setuju", dan 4 untuk "Sangat Setuju". Hal ini memungkinkan data dianalisis lebih lanjut dengan algoritma yang memerlukan data numerik.

Figure 4. Transformasi Data Teks ke Numerik Untuk Proses Kategorisasi Nilai Y

c. Pembagian Data

Dalam penelitian ini, set pelatihan digunakan untuk melatih model mengenali pola dalam data, sedangkan set pengujian untuk mengevaluasi kinerjanya. Pembagian ini membantu mencegah overfitting dan memastikan model dapat menggeneralisasi dengan baik pada data baru, memberikan hasil yang lebih dapat diandalkan. Dengan total 504 data, 80% (sekitar 403 data) digunakan untuk pelatihan dan 20% (sekitar 101 data) untuk pengujian.

3. Penerapan Algoritma Naïve Bayes Classifier

Algoritma ini mengandalkan Bayes Theorem untuk menghitung probabilitas kelas (dampak judi online) berdasarkan fitur-fitur dalam dataset. Naïve Bayes dipilih karena efektif dalam menangani klasifikasi dengan fitur yang saling independen.[12] Dataset yang digunakan berisi variabel terkait perilaku judi online, seperti tingkat kecanduan, frekuensi perjudian, dampak sosial, dan faktor eksternal. Data dibagi menjadi dua bagian: 80% untuk data train dan 20% untuk pengujian. Model Naïve Bayes dilatih dengan data latih dan diuji menggunakan data uji untuk mengevaluasi akurasi prediksi. Metrik evaluasi yang digunakan mencakup akurasi, presisi, recall, dan F1-score untuk mengukur kinerja model. Pengerjaan ini menggunakan pendekatan modeling pada bahasa pemrograman Python. Beberapa library yang digunakan antara lain ialah

a. Pandas: Digunakan untuk manipulasi dan analisis data.

b. Seaborn: Digunakan untuk visualisasi data, khususnya dalam membuat grafik.

c. Matplotlib.pyplot: Digunakan untuk membuat plot dan mengatur tampilan grafik

d. Scikit-learn (sklearn) : Khususnya modul naive_bayes, yang menyediakan berbagai algoritma klasifikasi, termasuk Gaussian Naive Bayes (GaussianNB).

e. NumPy: Digunakan untuk komputasi ilmiah dan manipulasi array multidimensi. NumPy menyediakan fungsi-fungsi matematis dan statistik yang efisien.

Pada analisa data ini, tahapan yang dilakukan ialah dengan mulai mengimpor data dari datasource ke dalam sistem koding. Berikut terlampir proses impir data menggunakan google collab.

Figure 5. Proses impor data

Proses selanjutnya ialah melakukan analisa deskriptif dari data dengan tujuan untuk memberikan visualisasi dari sebaran responden dimana pada script ini ingin menjelaskan mengenai pembuatan visualisasi pie chart sebaran data profesi responden.

Figure 6. Script yang dijalankan untuk membuat visualisasi sebaran data pekerjaan responden

Figure 7. Pembangunan Model Naive Bayes

Model Naïve Bayes selanjutnya dibangun dengan menggunakan script pada gambar 4.9, dimana data train yang digunakan ialah sebanyak 80% data dan di tes dengan menggunakan data test 20%.

Berikut adalah perhitungan untuk kelas-kelas yang ada.

1. P(Y = 1) = Jumlah data dengan Y = 1 / Total data

2. P(Y = 2) = Jumlah data dengan Y = 2 / Total data

3. P(Y = 3) = Jumlah data dengan Y = 3 / Total data

Langkah kedua adalah menghitung probabilitas bersyarat untuk setiap fitur. Misalnya, untuk fitur X1, kita akan menghitung P(X1 = x1 | Y = 1), P(X1 = x1 | Y = 2), dan seterusnya. Probabilitas ini dihitung dengan membagi jumlah data dengan X1 = x1 dan Y = k, dengan jumlah data dengan Y = k.

1. P(X1 = 4 | Y = 1) = Jumlah data dengan X1 = 4 dan Y = 1 / Jumlah data dengan Y = 1

2. P(X2 = 3 | Y = 1) = Jumlah data dengan X2 = 3 dan Y = 1 / Jumlah data dengan Y = 1

3. P(X1 = 4 | Y = 2) = Jumlah data dengan X1 = 4 dan Y = 2 / Jumlah data dengan Y = 2

4. P(X2 = 3 | Y = 2) = Jumlah data dengan X2 = 3 dan Y = 2 / Jumlah data dengan Y = 2

5. P(X1 = 4 | Y = 3) = Jumlah data dengan X1 = 4 dan Y = 3 / Jumlah data dengan Y = 3

6. P(X2 = 3 | Y = 3) = Jumlah data dengan X2 = 3 dan Y = 3 / Jumlah data dengan Y = 3

Langkah ketiga adalah menghitung probabilitas posterior untuk setiap kelas dengan mengalikan probabilitas prior dan probabilitas bersyarat untuk setiap fitur. Misalnya, untuk kelas 1, kita akan menghitung P(Y = 1 | X1 = 4, X2 = 3, ...) = P(Y = 1) * P(X1 = 4 | Y = 1) * P(X2 = 3 | Y = 1) * ... Begitu juga untuk kelas-kelas lainnya.

1. P(Y = 1 | X1 = 4, X2 = 3, ..., X14 = x14) = P(Y = 1) * P(X1 = 4 | Y = 1) * ... * P(X14 = x14 | Y = 1)

2. P(Y = 2 | X1 = 4, X2 = 3, ..., X14 = x14) = P(Y = 2) * P(X1 = 4 | Y = 2) * ... * P(X14 = x14 | Y = 2)

3. P(Y = 3 | X1 = 4, X2 = 3, ..., X14 = x14) = P(Y = 3) * P(X1 = 4 | Y = 3) * ... * P(X14 = x14 | Y = 3)

Langkah terakhir adalah memilih kelas yang memiliki probabilitas posterior tertinggi. Kelas dengan nilai posterior tertinggi akan menjadi prediksi untuk data tersebut.

Kelas yang diprediksi = argmax(P(Y = k | X1 = x1, X2 = x2, ..., X14 = x14))

4. Akurasi Dan Validasi

Model Naïve Bayes yang diterapkan dalam penelitian ini untuk menganalisis dampak judi online di kalangan masyarakat Sulawesi Utara menunjukkan kinerja yang sangat baik dengan akurasi mencapai 94.05%. Akurasi ini mencerminkan bahwa model berhasil memprediksi dengan benar, 94.05% dari seluruh data uji, yang menunjukkan bahwa sebagian besar prediksi yang dihasilkan sesuai dengan kondisi nyata dari dampak judi online, baik pad akategori ringan, sedang, maupun berat. Hasil ini menunjukkan bahwa model Naïve Bayes memiliki kemampuan yang sangat baik dalam memprediksi kategori dampak berdasarkan fitur-fitur yang ada dalam dataset, termasuk frekuensi perjudian, dampak social, dan faktor ekternal lainnya.

Figure 8. Analisa akurasi model

Akurasi model yang telah terbangun dianalisa dengan menggunakan library sklearn.metric dengan modul accuracy_score. Kemudian ini menghasilkan data akurasi sebesari 0.9405 atau jika dipresentasejan mencapai 94.05%.

Selanjutnya, untuk mendapatkan nilai nilai parameter seperti nilai Precision, Recall, F-1 Score dan Support. Pada penelitian

Figure 9. Script Report Klasifikasi Parameter Penilaian Model Naive Bayes

Evaluasi model dilakukan dengan menggunakan classification report yang mencakup precision, recall, dan F1-score untuk setiap kategori.[13] Precision untuk kategori ringan mencapai 1.00, menunjukkan bahwa model sangat akurat dalam mengklasifikasikan individu dengan dampak ringan. Precision untuk kategori berat adalah 0.89, sedikit lebih rendah, mengindikasikan beberapa kesalahan klasifikasi. Precision untuk kategori sedang adalah 0.94, menunjukkan akurasi yang tinggi meskipun terdapat sedikit kesalahan.

Recall untuk kategori ringan dan berat sangat tinggi, masing-masing 0.97, menunjukkan kemampuan model yang baik dalam mendeteksi kedua kategori tersebut. Namun, recall untuk kategori sedang lebih rendah, yaitu 0.88, yang mengindikasikan adanya beberapa kesalahan dalam deteksi kategori ini.

F1-score untuk kategori ringan adalah 0.98, untuk kategori berat 0.93, dan untuk kategori sedang 0.91. Nilai F1-score yang tinggi untuk kategori ringan dan berat menunjukkan kinerja model yang baik, meskipun kategori sedang memiliki F1-score yang lebih rendah, mencerminkan tantangan dalam membedakan kategori ini.

Figure 10. Klasifikasi Report Dari Akurasi Model

Temuan dalam penelitian ini menunjukkan bahwa model Naïve Bayes berhasil mencapai akurasi 94.05% dalam memprediksi dampak judi online, baik dalam kategori ringan, sedang, maupun berat. Kinerja model ini menunjukkan bahwa model mampu membedakan dengan baik antara dampak ringan, sedang, dan berat pada masyarakat Sulawesi Utara. Jika dibandingkan dengan penelitian oleh Agif Septia Meswari dan Matnur Ritonga (2023), yang menemukan bahwa sebagian besar remaja menunjukkan kesadaran terhadap dampak negatif judi online pada penyimpangan perilaku amoral dan hukum, penelitian ini memiliki kesamaan dalam hal kesadaran masyarakat terhadap dampak judi. Namun, hasil penelitian ini lebih mengarah pada pengukuran dampak yang lebih terstruktur menggunakan teknik pemodelan data seperti Naïve Bayes, yang menghasilkan prediksi yang lebih spesifik dan berbasis data dibandingkan dengan survei langsung pada perilaku remaja.

Naïve Bayes dipilih dalam penelitian ini karena kemampuannya yang terbukti dalam menangani masalah klasifikasi dengan berbagai fitur yang saling independen.[14] Dalam konteks dampak judi online, algoritma ini mampu memberikan akurasi yang cukup tinggi dalam mengklasifikasikan dampak judi online, dengan tingkat akurasi mencapai 94,05%, Hal ini menunjukan bahwa Naïve Bayes dapat menjadi alat yang efektif untuk mengklasifikasikan dampak psikologis dan sosial dari judi online, berdasarkan data yang mencakup usia, frekuensi bermain, serta masalah sosial yang muncul.

5. Pengembangan Prototype

Sub bab ini membahas rancangan prototype model yang dikembangkan untuk mengolah serta menampilkan hasil penelitian dalam bentuk dashboard interaktif, sehingga data mengenai dampak judi online di Sulawesi Utara dapat disajikan secara visual, informatif, dan mudah dianalisis. Berikut ini tahapan pembangunan prototipe.[15]

a. Menentukan Struktur Dashboard

Prototype ini disusun dalam file .Rmd dengan format flexdashboard. Bagian ini menentukan bahwa dashboard akan berbentuk single-page dengan layout berbasis baris (orientation: rows) dan mendukung komponen interaktif melalui Shiny (runtime: shiny).

b. Persiapan Data

Dataset diambil dari file Excel bernama dataset (4).xlsx. Data kemudian diolah untuk memastikan formatnya sesuai. Misalnya, jika kolom target Y belum ada, sistem menambahkan variabel tersebut secara acak untuk simulasi model prediksi

c. Mapping Pertanyaan (X1-X13)

Setiap variabel kuesioner dipetakan ke dalam daftar questions. Hal ini memudahkan dalam membuat menu dropdown untuk pemilihan pertanyaan:

d. Pembuatan Model Naïve Bayes

Model Naive Bayes dipilih karena sederhana, mampu bekerja baik dengan data kategori, dan dapat memberikan interpretasi probabilitas prediksi. Nilai akurasi model dihitung untuk mengevaluasi seberapa baik model mampu mengklasifikasikan data uji.

e. Pembuatan Visualisasi

Dashboard menampilkan berbagai jenis grafik. Salah satu contohnya adalah distribusi pekerjaan responden menggunakan diagram pie. Visualisasi ini menunjukkan proporsi masing-masing kategori pekerjaan responden.

f. Heatmap Korelasi

Untuk melihat hubungan antar pertanyaan, dibuat matriks korelasi lalu divisualisasikan dalam bentuk heatmap.

Berikut ini merupakan hasil visualisasi dari prototipe yang telah dibangun, prototipe ini dibangun dengan menggunakan shinyapps.io.

Figure 11. Visualisasi prototipe dashboard

Hasil akhir dari prototype ini diwujudkan dalam bentuk dashboard interaktif yang mampu menyajikan informasi secara visual dan mudah dipahami.

Hasil klasifikasi model Naïve Bayes menunjukkan variasi tingkat dampak judi online yang dialami responden, mulai dari kategori ringan hingga berat. Temuan ini dapat dimanfaatkan pemerintah daerah sebagai dasar dalam merancang program pencegahan dan penanganan yang lebih terarah. Misalnya, masyarakat yang tergolong dalam kategori ringan dapat memberikan edukasi literasi digital, sosialisasi bahaya judi online serta penyediaan kegiatan alternative yang positif. Untuk kategori sedang, pemerintah dapat menyediakan program konseling, pendampingan manajemen keuangan, dan kegiatan social yang mendorong produktivitas. Sedangkan bagi responden pada kategori berat, dibutuhkan intervensi lebih komprehensif seperti layanan rehabilitas psikologis, bantuan keuangan bersyarat, serta koordinasi lintas sector untuk menekan dampak social ekonomi yang muncul. Dengan demikian, hasil model tidak hanya menjadi temuan akademis, tetapi juga mendukung penyusunan kebijakan public berbasis data dalam upaya meminimalisasi maraknya judi online di daerah.

Meskipun penelitian ini mampu memberikan gambaran awal mengenail dampak judi online, terdapat sejumlah keterbtasan yang pelu dicermati. Pertama, kemungkinan adanya bias responden dalam oengisian koesioner, baik karena faktor stigma, rasa takut, maupun kecenderungan menyembunyikan pengalaman pribasi. Hal ini berpotensi mempengaruhi validitas data dan hasil klasifikasi. Kedua, model Naïve Bayes bekerja optimal pada dataset yang seimbang, sementara distribusi data antar kategori dalam penelitian ini tidak sepenuhnya merata. Kondisi ini dapat menimpulkan keterbtasan dalam tingkat akurasi prediksi. Oleh karena itu, hasil penelitian ini sebaiknya dipandang sebagai langkah awal yang masih memerlukan penguatan melalui pengumpulan data yang lebih luas, diversifikasi responden, serta penerapan metode analisis lain sebagai pembanding. Refleksi kritis ini penting agar temuan yang dihasilkan tidak hanya dipahami sebagai kesimpulan final, tetapi juga sebagapijakan untuk penelitian lanjutan dan penyusunan kebijakan yang lebih komprehensif.

IV. Kesimpulan

Berdasarkan hasil penelitian dan pengujian, dapat disimpulkan bahwa judi online memberikan dampak negative yang signifikan terhadap masyarakat Sulawesi Utara, meliputi aspek finansial, social, dan psikologis. Model Naïve Bayes terbukti cukup efektif dalam mengklasifikasikan tingkat dampak dengan akurasi tinggi, meskipun masih kurang optimal pada kategori “sedang” akibat asumsi independensi antar fitur. Hal ini menegaskan perlunya intervensi yang berbeda sesuai tingkat keparahan, mulai dari edukasi preventif, koseling, dan bimbingan keuangan, hingga rehabilitasi terpadu. Dari sisi ekonomi, perputaran dana judi online bersifat tidak produktif dan justru melemahkan perekonomian daerah, sehingga dibutuhkan kebijakan fiscal yang mendukung literasi digital, edukasi finansial, serta pengawasan transaksi daring untuk mencegah kerugian yang lebih besar.

Untuk penelitian selanjutnya, algoritma lain seperti Random Forest atau Gradient Boosting direkomendasikan karena keduanya lebih mampu menangani ketergantungan antar variable dan pola non liniear yang kompleks. Hal ini berpotensi meningkatkan akurasi klasifikasi, terutama pada kategori dampak “sedang” yang sulit diprediksi dengan Naïve Bayes. Dengan demikian, penelitian ini tidak hanya memberikan gambaram empiris tentang dampak judi online, tetapi juga membuka peluang eksplorasi metode analitik yang lebih kuat guna mendukung kebijakan pencegahan berbasis data.

UCAPAN TERIMA KASIH

Penulis menyampaikan apresiasi yang sebesar-besarnya kepada masyarakat Sulawesi Utara yang telah berkenan menjadi responden dalam penelitian ini. Penulis juga mengucapkan terima kasih atas partisipasi, keterbukaan, serta informasi yang diberikan, sehingga penelitian mengenai Analisis Dampak dari Judi Online di Kalangan Masyarakat Sulawesi Utara Menggunakan Algoritma Naïve Bayes Classifier dapat terlaksana dengan baik. Dukungan dan kontribusi yang diberikan sangat membantu kelancaran proses pengumpulan data hingga terselesaikannya penelitian ini.

References

Agif Septia Meswari and Matnur Ritonga, “Dampak Dari Judi Online Terhadap Masa Depan Pemuda, Desa Air Buluh Kec.Ipuh Kab.Mukomuko Provinsi Bengkulu,” J. Cakrawala Ilm., vol. 2, no. 5, pp. 2097–2102, 2023, doi: 10.53625/jcijurnalcakrawalailmiah.v2i5.4642.

L. Rafiqah, “Dampak Judi Online Terhadap Kehidupan Sosial Ekonomi Masyarakat,” vol. 20, pp. 282–290, 2023, doi: 10.46781/al-mutharahah.V20i2.763.

I. Tasya, U. Milyarta, K. Alea, A. Fatiha, and R. Riyani, “Analisis maraknya judi online di Masyarakat,” vol. 1, no. 1, pp. 20–27, 2023.

A. Laras, N. Salvabillah, C. Caroline, J. D. H, F. Dinda, and M. Finanto, “Analisis Dampak Judi Online di Indonesia Fakultas Psikologi ; Universitas Bhayangkara Jakarta Raya,” vol. 3, no. 2, pp. 320–331, 2024.

A. Maulana, A. Yuliana, T. Bandung, J. Politeknik, J. Pesantren, and K. Cimahi, “ONLINE MENGGUNAKAN ALGORITMA NAÏVE BAYES DAN SUPPORT VECTOR MECHINE,” vol. 12, no. 3, pp. 3706–3714, 2024.

J. M. Polgan et al., “Optimalisasi Algoritma Naive Bayes Dengan Teknik Ensemble Dalam Analisis Sentimen Twitter Pantai Kartini Jepara,” vol. 13, pp. 1331–1341, 2024.

S. Lestari and M. Badrul, “IMPLEMENTASI KLASIFIKASI NAIVE BAYES UNTUK PREDIKSI,” vol. 7, no. 1, pp. 8–16, 2020.

J. A. L. Volume, “Abdi Laksana : Jurnal Pengabdia Kepada Masyarakat,” vol. 6, 2025.

A. P. Candra, “Analisis Data Menggunakan Python : Memperkenalkan Pandas dan NumPy,” J. Inf. Syst. Educ. Dev., vol. 3, no. 1, pp. 11–16, 2025.

A.-M. S. R. Roba, S. Lailiyah, and A. Yusnita, “Application of Naive Bayes Algorithm for Analysis of User Reviews on Mobile Legends Game: Bang Bang,” J-Intech, vol. 13, no. 01, pp. 140–147, 2025, doi: 10.32664/j-intech.v13i01.1881.

I. Safitri, “Should Likert Data Be Transformed Using Summated Rating Scale? a Confirmatory Factor Analysis Study on the Continuous Learning,” J. Eduscience, vol. 11, no. 3, pp. 790–801, 2024, doi: 10.36987/jes.v11i3.6412.

A. D. Pangestu and L. S. Harahap, “Analisis Sentimen Terkait Judi Online di Media Sosial Instagram Menggunankan Naïve Bayes,” Indones. J. Educ. Dev. Res., vol. 3, no. 1, pp. 556–561, 2024, doi: 10.57235/ijedr.v3i1.4798.

Nuralia Anggelina, “Komparasi Algoritma Pengklasifikasian Terhadap DokumenJurnal Ilmiah,” vol. 02, no. 1, pp. 20–29, 2023, doi: 10.26418/juara.v2i1.53133.

L. Lia Regitaningtyas, T. Maharani, and B. Hikmahwan, “Klasifikasi Data Lulusan Siswa Smp Menggunakan Metode Naïve Bayes,” Kumpul. J. Ilmu Komput., vol. 09, no. 1, pp. 10–21, 2022.

M. Yusuf, A. Davy, F. Teknologi, I. Dan, and T. Informatika, “Implementasi Business Intelligence Menggunakan Tableau Untuk Visualisasi Data Dampak Judi Online Di Indonesia,” J. Ilm. Komputasi, vol. 23, no. 2, pp. 283–292, 2024, doi: 10.32409/jikstik.23.2.3609.