PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG
Mata Kuliah : Konsep Data Mining
Nama : Kevin Mantika Putra
NPM : 1B117044
Prosiding Seminar Ilmiah Nasional Teknologi Komputer (SENATKOM 2015) Vol. 1, Oktober 2015
Nama : Kevin Mantika Putra
NPM : 1B117044
Prosiding Seminar Ilmiah Nasional Teknologi Komputer (SENATKOM 2015) Vol. 1, Oktober 2015
Universitas Putra Indonesia YPTK Padang - 23 Oktober 2015 ISSN : 2460 – 4690
PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG
Sri Mulyati
Pascasarjana, Universitas Putra Indonesia “YPTK” Padang
e-mail: mulyati.sri52@gmail.com
Abstrak
Banyaknya data pengiriman burung pada Kantor Balai Karantina Pertanian Kelas I Jambi terjadi setiap tahunnya. Sehingga terjadi penumpukan data dan dapat diibaratkan seperti gunung data. Berlimpahnya data tersebut dapat kita manfaatkan untuk mencari informasi yang tersembunyi dari data-data tersebut. Untuk dapat mengetahui informasi yang tersembunyi dari data-data tersebut, maka perlu dilakukan pengolahan terhadap data-data tersebut. Proses pengolahan data tersebut disebut juga
dengan Data Mining. Penelitian ini bertujuan untuk melakukan pengelompokan terhadap data pengiriman burung menggunakan teknik Clustering. Metode yang digunakan adalah K-Means Clustering. Dengan menggunakan metode ini data-data yang telah didapatkan dapat dikelompokkan ke dalam beberapa cluster, berdasarkan kemiripan dari data-data tersebut, sehingga data-data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain. Sehingga dengan adanya pengelompokan ini akan diketahui jenis burung apa saja yang sering dikirim oleh masyarakat sehingga dapat diketahui daerah persebaran burung tersebut. Hasil penelitian didapatkan bahwa penyebaran burung banyak berasal dari daerah Jambi dengan tujuan daerah di pulau Jawa. Selain Jambi sebagai daerah asal penyebaran burung Jambi juga sebagai transit penyebaran burung yang akan dikirim ke pulau Jawa. Sehingga apabila terdapat kasus berjangkitnya wabah penyakit Flu Burung (Avian Influenza) dapat segera dilakukan tindakan antisipasi salah satunya dengan melakukan metode penyuluhan pencegahan dan penanggulangan flu burung pada daerah asal pengiriman burung dan daerah tujuan pengiriman burung tersebut.
Kata Kunci : Data Mining, Clustering, K Means, Pengelompokan Burung, Balai Karantina Pertanian Kelas I Jambi
Kata Kunci : Data Mining, Clustering, K Means, Pengelompokan Burung, Balai Karantina Pertanian Kelas I Jambi
1. PENDAHULUAN
Saat ini banyak masyarakat menggemari hobby memelihara berbagai macam jenis burung berkicau seperti burung Murai Batu, Kacer, Cucak Hijau dan lain-lain. Selain suaranya yang merdu dan enak didengar , keindahan tubuhnya juga tak kalah menariknya. Dari segi nilai ekonomis, harga jual burung ini pun cukup tinggi di pasaran. Hal ini terlihat dari banyaknya data pengiriman burung pada Kantor Balai Karantina Pertanian Kelas I Jambi setiap tahunnya. Data tersebut meliputi data masuk dan keluarnya berbagai macam jenis burung.
Penelitian ini bertujuan untuk melakukan pengelompokan terhadap data pengiriman burung menggunakan teknik Clustering. Metode yang digunakan adalah K-Means Clustering. Dengan menggunakan metode ini data-data yang telah didapatkan dapat dikelompokkan ke dalam beberapa cluster, berdasarkan kemiripan dari data-data tersebut, sehingga data-data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain. Sehingga dengan adanya pengelompokan ini akan diketahui jenis burung apa saja yang sering dikirim oleh masyarakat sehingga dapat diketahui daerah persebaran burung tersebut. Sehingga apabila terdapat kasus berjangkitnya wabah penyakit Flu Burung (Avian Influenza) dapat segera dilakukan tindakan antisipasi pada daerah asal pengiriman burung dan daerah tujuan pengiriman burung tersebut.
Saat ini banyak masyarakat menggemari hobby memelihara berbagai macam jenis burung berkicau seperti burung Murai Batu, Kacer, Cucak Hijau dan lain-lain. Selain suaranya yang merdu dan enak didengar , keindahan tubuhnya juga tak kalah menariknya. Dari segi nilai ekonomis, harga jual burung ini pun cukup tinggi di pasaran. Hal ini terlihat dari banyaknya data pengiriman burung pada Kantor Balai Karantina Pertanian Kelas I Jambi setiap tahunnya. Data tersebut meliputi data masuk dan keluarnya berbagai macam jenis burung.
Penelitian ini bertujuan untuk melakukan pengelompokan terhadap data pengiriman burung menggunakan teknik Clustering. Metode yang digunakan adalah K-Means Clustering. Dengan menggunakan metode ini data-data yang telah didapatkan dapat dikelompokkan ke dalam beberapa cluster, berdasarkan kemiripan dari data-data tersebut, sehingga data-data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain. Sehingga dengan adanya pengelompokan ini akan diketahui jenis burung apa saja yang sering dikirim oleh masyarakat sehingga dapat diketahui daerah persebaran burung tersebut. Sehingga apabila terdapat kasus berjangkitnya wabah penyakit Flu Burung (Avian Influenza) dapat segera dilakukan tindakan antisipasi pada daerah asal pengiriman burung dan daerah tujuan pengiriman burung tersebut.
Analisa cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasikan objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama (Ediyanto et al, 2013).
2. KAJIAN LITERATUR
Data Mining merupakan ekstraksi informasi yang tersembunyi dari database yang besar. Data Mining adalah teknologi baru yang kuat dengan potensi besar untuk membantu perusahaan agar fokus pada informasi yang paling penting dalam gudang data mereka (Ramamohan et al, 2012).
Menurut Eko Prasetyo (2012), pekerjaan yang berkenaan dengan Data Mining dapat dibagi menjadi empat
kelompok, yaitu model prediksi (prediction modelling), analisis kelompok (Cluster analysis), analisis asosiasi (association analysis) dan deteksi anomali (anomaly detection).
Analisa cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokan objek-objek berdasarkan karakteristik yang
dimilikinya. Analisis cluster mengklasifikasikan objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama (Ediyanto et al, 2013).
3. METODE PENELITIAN
Kerangka kerja dalam penelitian ini dapat dilihat pada gambar 3.1 berikut ini :
Kerangka kerja dalam penelitian ini dapat dilihat pada gambar 3.1 berikut ini :
Langkah-langkah penelitian dapat dijelaskan sebagai berikut :
- Mengumpulkan Data
- Metode wawancara,
penulis melakukan tanya jawab langsung dengan staf kantor
Balai Karantina Pertanian Kelas I Jambi mengenai data pengiriman burung yang meliputi data jenis burung,
data pengirim, dan data penerima.
- Metodeobservasi,penulis melakukan pengamatan langsung terhadap objek penelitian yaitu pada kantor Balai Karantina Pertanian Kelas I Jambi.
Penulis melakukan pengumpulan pengetahuan dari
berbagai macam sumber literatur berupa buku-buku, jurnal dan karya ilmiah yang
berkaitan dengan topik yang penulis angkat.
3.
Menganalisa Data.
Pada tahap ini penulis melakukan analisa data
menggunakan tahapan KDD (Knowledge Discovery in Database). Di mana
tahapan KDD ini meliputi : Seleksi
Data, Preprocessing dan Pembersihan Data, Transformasi Data, Data Mining,
Evaluasi/Interpretation.
4.
Menyeleksi Data (Data Selection) Pada proses ini
dilakukan pemilihan
himpunandata,menciptakan himpunan data target, atau memfokuskan pada subset variabel (sampel data) di mana penemuan (Discovery) akan dilakukan. Hasil seleksi
disimpan dalam suatu berkas yang terpisah dari basis data operasional Preprocessing.
5.
Melakukan Preprocessing dan Pembersihan Data (Cleaning Data) Pre
processing dan Cleaning Data dilakukan
dengan membuang data yang tidak konsisten dan noise,
duplikasi data, memperbaiki kesalahan data dan bisa diperkaya dengan
data eksternal yang relevan.
6.
Metransformasi Data (Data Transformation)
Proses ini mentransformasikan atau menggabungkan
data ke dalam yang lebih tepat untuk melakukan proses Mining dengan cara melakukan peringkasan
(Agregasi).
7.
Merancang Struktur K Means Clustering
Proses Data
Mining yaitu proses mencari pola atau informasi menarik
dalam data terpilih dengan menggunakan teknik, metode atau algoritma
tertentu sesuai dengan tujuan dari proses KDD secara
keseluruhan. Algoritma yang digunakan dalam penelitian ini menggunakan K Means Clustering.
8.
Mengevaluasi Data (Evaluation Data)
Tahap selanjutnya yaitu mengevaluasi data. Tahap
ini digunakan untuk menguji kualitas dari data apakah
pola atau informasi yang ditemukan bersesuaian atau
bertentangan dengan fakta sebelumnya.
9. Menguji
Hasil
Tahap pengujian hasil adalah suatu teknik yang
digunakan untuk
menentukan bahwa penerapan metode yang digunakan
telah mampu
memecahkan masalah. Pada penelitian ini dilakukan
pengujian dengan menggunakan aplikasi Data
Mining RapidMiner versi 5.3.
Berdasarkan pengetahuan yang diperoleh dari
pola-pola yang terbentuk, maka pola yang terbentuk tersebut dapat
dipresentasikan ke dalam bentuk visualisasi.
10. Menarik
Kesimpulan
Setelah melakukan analisa data menggunakan tahapan
KDD maka dapat ditarik suatu kesimpulan apakah informasi yang ditemukan
berkesesuaian dengan fakta sebelumnya atau tidak,
sehingga akan diperoleh pengetahuan baru.
11. Menerapkan
Pengetahuan.
Langkahselanjutnyayaitu
menerapkan pengetahuan yang diperoleh, sehingga
diharapkan dapat
membantu pimpinan organisasi/perusahaan dalam
proses pembuatan keputusan yang akan datang.
4. HASIL DAN PEMBAHASAN
Hasil dari penelitian ini dapat dilihat pada tabel
4.1 berikut ini :
Tabel 4.1
Hasil Cluster Satu
Dari hasil pengelompokan cluster
satu di atas, dapat dianalisa bahwa penyebaran burung paling banyak di pulau
Jawa, khususnya pada provinsi Jawa Barat dan Jawa Timur, sehingga apabila
terjadi wabah flu burung dapat dilakukan antisipasi di kedua daerah tersebut.
Tabel 4.2 Hasil Cluster Dua
Berdasarkan data hasil pengelompokan cluster dua, dapat dianalisa bahwa
daerah asal penyebaran burung selain dari Jambi juga berasal dari provinsi di
luar Jambi dengan tujuan paling banyak di provinsi DKI Jakarta, Jawa Tengah dan
provinsi Jambi sendiri. Di sini provinsi Jambi berfungsi sebagai daerah transit
pengiriman burung. Untuk itu, apabila terjadi wabah flu burung dapat dilakukan
antisipasi di daerah Jambi dan daerah tujuan terutama daerah DKI Jakarta dan
Jawa Tengah.
Tabel 4.3 Hasil Cluster
Tiga
Berdasarkan data hasil
pengelompokan cluster tiga, dapat
dianalisa bahwa daerah asal penyebaran burung selain dari Jambi juga berasal
dari provinsi di luar kota Jambi. Disini provinsi Jambi juga berfungsi sebagai
daerah transit pengiriman burung yang nantinya akan dikirimkan ke daerah tujuan
di provinsi-provinsi lain yang kebanyakan berada di pulau Jawa. Untuk itu
apabila terjadi wabah flu burung dapat diantisipasi di daerah Jambi dan daerah lain di
pulau Jawa seperti daerah DKI Jakarta, Jawa Tengah dan Jawa Timur.
Berdasarkan data hasil dari clustering di atas, maka dapat dilakukan metode penyuluhan pencegahan flu burung
yang dapat dilihat pada tabel 4.4 berikut ini :
Tabel 4.4 Metode Penyuluhan
Pencegahan Flu Burung
5. KESIMPULAN
Dari hasil analisa pengelompokan data penyebaran
burung menggunakan K Means Clustering maka dapat diambil kesimpulan sebagai berikut :
1. Terbentuk tiga cluster daerah
penyebaran burung yaitu cluster satu
dengan jumlah 345 item di mana
penyebaran burung berasal dari daerah Jambi dengan tujuan daerah Jawa Barat dan
Jawa Timur, cluster dua dengan jumlah
703 item di mana selain daerah asal
penyebaran burung Jambi juga merupakan daerah transit pengiriman burung ke
daerah lain seperti daerah DKI Jakarta dan Jawa Tengah dan cluster tiga dengan jumlah 257 item
di mana penyebaran burung berasal dari daerah Jambi dan Jambi juga merupakan
daerah transit pengiriman burung dengan daerah tujuan pengiriman
DKI Jakarta, Jawa
Tengah dan Jawa Timur.
2.
Metode penyuluhan pencegahan flu
burung dapat dilaksanakan dengan baik berdasarkan cluster yang terbentuk, sehingga masyarakat dapat terhindar dari
penyakit flu burung dan dapat mengantisipasinya dengan baik.
6. REFERENSI
6. REFERENSI
Amita Verma and Ashwani Kumar, (2014),” Performance Enhancement of K Means Clustering Algorithms for High Dimensional Data Sets”, International Journal of Advanced Research in Computer Science and Software Engineering, Vol.4, Issue 1, January 2014
Ediyanto et al, (2013). “Pengklasifikasian Karakteristik Dengan Metode K Means Cluster Analysis”, Buletin Ilmiah Mat. Stat. Terapannya (Bimaster), Volume 02, No.2, (2013)
0 Comments