PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG

Mata Kuliah : Konsep Data Mining
Nama : Kevin Mantika Putra
NPM : 1B117044

Prosiding Seminar Ilmiah Nasional Teknologi Komputer (SENATKOM 2015)                              Vol. 1, Oktober 2015

Universitas Putra Indonesia YPTK Padang -     23 Oktober 2015                                                ISSN : 2460 – 4690

PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG

Sri Mulyati
Pascasarjana, Universitas Putra Indonesia “YPTK” Padang
e-mail: mulyati.sri52@gmail.com

Abstrak

Banyaknya data pengiriman burung pada Kantor Balai Karantina Pertanian Kelas I Jambi terjadi setiap tahunnya. Sehingga terjadi penumpukan data dan dapat diibaratkan seperti gunung data. Berlimpahnya data tersebut dapat kita manfaatkan untuk mencari informasi yang tersembunyi dari data-data tersebut. Untuk dapat mengetahui informasi yang tersembunyi dari data-data tersebut, maka perlu dilakukan pengolahan terhadap data-data tersebut. Proses pengolahan data tersebut disebut juga

dengan Data Mining. Penelitian ini bertujuan untuk melakukan pengelompokan terhadap data pengiriman burung menggunakan teknik Clustering. Metode yang digunakan adalah K-Means Clustering. Dengan menggunakan metode ini data-data yang telah didapatkan dapat dikelompokkan ke dalam beberapa cluster, berdasarkan kemiripan dari data-data tersebut, sehingga data-data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain. Sehingga dengan adanya pengelompokan ini akan diketahui jenis burung apa saja yang sering dikirim oleh masyarakat sehingga dapat diketahui daerah persebaran burung tersebut. Hasil penelitian didapatkan bahwa penyebaran burung banyak berasal dari daerah Jambi dengan tujuan daerah di pulau Jawa. Selain Jambi sebagai daerah asal penyebaran burung Jambi juga sebagai transit penyebaran burung yang akan dikirim ke pulau Jawa. Sehingga apabila terdapat kasus berjangkitnya wabah penyakit Flu Burung (Avian Influenza) dapat segera dilakukan tindakan antisipasi salah satunya dengan melakukan metode penyuluhan pencegahan dan penanggulangan flu burung pada daerah asal pengiriman burung dan daerah tujuan pengiriman burung tersebut.

Kata Kunci : Data Mining, Clustering, K Means, Pengelompokan Burung, Balai Karantina Pertanian Kelas I Jambi 



1.  PENDAHULUAN 


Saat ini banyak masyarakat menggemari hobby memelihara berbagai macam jenis burung berkicau seperti burung Murai Batu, Kacer, Cucak Hijau dan lain-lain. Selain suaranya yang merdu dan enak didengar , keindahan tubuhnya juga tak kalah menariknya. Dari segi nilai ekonomis, harga jual burung ini pun cukup tinggi di pasaran. Hal ini terlihat dari banyaknya data pengiriman burung pada Kantor Balai Karantina Pertanian Kelas I Jambi setiap tahunnya. Data tersebut meliputi data masuk dan keluarnya berbagai macam jenis burung. 

Penelitian ini bertujuan untuk melakukan pengelompokan terhadap data pengiriman burung menggunakan teknik Clustering. Metode yang digunakan adalah K-Means Clustering. Dengan menggunakan metode ini data-data yang telah didapatkan dapat dikelompokkan ke dalam beberapa cluster, berdasarkan kemiripan dari data-data tersebut, sehingga data-data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain. Sehingga dengan adanya pengelompokan ini akan diketahui jenis burung apa saja yang sering dikirim oleh masyarakat sehingga dapat diketahui daerah   persebaran  burung tersebut. Sehingga apabila terdapat kasus berjangkitnya wabah penyakit Flu Burung (Avian Influenza) dapat segera dilakukan tindakan antisipasi pada daerah asal pengiriman burung dan daerah tujuan pengiriman burung tersebut.

Analisa cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasikan objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama (Ediyanto et al, 2013).


2.  KAJIAN LITERATUR

Data Mining merupakan ekstraksi informasi yang tersembunyi dari database yang besar. Data Mining adalah teknologi baru yang kuat dengan potensi besar untuk membantu perusahaan agar fokus pada informasi yang paling penting dalam gudang data mereka (Ramamohan et al, 2012).

Menurut Eko Prasetyo (2012), pekerjaan yang berkenaan dengan Data Mining dapat dibagi menjadi empat

kelompok, yaitu model prediksi (prediction modelling), analisis kelompok (Cluster analysis), analisis asosiasi (association analysis) dan deteksi anomali (anomaly detection).

Analisa cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokan objek-objek berdasarkan karakteristik yang

dimilikinya. Analisis cluster mengklasifikasikan objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama (Ediyanto et al, 2013).

3.  METODE PENELITIAN 
Kerangka kerja dalam penelitian ini dapat dilihat pada gambar 3.1 berikut ini :

Langkah-langkah penelitian dapat dijelaskan sebagai berikut :

  1. Mengumpulkan Data

Pada tahap pengumpulan data ini, penulis menggunakan beberapa metode yaitu:

  • Metode   wawancara,   penulis melakukan tanya jawab langsung dengan staf kantor Balai Karantina Pertanian Kelas I Jambi mengenai data pengiriman burung yang meliputi data jenis burung, data pengirim, dan data penerima.
  • Metodeobservasi,penulis melakukan pengamatan langsung terhadap objek penelitian yaitu pada kantor Balai Karantina Pertanian Kelas I Jambi.

      2. Mempelajari Literatur.

 Penulis melakukan pengumpulan pengetahuan dari berbagai macam sumber literatur berupa buku-buku, jurnal dan karya ilmiah yang berkaitan dengan topik yang penulis angkat. 

3.        Menganalisa Data.


Pada tahap ini penulis melakukan analisa data menggunakan tahapan KDD (Knowledge Discovery in Database). Di mana tahapan KDD ini meliputi : Seleksi Data, Preprocessing dan Pembersihan Data, Transformasi Data, Data Mining, Evaluasi/Interpretation.



4.      Menyeleksi Data (Data Selection) Pada proses ini dilakukan pemilihan

himpunandata,menciptakan himpunan data target, atau memfokuskan pada subset variabel (sampel data) di mana penemuan (Discovery) akan dilakukan. Hasil seleksi disimpan dalam suatu berkas yang terpisah dari basis data operasional Preprocessing.


5.      Melakukan Preprocessing dan Pembersihan Data (Cleaning Data) Pre processing dan Cleaning Data dilakukan dengan membuang data yang tidak konsisten dan noise,

duplikasi data, memperbaiki kesalahan data dan bisa diperkaya dengan data eksternal yang relevan.


6.      Metransformasi Data (Data Transformation)

Proses ini mentransformasikan atau menggabungkan data ke dalam yang lebih tepat untuk melakukan proses Mining dengan cara melakukan peringkasan (Agregasi).


7.      Merancang Struktur K Means Clustering

Proses Data Mining yaitu proses mencari pola atau informasi menarik

dalam data terpilih dengan menggunakan teknik, metode atau algoritma tertentu sesuai dengan tujuan dari proses KDD secara

keseluruhan. Algoritma yang digunakan dalam penelitian ini menggunakan K Means Clustering.


8.      Mengevaluasi Data (Evaluation Data)
Tahap selanjutnya yaitu mengevaluasi data. Tahap ini digunakan untuk menguji kualitas dari data apakah pola atau informasi yang ditemukan bersesuaian atau


bertentangan dengan fakta sebelumnya.


9.      Menguji Hasil

Tahap pengujian hasil adalah suatu teknik yang digunakan untuk

menentukan bahwa penerapan metode yang digunakan telah mampu

memecahkan masalah. Pada penelitian ini dilakukan pengujian dengan menggunakan aplikasi Data Mining RapidMiner versi 5.3.

Berdasarkan pengetahuan yang diperoleh dari pola-pola yang terbentuk, maka pola yang terbentuk tersebut dapat dipresentasikan ke dalam bentuk visualisasi.


10.  Menarik Kesimpulan

Setelah melakukan analisa data menggunakan tahapan KDD maka dapat ditarik suatu kesimpulan apakah informasi yang ditemukan

berkesesuaian dengan fakta sebelumnya atau tidak, sehingga akan diperoleh pengetahuan baru.


11.  Menerapkan Pengetahuan.
Langkahselanjutnyayaitu

menerapkan pengetahuan yang diperoleh, sehingga diharapkan dapat

membantu pimpinan organisasi/perusahaan dalam proses pembuatan keputusan yang akan datang.

4.  HASIL DAN PEMBAHASAN

Hasil dari penelitian ini dapat dilihat pada tabel 4.1 berikut ini :



Tabel 4.1 Hasil Cluster Satu



Dari hasil pengelompokan cluster satu di atas, dapat dianalisa bahwa penyebaran burung paling banyak di pulau Jawa, khususnya pada provinsi Jawa Barat dan Jawa Timur, sehingga apabila terjadi wabah flu burung dapat dilakukan antisipasi di kedua daerah tersebut.


Tabel 4.2 Hasil Cluster Dua
 



Berdasarkan data hasil pengelompokan cluster dua, dapat dianalisa bahwa daerah asal penyebaran burung selain dari Jambi juga berasal dari provinsi di luar Jambi dengan tujuan paling banyak di provinsi DKI Jakarta, Jawa Tengah dan provinsi Jambi sendiri. Di sini provinsi Jambi berfungsi sebagai daerah transit pengiriman burung. Untuk itu, apabila terjadi wabah flu burung dapat dilakukan antisipasi di daerah Jambi dan daerah tujuan terutama daerah DKI Jakarta dan Jawa Tengah.





Tabel 4.3 Hasil Cluster Tiga
 
                Berdasarkan data hasil pengelompokan cluster tiga, dapat dianalisa bahwa daerah asal penyebaran burung selain dari Jambi juga berasal dari provinsi di luar kota Jambi. Disini provinsi Jambi juga berfungsi sebagai daerah transit pengiriman burung yang nantinya akan dikirimkan ke daerah tujuan di provinsi-provinsi lain yang kebanyakan berada di pulau Jawa. Untuk itu apabila terjadi wabah flu burung dapat diantisipasi di daerah Jambi dan daerah lain di pulau Jawa seperti daerah DKI Jakarta, Jawa Tengah dan Jawa Timur.

 
                  Berdasarkan data hasil dari clustering di atas, maka dapat dilakukan metode penyuluhan pencegahan flu burung yang dapat dilihat pada tabel 4.4 berikut ini :
 

Tabel 4.4 Metode Penyuluhan Pencegahan Flu Burung





5.  KESIMPULAN

Dari hasil analisa pengelompokan data penyebaran burung menggunakan K Means Clustering maka dapat diambil kesimpulan sebagai berikut :

1.   Terbentuk tiga cluster daerah penyebaran burung yaitu cluster satu dengan jumlah 345 item di mana penyebaran burung berasal dari daerah Jambi dengan tujuan daerah Jawa Barat dan Jawa Timur, cluster dua dengan jumlah 703 item di mana selain daerah asal penyebaran burung Jambi juga merupakan daerah transit pengiriman burung ke daerah lain seperti daerah DKI Jakarta dan Jawa Tengah dan cluster tiga dengan jumlah 257 item di mana penyebaran burung berasal dari daerah Jambi dan Jambi juga merupakan daerah transit pengiriman burung dengan daerah tujuan pengiriman DKI Jakarta, Jawa Tengah dan Jawa Timur. 

2.      Metode penyuluhan pencegahan flu burung dapat dilaksanakan dengan baik berdasarkan cluster yang terbentuk, sehingga masyarakat dapat terhindar dari penyakit flu burung dan dapat mengantisipasinya dengan baik.



6.    REFERENSI



Amita Verma and Ashwani Kumar, (2014),” Performance Enhancement of K Means Clustering Algorithms for High Dimensional Data Sets”, International Journal of Advanced Research in Computer Science and Software Engineering, Vol.4, Issue 1, January 2014

Ediyanto et al, (2013). “Pengklasifikasian Karakteristik Dengan Metode K Means Cluster Analysis”, Buletin Ilmiah Mat. Stat. Terapannya (Bimaster), Volume 02, No.2, (2013)

Eko Prasetyo, (2012), “Data Mining Konsep dan Aplikasi Menggunakan Matlab”, Penerbit Andi, Yogyakarta

Er. Nikhil Chaturvedi & Er. Anand Rajavat, (2013).”An Improvement in K Means Clustering Algorithm Using Better Time and Accuracy”, International Journal Of Programming languages and Applications (IJPLA), Vol.3, No.4, October 2013

Fajar Astuti Hermawati, (2009),” Data Mining”,Penerbit Andi, Yogyakarta Feri   Sulianta,   (2014),       Customer Profiling Pada Supermarket Menggunakan Algoritma K Means Dalam Memilih   Produk   Berdasarkan   Selera Konsumen Dengan Daya Beli Maksimum”,   Jurnal   Ilmiah    Teknologi informasi  Terapan,   ISSN    2407-3911,Vol.1, No.1, Desember 2014


You Might Also Like

0 Comments