Jumat, 06 Januari 2017

Data Mining

Pengertian Data Mining

Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database.

Fungsi Data Mining
 
Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Secara umum tugas data mining dapat diklasifikasikan ke dalam dua kategori: deskriptif dan prediktif. Tugas menambang secara deskriptif adalah untuk mengklasifikasikan sifat umum suatu data di dalam database. Tugas data mining secara prediktif adalah untuk mengambil kesimpulan terhadap data terakhir untuk membuat prediksi.
  1. Konsep/Class Description
Data dapat diasosiasikan dengan pembagian class atau konsep.
  1. Association Analysis
Association analysis adalah penemuan association rules yang menunjukkan nilai kondisi suatu attribute yang terjadi bersama-sama secara terus-menerus dalam memmberikan set data.
  1. Klasifikasi dan Predikasi
Klasifikasi dan prediksi mungkin perlu diproses oleh analisis relevan, yang berusaha untuk mengidentifikasi atribut-atribut yang tidak ditambahkan pada proses klasifikasi dan prediksi.
  1. Cluster Analysis
Tidak seperti klasifikasi dan prediksi, yang menganalisis objek data dengan kelas yang terlabeli, clustering menganalisis objek data tanpa mencari keterangan pada label kelas yang diketahui.
  1. Outlier Analysis
Outlier dapat dideteksi menggunakan test yang bersifat statistik yang mengambil sebuah distribusi atau probabilitas model untuk data, atau menggunakan langkah-langkah jarak jauh di mana objek yang penting jauh dari cluster lainnya dianggap outlier.
  1. Evolution Analysis
Data analisa evolusi menggambarkan ketetapan model atau kecenderungan objek yang memiliki kebiasaan berubah setiap waktu. 
 
Selain itu data mining juga dapat berfungsi sebagai :
1. Segmentasi Pasar
Mengidentifikasi karakteristik umum dari pelanggan yang membeli produk yang sama
2. Analisis keranjang penjualan
Memahami produk atau servis yang pada umumnya dijual bersama-sama.
3. Analisis kecenderungan
Menyatakan perbedaan antara tipe pelanggan bulan ini dan yang lalu.
4. Intelligence Marketing

Jenis-jenis Data Mining 

1. Market Basket Analysis 
  Himpunan data yang dijadikan sebagai objek penelitan pada area data mining. Market basket analysis adalah proses untuk menganalisis kebiasaan pelanggan dalam menyimpan item-item yang akan dibeli ke dalam keranjang belanjaannya.
2. Memory-Based Reasoning 
  Metode klasifikasi yang digabungkan dengan penalaran berbasis memori. proses menggunakan satu set data untuk membuat model dari prediksi atau asumsi-asumsi yang dapat dibuat tentang objek baru yang diperkenalkan.
3. Cluster Detection 
  Ada dua pendekatan untuk clustering. Pendekatan pertama adalah dengan mengasumsikan bahwa sejumlah cluster sudah tersimpan dalam data, tujuannya adalah untuk memecah data ke dalam cluster. Pendekatan lain, disebut clustering agglomerative, dengan asumsi keberadaan setiap jumlah yang telah ditetapkan cluster tertentu, setiap item keluar di cluster sendiri, dan proses terjadi berulang-ulang yang berupaya untuk menggabungkan cluster, meskipun proses komputasi sama. 
4. Link Analysis 
  Proses mencari dan membangun hubungan antara object dalam kumpulan data juga mencirikan sifat yang terkait dengan hubungan antara dua object. Link Analysis berguna untuk aplikasi analitis yang mengandalkan teori grafik untuk mengambil kesimpulan. Selain itu Link Analysis berguna untuk proses optimasi. 
5. Rule Induction 
  Ekstraksi aturan sebab-akibat dari data secara statistic. identifikasi aturan bisnis yang tersimpan di dalam data. Metode berhubungan dengan induksi aturan yang digunakan untuk proses penemuan. Salah satu pendekatan untuk penemuan aturan adalah menggunakan pohon keputusan. 
6. Neural Networks 
  Model prediksi non linear yang melakukan pembelajaran melalui latihan dan menyerupai struktur jaringan nerual yang terdapat pada mahluk hidup. Mampu menurunkan pengertian dari data yang kompleks dan tidak jelas dan dapat digunakan pula untuk mengekstrak pola dan mendeteksi tren2 yang sangat kompleks untuk dibicarakan baik oleh manusia maupun teknik komputer lainnya. 
Keuntungan dan Kerugian Data Mining
Kelebihan Data Mining :
1. Kemampuan dalam mengolah data dalam jumlah yang besar.
2. Pencarian Data secara otomatis.
Kekurangan Data Mining :
1. Kendala Database ( Garbage in garbage out ).
2. Tidak bisa melakukan analisa sendiri.  

Kesimpulan
 
Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang tersimpan di dalam database besar.
Fungsi data mining itu sendiri terdiri dari konsep/class description, association analysis, klasifikasi dan predikasi, cluster analysis, outlier analysis, dan evolution analysis. selain itu data mining juga berfungsi untuk segmentasi pasar, analisis keranjang penjualan, analisis kecenderungan, intelligence marketing.
Jenis jenis data mining yaitu market basket analysis, memory-based reasoning, cluster detection, link analysis, rule induction, neural networks. 
Kelebihannya data mining dapat mengolah data dalam jumlah yang besar dan pencarian data secara otomatis.Kekurangannya ada pada kendala database ( garbage in garbage out ) dan tidak bisa melakukan analisa sendiri.
 
sumber : http://michsamuel.blogspot.co.id/2014/05/individu-2-data-mining.html