Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database.
Fungsi Data Mining
Kegunaan data mining adalah untuk menspesifikasikan pola yang
harus ditemukan dalam tugas data mining. Secara umum tugas data mining dapat
diklasifikasikan ke dalam dua kategori: deskriptif dan prediktif. Tugas
menambang secara deskriptif adalah untuk mengklasifikasikan sifat umum suatu
data di dalam database. Tugas data mining secara prediktif adalah untuk
mengambil kesimpulan terhadap data terakhir untuk membuat prediksi.
- Konsep/Class Description
Data dapat diasosiasikan dengan pembagian class atau konsep.
- Association Analysis
Association analysis adalah penemuan association rules yang
menunjukkan nilai kondisi suatu attribute yang terjadi bersama-sama secara
terus-menerus dalam memmberikan set data.
- Klasifikasi dan Predikasi
Klasifikasi dan prediksi mungkin perlu diproses oleh analisis
relevan, yang berusaha untuk mengidentifikasi atribut-atribut yang tidak
ditambahkan pada proses klasifikasi dan prediksi.
- Cluster Analysis
Tidak seperti klasifikasi dan prediksi, yang menganalisis
objek data dengan kelas yang terlabeli, clustering menganalisis objek data
tanpa mencari keterangan pada label kelas yang diketahui.
- Outlier Analysis
Outlier dapat dideteksi menggunakan test yang bersifat
statistik yang mengambil sebuah distribusi atau probabilitas model untuk data,
atau menggunakan langkah-langkah jarak jauh di mana objek yang penting jauh
dari cluster lainnya dianggap outlier.
- Evolution Analysis
Data analisa evolusi menggambarkan ketetapan model atau
kecenderungan objek yang memiliki kebiasaan berubah setiap waktu.
Selain itu data mining juga dapat berfungsi sebagai :
1. Segmentasi Pasar
Mengidentifikasi karakteristik umum dari pelanggan yang membeli produk yang sama
2. Analisis keranjang penjualan
Memahami produk atau servis yang pada umumnya dijual bersama-sama.
3. Analisis kecenderungan
Menyatakan perbedaan antara tipe pelanggan bulan ini dan yang lalu.
4.
Intelligence Marketing
1. Market Basket Analysis
Himpunan data yang
dijadikan sebagai objek penelitan pada area data mining. Market basket
analysis adalah proses untuk menganalisis kebiasaan pelanggan dalam menyimpan
item-item yang akan dibeli ke dalam keranjang belanjaannya.
2. Memory-Based
Reasoning
Metode klasifikasi yang
digabungkan dengan penalaran berbasis memori. proses menggunakan satu set data
untuk membuat model dari prediksi atau asumsi-asumsi yang dapat dibuat tentang
objek baru yang diperkenalkan.
3. Cluster Detection
Ada dua pendekatan untuk
clustering. Pendekatan pertama adalah dengan mengasumsikan bahwa sejumlah
cluster sudah tersimpan dalam data, tujuannya adalah untuk memecah data ke
dalam cluster. Pendekatan lain, disebut clustering agglomerative, dengan asumsi
keberadaan setiap jumlah yang telah ditetapkan cluster tertentu, setiap item
keluar di cluster sendiri, dan proses terjadi berulang-ulang yang berupaya
untuk menggabungkan cluster, meskipun proses komputasi sama.
4. Link Analysis
Proses mencari dan
membangun hubungan antara object dalam kumpulan data juga mencirikan sifat yang
terkait dengan hubungan antara dua object. Link Analysis berguna untuk aplikasi
analitis yang mengandalkan teori grafik untuk mengambil kesimpulan. Selain itu
Link Analysis berguna untuk proses optimasi.
5. Rule Induction
Ekstraksi aturan
sebab-akibat dari data secara statistic. identifikasi aturan bisnis yang tersimpan
di dalam data. Metode berhubungan dengan induksi aturan yang digunakan untuk
proses penemuan. Salah satu pendekatan untuk penemuan aturan adalah menggunakan
pohon keputusan.
6. Neural Networks
Model prediksi non linear
yang melakukan pembelajaran melalui latihan dan menyerupai struktur jaringan
nerual yang terdapat pada mahluk hidup. Mampu menurunkan pengertian dari data
yang kompleks dan tidak jelas dan dapat digunakan pula untuk mengekstrak pola
dan mendeteksi tren2 yang sangat kompleks untuk dibicarakan baik oleh manusia
maupun teknik komputer lainnya.
Keuntungan dan Kerugian Data Mining
Kelebihan Data
Mining :
1. Kemampuan
dalam mengolah data dalam jumlah yang besar.
2. Pencarian Data
secara otomatis.
Kekurangan Data
Mining :
1. Kendala
Database ( Garbage in garbage out ).
2. Tidak bisa
melakukan analisa sendiri.
Kesimpulan
Data mining merupakan proses semi otomatik yang
menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan
potensial dan berguna yang tersimpan di dalam database besar.
Fungsi data mining itu sendiri terdiri dari konsep/class description, association analysis, klasifikasi dan predikasi, cluster analysis, outlier analysis, dan evolution analysis. selain itu data mining juga berfungsi untuk segmentasi pasar, analisis keranjang penjualan, analisis kecenderungan, intelligence marketing.
Jenis jenis data mining yaitu market basket analysis, memory-based reasoning, cluster detection, link analysis, rule induction, neural networks.
Kelebihannya data mining dapat mengolah data dalam jumlah yang besar dan pencarian data
secara otomatis.Kekurangannya
ada pada kendala database ( garbage in garbage out ) dan tidak bisa
melakukan analisa sendiri.
sumber : http://michsamuel.blogspot.co.id/2014/05/individu-2-data-mining.html
Tidak ada komentar:
Posting Komentar