1. Pengertian Data Mining
Data Mining adalah serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama
ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri
berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar
material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang
dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine
learning, statistik dan database. Data mining adalah proses menerapkan metode
ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan
arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data
mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi.
2.
Hubungan
data mining,data warehouse, OLAP, dan Machine learning
a. Data
Mining dan Data Warehouse
· Data Mining dan Data Warehousing mempunyai kaitan
yang sangat erat tetapi bukan merupakan objek yang sama.
· Data Warehousing merupakan database besar yang
menyimpan raw data yang biasanya langsung didapat dari responden
· Agar data di dalam Data Warehouse dapat digunakan
untuk Data Mining, data-data tersebut biasanya dipersiapkan terlebih dahulu dan
biasanya disimpan dalam bentuk data mining database atau data mart.
b. Data
Mining dan OLAP
·
OLAP (Online
Analytical Processing) sering dikaitkan dengan Data Mining
·
OLAP menunjuk pada
summary dari data yang ada di dalam database yang dibentuk menjadi data cubes
·
Data Mining menunjuk
lebih kepada pemodelan-pemodelan yang tidak tergantung apakah data yang dimodel
berasal dari raw data yang ada di data warehouse atau data yang sudah
di-summary seperti data cubes
c. Data
Mining dan Machine Learning
·
Data Mining pada
pokoknya merupakan istilah bagi pemodelan yang dilakukan terhadap data
·
Machine Learning juga
pada pokoknya merupakan pemodelan terhadap data
·
Beberapa metode yang
digunakan dalam pengembangan software package data mining terkelompok di dalam
Machine Learning
3.
Proses
Data Mining
·
Merumuskan
masalah-masalah yang muncul di dalam bidang yang akan dimodel
·
Membangun data mining
database
·
Mengeksplorasi data
dan mempersiapkan data yang akan dimodel
·
Membangun model
·
Mengevaluasi model
·
Implementasi model dan
evaluasi hasil
4.
Model
Data Mining
a. Association Rules
· Sering disebut juga dengan Link Analysis atau
Market-basket Analysis
· Merupakan pendekatan diskriptif yang mengekplorasi
data untuk mencari hubungan antar data yang ada
· Banyak digunakan untuk melakukan penganalisaan
terhadap transaksi pemesanan/retail
b. Clustering
· Sering disebut dengan unsupervised classification
· Telah banyak diimplementasikan di berbagai bidang
mulai dari ekonomi sampai biologi
· Ada beberapa jenis: hierarchical, partitional dan
density estimation-based clustering
c. Decision Trees
· Sering disebut juga Regression Tree
· Merupakan metode yang terkelompok ke dalam
supervised classification
· Fungsinya sama dengan Neural Networks dalam hal
klasifikasi
· Sudah banyak diterapkan di dalam berbagai macam
pemodelan terapan
d. Neural Networks
· Merupakan metode yang terkelompok dalam supervised
classification
· Bisa digunakan untuk klasifikasi dan bias juga
digunakan untuk melakukan prediksi
· Merupakan pemodelan yang mencontoh otak manusia
(hewan)
e. Bayesian Networks
· Merupakan pemodelan dengan menggambarkan variable
sebagai bagian dari suatu jaringan
· Bisa dikatakan sebagai gabungan dari neural
networks dan decision trees
· Berguna untuk melakukan pemodelan yang kompleks,
dimana variables yang dianalisa mempunyai hubungan kompleks dan tidak hanya
hubungan satu arah
0 komentar:
Posting Komentar