Minggu, 17 Juni 2012

Hubungan antara data mining, data warehouse, OLAP< dan Machine learning


1.    Pengertian Data Mining
Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi.
2.    Hubungan data mining,data warehouse, OLAP, dan Machine learning
a.      Data Mining dan Data Warehouse
·      Data Mining dan Data Warehousing mempunyai kaitan yang sangat erat tetapi bukan merupakan objek yang sama.
·      Data Warehousing merupakan database besar yang menyimpan raw data yang biasanya langsung didapat dari responden
·      Agar data di dalam Data Warehouse dapat digunakan untuk Data Mining, data-data tersebut biasanya dipersiapkan terlebih dahulu dan biasanya disimpan dalam bentuk data mining database atau data mart.
b.      Data Mining dan OLAP
·            OLAP (Online Analytical Processing) sering dikaitkan dengan Data Mining
·            OLAP menunjuk pada summary dari data yang ada di dalam database yang dibentuk menjadi data cubes
·            Data Mining menunjuk lebih kepada pemodelan-pemodelan yang tidak tergantung apakah data yang dimodel berasal dari raw data yang ada di data warehouse atau data yang sudah di-summary seperti data cubes
c.      Data Mining dan Machine Learning
·         Data Mining pada pokoknya merupakan istilah bagi pemodelan yang dilakukan terhadap data
·         Machine Learning juga pada pokoknya merupakan pemodelan terhadap data
·         Beberapa metode yang digunakan dalam pengembangan software package data mining terkelompok di dalam Machine Learning
3.    Proses Data Mining
·            Merumuskan masalah-masalah yang muncul di dalam bidang yang akan dimodel
·            Membangun data mining database
·            Mengeksplorasi data dan mempersiapkan data yang akan dimodel
·            Membangun model
·            Mengevaluasi model
·            Implementasi model dan evaluasi hasil
4.    Model Data Mining
a.    Association Rules
·      Sering disebut juga dengan Link Analysis atau Market-basket Analysis
·      Merupakan pendekatan diskriptif yang mengekplorasi data untuk mencari hubungan antar data yang ada
·      Banyak digunakan untuk melakukan penganalisaan terhadap transaksi pemesanan/retail
b.    Clustering
·      Sering disebut dengan unsupervised classification
·      Telah banyak diimplementasikan di berbagai bidang mulai dari ekonomi sampai biologi
·      Ada beberapa jenis: hierarchical, partitional dan density estimation-based clustering
c.    Decision Trees
·      Sering disebut juga Regression Tree
·      Merupakan metode yang terkelompok ke dalam supervised classification
·      Fungsinya sama dengan Neural Networks dalam hal klasifikasi
·      Sudah banyak diterapkan di dalam berbagai macam pemodelan terapan
d.    Neural Networks
·      Merupakan metode yang terkelompok dalam supervised classification
·      Bisa digunakan untuk klasifikasi dan bias juga digunakan untuk melakukan prediksi
·      Merupakan pemodelan yang mencontoh otak manusia (hewan)
e.    Bayesian Networks
·      Merupakan pemodelan dengan menggambarkan variable sebagai bagian dari suatu jaringan
·      Bisa dikatakan sebagai gabungan dari neural networks dan decision trees
·      Berguna untuk melakukan pemodelan yang kompleks, dimana variables yang dianalisa mempunyai hubungan kompleks dan tidak hanya hubungan satu arah

0 komentar:

Diberdayakan oleh Blogger.