Minggu, 17 Juni 2012

Hipotesis, Pengujian Z, Pengujian T pada Statistik


1.  Pengertian Hipotesis
Hipotesis adalah pernyataan tentative yang merupakan dugaan mengenai apa saja yang sedang kita amati dalam usaha untuk memahaminya
·      Hipoptesis dapat diturunkan dari teori yang berkaitan dengan masalah yang akan kita teliti. Jadi, Hipotesis tidak jatuh dari langit secara tiba-tiba!!!!!!
·      Misalnya seorang peneliti akan melakukan penelitian mengenai harga suatu produk maka agar dapat menurunkan hipotesis yang baik, sebaiknya yang bersangkutan membaca teori mengenai penentuan harga.
Hipotesis merupakan kebenaran sementara yang perlu diuji kebenarannya oleh karena itu hipotesis berfungsi sebagai kemungkinan untuk menguji kebenaran suatu teori.
Jika hipotesis sudah diuji dan dibuktikan kebenaranya, maka hipotesis tersebut menjadi suatu teori. Jadi sebuah hipotesis diturunkan dari suatu teori yang sudah ada, kemudian diuji kebenarannya dan pada akhirnya memunculkan teori baru.
2.  Pengujian Z
Uji Z adalah salah satu  uji statistika yang  pengujian hipotesisnya didekati dengan distribusi normal.  Menurut teori limit terpusat, data dengan ukuran sampel yang besar akan berdistribusi normal.  Oleh karena itu, uji Z dapat digunakan utuk menguji data yang sampelnya berukuran besar.  Jumlah sampel 30 atau lebih dianggap sampel berukuran besar.  Selain itu, uji Z ini dipakai untuk menganalisis data yang varians populasinya diketahui.  Namun, bila varians populasi tidak diketahui, maka varians dari sampel dapat digunakan sebagai penggantinya.

3.  Pengujian T
Uji t (t-test) merupakan prosedur pengujian parametrik rata-rata dua kelompok data, baik untuk kelompok data terkait maupun dua kelompok bebas. Untuk jumlah data yang sedikit maka perlu dilakukan uji normalitas untuk memenuhi syarat dari sebaran datanya.
Umumnya pada uji t yang perlu diperhatikan selain normalitas data juga kehomogenan varian. Persamaan berikut ini digunakan jika varainsi data antara dua kelompok sampel sama.


Dengan perhitungan derajat bebas
Persamaan berikut ini digunakan jika varainsi data antara dua kelompok sampel berbeda

Dengan perhitungan derajat bebas (degree of freedom)

       Terlihat perbedaan antara kedua persamaan pada perhitungan Standar Error of Mean/pembagi selisih rata-rata. Selain itu perbedaan juga terletak pada perhitungan derajat bebas kedua persamaan itersebut. Umumnya pada software statistik kedua perhitungan itersebut ditanpilkan sehingga hal yang penting untuk memilih perhitungan mana yang akan digunakan terlebih dulu dilihat apakah hasil perhitungan nilai variansi kedua kelompok sampel berbeda atau sama.
4.  Soal dan Jawaban
1.   Uji Z satu pihak
Contoh Kasus
Pupuk Urea mempunyai 2 bentuk, yaitu bentuk butiran dan bentuk tablet.  Bentuk butiran lebih dulu ada sedangkan bentuk tablet adalah bentuk baru.  Diketahui bahwa hasil gabah padi yang dipupuk dengan urea butiran rata-rata 4,0 t/ha.  Seorang peneliti yakin bahwa urea tablet lebih baik daripada urea butiran.  Kemudian ia melakukan penelitian dengan ulangan n=30 dan hasilnya adalah sebagai berikut:
Hasil gabah padi dalam t/ha
4,0
5,0
6,0
4,2
3,8
6,5
4,3
4,8
4,6
4,1
4,9
5,2
5,7
3,9
4,0
5,8
6,2
6,4
5,4
4,6
5,1
4,8
4,6
4,2
4,7
5,4
5,2
5,8
3,9
4,7
Hipotesis
H0 :  =   (rata-rata hasil gabah padi yang dipupuk dengan pupuk urea tablet sama dengan padi yang dipupuk dengan urea butiran)
HA :  >    (rata-rata hasil gabah padi yang dipupuk dengan pupuk urea tablet lebih tinggi dari padi yang dipupuk dengan urea butiran)
Analisis
= 4,0 t/h
= 4,9 t/h
S   = 0,78 digunakan sebagai estimasi σ
Zhit = (yt – yb)/(σ/√n) = (4,0 – 4,9)/(0,78/√30 = – 6,4286
Ztabel = Zα= Z0,05 = 1,645
Kriteria Pengambilan Kesimpulan
Jika |Zhit|  < |Ztabel|, maka terima H0
Jika |Zhit|  ≥ |Ztabel|, maka tolak H0 alias terima HA
Kesimpulan
Karena harga |Zhit| = 6,4286  > harga |Ztabel | = 1,645, maka tolak H0 alias terima HA
Jadi, rata-rata hasil gabah padi yang dipupuk dengan pupuk urea tablet nyata lebih tinggi dari padi yang dipupuk dengan urea butiran
2.  Uji-Z dua pihak
Contoh kasus
Sebuah pabrik pembuat bola lampu pijar merek A menyatakan bahwa produknya tahan dipakai selama 800 jam, dengan standar deviasi 60 jam. Untuk mengujinya, diambil sampel sebanyak 50 bola lampu, ternyata diperoleh bahwa rata-rata ketahanan bola lampu pijar tersebut adalah 792 jam. Pertanyaannya, apakah kualitas bola lampu tersebut sebaik yang dinyatakan pabriknya atau sebaliknya?
Hipotesis
H0 :  = μ (rata ketahanan bola lampu pijar tersebut sama dengan yang dinyatakan oleh pabriknya)
HA :  ≠ μ  (rata ketahanan bola lampu pijar tersebut tidak sama dengan yang dinyatakan oleh pabriknya)
Analisis
Nilai Ztabel dapat diperoleh dari Tabel 1.   Dengan menggunakan Tabel 1, maka nilai Z0,025 adalah nilai pada perpotongan α baris 0,02 dengan α kolom 0,005, yaitu 1,96.  Untuk diketahui bahwa nilai Zα adalah tetap dan tidak berubah-ubah, berapapun jumlah sampel.  Nilai Z0,025 adalah 1,96 dan nilai Z0,05 adalah 1,645.
Kriteria Pengambilan Kesimpulan
Jika |Zhit|  < |Ztabel|, maka terima H0
Jika |Zhit|  ≥ |Ztabel|, maka tolak H0 alias terima HA
Kesimpulan
Karena harga |Zhit| = 0,94  < harga |Ztabel | = 1,96, maka terima H0
Jadi, tidak ada perbedaan yang nyata antara kualitas bola lampu yang diteliti dengan kualitas bola lampu yang dinyatakan oleh pabriknya.

Hubungan antara data mining, data warehouse, OLAP< dan Machine learning


1.    Pengertian Data Mining
Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi.
2.    Hubungan data mining,data warehouse, OLAP, dan Machine learning
a.      Data Mining dan Data Warehouse
·      Data Mining dan Data Warehousing mempunyai kaitan yang sangat erat tetapi bukan merupakan objek yang sama.
·      Data Warehousing merupakan database besar yang menyimpan raw data yang biasanya langsung didapat dari responden
·      Agar data di dalam Data Warehouse dapat digunakan untuk Data Mining, data-data tersebut biasanya dipersiapkan terlebih dahulu dan biasanya disimpan dalam bentuk data mining database atau data mart.
b.      Data Mining dan OLAP
·            OLAP (Online Analytical Processing) sering dikaitkan dengan Data Mining
·            OLAP menunjuk pada summary dari data yang ada di dalam database yang dibentuk menjadi data cubes
·            Data Mining menunjuk lebih kepada pemodelan-pemodelan yang tidak tergantung apakah data yang dimodel berasal dari raw data yang ada di data warehouse atau data yang sudah di-summary seperti data cubes
c.      Data Mining dan Machine Learning
·         Data Mining pada pokoknya merupakan istilah bagi pemodelan yang dilakukan terhadap data
·         Machine Learning juga pada pokoknya merupakan pemodelan terhadap data
·         Beberapa metode yang digunakan dalam pengembangan software package data mining terkelompok di dalam Machine Learning
3.    Proses Data Mining
·            Merumuskan masalah-masalah yang muncul di dalam bidang yang akan dimodel
·            Membangun data mining database
·            Mengeksplorasi data dan mempersiapkan data yang akan dimodel
·            Membangun model
·            Mengevaluasi model
·            Implementasi model dan evaluasi hasil
4.    Model Data Mining
a.    Association Rules
·      Sering disebut juga dengan Link Analysis atau Market-basket Analysis
·      Merupakan pendekatan diskriptif yang mengekplorasi data untuk mencari hubungan antar data yang ada
·      Banyak digunakan untuk melakukan penganalisaan terhadap transaksi pemesanan/retail
b.    Clustering
·      Sering disebut dengan unsupervised classification
·      Telah banyak diimplementasikan di berbagai bidang mulai dari ekonomi sampai biologi
·      Ada beberapa jenis: hierarchical, partitional dan density estimation-based clustering
c.    Decision Trees
·      Sering disebut juga Regression Tree
·      Merupakan metode yang terkelompok ke dalam supervised classification
·      Fungsinya sama dengan Neural Networks dalam hal klasifikasi
·      Sudah banyak diterapkan di dalam berbagai macam pemodelan terapan
d.    Neural Networks
·      Merupakan metode yang terkelompok dalam supervised classification
·      Bisa digunakan untuk klasifikasi dan bias juga digunakan untuk melakukan prediksi
·      Merupakan pemodelan yang mencontoh otak manusia (hewan)
e.    Bayesian Networks
·      Merupakan pemodelan dengan menggambarkan variable sebagai bagian dari suatu jaringan
·      Bisa dikatakan sebagai gabungan dari neural networks dan decision trees
·      Berguna untuk melakukan pemodelan yang kompleks, dimana variables yang dianalisa mempunyai hubungan kompleks dan tidak hanya hubungan satu arah
Diberdayakan oleh Blogger.