Eksplorasi 1.2 Pengujian Air

Banyak orang menghabiskan banyak uang untuk air botol. Tetapi apakah mereka lebih memilih air botol dari pada air keran? Peneliti di Longwood University (Lunsford dan Downling Fink, 2010) menginvestigasi pertanyaan ini dengan menunjukkan bagaimana orang yang datang ke suatu stan dalam festival lokal dengan 4 cangkir air. 3 cangkir air berisi beberapa merk air botol yang berbeda, dan satu cangkir  yang berisi air keran. Setiap orang ditanya mana dari ke-4 cangkir air tersebut yang akan mereka pilih. Peneliti mencatat bagaimana orang-orang memilih air keran untuk melihat apakah air keran akan terpilih dengan frekuensi yang lebih rendah daripada ekspektasi dengan model kesempatan.

Langkah 1. Merumuskan masalah.

  • Apakah pertanyaan pengamatan yang diharapkan oleh pengamat untuk ditanyakan?

Langkah 2. Merancang studi dan mengumpulkan data.

  • Identifikasi unit observasi dari studi ini.
  • Identifikasi variabel. Apakah kuantitatif variabel atau kategoris?
  • Berapa banyak hasil variabel yang didapatkan?

Definisi: Suatu variabel binary adalah variabel kategoris dengan hanya dua hasil. Sesering kita merubah variabel kategorial dengan lebih dari 2 hasil (contoh: keempat merk dari air botol) ke dalam variabel binary (contoh: air keran atau bukan). Dalam kasus ini, kita juga mengartikan satu hasil untuk menjadi “sukses” dan lainnya menjadi “gagal”.

  • Deskripsikan parameter yang diharapkan (dalam kata-kata). (Petunjuk: Parameter dari kemungkinan jangka panjang dari ….. ?)
  • Salah satu kemungkinannya adalah bahwa subyek memiliki pilihan yang sama dari keempat air dan mereka berkesempatan untuk memilih satu dari keempat air tersebut secara acak. Dalam kasus ini, apa yang dimaksud dengan kemungkinan jangka panjang terpilihnya air keran?
  • Kemungkinan yang lain adalah bahwa orang akan lebih sedikit memilih air keran daripada air botol dengan merk. Dalam kasus ini, apa yang dapat kita katakan tentang kemungkinan jangka panjang dimana orang dalam studi ini akan memilih air keran?(Petunjuk: Anda tidak untuk menentukan suatu nilai, namun akan mempengaruhi arah dari suatu nilai).

Definisi:

  • Hipotesis Null (nol)  merepresentasikan penjelasan “secara kebetulan”. Model kesempatan (untuk model “null”) dipilih untuk merefleksikan hipotesis ini.
  • Hipotesis Alternatif merepresentasikan penjelasan “ada efek” yang berlawanan dengan hipotesis nol. Ini merepresentasikan bahwa peneliti berharap untuk menggabungkan bukti untuk mendukung dugaan peneliti.
  • Jawaban kedua pertanyaan sebelumnya akan menjadi hipotesis nol dan alternatif untuk penelitian ini. Yang manakah hipotesis nol dan alternatif?

Berdasarkan percobaan, peneliti mendapatkan bahwa 3 dari 27 memilih air keran.

Langkah 3. Pengolahan Data.

  • Hitung nilai statistik yang relevan.

Penggunaan Simbol 

Kita dapat menggunakan simbol untuk merepresentasikan kuantitas dan menyederhanakan tulisan kita. Perbedaan dari statistik parameter adalah sangat penting sehingga kita harus menggunakan simbol yang berbeda untuk menjelaskan ini.

Ketika kita setuju dengan penggunaan parameter dalam kemungkinan jangka panjang, seperti kemungkinan subyek (masa depan) dalam studi ini akan memilih air keran sebagai pilihan yang akan mereka pilih, kita gunakan simbol Yunani yaitu π (disebut dengan “pi”). Tetapi kemudian kita akan bekerja dengan statistik yaitu proporsi dari “kesuksesan” dalam suatu sampel, sehingga proporsi dari subyek dalam studi ini yang memilih air keran akan lebih dipilih dan kita akan menggunakan p̂ (p-topi). Dan, kita gunakan simbol untuk merepresentasikan ukuran sampel.

  • Apakah nilai dari p̂ dalam studi ini?
  • Apakah nilai dari dalam studi ini?
  • Hipotesis akan selalu menduga tentang parameter yang belum diketahui. π. Kita juga dapat menggunakan H0 dan Ha sebagai suatu notasi yang singkat untuk hipotesis nol dan hipotesis alternatif, secara berurutan. Tanda titik dua (:), digunakan untuk merepresentasikan kata “adalah”. Dan menyatakan ulang hipotesis nol dan hipotesis alternatif dengan π.

Ho :

Ha :

Langkah 4. Penarikan Kesimpulan.

  • Apakah proporsi sampel yang memilih air keran dalam studi ini akan lebih sedikit dari kemungkinan yang telah tentera dalam hipotesis nol?
  • Apakah mungkin bahwa proporsi ini dapat berubah menjadi kecil meskipun hipotesis nol adalah benar (contoh: meskipun jika orang tidak suka dengan air keran dan dengan tidak sengaja memilih secara acak dari keempat cangkir)?

Seperti yang kita lakukan dalam contoh Buzz dan Doris, kita akan menggunakan simulasi untuk menginvestigasi bagaimana mengubah hasil dari sampel pengamatan (3 dari 17 yang memilih air keran), jika dalam kenyataannya orang tidak menyukai air keran dan setiap mereka memiliki 1/4 kemungkinan untuk memilih air keran. (Catatan, bahwa model hipotesis nol diasumsikan merupakan kemungkinan yang sama untuk semua orang).

Coba pikirkan: Apakah kita dapat menggunakan metode pelemparan koin untuk merepresentasikan model yang spesifik dengan hipotesis nol seperti sebelumnya? Jika tidak, dapatkah Anda menyarankan cara acak seperti apa yang dapat kita gunakan? Apa yang perlu diubah dari simulasi kita yang sebelumnya?

  • Jelaskan mengapa kita tidak dapat menggunakan pelemparan koin sederhana untuk mensimulasikan pilihan orang-orang, seperti yang kita lakukan pada studi Buzz dan Doris.
  • Kita dapat melakukan simulasi dengan menggunakan 4 buah kartu mainan: satu hitam dan tiga merah. Helaskan bagaimana simulasi ini dapat bekerja pada kasus ini.
  • Pilihan lain yaitu kita dapat menggunakan pemutar (spinner) seperti ini,probability-spinner-clipart-1sepertinya layaknya kita bermain permainan anak kecil. Jelaskan bagaimana simulasi ini dapat bekerja jika kita menggunakan papan pemutar.

Apa representasi dari setiap wilayah dari spinner ?

Berapa banyak putar dari spinner yang Anda perlukan untuk mensimulasikan satu perulangan dari percobaan ketika kita ingin melihat pilihan preferensi dari keempat air (apakah hipotesis nol benar)?

  • Sekarang kita akan menggunakan applet Satu Proporsi untuk menghasilkan analisa simulasi statistik. Ingat bahwa applet akan menunjukkan kepada kita apa yang akan terjadi jika kita melakukan simulasi menggunakan spinner.
  1. Pertama masukkan nilai spesifik dari kemungkinan sukses dalam hipotesis nol.
  2. Masukkan ukuran sampel yang sesuai (nilai dari subyek pada studi ini).
  3. Masukkan 1 sebagai nilai sampel, dan tekan Draw Samples. Catat dan laporkan angka “sukses” dalam sampel simulasi.
  4. Sekarang, pilih menu untuk “Proportion of successes”. Laporkan proporsi sukses dalam sampel simulasi. Gunakan jawaban n0.3 untuk memverifikasi bagaimana nilai ini akan dihitung.
  5. Tinggalkan pilihan menu “Proportion of successes” yang telah dipilih, tekan Draw Samples 4 kali. Apakah Anda akan mendapat jawaban yang sama setiap waktu?
  6. Sekarang masukkan 995 sebagai angka dari sampel dan tekan Draw Samples, gunakan angka dari simulasi sampel sampai 1000. Berikan hasil tengah, variabilitas dan bentuk hasil distribusi dari proporsi sampel.

Distribusi simulasi proporsi sampel ini dinamakan Distribusi Nol, karena ini berdasarkan dari asumsi hipotesis nol benar.

  • Ingat kembali nilai pengamatan dari proporsi sampel yang memilih air keran dalam studi ini adalah p̂ = 3/27 ≈ 0.1111. Lihat dalam distribusi nol yang telah kita simulasikan, apakah ini merupakan hasil yang tidak masuk akal, jika hipotesis nol benar? Dengan kata lain, apakah nilai ini jauh dari ekor distribusi nol ?

Nilai 0.1111 tidak jauh daripada ekor distribusi, tetapi juga dekat dengan daerah tengah distribusi. Untuk membantu membuat suatu keputusan tetang kekuatan dari bukti dalam kasus ini, kita dapat menghitung berapa banyak (dan proporsi apa) dari sampel proporsi simulasi adalah ekstrem, dan lebih ekstrem, daripada nilai pengamatan.

  • Gunakkan applet untuk menghitung seberapa banyak (dan proporsi apa) dari simulasi proporsi sampel adalah lebih ekstrem daripada nilai pengamatan.

Untuk melakukan semua ini, pertama tekan simbol pertidaksamaan (≥) untuk mengubahnya menjadi (≤) (untuk mencocokkan hipotesis alternatif). Kemudian tekan tombol Count. Catat semua angka dan proporsi dari simulasi proporsi sampel yang seekstrem, atau lebih ekstrem, daripada nilai pengamatan.

Definisi: Nilai p diestimasikan sebagai suatu proporsi dari simulasi statistik di distribusi nol yang setidaknya seekstrem (pada arah hipotesis alternatif) sebagai nilai dari pengamatan aktual statistik dalam studi pengamatan.

Bagaimana kita dapat mengevaluasi nilai p sebagai suatu penilaian kekuatan bukti yang tersedia sebagai suatu data sampel terhadap hipotesis nol? Satu jawaban adalah: Semakin kecil nilai p, maka semakin kuat bukti terhadap hipotesis nol dan mendukung hipotesis alternatif. Tetapi sebagaimana kecil yang dapat dianggap cukup kecil untuk dapat meyakinkan? Tidak ada jawaban yang pasti, tetapi inilah beberapa garis pedoman:

Garis Pedoman untuk mengevaluasi kekuatan bukti dari nilai p 

0.1    <  nilai p                tidak cukup bukti yang kuat melawan hipotesis nol; nol masuk akal

0.05 < nilai p ≤ 0.10    bukti cukup melawan hipotesis nol

0.01 < nilai p ≤ 0.05    bukti yang cukup kuat melawan hipotesis nol

nilai p ≤ 0.01    bukti yang sangat kuat melawan hipotesis nol

Semakin kecil nilai p, semakin kuat bukti melawan hipotesis nol 

  • Apakah nilai pendekatan untuk p dari analisi simulasi Anda (nomor #20) cukup untuk menyediakan bukti menentang hipotesis nol sehingga orang lebih memilih air keran sama dengan air botol yang bermerk? Jika iya, seberapa kuat bukti tersebut? Jelaskan.
  • Ketika memasukkan nilai p, “lebih ekstrem” selalu diukur dengan arah dari hipotesis alternatif. Gunakan fakta ini untuk menjelaskan mengapa Anda menekan (≤) lebih awal.

Langkah 5. Penarikan Kesimpulan

  • Bagaimana kamu dapat memikirkan jika hasil dari sampel pengamat adalah siginifikan terhadap statistik? Coba ingat maksud daripada hasil pengamatan yang tidak masuk akal dengan hanya menebak.
  • Sebagaiman jauhnya Anda berkeinginan untuk mengeneralisasikan kesimpulan Anda? Apakah Anda berkeinginan untuk mengeneralisasikan kesimpulan dari air minum melebih orang-orang yang memilih dalam studi ini? Jadi seberapa jauh? Jelaskan jawaban Anda.

Langkah 6. Evaluasi dan Pengulangan dari awal.

  • Sarankan suatu pertanyaan untuk penelitian yang baru yang dapat kamu investigasi selanjutnya, pertanyaan apa yang dapat Anda pelajari dalam kasus ini.