Eksplorasi 2.2: Tidur Malam

Langkah 1. Merumuskan Masalah

Seberapa banyak murid di sekolah Anda yang tidur malam seperti ini? Cobalah untuk membuat pertanyaan yang lebih spesifik dan tanyakan tentang malam kemarin. Apakah rata-rata menyatakan kurang dari 8 jam? Bagaimana kita dapat memperkirakan rata-rata tersebut?

  • Berdasarkan pertanyaan tersebut, apakah populasi kepentingan? Apa parameternya? Apa simbol yang dapat kita gunakan untuk parameter ini?

Populasi :

Parameter :

Simbol :

Langkah 2. Merancang Penelitian dan Mengumpulkan Data

Coba investigasikan apakah rata-rata dari tidur malan untuk populasi dari semua murid dalam kelas kurang dari 8 jam.

  • Nyatakan hipotesis nol dan hipotesis alternatif untuk menginvestigasi pertanyaan ini.

Hipotesis Nol :

Hipotesis Alternatif :

Untuk melakukan pengecekan terhadap hipotesis, kita perlu untuk melakukan pengumpulan data.

  • Idealnya, bagaimana kita dapat memperoleh suatu sampel dari populasi untuk seluruh murid di dalam kelas?
  • Variabel apa yang dapat mengukur jam tidur masing-masing murid?

Sedangkan untuk memperoleh sampel acak sederhana dari murid di sekolah Anda langkah ideal untuk mencoba mendapatkan sampel perwakilan, tidak ada pertanyaan yang akan mengambil sedikit pekerjaan yang adil untuk membuat itu terjadi. Begitu banyak sehingga kita tidak perlu melakukan studi lagi. Ini sering terjadi dalam statistik, dan sebaliknya peneliti sering menggunakan cara yang mudah. Salah satu pilihan dari sampel sederhana dari murid di sekolah Anda adalah dengan mengambil dari kelas Anda.

  • Identifikasikan paling tidak satu cara dari kelas Anda yang dapat mewakili dengan baik keseluruhan murid di sekolah Anda tentang dalam jam tidur semalam.
  • Tarik informasi dari bagian sebelumnya bahwa sampling sederhana harus ______ (berat sebelah/ tidak berat sebelah) sedangkan sampling acak sederhana adalah __________ (berat sebelah/ tidak berat sebelah).

Kita akan melihat kembali implikasi dari penggunaan kelas sebagai sampel dari murid dari sekolah Anda setelah kita mengevaluasi studi. Untuk sekarang, mari kita kumpulkan data terlebih dahulu.

  • Seberapa banyak tidur (dengan pendekatan 1/4 dari jam tidur) yang Anda dapatkan tadi malam? Kombinasikan jawaban Anda dengan jawaban teman sekelas Anda.
  • Apakah Anda melaporkan berapa jam tidur atau berapa menit tidur?

Poin Penting: Ketika mendeskripsikan variabel kuantitatif, kita harus dengan sadar mengetahui unit perhitungan dari variabel. Unit perhitungan mengindikasikan informasi tentang konteks dan pengukuran dari suatu variabel (contohnya: jam vs. hari). Selalu mengandung unit pengukuran ketika kita mendeskripsikan variabel.

Langkah 3. Pengolahan Data

Setelah kita mengumpulkan data, langkah selanjutnya adalah pengolahan data. Dalam kasus variabel kuantitatif (seperti yang kita miliki saat ini), eksplorasi data cukup terkait dalam kasus ini. Coba ulangi lagi dari bahan eksplorasi kita sebelumnya dan kita dapat menyimpulkan variabel kuantitatif dengan menggunkan grafik titik dan kemudian kita deskribsikan bentuk, pusat distribusi, variabilitas dan ketidaknormalan pengamatan.

Gunakan applet Statistik Deskriptif (Desriptive Statistics) untuk menentukan suatu grafik titik dari sampel data. Untuk melakukan ini, tekan Clear untuk menghapus data yang judah ada sebelumnya dan kemudian copy dan paste dalam data kelas Anda (dengan satu kata nama variabel) ke dalam kotak “Sample data” dan kemudian tekan Use Data.

Bentuk 

Sebelumnya, kita mendeskripsikan suatu bentuk distribusi dengan: apakah itu simetris atau tidak simetris. Ketika distribusi tidak simetris, biasanya dideskripsikan sebagai suatu kemiringan.

  • Deskripsikan bentuk dari distribusi dari waktu tidur dalam sampel sebagai simetris, condong kanan, condong kiri, atau yang lain.

Pusat 

  • Satu langkah untuk menyimpulkan pusat dari suatu distribusi adalah dengan rata-rata. Coba cek kotak yang dekat dengan “Actual” dalam baris rata-rata dan menyimpan nilai dari rata-rata dari waktu tidur di kelas Anda. Apakah simbol dapat kita gunakan untuk merepresentasikan nilai ini? Dan laporkan unit perhitungan untuk nilai. Ketika mendeskripsikan pusat dari distribusi, rata-rata tidak selalu menjadi pilihan yang tepat. Khususnya, ketika distribusi condong/miring, ekor dari distribusi menarik rata-rata di arah ini, berarti, dalam beberapa kasus, proporsi yang besar dari nilai data dapat di atas atau di bawah dari rata-rata.

Poin Penting: Suatu distribusi semakin condong ke kanan, semakin besar presentase nilai data di bawah rata-rata. Hal yang sama juga, suatu distirbusi semakin condong ke kiri, semakin besar presentase nilai data di atas rata-rata. (Nilai rata-rata tertarik menuju ekor yang lebih panjang).

  • Untuk kelas Anda, bagaimana banyak tidur murid yang di atas nilai rata-rata? Untuk menemukan perhitungan nilai titik dalam grafik titik di atas tanda panah merah, atau dengan mudah lihat ke dalam data yang Anda paste ke dalam applet.
  • Apa presentase dari kelas Anda yang memiliki jam tidur di atas nilai rata-rata?
  • Apa yang Anda sugestikan tentang kemiringan/kecondongan dari distribusi jam tidur kelas Anda ?

Karena dalam distirbusi yang condong presentase nilai data terbesar dapat di atas atau di bawah rata-rata, nilai tengah (median) terkadang merupakan suatu jalan untuk mengukur pusat dari distribusi. Nilai tengah adalah angka tengah ketika nilai data diurutkan dari kecil ke besar. Ini menyebabkan nilai tengah (median) merupakan angka yang terpisah rata tengah dari data sehingga setengah dari nilai data lebih besar dan setengahnya lebih kecil.

  • Sebelum Anda menggunakan applet untuk mencari nilai tengah dari data jam tidur dalam kelas Anda, pastikan bahwa Anda memahami bagaimana untuk mencari median dengan mencari statistil median murid kelas lain (kecil!). Ini adalah waktu tidur dari kelas kecil yang berjumlah 6 murid: 5, 7.5, 5.5, 8, 6.5, 7.5.

Apakah nilai tengah (median) dari kelas kecil ini? Coba temukan dengan manual, dan jangan gunakan applet.

  • Sekarang, coba kembali ke data kelas Anda. Gunakan applet untuk mencari nilai tengah dari waktu tidur untuk kelas Anda dengan melakukan pengecekan dari kotak “Actual” di dalam baris Median.
  • Apakah nilai tengah dan nilai rata-rata untuk kelas Anda sangat jauh berbeda? Apakah nilai pengamatan dari sampel rata-rata dan nilai tengah merupakan bukti awal mendukung hipotesis alternatif kita?

Variabilitas

Langkah ketiga untuk mendeskribsikan suatu distribusi adalah untuk mendiskusikan variabilitas. Salah satu cara untuk menyimpulkan suatu variabilitas dari distribusi adalah dengan melaporkan nilai standar deviasi.

  • Apakah standar deviasi dari waktu tidur untuk murid dalam kelas Anda? Gunakan applet untuk menemukan dengan mencentang kotak “Actual” ke kotak Std dev.
  • Isi kekosongan dengan mengintepretasikan dengan benar standar deviasi. “Suatu standar deviasi dari __________ (waktu tidur / rata-rata waktu tidur) untuk ________ (murid di kelas/ semua murid di sekolah) adalah ______________ (isi dengan nilai) _________________ (berikan unit pengukuran) dari rata-rata waktu tidur dari ___________________ (isi dengan nilai).

Pengamatan yang Tidak Biasa 

Langkah keempat dari penarikan kesimpulan dari distribusi variabel adalah untuk mengidentifikasikan beberapa pengamatan yang tidak biasa (di luar garis). Meskipun ada beberapa aturan matematika untuk mendefinisikan nilai yang tidak biasa (contoh: jarak tertentu dari kumpulan data), sering kali deskripsi subyektif dari pengamatan yang tidak biasa cukup dibutuhkan.

  • Apakah ada jam tidur di dalam kelas Anda yang dapat Anda karakteristikan sebagai yang tidak biasa (di luar garis)? Apakah itu adalah, waktu tidur yang jauh dari kumpulan data Anda?

Pertentangan 

Coba lihat pilihan dari rata-rata vs. nilai tengah dalam satu langkah lagi.

  • Dalam kotak “Sample Data” dalam applet coba temukan nilai waktu tidur terlama dan ubahlah ke 20.

Carilah nilai baru dari rata-rata : _______

Bagaimana nilai ini berubah dari rata-rata sebelumnya? Kenapa?

Carilah nilai baru dari nilai tengah : ________

Bagaimana nilai ini berubah dari nilai tengah sebelumnya? Kenapa?

Carilah nilai baru dari standar deviasi dari waktu tidur: ________

Bagaimana nilai ini berubah dari nilai standar deviasi sebelumnya? Kenapa?

  • Lingkari yang mana dari ketiga karakteristik yang tidak bertentangan.

Rata-rata                                       Median                                               Standar Deviasi

Langkah 4. Inferensi Statistik.

Sekarang setelah kita melakukan pengolahan data dan lebih memahami suatu distribusi dari jam waktu tidur dalam kelas Anda, kita akan belajar bagaimana untuk menggunakan kedua simulasi dan pendekatan berbasis teori untuk mengevaluasi kekuatan bukti yang menentang hipotesis nol.

Pendekatan berdasar SimulasiMengaplikasikan strategi 3S untuk hipotesis tentang rata-rata populasi 

Untuk mengevaluasi kekuatan butki dari data sampel Anda yang menentang hipotesis nol kita perlu untuk menginvestigasi sebagaimana sering suatu rata-rata dari sampel memiliki nilai sekecil pengamtan dalam sampel Anda dapat terjadi, jika Anda memilih suatu sampel acak dari populasi dimana rata-rata dari waktu tidur benar-benar 8 jam (hipotesis nol). Pada dasarnya, kita akan menggunakan strategi 3S seperti yang kita lakukan sebelumnya

1. Statistik

  • Coba ingatkan diri Anda kembali bahwa rata-rata jam tidur di dalam kelas Anda.

x̄ = ________

2. Simulasi

Pertama, coba misalkan bahwa populasi dari waktu tidur mengikuti suatu distribusi normal dengan rata-rata μ = 8 jam (suatu indikasi dibawah hipotesis nol) dan standar deviasi σ = 1.5 jam (mungkin yang dapat Anda temukan dari sampel Anda). Catatan: kita menggunakan simbol σ untuk merepresentasikan populasi dari standar deviasi.

Kita dapat menginvestigasi apakah nilai pengamatan dari rata-rata sampel cukup mengejutkan untuk naik untuk sampel acak dari beberapa populasi.

Untuk melakukan semua ini, kita harus membuat suatu populasi hipotesis yang cukup besar dari ribuan murid yang ada di sekolah sebagai nilai parameter (rata-rata μ = 8 jam dan standar deviasi σ = 1.5 jam). Anda akan menggunakan applet One Mean untuk menggambarkan sampel acak dari jumlah murid yang sama dari populasi dan mengevaluasi bagaiamana rata-rata kelas Anda akan terbentuk.

  • Bukalah applet One Mean. Ingat bahwa “Pop1” terpilih dan suatu histogram akan menggambarkan distribusinya. Coba periksa distribusi populasi yang terlihat terdistribusi secara normal dengan rata-rata yang sangat dekat dengan 8 jam dan SD adalah skitar 1.5 jam.

Periksa kotak Show Sampling Options. Tetapkan Number of Samples diangka 1 untuk sekarang ini. Coba tetapkan juga Sample Size, cocokkan dengan survei di kelas Anda. Tekan Draw Samples. Coba pilih untuk meilihat angka ID dan nilai waktu tidur yang secara acak terpilih dari populasi hipotesis.

Catat semua nilai dari rata-rata sampel dari sampel ini dari grafik titik ‘Most Recent Sample’. Ingat bahwa sampel ini ditambahkan ke grafik titik statistik.

  • (*) Tekan lagi Draw Samples. Anda akan melihat rata-rata sampel kedua yang ditambahkan ke statistik grafik titik. Rata-rata dari kedua rata-rata sampel dilaporkan sebgaia rata-rata dari grafik titik. Sekarang coba ganti Number of Samples ke 998 (untuk 1000 total sampel) dan tekan Draw Samples.
  1. Apakah bentuk dari distribusi nol?
  2. Dimanakah distribusi ini terpusat? Kenapa ini masuk akal?
  3. Apakah standar deviasi (SD) dari distribusi nol?

3. Kekuatan suatu Bukti

  • (1*) Gantilah Count Sample dengan menu ke bawah ke Less Than (untuk mencocokkan arah dari hipotesis alternatif) dan menspesifikkan rata-rata dari pengamatan sampel dari kelas Anda. Tekan tombol Count dan laporkan nilai pengamatan.

Berdasarkan nilai p, coba kerjakan data sampel yang menghasilkan bukti yang kuat dari rata-rata populasi waktu tidur tadi malam di sekolah Anda yang kurang dari 8 jam? Samakan jawaban Anda, juga kepada teman Anda yang tidak belajar statistik.

  • Pastikan nilai dari statistik standarisasi dengan menggunakan rumus dari pembelajaran sebelumnya :

formula1

  • Berdasarkan dari  nilai standarisasi statistik, simpulkan kekuatan bukti dari bukti yang diberikan berdasarkan data sampel yang menentang hipotesis nol,

Pendekatan Berbasis Teori

Dari beberapa eksplorasi sebelumnya kita dapat melihat bahwa kita dapat memprediskikan bentuk dari distribusi nol dengan menggunakan teori berdasar simulasi, selama beberapa kondisi valid terpenuhi. Kita sekarang akan mengeksplorasi suatu pendekatan berbasis teori untuk melakukan test terhadap rata-rata tunggal.

Dalam eksplorasi pertama sebelum ini, kita menggunakan kemungkinan secara teoritis yang disebut dengan distribusi normal untuk memprediksi distribusi dari proporsi sampel. Ternyata banyak orang yang tidak dapat memprediksi rata-rata suatu distribusi sampel secara langsung, sehingga mereka melakukan prediksi dari suatu distribusi statistik standarisasi. Distribusi matematika yang mereka temukan disebut dengan distribusi t. Bentuk daripada distribusi t masih tetap berbentuk kurva puncak, tetapi dengan pusat nol (0). Ini sangat tampak sekali seperti distribusi normal tetapi lebih menyebar keluar daripada distribusi normal pada umumnya(lebih banyak data di ‘ekor’ maka lebih sedikit yang terdapat di tengah kurva. Untuk kasus ini, standarisasi statistik untuk melakukan uji hipotesis tentang suatu rata-rata populasi bukan statistik-z (distribusi normal), tetapi disebut dengan t statistik (distribusi-t).

Kondisi Keabsahan (Validitas)

Seperti yang telah kita diskusikan pada eksplorasi sebelumnya, uji berdasar teori adalah absah ketika suatu kondisi terpenuhi. Dalam kasus dari uji rata-rata tunggal (disebut dengan one sample t-test) kondisi absah lebih rumit daripada proporsi tunggal.

Kondisi Keabsahan: Variabel kuantitatif harus memiliki distribusi simetris atau Anda harus memiliki paling tidak 20 pengamatan dan distribusi sampel yang tidak condong.

Perlu diingat bahwa kondisi merupakan kondisi kasar dan tidak menggaransi. Semua metode berbasis teori adalah suatu pendekatan. Ini akan bekerja secara maksimal ketika suatu distribusi adalah simetris, ketika ukuran sampel besar dan tidak ada garis batas/batasan yang besar. Ketika ini ragu, gunakan metode berbasis teori seperti cross-check. Jika kedua metode memberikan hasil yang sangat berbeda Anda harus paling tidak berkonsultasi dengan ahli statistik.

  • (**) Apakah Anda akan berpikir bahwa kondisi keabsahan akan bertemu pada populasi 1?

Rumus untuk Statistik t

  • Hasil dari statistik t untuk uji dari rata-rata populasi dapat ditemukan dengan menggunakan rumus berikut :

 formula2dimana μo adalah simbol yang digunakan untuk merepresentasikan nilai dari rata-rata proporsi ketika distribusi nol benar. Ingat bahwa adalah sampel dari standar deviasi dan adalah ukuran sampel.

Hitung nilai dari statistik untuk data kelas Anda.

  • Kabar baiknya adalah statistik t dapat diintepretasikan sangat dekat dengan statistik z. Dengan nama, nilai lebih besar dari 2 (atau lebih kecil dari -2 ) memberikan bukti kuat untuk menentang hipotesis nol. Artikan apa yang dimaksud dengan statistik yang memberikan pengertian tentang kekuatan bukti yang menentang hipotesis nol.

Ingat bahwa rumus untuk statistik sangatlah dekat dengan bagaimana kita memasukkan standarisasi statistik ke dalam simulasi. Dengan kata lain, coba carilah statistik t, kurangkan nilai hipotesis (μo) dari sampel statistik (x̄) dan kemudian bagi dengan sesuatu. Ketika simulasi yang kita bagi dengan standar deviasi dari statistik simulasi, kita akan bagi dengan (s/√n). Ternyata s/√n adalah suatu prediksi untuk standar deviasi dari statistik simulasi.

Kunci Ide: Ketika kita melakukan sampling dari populasi yang besar, suatu standar deviasi dari rata-rata sampel diperkirakan dengan s/√n. Populasi dikatakan cukup besar ketika ini memiliki lebih dari 10 atau 20 kali dari bertemunya ukuran sampel dan kondisi keabsahan. Ini adalah versi lain dari Teorema Limit Pusat yang kita sempat singgung pada contoh dan eksplorasi sebelumnya, tetapi untuk data kuantitatif.

  • Bandingkan standar deviasi dari distribusi nol yang Anda laporkan di jawaban Anda sebelumnya pada soal (*) nilai dari s/√n. Mengapa nilai tersebut sangat dekat (sama) ?
  • Dalam applet One Mean, di atas dari grafik statistik, ubahlah pilihan dari rata-rata statistik ke statistik t. Centang kotak untuk  Overlay t Distribution. Apakah model teoritis melakukan suatu pekerjaan yang sesuai dengan memprediksikan sifat dari distribusi simulasi statistik t ? Bagaimana ini berhubungan dengan jawaban Anda pada pertanyaan (**)?
  • (***) Gunakan applet untuk menghitung angak dari sampel simulasi dengan statistik t yang lebih kecil (hipotesis alternatif kita) daripada nilai pengamatan dari statistik t untuk menemukan nilai perkiraan (berdasarkan statistik t).
  • Nilai berdasar teori (uji satu sampel t) juga dihasilkan pada keluaran/ output. Apakah nilai p berdasarkan teori?
  • Kenapa nilai p berdasar teori sama dengan nilai p yang kalian dapat pada (1*) (dengan menggunakan statistik t) dan pada (***) (dengan menggunakan rata-rata sampel)?

Langkah 5. Penarikan Kesimpulan

  • Coba pikirkan kembali mengenai sampel yang terpilih dari populasi. Apakah Anda merasa nyaman mengenerelasisikan hasil dari hasil kalian dengan populasi dari seluruh siswa di dalam sekolah Anda? Jelaskan.

Langkah 6. Mengevaluasi dan Mengulang Kembali.

  • Coba pikirkan kebelakang. Apakah yang berkaitan dengan kerangka dan kesimpulan dari studi ini yang dapat kalian pikirkan?

Beberapa perdebatan yang dapat kalian kritisi antara lain:

  1. Kecocokan antara pertanyaan riset dan kerangka studi?
  2. Bagaimana unit pengamatan terpilih?
  3. Bagaimana pengukuran tercatat?
  4. Apakah yang kita amati adalah nilai praktis?

Pikirkan ke depan. Apakah yang harus diperbaiki ke depannya oleh Peneliti untuk mengatasi kekurangan atau merencangakan pengetahuan/ilmu ke depannya?

Review #1

Untuk mendapatkan analisis di atas, kita dapat membuat suatu hipotesis populasi untuk contoh sampel. Bagaimana senstifnya suatu analisis untuk pilihan populasi tersebut

  1. Simulasi
  • Sekarang coba asumsikan bentuk yang berbeda untuk populasi dari waktu tidur. Gunakan tombol untuk memilih Pop 2.

– Deskribsikan bagaimana bentuk dari populasi tersebut berbeda dari populasi pada contoh sebelumnya. Dan coba laporkan rata-rata dari populasi dan standar deviasinya.

– Selanjutnya coba pikirkan suatu pendekatan nilai dari hasil kelas Anda. Deskribbsikan bagaimana Anda dapat menyelesaikan dan alporkan nila p. Berdasarkan nilai p, apakah nilai Anda memberikan bukti yang cukup kuat bahwa suatu rata-rata populasi waktu tidur semalam di sekolah Anda lebih kecil dari 8 jam?

  • Apakah nilai p berdasar teori merupakan suatu pendekatan yang valid (absah) dari simulasi nilai p untuk 2 populasi dan ukuran sampel ini? Jelaskan bagaimana Anda dapat memilihnya.
  • Apakah asumsi dari bentuk populasi (Pop 1 vs. Pop 2) memberikan perbedaan yang substansial dalam rata-rata distribusi sampel? Samakan jawaban Anda. (Petunjuk: Pikirkan bentuk, pusat, dan variabilitas dari rata-rata sampel.)
  • Apakah asumsi dari bentuk populasi (Pop 1 vs. Pop 2) memberikan perbedaan yang substansial di kekuatan bukti menentang hipotesis nol? Jelaskan.

Jadi pada kenyataannya, metode berbasis teori tidak harus terlalu sensitif terhadap bentuk dari populasi yang kita gunakan. Satu keuntungan dari prosedur dari bahwa kita tidak harus membangkitkan suatu populasi untuk keseluruhan sampel, selama kondisi validasi bertemu.

Review #2

Pertama untuk bagian yang kita bicarakan tentang keuntungan potensil dari nilai tengah dibandingkan dengan nilai rata-rata dalam kesimpulan variabel kuantitatif ketika distribusi dari variabel condong. Tetapi, kita dapat melakukan analisis dari kekuatan bukti dengan menggunakan rata-rata populasi. Bagaimana jika kita tetap menggunakan nilai tengah?

  • Coba paparkan ulang hipotesis nol dan hipotesis alternatif dari nilai tengah populasi dalam 8 jam.
  • Coba jelaskan bagaimana Anda dapat mengubah strategi 3S untuk uji hipotesis berikut
  1. Statistik. Apakah nilai untuk statistik baru?
  2. Simulasi. Coba jelaskan bagaimana Anda dapat mengubah simulasi? (Petunjuk: Informasi apa yang dapat Anda kumpulkan dari setiap sampel acak?)
  3. Kekuatan bukti. Bagaimana Anda dapat mengubah penaksiran Anda terhadap kekuatan bukti?
  • Gunakan applet One Mean untuk mensimulasikan 1000 sampel acak dari populasi 1 dengan menggunakan nilai tengah sebagai statistik. Apa yang dapat kita simpulkan tentang kekuatan suatu bukti yang diberikan berdasar nilai tengah sampel yang menentang hipotesis nol?
  • Coba periksa populasi 2. Apakah Anda dapat menggunakannya untuk menguji apakah ini merupakan suatu bukti dari nilai tengah dari sampel Anda berdasarkan suatu populasi? Jelaskan.

Sedangkan mengubah strategi 3S untuk menguji nilai tengah tidaklah sulit, uji berdasarkan teori untuk nilai tengah lebih sulit dan tidak umum. Meskipun ada beberapa opsi untuk melakukan uji berdasar teori untuk suatu nilai tengah, maka tidak akan ada pertanyaan apakah pendekatan simulasi tidak rumit dan mudah untuk diimplementasikan!