Eksplorasi 3.2 Paham Perkecualian untuk Orang Amerika

Organisasi Gallup mengadakan suatu survei dengan sampel acak dari 1019 orang Amerika dewasa pada tanggal 10-12 Desember 2010. Mereka menemukan 80% dari responden percaya dengan pernyataan bahwa Amerika memiliki karakter yang unik yang membuatnya menjadi negara terhebat di seluruh dunia.

  • Identifikasikan populasi dan sampel dalam survei ini

Populasi :                                                     Sampel :

  • Apakah ini masuk akal untuk mempercayai bahwa sampel dari 1019 orang Amerika dewasa merupakan perwakilan dari populasi yang lebih besar? Jelaskan kenapa iya atau kenapa tidak?
  • Jelaskan kenapa 80% adalah suatu statistik dan bukan parameter. Apa simbol yang akan digunakan untuk merepresentasikan ini?
  • Identifikasikan (dengan kata-kata) parameter yang ingin dibuktikan dari organisasi Gallup.
  • Apakah ini masuk akal untuk menyimpulkan bahwa tepat 80% dari orang Amerika dewasa percaya dengan pernyatan tentang perkecualian orang Amerika? Jelaskan kenapa ya atau kenapa tidak.
  • Meskipun kita perkirakan π dekat ke 0.80, kita sadar bahwa ada nilai yang masuk akal untuk proporsi populasi. Pertama kita pikirkan bahwa nilainya adalah 0.775. Apakah ini masuk akal untuk suatu nilai π? Gunakan applet Satu Proporsi untuk mensimulasikan sampel acak dari 1019 orang dari suatu populasi. (Petunjuk: Coba ingat bahwa 0.775 adalah apa yang kita asumsikan untuk suatu proporsi populasi dan 0.80 adalah proporsi sampel pengamatan). Apa yang dapat Anda perkirakan untuk nilai dua sisi dari nilai p? Apakah Anda akan menolak atau gagal untuk menolak hipotesis nol di 5% tingkat signifikansi?
  • Coba cek juga kotak Summary Box dan laporkan rata-rata dan standar deviasi dari distribusi nol ini.
  • Sekarang coba pikirkan 0.5. Apakah ini masuk akal suatu nilai dari π? Ulangi lagi seperti soal berikutnya dan catat rata-rata dan standar deviasi untuk distribusi nol ini seperti yang kita lakukan sebelumnya.

Secara jelas ini akan menjadi “sangat jauh” dari nilai p = 0.08 yang masuk akal. Tetapi seberapa jauh “sangat jauh” itu? Kita harus melihat Metode Nilai yang Masuk Akal (Plausible Values Method) pada bagian 3.1 untuk menghasilkan suatu selang kepercayaan untuk proporsi dari seluruh orang Amerika dewasa yang setuju dengan pernyataan ini. Tetapi pendekatan ini susah untuk dipakai dan waktu-insentif, maka sekarang kita akan belajar beberapa pendekatan dengan jalan pintas.

  • Pikirkan tebakan awal kita dari π yaitu 0.775. Seberapa banyak standar deviasi 0.80 dari 0.775? (Petunjuk: Nilai standarisasi dengan melihat perbedaan dari 0.775 dan 0.80 dan dibagi dengan standar deviasi yang Anda temukan di nomor sebelumnya.)

Anda harus mengetahui bahwa 0.775 dan 0.80 adalah kurang lebih 2 standar deviasi jauhnya DAN nilai dari dua sisi nilai kurang lebih 0.05, jadi nilai ini sangat dekat dengan batas nilai yang dapat dianggap masuk akal. Nilai diantara 0.80 dan 0.775 dianggap masuk akal dan nilai lebih kecil dari 0.775, atau lebih dari dua standar deviasi di bawah 0.80, tidak akan merupakan nilai yang masuk akal untuk proporsi populasi.

Kunci Ide : Ketika distribusi berbentuk lonceng, seperti distribusi nol yang dipelajari dalam studi ini, perkiraan 95% dari statistik dalam distribusi nol akan jatuh pada dua standar deviasi dari rata-rata. Ini menyebabkan 95% dari proporsi sampel jatuh  pada dua standar deviasi dari kemungkinan jangka panjang (π),  dimana berarti π berada di antara dua standar deviasi dari proporsi sampel pengamatan untuk 95% dari seluruh sampel.

Kita juga dapat melanjutkan ide ini untuk membuat 95% interval kepercayaan.

Kunci Ide : Kita dapat membangun 95% selang kepercayaan dari nilai yang masuk akal unutk suatu parameter dengan menyertakan semua nilai yang jatuh pada kedua standar deviasi dari sampel statistik. Metode ini hanya berlaku ketika distribusi nol mengikuti bentuk lonceng, distribusi simetrik. Kita sebut dengan Metode 2SD. Maka kita dapat menggambarkan 95% dari selang kepercayaan untuk kemungkinan jangka panjang (atau proporsi populasi) π dalam simbol :

p ± 2 x SD(p) 

ketika adalah proporsi sampel dan SD(p) adalah standar deviasi dari distribusi nol dari proporsi sampel. Nilai dari 2 x SD, dimana merepresentasikan setengah dari lebar dari selang kepercayaan, disebut dengan margin of error (rentang kesalahan) dari 95% kepercayaan.

Coba pikirkan: Jadi bagaimana kita dapatkan standar deviasi untuk menggunakan metode 2SD ?

  • Bagaimana standar deviasi yang Anda temukan pada soal di atas (dengan π = 0.775) dan (dengan π = 0.5) dibandingkan?

Anda harus melihat perubahan standar deviasi yang berubah secara perlahan ketika kita mengubah π sedikit demi sedikit. Variabilitas dari proporsi sampel lebih besar dari kenyaatan ketika π = 0.5. Sehingga, suatu pendekatan untuk membuat suatu simulasi (dengan beberapa percobaan) dengan π=0.5, dan dengan menggunakan suatu nilai dari standar deviasi untuk menghitung margin of error. 

  • Misalkan 95% adalah interval kepercayaan dan akan dihitung menggunakan metode 2SD :
  1. Pertama hitung 2 x (standar deviasi dengan distribusi nol dari proporsi sampel) dengan nilai 0.5 dalam simulasi untuk memperkirakan suatu standar deviasi. (Ini adalah margin of error) .
  2. Dengan menggunakan SD untuk menghasilkan 95% selang kepercayaan dengan π. (petunjuk: kurangi rentang kesalahan dari untuk menghitung batas nilai bawah dari selang dan kemudian tambahkan rentang kesalahan ke untuk menentukan batas nilai atas dari selang.)
  3. Intepretasikan interval kepercayaan Anda adalah 95%. Interval kepercayaan apa yang ada di antara kedua nilai?

Suatu batasan dari metode ini adalah hanya menggunakan 95% sebagai level kepercayaan. Bagaimana jika kita ingin menggunakan 90% atau 99% sebagai gantinya? Kita dapat memperluas metode 2SD ini lebih umum dengan pendekatan berbasis teori. Seperti yang kita lihat dalam eksplorasi sebelumnya, kita tidak selalu memerlukan suatu simulasi dari distribusi nol jika kita dapat memprediksi secara tepat apa yang terjadi jika kita melakukan simulasi. Sebagai gantinya, kita dapat memprediksi suatu standar deviasi dengan menggunakan rumus:

screen-shot-2016-09-21-at-3-29-27-pm

dan kita dapat bandingkan dengan nilai dari standar deviasi ke distribusi normal. Tetapi ketika membangun suatu selang kepercayaan, kita tidak memiliki suatu nilai hipotesis dari π, maka kita harus memperkirakan standar deviasi, kita akan mengganti proporsi sampel pengamatan.

screen-shot-2016-09-21-at-3-29-31-pm

  • Hitung standar error untuk studi ini. Bagaimana ini dapat dibandingkan dengan standar deviasi yang Anda temukan sebelumnya?

jadi untuk lebih rumusan yang lebih umum untuk menggunakan metode 2SD untuk memperkirakan suatu proporsi populasi adalah sebagai berikut :

screen-shot-2016-09-21-at-3-31-06-pm

Tetapi bagaimana kita mengubah level kepercayaan?

Metode 2SD telah dirumuskan dengan 95% dari sampel yang merupakan sample proporsi dengan 2 standar deviasi dari proporsi populasi. Jika Anda ingin lebih percaya diri bahwa parameter terdapat pada rentang kesalahan, kita dapat membuat margin of error yang lebih besar dengan meningkatkan suatu pengali. Dalam kenyataanya suatu pengali dari 2.567 memberikan kita 99% tingkat kepercayaan, dimana suatu pengali dari 1.645 hanya memberikan kita 90% kepercayaan.

  • Kita ingin mengandalkan suatu teknologi untuk menemukan suatu pengali yang sesuai untuk tingkat kepercayaan kami.
  1. Dalam applet Kesimpulan Berbasis Teori (Theory-Based Inferences), spesifikasian ukuran sampel (n) dari 1019 dan proporsi sampel 0.80 (atau hitugan sampel 815) dan kemudian tekan Calculate. (Applet akan mengisi dalam count).
  2. Kemudian centang kotak dari interval Kepercayaan (Confidence Interval), pastikan tinkat kepercayaan 95% dan kemudian tekan Calculate CI untuk membangkitkan kepercayaan dari kesimpulan berbasis teori. Catatlah selang kepercayaan berbasis teori dari 95%.

Screen Shot 2016-09-21 at 3.34.15 PM.png

  • Apakah selang kepercayaan berbasis teori sama seperti salah satu yang telah diamati dengan menggunakan metode 2SD ?

Kondisi Keabsahan: Pendekatan berdasarkan teori (disebut dengan selang satu-sampel-z) dikatakan ada paling tidak 10 unit pengamatan dalam setiap kategori dari variabel kategori (contoh: paling tidak 10 sukses dan paling tidak 10 gagal).

Karena kita memiliki suatu ukuran sampel yang besar, pendekatan berbasis teori menghasilkan hasil yang sangat persis seperti Metode Nilai Masuk Akal dan Metode 2SD. Dalam kasus ini, pendekatan berbasis teori sering dikatakan paling mudah, khususnya jika  tingkat kepercayaan kita tidak sama dengan 95%.

  • Ubahlah tingkat kepercayaan dalam Applet dari 95% ke 99% dan kemudian tekan lagi tombol Calculate CI. Laporkan selang kepercayaan 99% yang dihasilkan oleh applet. Bagaimana ini dibandingkan dengan selang 95%? (Bandingkan kedua nilai tengah dari selang = (nilai batas bawah + nilai batas atas)/2 dan margin of error = (nilai batas atas – nilai batas bawah)/2.)