Contoh 6.2 Bersepeda Ke Kantor

Langkah 1. Merumuskan Masalah

Apakah jenis bahan sepeda mempengaruhi waktu perjalanan?

Langkah 2. Merancang Penelitian dan Mengumpulkan Data.

Sebuah artikel di British Medical Journal menunjukkan hasil dari suatu penelitian yang dilakukan oleh Jeremy Groves, yang meneliti apakah bahan rangka sepeda mempengaruhi waktu perjalanannya ke kantor. Selama 56 hari (dari pertengahan Januari sampai pertengahan Juli 2010), Groves melakukan pelemparan koin untuk menentukan sepeda mana yang akan ia gunakan – sepeda karbon yang ringan (20.9 lbs) atau sepeda besi yang lebih berat (29.75 lbs).

Pikirkanlah: Apa saja unit eksperimen dalam penelitian ini? Identifikasi dan klasifikasi peran dari variabel dalam penelitian ini.

Unit eksperimen dalam penelitian ini adalah 56 hari yang berbeda. Variabel penjelasnya adalah sepeda bahan apa yang digunakan oleh Groves. Variabel responsnya adalah waktu perjalanannya ke kantor. Variabel penjelasnya bersifat biner dengan dua hasil yang mungkin: sepeda karbon atau sepeda besi. Variabel responsnya bersifat kuantitatif (waktu).

Data yang didapat adalah sebagai berikut:

20170516_094413.jpg

Hipotesa kita adalah sebagai berikut:

Hipotesa Nol: Tidak ada asosiasi antara sepeda mana yang digunakan dengan waktu perjalanan.

Hipotesa Alternatif: Ada asosiasi antara sepeda mana yang digunakan dengan waktu perjalanan.

Variabel respons kita bersifat kuantitatif sehingga kita dapat membandingkan nilai rata-rata antara kedua sampel. Kita juga bisa mendefinisikan parameter yang diamati untuk menjadi perbedaan jangka panjang untuk waktu perjalanan dari kedua jenis sepeda. Hal ini dapat dilambangkan dengan μkarbon – μbesi dimana

μkarbon adalah nilai rata-rata jangka panjang untuk waktu perjalanan menggunakan sepeda karbon.

μbesi adalah nilai rata-rata jangka panjang untuk waktu perjalanan menggunakan sepeda besi.

μ digunakan untuk melambangkan parameter “nilai rata-rata jangka panjang”. Oleh karena itu, kita dapat menuliskan kembali hipotesa kita menjadi:

H0 = μkarbon = μbesi

Ha = μkarbon ≠ μbesi

Perlu diingat bahwa hipotesa selalu berkenaan dengan populasi atau proses, bukan hanya sampel data. Kita ingin menggunakan sampel data untuk memperkirakan probabilitas jangka panjang dari suatu populasi atau proses. Oleh karena itu, hipotesa-hipotesa yang ada semuanya berkaitan dengan waktu perjalanan, bukan hanya selama 56 hari percobaannya.

Pikirkanlah: Apakah ini merupakan suatu studi observasi atau eksperimen?

Ini adalah eksperimen acak karena peneliti menggunakan pengaturan acak (pelemparan koin) untuk menentukan sepeda mana yang akan ia gunakan.

Langkah 3. Pengolahan Data.

Berikut adalah data dalam bentuk boxplot:

20170516_101558.jpg

Untuk menyimpulkan waktu perjalanan untuk setiap jenis sepeda, kita dapat menggunakan nilai rata-rata, standar deviasi, dan Statistika 5 Serangkai. Nilai yang lebih besar untuk standar deviasi berarti lebih banyak variabilitas sekitar nilai rata-rata sampel data.

Langkah 4. Inferensi Statistik.

Seperti yang dapat dilihat dari dotplot dan ringkasan numerik, sampel nilai rata-rata wkatu perjalanan dan sampel variabilitas lebih tinggi untuk sepeda karbon. Hal ini menunjukkan adanya kecenderungan waktu yang lebih lama dan sedikit konsistensi dalam waktu perjalanan menggunakan sepeda karbon. Namun, perbedaan ini tidak terlalu jauh. Bisa saja ia kurang beruntung saat menggunakan sepeda karbon, seperti jalanan macet. Atau apakah ini menunjukkan adanya perbedaan yang disebabkan oleh perbedaan jenis sepeda yang digunakan? Aakah ini hanya sebuah keberuntungan?

Tentu, hal ini mungkin menjadi suatu keberuntungan. Namun, apakah hal ini masuk akal? Mari kita gunakan Strategi 3S .

Strategi 3S

1. Statistik

Kita telah menghitung bahwa selisih antara rata-rata waktu perjalanan dari sampel data (x¯ karbon – x¯besi) adalah 0.53 menit.

2. Simulasi 

Untuk menginvestigasi apakah selisih yang didapat dari nilai rata-rata sampel waktu perjalanan tidak mungkin terjadi hanya karena suatu kebetulan, kita akan melakukan analisa simulasi. Kita akan menggunakan 26 + 30 kartu (total: 56 kartu). 26 kartu adalah 26 kali perjalanan menggunakan sepeda karbon. 30 kartu adalah 30 kali perjalanan menggunakan sepeda besi. Sekarang, kita masukkan nilai-nilai numeriknya pada kartu-kartu tersebut.

Misalkan waktu perjalanan tidak berkaitan dengan jenis sepeda yang digunakan (hipotesa nol). Kita bisa melakukan simulasi untuk hipotesa nol dengan mengacak 56 kartu tersebut dan membaginya ke dalam 2 tumpukan masing-masing 26 kartu dan 30 kartu. Lalu, kita menghitung kembali selisih dari nilai rata-ratanya. Setelah beberapa kali pengulangan, kita akan membentuk suatu distribusi nol.

Dalam beberapa kali pengulangan yang dilakukan, didapat 3 macam selisih, yaitu 2.42, – 0.70, dan 1.05. Pada ketiga kali pengulangan tersebut, semua selisihnya (dalam bilangan absolut) memiliki nilai yang lebih besar daripada selisih rata-rata waktu perjalanan yang didapat melalui sampel data.

Dalam penelitian Groves, kita ingin mengetahui apabila selisih 0.53 ini cukup signifikan untuk mengatakan bahwa hasil ini bukanlah suatu kebetulan dan memang ada perbedaan dalam selisih nilai rata-rata waktu perjalanan dalam jangka panjang.

Jika hipotesa nol benar dan waktu perjalanan tidak berasosiasi dengan jenis sepeda yang digunakan, tidak mengejutkan jika selisih nilai rata-rata yang didapat adalah 0.53 menit. Dalam suatu histogram, nilai ini berada cukup dekat dengan pusat distribusi, yaitu 0. Dengan kata-kata lain, kita bisa menggunakan p-value untuk penelitian ini.

Karena hipotesa alternatif kita memiliki 2 sisi, kita menghitung p-value dengan melihat kedua sisi ekor dari distribusi. Dari penghitungan yang dilakukan, didapat p-value dua sisi bernilai 0.732.

Dari p-value ini, kita bisa menginterpretasikan bahwa probabilitas untuk mendapatkan hasil yang serupa dengan penelitian mungkin jika hipotesa nol benar. Dalam penerapannya untuk penelitian ini, hal ini berarti bahwa nilai rata-rata selisih waktu perjalanan dengan menggunakan kedua jenis sepeda tersebut tetap sama. Jika kita mengulang penelitian dengan pengaturan acak 26 kali penggunaan untuk sepeda karbon dan 30 kali penggunaan untuk sepeda besi, kita bisa menemukan selisih 0.53 atau lebih dalam 73.2% dari seluruh pengaturan acak yang mungkin.

3. Strength of Evidence (Kekuatan Bukti)

P-value yang didapat cukup besar, dan hal ini menunjukkan bahwa hasil ini memungkinkan hipotesa nol bersifat benar.Oleh karena itu, kita tidak memiliki cukup bukti untuk mengatakan bahwa jenis sepeda mempengaruhi waktu perjalanan. Walaupun penelitian ini bersifat eksperimen acak, p-value yang besar tidak membantu kita dalam mengambil kesimpulan.

Ingat, bahwa p-value yang besar tidak menyatakan bahwa hipotesa nol benar. Hal ini hanya berarti bahwa hipotesa nol masuk akal. Kebetulan masih saja mungkin, hanya saja tidak terlihat dalam penelitian ini.

Memperkirakan Interval Kepercayaan

Kita bisa menggunakan interval kepercayaan untuk membuat suatu jangkauan nilai-nilai yang masuk akal.

Metode 2SD membantu kita membuat interval kepercayaan 95% dengan mengambil 2 kali standar deviasi dari hasil simulasi distribusi nol, dengan menambahkan dan mengurangkan hasil tersebut kepada statistik yang diamati. Dalam penelitian ini, standar deviasi adalah 1.46 menit. Oleh karena itu, jangkauan dari interval ini adalah 0.53 – 2*1.46 = -3.45 dan 0.53 + 2*1.46 = 2.59. Kita 95% yakin bahwa selisih waktu perjalanan jangka panjang antara kedua sepeda (μkarbon – μbesi) berada di antara -3.45 menit sampai 2.59 menit.

Dalam interval kepercayaan, dicakup nilai 0 menit. Hal ini masih membuka kemungkinan bahwa hipotesa nol masuk akal. Walaupun penelitian ini bersifat eksperimen acak, p-value yang besar tidak membantu kita dalam mengambil kesimpulan.

Langkah 5. Menarik Kesimpulan.

Pikirkanlah: Dapatkah kita melakukan generalisasi kesimpulan ke dalam populasi yang lebih luas? Dapatkah kita menarik kesimpulan sebab-akibat?

Seperti yang telah kita lihat sebelumnya, lingkup dari kesimpulan yang akan diambil adalah berdasarkan permasalahan: Apakah sampel diambil secara acak dari populasi yang lebih luas? Apakah unit observasi diberikan perlakuan secara acak?

Untuk pertanyaan pertama, jawabannya tidak. Sampel adalah percobaan dilakukan selama 56 hari berturut-turut dan jika hal ini dilakukan pada musim lain, hasilnya pun bisa berbeda (misalnya musim panas dengan musim salju). Selain itu, percobaan ini hanya dilakukan dengan satu subyek yaitu Jeremy Groves.

Untuk pertanyaan kedua, jawabannya ya. Unit observasinya diatur secara acak sehingga perlakuan yang didapat juga bersifat acak. Jika p-value nya kecil, kita bisa menarik kesimpulan sebab-akibat. Namun, batasan penelitian ini adalah penelitian yang tidak bersifat double-blind (peneliti dan subyek sama-sama tidak tahu perkiraan dan hasil observasi).

Langkah 6. Mengevaluasi dan Mengulang Kembali.

Banyak pengguna sepeda memilih menggunakan bahan sepeda yang lebih ringan karena mereka berasumsi bahwa bahan yang lebih ringan membantu mempercepat waktu perjalanan.

Penelitian ini menunjukkan bahwa bahan tidak mempengaruhi waktu perjalanan. P-value yang besar tidak menjadi bukti yang melawan hipotesa nol, hanya mengatakan bahwa masuk akal jika tidak ada perbedaan dan dampak dari bahan sepeda yang digunakan. Selain itu, interval kepercayaannya juga menunjukkan bahwa selisih rata-rata waktu perjalanan adalah antara hanya 2-3 menit sehingga biaya tambahan tidak sebanding dengan hasil yang didapat.

Untuk ke depannya, eksperimen perlu menggunakan lebih banyak subyek, lingkungan, dan cuaca agar kesimpulan yang diambil bisa lebih kuat.