| www.unesa.ac.id | pdpt.unesa.ac.id

KAMPUS KETINTANG
Jl. Ketintang, Surabaya 60231

KAMPUS LIDAH WETAN
Jl. Lidah Wetan, Surabaya
info@unesa.ac.id

statistika II
FileName : statistika II.doc
FileType : application/msword
FileSize : 908 KB
Download



Plain Text Preview

BAB I PENDAHULUAN Statistika inferensial adalah metode-metode yang berhubungan dengan analisis sebagian data (sample) untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan data populasi. Dari pernyataan tersebut terkandung makna bahwa statistika inferensial mempunyai 2 fungsi, yaitu: 1. Estimasi, yaitu usaha untuk menduga, menaksir atau meramalkan suatu keadaan tertentu. 2. Membuktikan atau menguji kebenaran suatu hipotesis. Hipotesis adalah asumsi atau dugaan mengenai sesuatu hal. Ada 2 macam hipotesis: 1. Hipotesis nol (H0) merupakan suatu pernyataan mengenai nilai parameter populasi. Biasanya dinyatakan dengan "tidak ada perbedaan" , "tidak ada hubungan", "sama dengan", dll. 2. Hipotesis alternative (H1) merupakan pernyataan yang diperoleh dari kajian teoritis, biasanya merupakan asumsi dari peneliti. Beberapa bentuk pasangan hipotesis: a. H0 : ?????? H1 : ? ? ?? c. H0 : ?????? H1 : ?????? b. H0 : ?????? H1 : ?????? Contoh: 1. H0 : ???????ribu H1 : ? ? ???ribu 2. H0 : pp = pw H1 : pp > pw Jenis Kesalahan Keputusan Terima H0 Terima H1 Keadaan sebenarnya H0 benar Benar Salah jenis I (?) H1 benar Salah jenis II ??? Benar ? adalah peluang menolak H0 padahal H0 benar ? adalah peluang menolak H1 padahal H1 benar Peneliti atau pembuat keputusan selalu berusaha agar kedua jenis kesalahan tersebut dibuat sekecil mungkin. Nilai kesalahan yang biasa digunakan adalah ? sebesar 0.05 = 5% Prosedur pengujian hipotesis: 1. Merumuskan hipotesis (H0 dan H1) 2. Menentukan uji yang sesuai (uji Z, uji t, F, ?2, dll) 3. Menentukan nilai tabel 4. Menentukan daerah keputusan 5. Mengambil keputusan (tolak H0 atau terima H0) dan menyimpulkan BAB II UJI CHI SQUARE (?2) Merupakan teknik analisis yang diantaranya digunakan untuk menguji ada tidaknya perbedaan pada gejala nominal atau ordinal dan kemudian menarik kesimpulan dari gejala tersebut. Pada dasarnya teknik analisis dapat dikelompokkan menjadi 2: 1. Bila tabel kontingensi berbentuk 2 x 2 2. Bila tabel kontingensi berbentuk selain 2 x 2 dimana fo = frekuensi observasi fe = frekuensi ekspektasi atau frekuensi harapan = Dengan derajat bebas (db) = (r-1) (c-1) Kriteria pengambilan keputusan * Tolak H0 bila ?2 hitung = ?2 ??, db * Terima H0 bila ?2 hitung < ?2 ??, db Untuk mengetahui besarnya hubungan antara dua variable digunakan koefisien Cremer (V) dengan persamaan: -1 = V = 1 * Uji ?2 untuk sample lebih dari satu Contoh: 1. Seorang manager pemasaran ingin mengetahui bagaimana minat pembelian suatu produk bila ditinjau dari usia konsumen berdasarkan data berikut: Minat membeli Jumlah Suka Tidak suka Muda 10 30 40 Tua 40 20 60 Jumlah 50 50 100 Penyelesaian: 1. Menentukan hipotesis: H0 : tidak terdapat perbedaan minat antara konsumen usia muda dan tua H1 : ada perbedaan minat antara konsumen usia muda dan tua 2. Menentukan uji yang sesuai. Karena tabel yang terbentuk 2 x 2 maka digunakan persamaan Suka Tidak suka Muda 10 20 30 20 40 Tua 40 30 20 30 60 50 50 100 3. Nilai tabel untuk ?2 0.05 (1) = 3.841 4. Menentukan daerah keputusan * Tolak H0 bila ?2 hitung = ?2 0.05 (1) * Terima H0 bila ?2 hitung < ?2 0.05 (1) 5. Sehingga kriteria keputusan adalah tolak H0 karena ?2 hit > ?2 0.05 (1) dengan kesimpulan bahwa ada perbedaan minat antara konsumen usia muda dan konsumen usia tua Sementara itu untuk mengetahui besarnya hubungan antara kedua variable tersebut digunakan persamaan: = = 0.3878 Ini menunjukkan meskipun ada perbedaan minat antara konsumen usia muda dan konsumen usia tua tetapi hubungan antara minat membeli dan usia tidak terlalu besar. 2. Seorang peneliti menemukan data tentang tingkat pendidikan dengan jumlah anak = 1 2-3 > 3 Jumlah Pendidikan tinggi 30 20 10 60 Pendidikan sedang 40 40 10 90 Pendidikan rendah 20 40 90 150 Jumlah 90 100 110 300 Penyelesaian: 1. Menentukan hipotesis: Hipotesis: H0 : tidak terdapat hubungan antara tingkat pendidikan dengan jumlah anak H1 : terdapat hubungan antara tingkat pendidikan dengan jumlah anak 2. Menentukan uji yang sesuai. = 1 2-3 > 3 Jumlah Pendidikan tinggi 30 18 20 20 10 22 60 Pendidikan sedang 40 27 40 30 10 33 90 Pendidikan rendah 20 45 40 50 90 55 150 Jumlah 90 100 110 300 = 42.259 3. Menentukan nilai tabel untuk ?2 0.05 (4) = 9.483 4. Menentukan daerah keputusan * Tolak H0 bila ?2 hitung = ?2 0.05 (1) * Terima H0 bila ?2 hitung < ?2 0.05 (1) 5. Sehingga kriteria keputusan adalah tolak H0 karena ?2 hit > ?2 0.05 (4) dengan kesimpulan bahwa ada hubungan antara tingkat pendidikan dengan jumlah anak. Sementara itu untuk mengetahui besarnya hubungan antara kedua variable tersebut digunakan persamaan: = = 0.265 Ini menunjukkan bahwa hubungan antara tingkat pendidikan dan jumlah anak tidak terlalu besar. SOAL: 1. Berdasarkan data berikut, seorang dokter ingin : Sakit jantung Tidak sakit Bukan perokok 10 30 Perokok 40 20 a. mengetahui pengaruh kebiasaan merokok terhadap penyakit jantung b. Besarnya hubungan antara kedua variable tersebut 2. Penelitian dilakukan terhadap 180 anak usia sekolah dari beberapa keluarga dengan tingkat sosial ekonomi (sosek) yang berbeda, diperoleh hasil sebagai berikut: Mudah sakit Sehat Sosek baik 10 45 Sosek menengah 15 45 Sosek buruk 45 20 Berdasarkan data tersebut, a. ujilah apakah ada hubungan antara kesehatan dengan tingkat sosial ekonomi b. besarnya hubungan antara kedua variable tersebut. * Uji ?2 untuk sample tunggal * Bila db=1 Contoh: Misalnya dari suatu percobaan dengan metode baru diperoleh data sbb: Kategori Frek. Berhasil Gagal Jumlah fo fe 27 20 13 20 40 40 1. Hipotesis: H0 : peluang keberhasilan dan kegagalan untuk metode baru tersebut sama H1 : peluang keberhasilan dan kegagalan untuk metode baru tersebut tidak sama 2. 3. Nilai tabel untuk ?2 0.05 (1) = 3.841 4. Menentukan daerah keputusan a. Tolak H0 bila ?2 hitung = ?2 0.05 (1) b. Terima H0 bila ?2 hitung < ?2 0.05 (1) 5. Sehingga kriteria keputusan adalah tolak H0 karena ?2 hit > ?2 0.05 (1) dengan kesimpulan bahwa peluang keberhasilan dan kegagalan untuk metode baru tersebut sama dimana metode mempunyai keberhasilan lebih banyak dari kegagalan * Bila db > 1 Contoh: Penelitian dilakukan terhadap 45 siswa sekolah kejuruan. 13 orang menyukai sekolah mereka, 8 orang menyatakan sama saja dengan sekolah lain dan 14 anak tidak menyukai sekolah mereka. Pendapat Frek Menyukai Sama saja Tdk menyukai fo fe 13 15 8 15 14 15 1. Hipotesis: H0 : peluang pendapat siswa mengenai sekolah mereka sama H1 : peluang pendapat siswa mengenai sekolah mereka tidak sama 2. = 3.6001 3. Nilai tabel untuk ?2 0.05 (2) = 5.991 4. Menentukan daerah keputusan a. Tolak H0 bila ?2 hitung = ?2 0.05 (2) b. Terima H0 bila ?2 hitung < ?2 0.05 (2) 5. Sehingga kriteria keputusan adalah terima H0 karena ?2 hit < ?2 0.05 (2) dengan kesimpulan bahwa peluang pendapat mereka mengenai sekolah mereka sama * Menghitung ?2 tanpa frekuensi harapan Untuk tabel berbentuk 2 x 2 Kategori 1a Kategori 1b Jumlah baris Kategori 2a a b a+b Kategori 2b c d c+d Jumlah kolom a+c b+d Jml tot= a+b+c+d Contoh: Penyelesaian: 1. Menentukan hipotesis: H0 : tidak terdapat perbedaan minat antara konsumen usia muda dan tua H1 : ada perbedaan minat antara konsumen usia muda dan tua 2. Menentukan uji yang sesuai. Karena tabel yang terbentuk 2 x 2 maka dapat digunakan persamaan Minat membeli Jumlah Suka Tidak suka Muda 10 30 40 Tua 40 20 60 Jumlah 50 50 100 3. Nilai tabel untuk ?2 0.05 (1) = 3.841 4. Menentukan daerah keputusan a. Tolak H0 bila ?2 hitung = ?2 0.05 (1) b. Terima H0 bila ?2 hitung < ?2 0.05 (1) 5. Sehingga kriteria keputusan adalah tolak H0 karena ?2 hit > ?2 0.05 (1) dengan kesimpulan bahwa ada perbedaan minat antara konsumen usia muda dan konsumen usia tua ?2 Untuk Uji Kenormalan Dengan hipotesis: H0: data berdistribusi normal H1 : data tidak berdistribusi normal Menentukan daerah keputusan > Tolak H0 bila ?2 hitung = ?2 ? (5) ==> data tidak berdistribusi normal > Terima H0 bila ?2 hitung < ?2 ??(5) ==> data berdistribusi normal Contoh: berikut ini adalah 50 data produksi gabah di suatu daerah. Tentukan apakah data tersebut berdistribusi normal 20 24 26 30 38 20 24 27 31 38 20 25 27 31 38 22 25 28 33 39 22 25 28 33 40 22 25 30 34 40 22 25 30 35 40 23 25 30 35 43 24 26 30 36 43 24 26 30 37 44 Penyelesaian: 1. Tentukan hipotesisnya: H0: data berdistribusi normal H1 : data tidak berdistribusi normal 2. Menentukan nilai ?2 a. mencari nilai mean = dan standard deviasi = dari data di atas diperoleh mean= 29.9 dan standard deviasi = 6.8 b. menentukan nilai interval untuk mendapatkan frekuensi observasi (fo) 3. Membuat tabel untuk menghitung nilai ?2 Kategori Interval fo fo (%) fe (%) fo-fe (fo-fe)2 > mean+2s > 43.5 3 6 2.28 3.72 13.8384 6.069474 Mean+2s s/d mean+1s 36.7-43.5 8 16 13.59 2.41 5.8081 0.42738 Mean+1s s/d mean 29.9-36.7 14 28 34.13 -6.13 37.5769 1.100993 mean s/d mean-1s 23.1-29.9 17 34 34.13 -0.13 0.0169 0.000495 Mean-1s s/d mean-2s 16.3-23.1 8 16 13.59 2.41 5.8081 0.42738 Mean-2s > 16.3 > 0 0 2.28 -2.28 5.1984 2.28 Jumlah 50 100 100 10.3057 4. Menentukan nilai ?2 tabel ?2 tabel untuk db=5 dan taraf nyata 5% = 11.07 5. Menentukan kesimpulan Karena ?2 hitung (=10.3057) lebih kecil daripada ?2 tabel (11.07) maka terima H0 dengan kesimpulan bahwa data berdistribusi normal SOAL: 1. Suatu perusahaan keluarga memiliki 5 unit usaha. Pada rapat tahunan pemegang saham diharapkan setiap unit memberikan keuntungan 50jt per tahun. Berdasarkan laporan tutup buku diperoleh hasil sbb: Bidang Usaha Keuntungan(jt) Wartel 41 Warnet 84 Toko kelontong 28 Fotocopy 52 Kantin 59 Ujilah apakah setiap unit memberikan keuntungan yang sama? 2. Tentukan kenormalan dari data di bawah ini: 52 57 60 62 66 54 57 60 63 66 55 57 61 63 67 56 58 61 63 67 56 59 61 64 67 56 59 61 64 68 56 59 61 64 68 56 59 62 65 73 56 60 62 65 75 56 60 62 65 77 BAB III PENGUJIAN RATA-RATA Dalam pengujian nilai tengah (rata-rata) uji statistik yang digunakan adalah uji z atau uji t, tergantung pada banyaknya data sample yang diperoleh. Untuk sample besar (n=30) digunakan uji z, sedangkan untuk sample kecil (n<30) digunakan uji t. Kedua uji statistik tersebut mensyaratkan bahwa sample harus berdistribusi normal dan merupakan data interval atau rasio. :) PENGUJIAN RATA-RATA UNTUK SATU POPULASI a. sample besar (n = 30) Hipotesis yang digunakan adalah: ?????????? ??????????? ?????????? ??????????? ?????????? ??????????? Wilayah kritis Wilayah kritis Wilayah kritis zhit > z? zhit <- z?/2 dan zhit > z?/2 zhit <- z? Contoh: 1. Pada tahun 1970-an tinggi badan rata-rata orang Indonesia adalah 161 cm dengan varians 81 cm. Saat ini, diduga telah terjadi kenaikan rata-rata tinggi badan bila dibandingkan dengan tahun 1970-an. Untuk membuktikannya diambil contoh acak berukuran 35 dan diperoleh rata-rata sebesar 167 cm. Ujilah apakah dugaan tersebut benar pada taraf nyata 5%. Diasumsikan sample berdistribusi normal. Diketahui: Rata-rata populasi (?0) = 161 cm varians (??) = 81 cm ==> simpangan baku (?) = 9 cm Banyaknya sample (n) = 35 Rata-rata sample () = 167 Taraf nyata (?) = 0.05 Jawab: 1. Menentukan hipotesis H0 : ??= 161 (rata-rata tinggi badan sama dengan 161 cm) H1 : ? > 161 (rata-rata tinggi badan lebih dari 161 cm) 2. Karena sample yang digunakan berukuran besar (n > 30) maka uji yang digunakan adalah uji z z = = 3. Menentukan nilai tabel. Untuk ? = 0.05 maka z?????= 1.645 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila zhit = z???? = 1.645 * Terima H0 bila zhit < z???? = 1.645 5. Karena nilai zhit (3.94) lebih besar dari nilai z???? (1.645) maka tolak H0 dengan kesimpulan rata-rata tinggi orang Indonesia saat ini lebih dari 161 cm 2. Sebuah perusahaan alat olah raga mengembangkan jenis batang pancing sintetik yang dikatakan mempunyai kekuatan rata-rata 8 kg dan simpangan baku 0.5 kg. Ujilah hipotesis alternatif yang menyatakan bahwa kekuatan rata-ratanya tidak sama dengan 8 kg, bila dari 50 sampel batang pancing yang diambil menunjukkan rata-rata kekuatan 7.8 kg. Gunakan taraf nyata 0.01. Diasumsikan sample berdistribusi normal. Diketahui: Rata-rata populasi (?0) = 8 kg simpangan baku (?) = 0.5 kg Banyaknya sample (n) = 50 Rata-rata sample () = 7.8 kg Taraf nyata (?) = 0.01 Jawab: 1. Menentukan hipotesis H0 : ??= 8 (rata-rata kekuatan batang pancing sama dengan 8 kg) H1 : ? ? 8 (rata-rata kekuatan batang pancing tidak sama dengan 8 kg) 2. Karena sample yang digunakan berukuran besar (n > 30) maka uji yang digunakan adalah uji z z = = 3. Menentukan nilai tabel. Karena hipotesis yang digunakan bertanda ? maka digunakan uji 2 arah ==> ??? = 0.005 maka z????? = 2.575 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila zhit = - z????? = - 2.575 atau bila zhit = z????? = 2.575 * Terima H0 bila -z????? (-2.575) < zhit < z????? (2.575) 6. Karena nilai zhit (-2.83) lebih kecil dari nilai -z???? (-2.575) maka tolak H0 dengan kesimpulan bahwa rata-rata kekuatan batang pancing tidak sama dengan 8 kg, tetapi kurang dari 8 kg b. sample kecil (n < 30) ? Hipotesis yang digunakan adalah: H0: ?????? H1 : ?????? H0: ?????? H1 : ?????? H0: ?????? H1 : ?????? Wilayah kritis Wilayah kritis Wilayah kritis thit > t? thit <- t?/2 dan thit > t?/2 thit <- t? Contoh: 1. Suatu perusahaan lampu menyatakan bahwa lampu produksinya rata-rata dapat bertahan selama 400 jam. Sebuah lembaga konsumen berkeinginan untuk membuktikan pendapat tersebut sebab ada keluhan dari masyarakat yang menyatakan bahwa lampu pijar tersebut cepat putus. Untuk membuktikannya diambil contoh acak sebanyak 25 lampu dengan data sbb: 450 390 400 480 500 380 350 400 340 300 300 345 375 425 400 425 390 340 350 360 300 200 300 250 400 Ujilah apakah pendapat perusahaan lampu tersebut benar, gunakan taraf nyata 5%. Diasumsikan sample berdistribusi normal. Diketahui: Rata-rata populasi (?0) = 400 jam Banyaknya sample (n) = 25 Rata-rata sample () = = 366 jam simpangan baku (s) = = 68.25 Taraf nyata (?) = 0.05 Jawab: 1. Menentukan hipotesis H0 : ??= 400 (rata-rata daya tahan lampu sama dengan 400 jam) H1 : ? < 400 (rata-rata daya tahan lampu kurang dari 400 jam) 2. Karena sample yang digunakan berukuran kecil (n < 30) maka uji yang digunakan adalah uji t = 3. Menentukan nilai tabel. ??= 0.05 ==> t0.05 =1.711 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila thit = - t???? (- 1.711) * Terima H0 bila thit > t0.05 (-1.711) 5. Karena nilai thit (-2.49) lebih kecil dari nilai -t???? (-1.711) maka tolak H0 dengan kesimpulan bahwa rata-rata daya tahan lampu pijar tersebut kurang dari 400 jam 2. Tinggi rata-rata mahasiswi tingkat persiapan di suatu perguruan tinggi adalah 162.5 cm. apakah ada alasan untuk mempercayai bahwa terjadi peningkatan dalam tinggi rata-rata mahasiswi, bila diambil suatu contoh acak sebanyak 20 mahasiswi dengan tinggi rata-rata 165.2 cm dan simpangan baku 5.9 cm. gunakan taraf nyata 5% Diketahui: Rata-rata populasi (?0) = 162.5 cm Banyaknya sample (n) = 20 Rata-rata sample () = 165.2 cm simpangan baku (s) = 5.9 cm Taraf nyata (?) = 0.05 Jawab: 1. Menentukan hipotesis H0 : ??= 162.5 (rata-rata tinggi badan mahasiswi sama dengan 162.5 cm) H1 : ? > 165.2 (rata-rata tinggi badan mahasiswi lebih dari 162.5 cm) 2. Karena sample yang digunakan berukuran kecil (n < 30) maka uji yang digunakan adalah uji t = 3. Menentukan nilai tabel. ??= 0.05 ==> t0.05 = 1.711 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila thit = t???? (1.711) * Terima H0 bila thit < t0.05 (1.711) 5. Karena nilai thit (2.05) lebih besar dari nilai t???? (1.711) maka tolak H0 dengan kesimpulan bahwa terjadi peningkatan tinggi rata-rata mahasiswi tingkat persiapan S O A L 1. Sebelum kenaikan BBM, pedagang jeruk rata-rata dapat menjual jeruk paling banyak 100 kg jeruk per hari. Peneliti ingin membuktikan bahwa setelah kenaikan BBM ada penurunan jumlah penjualan jeruk. Untuk itu dilakukan pendataan terhadap 20 pedagang jeruk dengan hasil penjualan sbb: 98 80 12 90 70 100 60 85 95 100 70 95 90 85 75 90 70 90 60 110 2. Ujilah hipotesis yang menyatakan bahwa isi kaleng rata-rata suatu jenis minyak pelumas adalah 10 liter. Bila diambil contoh acak 10 kaleng dengan isi sebanyak: 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3, dan 9.8 liter. Gunakan taraf nyata 0.01 dan asumsikan bahwa isi tersebut menyebar normal. 3. Ada yang menyatakan bahwa jarak tempuh mobil rata-rata paling banyak adalah 20000 km/tahun dengan simpangan baku 1700km. Untuk menguji pendapat tersebut, diambil 100 sampel mobil dengan waktu tempuh rata-rata 23500 km/tahun. Ujilah pendapat tersebut dengan taraf nyata 0.05. 4. Sebuah pabrik rokok menyatakan bahwa kadar nikotin rata-rata pada rokoknya tidak melebihi 3.5 mg. Diambil contoh acak 8 batang rokok dengan kadar nikotin rata-rata 4.2 mg dan simpangan baku 1.4. Ujilah pernyataan pabrik rokok tersebut pada taraf nyata 0.01 dan asumsikan kadar nikotin tsb mempunyai sebaran normal. :) PENGUJIAN RATA-RATA UNTUK 2 POPULASI Uji ini dilakukan bila ingin diketahui ada tidaknya perbedaan rata-rata dua populasi atau lebih. Misalnya seorang bupati menyatakan bahwa penduduk yang tinggal di kabupatennya memiliki tingkat kesadaran politik yang lebih tinggi dari kabupaten lain. Atau sebuah perusahaan mobil menyatakan bahwa mobil yang diproduksi di pabriknya, memiliki efisiensi penggunaan bahan bakar yang lebih baik dari produknya yang lama. A. Pengujian untuk 2 sampel bebas (independent sample) Sebelum melakukan pengujian terhadap dua sample bebas, terlebih dahulu perlu dilakukan pengujian terhadap homogenitas varians sample tersebut. Pengujian homogenitas varians Dengan hipotesis: H0 : varians dari kedua sample tersebut homogen H1 : varians dari kedua sample tersebut heterogen derajat bebas : v1 = (n1 - 1), v2 = (n2 - 2) Bila nilai Fhitung = F?;(v1,v2) maka tolak H0 dengan kesimpulan varians heterogen nilai Fhitung < F?;(v1,v2) maka terima H0 dengan kesimpulan varians homogen 1. Uji t untuk dua sample bebas (independent) dengan varians homogen * Bila n1 ? n2 t = ......1) Derajat bebas (db)= n1 + n2 - 2 Atau t = ........2) db = n1 + n2 - 2 Contoh: 1. Pelajaran matematika diberikan kepada 10 siswa dengan metode pengajaran A. Kelas kedua yang terdiri dari 12 siswa mendapat pelajaran yang sama tetapi dengan metode pengajaran B. Pada akhir semester, murid kedua kelas tersebut diberi ujian dengan soal yang sama. Kelas pertama mencapai nilai rata-rata 81 dengan simpangan baku 5, sedangkan kelas kedua memperoleh nilai rata-rata 86 dengan simpangan baku 4. Ujilah hipotesis bahwa kedua metode tersebut tidak sama menggunakan taraf nyata 5%. Asumsikan bahwa kedua populasi menyebar normal. Diketahui: n1 = 10 n2 = 12 rata-rata sample 1 () = 81 rata-rata sample 2 () = 86 s1 = 5 ==> s12 = 25 s2 = 4 ==> s22 = 16 Sebelum melakukan pengujian terhadap rata-rata, terlebih dahulu dilakukan pengujian terhadap homogenitas ragam untuk menentukan rumus uji-t yang akan digunakan. Dengan hipotesis: H0 : varians dari kedua sample tersebut homogen H1 : varians dari kedua sample tersebut heterogen s1 = 5 ==> s12 = 25 ; db = (9,11) s2 = 4 ==> s22 = 16 Jawab: 1. Menentukan hipotesis H0 : ???????? (rata-rata nilai ujian dari dua metode pengajaran tersebut sama) H1 : ???? ??? (rata-rata nilai ujian dari dua metode pengajaran tersebut tidak sama) 2. Karena n1 ? n2 maka uji yang digunakan adalah : 3. Menentukan nilai tabel. Karena hipotesis yang digunakan bertanda ? maka digunakan uji 2 arah ==> ??? = 0.025 maka t????? untuk db=20 adalah 2.086 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila thit = - ttab = - 2.086 atau bila thit = ttab = 2.086 * Terima H0 bila -ttab(-2.086) < thit < ttab (2.086) 5. Karena nilai thit (-2.63) lebih kecil dari nilai -ttab (-2.086) maka tolak H0 dengan kesimpulan bahwa rata-rata nilai ujian kedua metode tersebut tidak sama, ternyata metode B lebih baik dari metode A * Bila n1 = n2 Atau t = db = 2n - 2 2. Berikut ini adalah nilai ujian siswa pria dan wanita pada mata kuliah statistika: No Pria Wanita 1 2 3 4 5 6 7 8 9 10 7 6 7 8 6 7 6 8 8 7 8 7 3 5 8 7 7 8 6 6 Ujilah hipotesis bahwa ada perbedaan rata-rata nilai ujian antara siswa pria dan wanita. Gunakan taraf nyata 5%. Asumsikan bahwa kedua populasi menyebar normal. Diketahui: n1 = 10 n2 = 10 rata-rata sample 1 () = 7 rata-rata sample 2 () = 6.8 s12 = 0.68 s22 = 1.067 Sebelum melakukan pengujian terhadap rata-rata, terlebih dahulu dilakukan pengujian terhadap homogenitas ragam untuk menentukan rumus uji-t yang akan digunakan. Dengan hipotesis: H0 : varians dari kedua sample tersebut homogen H1 : varians dari kedua sample tersebut heterogen s1 = 5 ==> s12 = 0.68 ;db = (9,9) s2 = 4 ==> s22 = 1.067 Jawab: 1. Menentukan hipotesis H0 : ?P= ?W (rata-rata nilai ujian dari siswa pria dan wanita sama) H1 : ?P? ?W (rata-rata nilai ujian dari siswa pria dan wanita tidak sama) 2. Karena n1 = n2 maka uji yang digunakan adalah : t= 3. Menentukan nilai tabel. Karena hipotesis yang digunakan bertanda ? maka digunakan uji 2 arah ==> ??? = 0.025 maka t????? untuk db=18 adalah 2.101 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila thit = - ttab = - 2.101 atau bila thit = ttab = 2.101 * Terima H0 bila -ttab(-2.101) < thit < ttab (2.101) 5. Karena nilai thit (0.48) lebih kecil dari nilai ttab (2.101) maka terima H0 dengan kesimpulan bahwa rata-rata nilai ujian untuk siswa pria dan wanita adalah sama. 2. Uji t untuk dua sample bebas (independent) dengan varians heterogen * Bila n1 ? n2 Pengganti ttabel adalah: dimana t1 = t? ; (n1-1) dan t2 = t? ; (n2-1) * Bila n1 = n2 , db= n-1 Contoh: Dilakukan penelitian untuk mengetahui kecepatan memasuki dunia kerja antara lulusan SMU dan SMK. Berdasarkan 22 responden lulusan SMU dan 18 responden lulusan SMK diperoleh data bahwa lama menunggu untuk mendapatkan pekerjaan kedua kelompok lulusan sekolah tersebut adalah: No Lama menunggu pekerjaan (dalam tahun) SMU SMK 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 6 3 5 2 5 1 2 3 1 3 2 4 3 4 2 3 1 5 1 3 1 4 2 1 3 1 3 2 2 1 3 1 1 1 3 2 1 2 2 1 n1 = 22 1 = 2.91 s1 = 1.51 s12 = 2.28 n2 = 18 2 = 1.78 s2 = 0.81 s22 = 0.65 Ujilah hipotesis bahwa waktu tunggu untuk mendapatkan pekerjaan bagi lulusan SMU dan SMK tidak sama. Gunakan taraf nyata 5% dan asumsikan bahwa kedua populasi menyebar normal. Diketahui: n1 = 22 1 = 2.91 s1 = 1.51 s12 = 2.28 n2 = 18 2 = 1.78 s2 = 0.81 s22 = 0.65 Sebelum melakukan pengujian terhadap rata-rata, terlebih dahulu dilakukan pengujian terhadap homogenitas ragam untuk menentukan rumus uji-t yang akan digunakan. Dengan hipotesis: H0 : varians dari kedua sample tersebut homogen H1 : varians dari kedua sample tersebut heterogen s1 = 1.51 ==> s12 = 2.28 ; db = (21,17) s2 = 0.81 ==> s22 = 0.65 Jawab: 1. Menentukan hipotesis H0 : ???????? (tidak ada perbedaan masa menunggu untuk mendapatkan pekerjaan antara lulusan SMA dan SMK) H1 : ????????(ada perbedaan masa menunggu untuk mendapatkan pekerjaan antara lulusan SMA dan SMK) 2. = = 3. Karena n1 ? n2 maka perlu dicari nilai t pengganti nilai ttabel dengan persamaan berikut: = 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila thit = - t' = - 2.09 atau bila thit = t' = 2.09 * Terima H0 bila -t' (-2.09) < thit < t' (2.09) 5. Karena nilai thit (3.02) lebih besar dari nilai t' (2.09) maka tolak H0 dengan kesimpulan bahwa terdapat perbedaan masa menunggu untuk mendapatkan pekerjaan antara lulusan SMA dan SMK B. Pengujian untuk 2 sampel berpasangan (correlated sample) Uji t untuk 2 sampel berpasangan t = derajat bebas = n-1 Contoh: Untuk mengetahui apakah keanggotaan dalam organisasi mahasiswa mempunyai akibat baik atau buruk pada nilai seseorang, berikut ini telah dikumpulkan nilai IP selama 5 tahun. Dengan mengasumsikan bahwa populasinya normal, ujilah pada taraf 0.025, apakah keanggotaan dalam organisasi mahasiswa berakibat buruk pada nilai seseorang. Tahun 1 2 3 4 5 Anggota Bukan anggota 2.0 2.2 2.0 1.9 2.3 2.5 2.1 2.3 2.4 2.4 Diketahui: rata-rata sample 1 () = 2.16 rata-rata sample 2 () = 2.26 n = 5 Jawab: 1. Hipotesis H0 :??????? H1 : ??????? 2. menghitung nilai t Anggota Bukan anggota di di2 2.0 2.0 2.3 2.1 2.4 2.2 1.9 2.5 2.3 2.4 -0.2 0.1 -0.2 -0.2 0.0 0.04 0.01 0.04 0.04 0.00 -0.5 0.13 t = = 3. menentukan nilai tabel, untuk taraf nyata 0.025 dan db=4 (n-1). t(0.025;4) =2.776 4. Menentukan daerah keputusan (wilayah kritik) * Tolak H0 bila thit = - ttab = - 2.776 * Terima H0 bila thit > - ttab (-2.776) 5. Karena nilai thit (-1.58) lebih besar dari nilai -t????? (-2.776) maka terima H0 dengan kesimpulan bahwa keanggotaan organisasi bagi mahasiswa tidak memberikan pengaruh yang berarti pada nilai yang dicapainya. S O A L 1. Sebuah perusahaan menyatakan bahwa kekuatan rentangan rata-rata tali A melebihi kekuatan tali B. Untuk menguji pernyataan tersebut, 51 tali dari masing-masing jenis diuji. Hasil uji memperlihatkan bahwa tali A mempunyai kekuatan rentangan rata-rata 86.7 kg dengan simpangan baku 6.28 kg. Sedangkan tali B mempunyai kekuatan rentangan rata-rata 77.8 kg dengan simpangan baku 5.61 kg. a. Ujilah pernyataan perusahaan tsb dengan menggunakan taraf nyata 0.05. b. Bagaimanakah hubungan antara jenis tali dengan kekuatan rentangan? 2. Data di bawah ini menunjukkan masa putar film yang diproduksi dua perusahaan film yang berbeda (asumsikan keduanya berdistribusi normal): Masa putar (menit) Perusahaan 1 102 86 98 109 92 Perusahaan 2 81 165 97 134 92 87 114 Perusahaan 2 menyatakan bahwa masa putar rata-rata film yang diproduksi perusahaannya melebihi masa putar rata-rata film yang diproduksi perusahaan 1. Ujilah pernyataan tersebut pada taraf nyata 0.1. 3. Sebuah pabrik mobil ingin memutuskan apakah akan menggunakan ban merek A atau merek B bagi mobil terbarunya. Untuk membantu mencapai keputusan tersebut, dilakukan percoban menggunakan 12 ban untuk masing-masing merek tersebut. Ban-ban tersebut dipasang dan digunakan sampai aus sehingga harus diganti. Hasilnya adalah: Merek A Rata-rata=37900 km S1 =5100 km Merek B Rata-rata = 39800 km S2 = 5900 km Ujilah hipotesis pada taraf nyata 5% bahwa tidak ada perbedaan antara kedua merek ban tersebut. Asumsikan kedua populasi berdistribusi normal 4. Seorang perancang mobil mempunyai keyakinan teoritis bahwa pengecatan sebuah mobil perlombaan mengurangi kecepatan maksimalnya. Dia memilih 6 mobil dari bengkel dan menguji dengan dan tanpa cat. Hasilnya adalah: Mobil Kecepatan maksimal (mph) Dicat Tidak dicat 1 2 3 4 5 6 186 185 179 184 183 186 189 186 183 188 185 188 a. Ujilah pernyataan perancang mobil tersebut pada taraf nyata 5% b. Tentukan hubungan antara kecepatan maksimal dan pengecatan mobil. :) UNTUK SAMPLE BESAR ( n = 30 ) A. Pengujian untuk 2 sampel bebas (independent sample) Sama halnya dengan sample kecil (n< 30), untuk sampel besar ini, sebelum melakukan pengujian terhadap dua sample bebas, terlebih dahulu perlu dilakukan pengujian terhadap varians sample tersebut. Caranya sama dengan kasus untuk sample kecil 1. Uji z untuk dua sample bebas (independent) dengan varians homogen * Bila n1 ? n2 = 30 z = atau z = * Bila n1 = n2 = 30 2. Uji z untuk dua sample bebas (independent) dengan varians heterogen * Bila n1 ? n2 = 30 dan n1 = n2 = 30 z B. Pengujian untuk 2 sampel berpasangan (correlated sample) Uji z untuk 2 sampel berpasangan z = untuk mengetahui kuatnya hubungan antara dua variable dapat dicari dengan korelasi point biserial (rpb): Dengan kriteria: * 0 - 0.19 = sangat rendah * 0.20 - 0.39 = rendah * 0.40 - 0.59 = sedang * 0.60 - 0.79 = kuat * 0.80 - 1.00 = sangat kuat Sedangkan untuk mengetahui besarnya pengaruh suatu variable terhadap variable lainnya digunakan koefisien determinasi: Koef. Determinasi = rpb2 x 100% BAB III ANALISIS VARIANS Pengujian nilai tengah digunakan untuk menguji beda rata-rata dari satu atau dua populasi. Sedangkan untuk tiga populasi atau lebih digunakan Analisis Varians (ANAVA)/Analysis of Variance (ANOVA). Data yang digunakan berupa data interval atau rasio dan berdistribusi normal. 1. Analisis Varians Satu Arah digunakan jika ingin menguji beda rata-rata suatu pengamatan berdasarkan satu kriteria yang memiliki beberapa populasi. Banyaknya data untuk setiap populasi bisa sama (n1= n2=...= nk) atau bisa juga berbeda (n1? n2?...? nk) Contoh: Berikut ini adalah data penjualan dari 3 merek rokok selama 5 hari: Hari ke- Penjualan (bungkus) Merek A Merek B Merek C 1 2 3 4 5 20 25 15 27 19 10 15 22 13 20 19 26 21 16 25 Pada contoh di atas, merek merupakan kriteria populasinya terdiri dari merek A, B, C. TABEL ANALISIS VARIANS SATU ARAH Sumber Variasi Jumlah Kuadrat Derajat Bebas (db) Kuadrat Tengah F Antar Kelompok (between) Dalam Kelompok (within) JKK JKE k -1 N - k KTK = KTE = Ftabel = F(k-1),(N-k) ; ? Total JKT N -1 dimana: :) JKT = JKK + JKE = Jumlah Kuadrat Total :) JKT = :) JKK = = jumlah kuadrat kelompok dgn N= n1+n2+...+nk :) JKE = JKT - JKK Kriteria pengujian: Tolak H0 bila Fhitung = Ftabel dimana H0 : tidak ada perbedaan antar kelompok (??????...???) H1: sekurang-kurangnya ada dua kelompok yang berb eda Uji F di atas hanya dapat menyatakan ada tidaknya perbedaan, sedangkan untuk mengetahui kelompok mana saja yang berbeda digunakan metode: * LSD (Least Significant Difference), bila n-nya sama dengan persamaan: LSD = t(N-k);0.05 * t protected , bila n-nya tidak sama dengan persamaan: t protected = Untuk mengetahui kuatnya hubungan dan besarnya pengaruh antar kelompok digunakan analisis korelasional ETA ( ?), dengan persamaan: ETA ( ?) = Contoh ANOVA satu arah dengan n sama 1. Seorang pemilik toko ingin melihat apakah ada perbedaan penjualan untuk ketiga jenis merek rokok berikut: Hari ke- Penjualan (bungkus) Merek A Merek B Merek C 1 2 3 4 5 20 25 15 27 19 10 15 22 13 20 19 26 21 16 25 Jawab: 1. Hipotesis: H0 : tidak ada perbedaan rata-rata hasil penjualan untuk ketiga merek tersebut (??????????... ????) H1: sekurang-kurangnya ada dua merek yang memberikan rata-rata hasil penjualan berbeda 2. Menghitung nilai-nilai yang terdapat dalam tabel ANOVA XA XA2 XB XB2 XC XC2 ?X ?X2 20 400 10 100 19 361 49 861 25 625 15 225 26 676 66 1526 15 225 22 484 21 441 58 1150 27 729 13 169 16 256 56 1154 19 361 20 400 25 625 64 1386 JUMLAH 106 2340 80 1378 107 2359 293 6077 JKT = = = 353.7333 JKK = =2247.2 + 1280 + 2289.8 - 5723.2667 = 93.7333 JKE = JKT - JKK = 353.7333 - 93.7333 = 260 Sumber Variasi Jumlah Kuadrat Derajat Bebas (db) Kuadrat Tengah F Kelompok Error 93.7333 260 2 12 KTK = 46.8667 KTE = 21.6667 F= 2.1631 Total 353.7333 14 3. Menentukan nilai Ftabel = F(2 , 14) ; 0.05 = 3.74 4. Menentukan daerah keputusan: Tolak H0 bila Fhitung = Ftabel dan terima H0 bila Fhitung < Ftabel 5. Karena nilai Fhitung (=2.1631) < Ftabel (= 3.74) maka terima H0 dengan kesimpulan bahwa ketiga merek rokok tersebut memberikan hasil penjualan yang sama Contoh ANOVA satu arah dengan n tidak sama 2. Seorang pemilik toko ingin melihat apakah ada perbedaan penjualan untuk ketiga jenis merek rokok berikut: Hari ke- Penjualan (bungkus) Merek A Merek B Merek C 1 2 3 4 5 30 25 20 27 10 15 22 13 20 19 26 21 Jawab: 1. Hipotesis: H0 : tidak ada perbedaan hasil penjualan untuk ketiga merek tersebut (??????...???) H1: sekurang-kurangnya ada dua merek rokok yang memberikan hasil penjualan berbeda 2. Menghitung nilai-nilai yang terdapat dalam tabel ANOVA XA XA2 XB XB2 XC XC2 ?X ?X2 30 900 10 100 19 361 59 1361 25 625 15 225 26 676 66 1526 20 400 22 484 21 441 63 1325 27 729 13 169 40 898 20 400 20 400 JUMLAH 102 2654 80 1378 66 1478 248 5510 Rata-rata 25.5 16 22 JKT = = = 384.6667 JKK = =2601 + 1280 + 1452 - 5125.3333= 207.6667 JKE = JKT - JKK = 384.6667-207.6667 = 177 Sumber Variasi Jumlah Kuadrat Derajat Bebas (db) Kuadrat Tengah F Kelompok Error 207.6667 177 2 9 KTK = 103.8333 KTE = 19.6667 F= 5.2797 Total 384.6667 11 3. Menentukan nilai Ftabel = F(2 , 9) ; 0.05 = 4.26 4. Menentukan daerah keputusan: Tolak H0 bila Fhitung = Ftabel dan terima H0 bila Fhitung < Ftabel 5. Karena nilai Fhitung (=5.2797) > Ftabel (= 4.26) maka terima H1 dengan kesimpulan bahwa sekurang-kurangnya ada dua merek rokok yang memberikan hasil penjualan berbeda Untuk melihat merek mana yang memberikan hasil berbeda digunakan t protected (karena n-nya tidak sama) dengan persamaan: t protected = * Untuk XA dan XB: t p = = 3.1934 SOAL Berikut ini merupakan hasil penjualan 5 merek TV di sebuah toko. Ingin diketahui apakah ada perbedaan hasil penjualan pada kelima merek tersebut. No. A B C D E 1. 2. 3. 4. 5. 5 4 8 6 3 9 7 8 6 9 3 5 2 3 7 2 3 4 1 4 7 6 9 4 7 2. Analisis Varians dua arah Digunakan jika ingin menguji beda rata-rata suatu pengamatan berdasarkan dua criteria yang berbeda. a. ANALISIS VARIANS DUA ARAH TANPA INTERAKSI Sumber Variasi Jumlah Kuadrat Derajat Bebas (db) Kuadrat Tengah F Baris Kelompok Error JKB JKK JKE r - 1 c - 1 (r-1)(c-1) KTB = KTK = KTE = Ftabel = F(k-1),(N-k) ; ? Total JKT rc -1 dimana: :) JKT = JKK + JKB + JKE = Jumlah Kuadrat Total :) JKT = :) JKB = = jumlah kuadrat baris :) JKK= = jumlah kuadrat kelompok dgn r = jumlah baris c = jumlah kolom :) JKE = JKT - JKB - JKK Contoh: Seorang pemilik toko ingin mengetahui hasil penjualan 3 merek rokok di tiga daerah yang berbeda Merek A Merek B Merek C Kota besar 25 21 14 Kota kecil 12 18 17 Pedesaan 15 10 11 1. Hipotesis: a. H0 : tidak ada perbedaan rata-rata hasil penjualan rokok untuk ketiga daerah tersebut H1: sekurang-kurangnya ada dua daerah yang memberikan rata-rata hasil penjualan rokok berbeda b. H0 : tidak ada perbedaan rata-rata hasil penjualan rokok untuk ketiga merek tersebut H1: sekurang-kurangnya ada dua merek yang memberikan rata-rata hasil penjualan rokok berbeda 2. Membuat tabel ANOVA Merek A Merek B Merek C Jumlah Kota besar 25 21 14 60 Kota kecil 12 18 17 47 Pedesaan 15 10 11 36 Jumlah 52 49 42 143 :) JKT = = (252 + 212 + 142 + 122 + ... + 112) - = 2465 - 2272,11 = 192,89 :) JKB = = = 96,22 :) JKK= = = 17,56 :) JKE = JKT - JKB - JKK = 192,89 - 96,22 - 17,56 = 79,11 Sumber Variasi Jumlah Kuadrat Derajat Bebas (db) Kuadrat Tengah F Baris Kelompok Error 96,22 17,56 79,11 2 2 4 KTB = KTK = KTE = F1 = 2,43 F2 = 0,44 Total 192,89 8 3. Menentukan nilai Ftabel = F(2 , 4) ; 0.05 = 6,94 (nilai Ftabel untuk baris dan kolom sama karena derajat bebas keduanya juga sama) 4. Menentukan daerah keputusan: Hipotesis a: Tolak H0 bila F1 = Ftabel dan terima H0 bila Fhitung < Ftabel Hipotesis b: Tolak H0 bila F2 = Ftabel dan terima H0 bila Fhitung < Ftabel 5. Hipotesis a: Karena nilai F1 (=2,43) < Ftabel (= 6,94) maka terima H0 dengan kesimpulan bahwa tidak ada perbedaan rata-rata hasil penjualan rokok untuk ketiga daerah tersebut Hipotesis b: Karena nilai F1 (=0,44) < Ftabel (= 6,94) maka terima H0 dengan kesimpulan bahwa tidak ada perbedaan rata-rata hasil penjualan rokok untuk ketiga merek tersebut b. ANALISIS VARIANS DUA ARAH DENGAN INTERAKSI Sumber Variasi Jumlah Kuadrat Derajat Bebas (db) Kuadrat Tengah F Baris Kelompok Interaksi Error JKB JKK JK(BK) JKE r - 1 c - 1 (r-1)(c-1) rc(n - 1) KTB = KTK = KT(BK) = KTE = Total JKT rcn -1 dimana: :) JKT = JKK + JKB + JKE = Jumlah Kuadrat Total :) JKT = :) JKB = =jumlah kuadrat baris :) JKK= = jumlah kuadrat kelompok :) JK(BK) = dgn r = jumlah baris c = jmlah kolom n = jumlah pengamatan setiap sel :) JKE = JKT - JKB - JK(BK) - JKK Contoh: Berikut ini adalah data penjualan rokok selama 2 bulan dilihat dari merek dan daerah penjualan : Merek A Merek B Merek C Kota besar 25 30 21 15 14 25 Kota kecil 10 12 15 18 20 17 Pedesaan 15 20 10 15 12 18 1. Hipotesis: a. H0 : tidak ada perbedaan rata-rata hasil penjualan rokok untuk ketiga daerah tersebut H1: sekurang-kurangnya ada dua daerah yang memberikan rata-rata hasil penjualan rokok berbeda b. H0 : tidak ada perbedaan rata-rata hasil penjualan rokok untuk ketiga merek tersebut H1: sekurang-kurangnya ada dua merek yang memberikan rata-rata hasil penjualan rokok berbeda c. H0 : tidak ada interaksi antara merek rokok dan daerah penjualan H1: ada interaksi antara merek rokok dan daerah penjualan 2. Membuat tabel ANOVA Merek A Merek B Merek C Jumlah Kota besar 25+30=55 21+15=36 14+25=39 130 Kota kecil 10+12=22 15+18=33 20+17=37 92 Pedesaan 15+20=35 10+15=25 12+18=30 90 Jumlah 112 94 106 312 :) JKT = = = 5912 - = 504 :) JKB = = = =169,33 :) JKK = = == 28 :) JK(BK) = = = = 161,67 :) JKE = JKT - JKB - JKK- JK(BK) = 504 - 169,33 - 28 - 161,67 = 145 Sumber Variasi Jumlah Kuadrat Derajat Bebas (db) Kuadrat Tengah F Baris Kelompok Interaksi Error 169,33 28 161,67 145 2 2 4 9 KTB = 84,67 KTK = 14 KT(BK) = 40,42 KTE = 16,11 5,26 0,87 2,51 Total 504 17 3. Menentukan nilai Ftabel : F1 ( F(2 , 9) ; 0.05 = 4,26 F2 ( F(2 , 9) ; 0.05 = 4,26 F3 ( F(4 , 9) ; 0.05 = 3,63 4. Menentukan daerah keputusan: Tolak H0 bila Fhitung = Ftabel dan terima H0 bila Fhitung < Ftabel 5. Kesimpulan a. Sekurang-kurangnya ada dua daerah penjualan yang memberikan rata-rata hasil penjualan rokok berbeda b. tidak ada perbedaan rata-rata hasil penjualan rokok untuk ketiga merek tersebut c. tidak ada interaksi antara merek rokok dan daerah penjualan BAB IV ANALISIS KORELASI (r) Digunakan untuk mengetahui atau menguji ada tidaknya hubungan antara dua variable atau lebih. Tingkat hubungan antar variabel tersebut diukur dengan indeks korelasi yang disebut dengan koefisien korelasi. Dalam korelasi terdapat dua macam variable, yaitu: a. Variabel bebas (independent variable), biasa dinyatakan dengan X b. Variabel terikat (dependent variable), biasa dinyatakan dengan Y Korelasi mempunyai nilai antara -1 sampai 1 (-1< r < 1) dimana: a. nilai 0 menunjukkan bahwa tidak ada hubungan antara variable X dan Y (tidak berkorelasi) b. nilai (+) menunjukkan bahwa bila nilai X bertambah, maka nilai Y juga akan bertambah (korelasi positif). c. Nilai (-) menunjukkan bahwa bila nilai X bertambah, maka nilai Y akan berkurang (korelasi negative). Hubungan antara X dan Y dapat dinyatakan pada gambar berikut: Untuk menafsirkan apakah koefisien korelasi yang diperoleh menunjukkan hubungan yang kuat, sedang atau rendah digunakan ketentuan sebagai berikut: Interval koefisien Tingkat Hubungan 0.00 - 0.19 0.20 - 0.39 0.40 - 0.59 0.60 - 0.79 0.80 - 1.00 Sangat rendah Rendah Sedang Kuat Sangat kuat Korelasi Sederhana Digunakan untuk mencari hubungan antara satu variable X dengan satu variable Y. Untuk menggunakan teknik analisis korelasi yang sesuai, perlu memperhatikan jenis data yang dimiliki. * Korelasi Pearson (Product Moment Correlation) * Digunakan bila variabel X dan Y datanya berupa data interval/rasio * Persamaan yang digunakan adalah sebagai berikut: Atau Dimana : n = banyaknya pengamatan ? X = jumlah variabel X ? XY = jumlah dari hasil kali variabel X dan Y ? X2 = jumlah dari variabel X yang dikuadratkan (? X) 2 = kuadrat dari jumlah variabel X Contoh: Seorang manager ingin mengetahui hubungan antara motivasi kerja (X) dengan prestasi kerja (Y) Responden Motivasi kerja (X) Prestasi kerja (Y) 1. 2. 3. 4. 5. 6. 50 70 80 40 90 60 30 40 50 25 60 45 Jawab: Responden Motivasi kerja (X) Prestasi kerja (Y) X2 Y2 X.Y 1. 2. 3. 4. 5. 6. 50 70 80 40 90 60 30 40 50 25 60 45 Jumlah 390 250 = = Ini menunjukkan bahwa hubungan yang terjadi antara motivasi kerja dengan prestasi kerja sangat kuat. * Uji Signifikansi Pengujian signifikansi koefisien korelasi dapat dihitung menggunakan uji t dengan persamaan sebagai berikut: , dimana ttabel = t(n-2); ? Hipotesis yang digunakan berdasarkan contoh di atas adalah: H0 : ? = 0 : tidak ada hubungan antara motivasi dan prestasi kerja H1 : ? ? 0 : ada hubungan antara motivasi dan prestasi kerja * Korelasi Point Biserial * Jika ingin diketahui hubungan antara sebuah variabel yang datanya berbentuk interval/rasio dengan sebuah variabel lain yang datanya terdiri dari dua kategori/dikotomi (misalnya: laki-laki dan perempuan, sudah menikah dan belum menikah, desa dan kota). * Persamaan yang digunakan adalah: Dimana: p = proporsi kategori 1 q = proporsi kategori 0 = rataan Y untuk kategori 1 = rataan Y untuk kategori 0 SY = standar deviasi (simpangan baku) Y = Contoh: Seorang guru ingin mengetahui hubungan antara nilai ulangan matematika dengan jenis kelamin. Dalam kasus ini, jenis kelamin mempunyai dua kategori yaitu L (1) dan P (0). Responden JK (X) Nilai matematika (Y) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 1 1 0 0 0 1 0 0 0 1 10 15 30 20 25 15 20 25 30 20 Jawab: p = 4/10 = 0.4 q = 6/10 = 0.6 = 60/4 = 15 = 150/6=25 Sy = 6.58 Tanda (-) menunjukkan bahwa bila nilai ulangan matematika siswa perempuan tinggi maka siswa laki-laki mendapatkan nilai ulangan yang rendah. * Uji Signifikansi Pengujian signifikansi koefisien korelasi dapat dihitung menggunakan uji t dengan persamaan sebagai berikut: , dimana ttabel = t(n-2); ? Hipotesis yang digunakan adalah: H0 : ? = 0 : tidak ada hubungan antara variabel Y dan variabel X H1 : ? ? 0 : ada hubungan antara variabel Y dan variabel X * Korelasi Biserial * Digunakan untuk mencari hubungan antara dua variabel dimana salah satu dari variabel tersebut dianggap sebagai variabel dikotomi sedangkan variabel lainnya berbentuk interval/rasio * Persamaan yang digunakan adalah: Dimana: p = proporsi kategori 1 q = proporsi kategori 0 = rataan Y untuk kategori 1 = rataan Y untuk kategori 0 sY = standar deviasi (simpangan baku) Y u = ordinat dari kurva normal yang membagi kurva normal atas 2 bagian, satu bagian adalah proporsi p dan bagian lainnya adalah proporsi q dari total area Contoh: Seorang peneliti ingin melihat apakah ada hubungan antara IQ dengan kelulusan seseorang pada akhir tahun kuliah. Resp. IQ Nilai akhir Resp. IQ Nilai akhir 1 2 3 4 5 6 7 8 9 10 100 115 125 90 120 140 150 120 110 130 75 50 70 65 40 70 80 50 65 45 bila syarat kelulusan adalah mahasiswa yang memiliki nilai > 60 maka dari data awal dapat diubah menjadi: 1 2 3 4 5 6 7 8 9 10 100 115 125 90 120 140 150 120 110 100 Lulus (1) Tidak lulus (0) Lulus (1) Lulus (1) Tidak lulus (0) Lulus (1) Lulus (1) Tidak lulus (0) Lulus (1) Tidak lulus (0) Jawab: p = 6/10 = 0.6 q = 4/10 = 0.4 = 715/6 = 119.17 = 455/4=113.75 Sy = 18.44 * Uji Signifikansi Pengujian signifikansi koefisien korelasi dapat dihitung menggunakan uji t dengan persamaan sebagai berikut: , dimana ttabel = t(n-2); ? Hipotesis yang digunakan adalah: H0 : ? = 0 : tidak ada hubungan antara variabel Y dan variabel X H1 : ? ? 0 : ada hubungan antara variabel Y dan variabel X * Korelasi Rank Spearman * Jika pengamatan dari variabel X dan Y diukur sekurang-kurangnya dalam bentuk skala ordinal. * Persamaan yang digunakan adalah: Dimana : di = beda (selisih) antara 2 pengamatan yang berpasangan n = banyaknya pengamatan Contoh: Ingin diketahui apakah ada korelasi antara nilai ujian akhir matematika dan nilai Ekonomi mikro. Untuk itu dipilih secara acak nilai ujian akhir matematika dan ekonomi mikro dari 10 orang mahasiswa. Nilai-nilai tersebut adalah sebagai berikut: Mahasiswa Nilai matematika Nilai ekonomi mikro a b c d e f g h i j 85 90 80 50 40 70 60 30 65 95 70 80 100 60 60 80 60 50 80 100 Jawab: Langkah pertama adalah melakukan rangking pada data di atas Data nilai matematika: Nilai matematika rank Nilai Ek. mikro rank 30 40 50 60 65 70 80 85 90 95 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 50 60 60 60 70 80 80 80 100 100 1 2 3 4 5 6 7 8 9 10 1 3 3 3 5 7 7 7 9.5 9.5 Selanjutnya masukkan nilai rank tersebut ke dalam data asal. Mahasiswa Rank nilai matematika Rank nilai ekonomi mikro di (di)2 a b c d e f g h i j 8 9 7 3 2 6 4 1 5 10 5 7 9.5 3 3 7 3 1 7 9.5 3 2 -2.5 0 -1 -1 1 0 -2 0.5 9 4 6.25 0 1 1 1 0 4 0.25 Jumlah 26.5 Dengan demikian nilai korelasi Spearman adalah: * Uji Signifikansi Pengujian signifikansi koefisien korelasi rank Spearman dapat dihitung menggunakan uji t (bila n< 30) atau uji z (bila n> 30) dengan persamaan sebagai berikut: Uji t ==> , dimana ttabel = t(n-2); ? Uji Z ==> , dimana Ztabel = Z? Hipotesis yang digunakan adalah: H0 : ? = 0 : tidak ada hubungan antara variabel Y dan variabel X H1 : ? ? 0 : ada hubungan antara variabel Y dan variabel X * Korelasi Rank Kendall * Sama halnya dengan korelasi rank spearman, korelasi ini digunakan jika pengamatan dari variabel X dan Y diukur sekurang-kurangnya dalam bentuk skala ordinal. * Persamaan yang digunakan adalah: Tau = Dimana : S = jumlah seluruh nilai negative dan positif dari seluruh pasangan n = banyaknya pengamatan Contoh: Berdasarkan data dari contoh soal pada korelasi rank Spearman, telah diperoleh nilai rank untuk nilai matematika dan ekonomi mikro sbb: Mahasiswa Rank nilai matematika Rank nilai ekonomi mikro a b c d e f g h i j 8 9 7 3 2 6 4 1 5 10 5 7 9.5 3 3 7 3 1 7 9.5 Jawab: Untuk mencari nilai korelasi rank Kendall, rank untuk nilai matematika diurutkan berdasarkan nilai yang terkecil sehingga kedua kolom lainnya akan mengikuti urutan tersebut. Mahasiswa Rank nilai matematika Rank nilai ekonomi mikro h e d g i f c a b j 1 2 3 4 5 6 7 8 9 10 1 3 3 3 7 7 9.5 5 7 9.5 S dapat dicari dengan memperhatikan rank pada variabel nilai ek. mikro. * Responden h mempunyai ranking 1, responden dibawahnya yang mempunyai rangking lebih besar dari 1 ada 9 orang sedangkan yang lebih kecil dari 1 tidak ada (= 0) ==> (9-0) * Responden e mempunyai ranking 3, responden dibawahnya yang mempunyai ranking lebih besar dari 3 ada 6 orang sedangkan yang lebih kecil dari 3 tidak ada (= 0) ==> (6-0) * Sama juga halnya untuk responden d dan g * Responden c mempunyai ranking 9.5, responden dibawahnya yang mempunyai ranking lebih besar dari 9.5 tidak ada (= 0) sedangkan yang lebih kecil dari 9.5 ada 2 orang ==> (0-2) Sehingga diperoleh nilai S sebagai berikut: S = (9-0) + (6-0) + (6-0) + (6-0) + (2-1) + (2-1) + (0-2) + (2-0) + (1-0) = 30 Dengan demikian korelasi rank Kendall: = * Uji Signifikansi Pengujian signifikansi koefisien korelasi tau Kendall dapat dilihat pada tabel signifikansi rank Kendall bila n<10, sedangkan untuk n>10 menggunakan uji Z sebagai berikut: Uji Z ==> dimana Ztabel = Z? Hipotesis yang digunakan adalah: H0 : ? = 0 : tidak ada hubungan antara variabel Y dan variabel X H1 : ? ? 0 : ada hubungan antara variabel Y dan variabel X Korelasi Ganda Digunakan untuk menunjukkan hubungan secara bersama-sama antara beberapa variabel independent (X1, X2,..., Xn) dengan satu variabel dependent (Y). Dimana: rY.X1X2 = koefisien korelasi ganda variabel X1 dan X2 secara bersama-sama terhadap variabel Y. rYX1 = koefisien korelasi product moment antara variabel X1 dengan variabel Y rYX2 = koefisien korelasi product moment antara variabel X2 dengan variabel Y rX1X2 = koefisien korelasi product moment antara variabel X1 dengan variabel X2 Jadi sebelum menghitung koefisien korelasi ganda, terlebih dahulu menghitung nilai koefisien product moment untuk setiap variabel. Contoh: Ingin diketahui hubungan antara nilai ujian matematika dengan nilai tugas dan frekuensi tidak mengikuti kuliah. Siswa Nilai ujian (Y) Nilai tugas (X1) frek.tidak kuliah (X2) 1 2 3 4 5 6 7 8 9 10 85 74 76 90 85 87 94 98 81 91 65 50 55 65 55 70 65 70 55 70 1 7 5 2 6 3 2 1 4 3 Jawab: Langkah pertama adalah menghitung nilai korelasi antara Y dengan X1, Y dengan X2, serta korelasi X1 dengan X2 dan diperoleh hasil sebagai berikut: rYX1 = 0.84 rYX2 = -0.78 rX1X2 = -0.84 sehingga koefisien korelasi gandanya adalah = * Uji Signifikansi Pengujian signifikansi koefisien korelasi ganda dapat dihitung menggunakan uji F dengan persamaan sebagai berikut: , dimana Ftabel = F(k,n-k-1) ; ? Dimana : n = banyaknya pengamatan k = banyaknya variabel X Hipotesis yang digunakan adalah: H0 : ? = 0 : tidak ada hubungan antara X1 dan X2 terhadap Y H1 : ? ? 0 : ada hubungan antara X1 dan X2 terhadap Y Korelasi Parsial Digunakan untuk mengetahui hubungan antara beberapa variabel X dan variabel Y bila salah satu variabel X dibuat tetap. dimana rYX1.X2 = korelasi parsial antara variabel Y dan variabel X1 bila X2 tetap (dikontrol) Misalnya ingin diteliti tentang hubungan antara kepemimpinan (X1) dan tata ruang kantor (X2) dengan kepuasan kerja (Y). Berdasarkan data yang ada diperoleh hasil sebagai berikut: * Korelasi antara kepuasan kerja dengan kepemimpinan, rYX1 = 0.45 * Korelasi antara kepuasan kerja dengan tata ruang, rYX2 = 0.48 * Korelasi antara kepemimpinan dengan tata ruang, rX1X2 = 0.22 Berdasarkan data di atas bila ingin diketahui korelasi antara Y dengan X1 dimana X2 tetap maka diperoleh hasil rYX1.X2 = 0.40 * Uji Signifikansi Pengujian signifikansi koefisien korelasi parsial dapat dihitung menggunakan uji F dengan persamaan sebagai berikut: , dimana Ftabel = F(1, n - 3) ; ? Dimana : n = banyaknya pengamatan Berdasarkan contoh di atas, hipotesis tersebut yang digunakan adalah: H0 : ? = 0 : tidak ada hubungan antara X1 dan Y bila X2 dibuat tetap H1 : ? ? 0 : ada hubungan antara X1 dan Y bila X2 dibuat tetap BAB V ANALISIS REGRESI Apabila variabel X dan Y mempunyai hubungan maka perubahan nilai variabel yang satu akan mempengaruhi nilai variabel lainnya. Misalnya: Suatu perusahaan meningkatkan biaya iklan agar penjualan produknya meningkat, pemerintah mengurangi impor beras agar penjualan beras dalam negeri meningkat, mahasiswa memperbanyak jam belajar agar memperoleh nilai bagus dalam ujian, dan lain sebagainya. Kuat tidaknya hubungan antara X dan Y diukur dengan suatu nilai yang disebut koefisien korelasi, sedangkan besarnya pengaruh X terhadap Y diukur dengan koefisien regresi. Hubungan yang terjadi dalam analisis regresi tidak selalu / tidak harus hubungan yang menunjukkan sebab akibat Selain untuk melihat besarnya pengaruh, regresi juga dapat digunakan untuk meramalkan (forecasting) suatu nilai di waktu mendatang Asumsi yang harus dipenuhi dalam analisis regresi: * Variabel independent (bebas) dan dependent (terikat) berdistribusi normal * Model bersifat linier aditif * Var(Yi) = Var (ei) = ?2 (ragam/varians konstan) * Error (ei) menyebar normal dengan mean= 0 dan varians ?2 * Error suatu pengamatan tidak tergantung dari error pengamatan sebelumnya (bersifat bebas) a b c d Keterangan: Gambar a : plot sisaan terhadap X menunjukkan bahwa regresi linier yang digunakan sudah sesuai Gambar b : plot sisaan terhadap X menunjukkan terdapat penyimpangan terhadap regresi linier. Ada indikasi bahwa model yang digunakan adalah regresi non linier Gambar c : plot sisaan terhadap X menunjukkan penyimpangan terhadap asumsi regresi linier. Gambar tersebut menunjukkan ragam tidak konstan Gambar d : plot sisaan terhadap X menunjukkan penyimpangan terhadap regresi linier. Sisaan negatif berasal dari Y yang rendah dan sisaan positif berasal dari Y yang tinggi Persamaan regresi antara variable X dan Y berikut ini dapat dibentuk apabila populasi dari seluruh pasangan nilai (Xi, Yi) diketahui. Y = A + B X + ? ...............(1) Dalam prakteknya tidak mungkin mengetahui nilai (Xi, Yi) dalam populasi, sehingga digunakan data sample. Persamaan garis regresi menjadi: Y = a + b X + e ...............(2) Parameter a, b, dan e merupakan nilai taksiran/perkiraan untuk parameter A, B, dan ???Untuk memperoleh nilai a dan b digunakan metode least square (metode kuadrat terkecil). Prinsip dasar metode ini adalah berusaha meminimumkan error (e), yaitu selisih antara data asli dengan nilai yang diperoleh dari garis regresi. Makin kecil nilai error, maka titik-titik data semakin dekat dengan garis regresi. Jika nilai error sama dengan nol berarti semua titik data dilalui oleh garis regresi. Garis yang melalui titik-titik pada gambar di bawah ini disebut garis regresi dugaan dan memiliki persamaan: = a + b X Sedangkan sebaran titik-titik data tersebut memenuhi persamaan: Y = a + b X + e Gambar diagram pencar dari pasangan (Xi, Yi) dalam sample. Garis regresi dugaan mempunyai persamaan: = a + b X Sedangkan titik-titik data tersebut memenuhi persamaan: Y = a + b X + e Maka: => dikuadratkan menjadi: => karena , maka: Dengan menggunakan kalkulus diperoleh hasil sbb: dari persamaan (1) dan persamaan (2) diperoleh hasil sebagai berikut: * atau b = * dimana: ? x= ? y= ? x y = Interpretasi persamaan regresi : * Bertambahnya nilai X sebesar 1 satuan akan meningkatkan nilai Y sebesar b * Bila X=0, maka nilai Y akan sama dengan a. Sifat Penduga MKT Nilai taksiran/penduga a dan b yang diperoleh melalui metode kuadrat terkecil memiliki sifat Best Linear Unbiased Estimator. * Best : yaitu jika estimator tersebut memiliki ?a2 dan ?b2 yang sama atau lebih kecil dibandingkan estimator tak bias yang lain * Linear : yaitu bila penduga a dan b merupakan fungsi linier dari Y * Unbiased : yaitu bila E(a) = A dan E(b) = B nilai harapan penduga a dan b sama dengan nilai parameter populasi A dan B. Contoh: Berikut ini adalah data tentang jam kerja karyawan suatu perusahaan beserta banyaknya produk yang dihasilkan. Produksi ke- Jam kerja (X) Jumlah produksi (Y) 1 2 3 4 5 6 7 8 9 10 73 50 128 170 87 108 135 69 148 132 30 20 60 80 40 50 60 30 70 60 Carilah persamaan regresi untuk kasus di atas. Jawab: Untuk menyelesaikan permasalahan tersebut perlu dicari nilai X2 , Y2 , dan XY. Prod. Ke- Jam kerja (X) Jumlah produksi (Y) X2 Y2 XY 1 73 30 5329 900 2190 2 50 20 2500 400 1000 3 128 60 16384 3600 7680 4 170 80 28900 6400 13600 5 87 40 7569 1600 3480 6 108 50 11664 2500 5400 7 135 60 18225 3600 8100 8 69 30 4761 900 2070 9 148 70 21904 4900 10360 10 132 60 17424 3600 7920 Jumlah 1100 500 134660 28400 61800 Persamaan regresi dugaan: = = = = 50 - (0.498) (110) = 50 - 54.78 = - 0.478 Jadi persamaannya adalah: Interpretasi: Peningkatan jam kerja sebesar 1 satuan akan meningkatkan jumlah produksi sebesar 0.498. Sedangkan bila jam kerja ditiadakan maka jumlah produksi yang dihasilkan sebesar -0.478 Simpangan baku sisaan (standard error/ Se) Digunakan untuk mengetahui sejauh mana garis regresi dapat mencerminkan keadaan data secara menyeluruh. Formula yang digunakan adalah: Dimana: Semakin kecil nilai Se, maka titik-titik data semakin terkonsentrasi di sekitar garis regresi. Sedangkan semakin besar nilai Se, maka semakin jauh jarak pencaran data dengan garis regresi. 2 1 Statistika II