RSS

Bahan Kuliah Statistik 2

13 Apr

BAB I
PENDAHULUAN

1.1. STATISIK DESKRIPTIF DAN INDUKTIF

Ada 2 jenis Statistik yaitu: Statistik Deskriptif dan Statistik Induktif. Statistik Deskriptif semua materi tercakup pada Mata Kuliah Statistik I, sedangkan Statistik Induktif hanya sebagian yang tercakup pada Mata Kuliah Statistik II (sebagian yang lain merupakan advance statistics)

Statistik Deskriptif:
• Hanya menggambarkan suatu keadaan
• Melihat Perkembangan dari waktu ke waktu
• Membandingkan antar objek
• Tidak memerlukan landasan teori dan penghitungan statistik yang rumit
• Sampel yang dipilih bisa random atau non random
• Teknik-teknik analisis Statistik Deskriptif:
1. Analisa Tabel:
Tabel satu arah, Tabel dua arah, dan Tabel tiga arah
2. Analisa Grafik
Grafik Garis, Grafik Batang, Grafik Lingkaran, Grafik Gambar, dan Grafik Peta
3. Ukuran statistik
Rata-rata, median, modus, persentase, koefisien variasi, dan standar deviasi,
4. Angka Indeks
Indeks sederhana, Indeks agregatif tidak tertimbang, Indeks agregatif tertimbang
(Laspeyres, Paasche, Fisher, Drobisch, Marshal)
5. Ukuran korelasi
Korelasi Pearson, Korelasi Rank Spearman, dan Contingency Coefficient

Statistik Induktif :
• Men-generalisasi keadaan
• Mengestimasi/memodelkan
• Memerlukan landasan teori statistik
• Sampel yang dipilih harus random
• Teknik-teknik analisis Statistik Induktif:
1. Pendugaan parameter (pendugaan interval)
2. Analisis Korelasi dan Pengujiannya
3. Uji Beda rata-rata (observasi berpasangan)
4. Analisis Regresi Linier Sederhana
5. Analisis Regresi Linier Berganda
6. Model-model Kuantitatif
7. Model Ekonometrik
8. Model Quality Control
9. Analisis-analisis Multivariate: An. Komponen Utama, An. Faktor, An. Cluster, An. Diskriminan, An. Korelasi Kanonik, An. Regresi Logistik, dll

1.2. CAKUPAN MATERI STATISTIK II

a. Perbedaan Statistik Deskriptif dan Induktif
 Statistik Deskriptif bersifat menggambarkan suatu keadaan (biasanya meliputi perbandingan antar objek atau perkembangan dari waktu ke waktu)
 Statistik Induktif bersifat mengestimasi, menguji hipotesa dan membuat model untuk penarikan kesimpulan
 Statistik I = Statistik Deskriptif
 Statistik II = sebagian dari Statistik Induktif

b. Teori Peluang
 Konsep dasar peluang: Percobaan Statistik, Ruang Sampel, Kejadian
 Penghitungan peluang: konsep klasik dan konsep frekuensi relatif
 Konsep Peubah Acak dan Fungsi Peluang
 Fungsi Peluang Empiris (Diskrit dan Kontinu)
 Fungsi Peluang Teoritis (Fungsi Distribusi Statistik): Binomial, Poisson, Hipergeometrik, dan Normal

c. Pendugaan Interval
 Pendugaan interval rata-rata 1 populasi
 Pendugaan interval selish rata-rata 2 populasi
 Pendugaan interval proporsi 1 populasi
 Pendugaan interval selisih proporsi 2 populasi

d. Pengujian Hipotesa
 Pengujian hipotesa rata-rata 1 populasi
 Pengujian hipotesa beda rata-rata 2 populasi
 Pengujian hipotesa proporsi 1 populasi
 Pengujian hipotesa beda rata-rata 2 populasi
 Pengujian hipotesa independensi

e. Analisis Regresi Linier
 Pembentukan Model regresi
 Pengujian model (koefisien regresi)
 Interpretasi model

1.3. METODE SAMPLING

Metode Sampling (Pengambilan Sampel) ini diperlukan untuk memilih sampel random yang dapat mewakili populasinya. Ini terutama diperlukan untuk analisis statistik induktif.
Metoda Sampling adalah cara bagaimana memilih sampel yang tepat. Sampel yang tepat adalah Sampel dengan jumlah sekecil mungkin, namun dapat mewakili populasi.

Tujuannya = Agar hasil penelitian (estimasi) relatif tepat, penyimpangan Sekecil mungkin
Alasan Penggunaan Sampel:
a. Biaya lebih murah
b. Waktu lebih singkat
c. Tenaga lebih sedikit
d. Akurasi lebih tinggi
e. Penelitian bersifat merusak

Teknik Sampling ada 2 macam :
a. Non Probability Sampling (Non Random Sampinlg)
b. Probability Samping (Random Sampling)

Non Probability Sampling tidak memerlukan Kerangka Sampel
Probability Sampling mutlak memerlukan Kerangka Sampel

Kerangka Sampel (Sampling Frame):
a. daftar anggota populasi yang diteliti
b. yarat kerangka sampel yang baik:
– Lengkap (tidak terlewat atau duplikasi)
– up to date
– relevan

Non Probability Sampling
• Pengambilan Sampel dilakukan secara non random (tidak acak)
• Pengambilan dilakukan secara subyektif
• Teknik ini tidak dapat diajarkan secara ilmiah
• Hanya bersifat pengalaman
• Teknik Samplingnya:
– Purposive Samplin
– Quota Sampling
– Haphazard Sampling

Probability Sampling
• Pengambilan Sampel dilakukan secara random
• Ada prosedur pengambilan sampel yang baku
• Dapat dipelajari/diajarkan secara ilmiah
• Teknik Sampling:
– Simpel Random Sampling
– Stratified Sampling
– Systematic Sampling
– Cluster/Multistage Sampling

 Simpel Random Sampling
– Digunakan untuk populasi yang relatif homogen
– Sampel dipilih dengan 2 cara :
Metode lotery (arisan)
Dengan Tabel Angka Random

 Stratified Sampling
– Digunakan untuk populasi yang relatif heterogen
– Populasi dibagi menjadi sub-sub populasi yang relatif homogen (Strata)
– Jadi setiap strata merupakan kumpulan objek yang homogen
– Setiap strata ada wakilnya

 Systematic Sampling
– Digunakan untuk populasi yang relatif heterogen
– Objek-objek dalam populasi diurutkan
– Diambil secara sistematis : – linear systematic
– circulair systematic

 Multistage Sampling
Digunakan untuk populasi yang relatif heterogen
Biasanya objek-objek dikelompokkan dalam wilayah-wilayah
Wilayah yang dimaksud: RT, RW, Desa/Kel, Kec, Kab/Kota, Prop, Negara
Pemilihan sampelnya bertahap dari unit terbesar sampei terkecil
Contoh : Three Stages Sampling (3 tahap)
Tahap 1 : Kabupaten/Kota
Tahap 2 : Kelurahan
Tahap 3 : Rumah Tangga

BAB II
PENGANTAR TEORI PROBABILITAS

Untuk mengetahui karakteristik suatu populasi sering dilakukan dengan menganalisis hanya sebagian data saja (atau sering disebut dengan sampel). Berdasarkan informasi yang terkandung dalam sampel, dilakukan pengambilan kesimpulan terhadap populasinya. Dasar logika dari proses pengambilan kesimpulan tentang suatu populasi dengan menganalisis data sampel adalah probabilitas. Oleh karena itu, pemahaman tentang teori probabilitas sangat diperlukan dan bersifat mendasar.
Kata “probabilitas” atau “peluang” adalah kata yang biasa dipakai dalam kehidupan sehari-hari. Suatu peristiwa yang mempunyai probabilitas untuk terjadi mengandung arti bahwa ada harapan peristiwa itu akan terjadi. Jika ada kepastian bahwa suatu peristiwa akan terjadi, maka peluang terjadinya peristiwa itu adalah 1. Jika tidak ada peluang sama sekali bahwa suatu peristiwa akan terjadi, maka peluangnya adalah 0.
Konsep probabilitas berhubungan dengan pengertian eksperimen atau percobaan yang menghasilkan “hasil” yang tidak pasti. Artinya, eksperimen yang diulang-ulang dalam kondisi yang sama akan memberikan “hasil” yang dapat berbeda-beda. Beberapa contoh eksperimen statistik adalah sebagai berikut :
– Percobaan : pengukuran waktu reaksi kimia
Hasil : lama reaksi,
– Percobaan : pengamatan sekumpulan hasil produksi
Hasil : banyaknya produk cacat dalam kumpulan produk itu.

Beberapa definisi
• Ruang sampel (sample space) :
Himpunan semua hasil yang mungkin dari suatu percobaan.
• Titik sampel :
Setiap unsur / elemen / anggota dari ruang sampel.
• Kejadian :
Hasil dari suatu percobaan yang mempunyai sifat tertentu.
Himpunan bagian dari ruang sampel.

CONTOH:
Dua buah uang logam dilemparkan. Tentukan yang dimaksud dengan percobaan, ruang sampel, dan titik sampelnya ! Serta berikan contoh tentang kejadian !

Jawab :
Percobaan : pelemparan dua buah uang logam
Ruang sampel :
S = {AA, AG, GA, GG}
Terdapat empat titik sampel, yaitu : AA, AG, GA, GG
Kejadian :
D = paling sedikit satu gambar muncul
D = {AG, GA, GG}.

2.1. MENCACAH TITIK SAMPEL
• Kaidah Penggandaan
Bila suatu operasi dapat dilakukan dalam n1 cara, bila untuk setiap cara tersebut operasi kedua tersebut dapat dilakukan dalam n2 cara, bila untuk setiap pasangan dua cara yang pertama operasi ketiga dapat dilakukan dengan n3 cara, dan seterusnya, maka k operasi dalam urutan tersebut dapat dilakukan dalam n1 n2 … nk cara.

CONTOH:
Bila sepasang dadu dilemparkan sekali, berapa banyaknya titik sampel dalam ruang sampelnya ?

Jawab :
Dadu pertama dapat menghasilkan n1 = 6 cara. Untuk setiap cara tersebut dadu kedua dapat menghasilkan n2 = 6 cara. Dengan demikian, sepasang dadu tersebut dapat menghasilkan n1 x n2 = 6 x 6 = 36 cara.

CONTOH:
Berapa banyak bilangan genap, terdiri atas tiga angka yang dapat dibentuk dari angka-angka 1, 2, 5, 6, dan 9, bila setiap angka tersebut hanya boleh digunakan sekali ?

Jawab :
Karena bilangan genap yang terdiri atas tiga angka ditentukan oleh angka yang menduduki posisi satuan, maka terdapat 2 pilihan angka. Untuk setiap pilihan tersebut, tersedia 4 pilihan bagi posisi ratusan dan 3 pilihan bagi posisi puluhan. Dengan demikian, terdapat (2) (4) (3) = 24 bilangan genap yang terdiri dri tiga angka.

• Permutasi
Adalah susunan yang dibentuk dari suatu kumpulan obyek yang diambil sebagian atau seluruhnya.
 Banyaknya permutasi n obyek yang berbeda adalah n(n – 1)(n – 2)…3  2  1 = n!
 Banyaknya permutasi akibat pengambilan r obyek dari n obyek yang berbeda, untuk r  n, adalah n(n-1)(n-2)…(n-(r-1)) = nPr = n! / (n-r)!
 Banyaknya permutasi n benda berlainan yang disusun melingkar adalah (n – 1)!
 Banyaknya permutasi yang berbeda dari n benda yang n1 diantaranya berjenis pertama, n2 berjenis kedua, … , nk berjenis ke-k adalah
n!
n1! n2 ! … nk !
dengan n1 + n2 + … + nk = n.

CONTOH:
a. Berapa banyak susunan berbeda huruf-huruf A, B, C bisa dibentuk, bila masing-masing huruf hanya boleh digunakan sekali ?
b. Bila diambil dua huruf dari tiga huruf tsb., maka berapa susunan huruf berbeda yang mungkin dibentuk ?

Jawab :
a. (3) (2) (1) = 6 cara.
b. (3) (2) = 6 cara.

CONTOH:
a. Tersedia empat angka : 1, 2, 3, 4. Berapa bilangan yang dapat dibuat dari semua angka tersebut ?
b. Bila diambil dua angka dari empat angka, maka berapakah susunan angka berbeda yang mungkin dibentuk ?

Jawab :
a. (4) (3) (2) (1) = 4 ! = 24 bilangan.
b. 4P2 = (4!) / ((4-2)!) = 12 susunan angka.

CONTOH:
Berapa macam permutasi yang berlainankah yang dapat disusun dari kata ‘matematika’ ?

Jawab :
10 ! = 453600 macam
2! 2! 2! 1! 1! 1! 1!

• Kombinasi
Adalah banyaknya cara mengambil r obyek dari n obyek tanpa memperhatikan urutan.
 Kombinasi adalah membuat sekatan dengan 2 sel. Satu sel berisi r benda yang dipilih dan sel yang lain berisi n-r benda yang tidak terpilih.
 Banyaknya kombinasi r obyek dari n obyek yang berbeda adalah

CONTOH:
Dalam berapa cara 2 pertanyaan dalam soal ujian dapat dipilih, dari 3 pertanyaan yang disediakan ?

Jawab :
Banyaknya cara memilih 2 dari 3 soal ujian

2.2. PROBABILITAS SUATU KEJADIAN
• Kemungkinan terjadinya suatu kejadian sebagai hasil percobaan statistika dinilai dengan menggunakan bil real yang disebut bobot atau probabilitas (peluang) dengan nilai dari 0 sampai 1.
• Untuk tiap titik pada ruang sampel dikaitkan dengan suatu bobot sedemikian hingga jumlah semua bobot sama dengan 1.
• Bila titik sampel tertentu mempunyai kemungkinan besar untuk terjadi, maka bobot yang diberikan hendaknya dekat dengan 1. Sebaliknya, bobot yang lebih dekat dengan 0 diberikan pada titik sampel yang kecil kemungkinannya terjadi.
• Probabilitas suatu kejadian A adalah :
Jumlah bobot semua titik sampel yang termasuk dalam A. Jadi :
0  P(A)  1
P() = 0
P(S) = 1

CONTOH:
Sekeping uang logam setimbang dilemparkan dua kali. Berapakah probabilitasnya sekurang-kurangnya sisi gambar muncul sekali ?

Jawab :
Ruang sampel percobaan ini adalah :
S = {AA, AG, GA, GG}
Bila D menyatakan kejadian bahwa sekurang-kurangnya sisi gambar muncul sekali, maka
D = {GA, AG, GG}
P(D) = ¼ + ¼ + ¼ = ¾

• Bila suatu percobaan mempunyai N hasil percobaan yang berbeda, dan masing-masing mempunyai kemungkinan sama untuk terjadi, dan bila tepat n di antara hasil percobaan itu menyusun kejadian A, maka probabilitas kejadian A adalah :
P(A) = n/N

CONTOH :
Sekantung obat berisi 6 vitamin rasa jeruk, 4 rasa anggur, dan 3 rasa strawberi. Bila seseorang mengambil satu obat secara acak, carilah probabilitasnya mendapat :
a. Satu rasa jeruk
b. Satu rasa anggur atau strawberi.

Jawab :
Misalkan J, A, dan S masing-masing menyatakan kejadian bahwa yang terpilih adalah rasa teruk, anggur dan strawberi. Jumlah tablet 13, semuanya terpilih dengan probabilitas yang sama.
a. Karena 6 dari 13 tablet dengan rasa jeruk, maka probabilitas kejadian J, satu rasa j eruk terpilih secara acak
P(J) = 6/13
b. Karena 7 dari 13 tablet dengan rasa anggur atau strawberi, maka
P(A  B) = 7/13

• Definisi probabilitas berdasarkan frekuensi relatif :
Penentuan probabilitas didasarkan atas pengetahuan sebelumnya atau berdasarkan bukti percobaan.
Penentuan probabilitas didasarkan atas frekuensi relatif dari terjadinya kejadian apabila banyaknya pengamatan sangat besar.

• Definisi probabilitas berdasarkan subyektivitas :
Penentuan probabilitas didasarkan atas intuisi, keyakinan pribadi, & informasi tidak langsung lain.

2.3. ATURAN PENJUMLAHAN
• Bila A dan B adalah dua kejadian sembarang, maka
P(A  B) = P(A) + P(B) – P(A  B)

• Bila A dan B adalah dua kejadian yang saling terpisah (mutually exclusive), maka
P(A  B) = P(A) + P(B)

• Bila A, B, C adalah tiga kejadian sembarang, maka
P(A  B  C) = P(A) + P(B) + P(C) – P(A  B) – P(A  C) – P(B  C)
+ P(A  B  C)

• Bila A1, A2,.…, An adalah kejadian-kejadian yang saling terpisah, maka
P(A1  A2  …  An) = P(A1) + P(A2) + … + P(An)

• Bila A dan A’ adalah dua kejadian berkomplementer, maka
P(A) + P(A’) = 1

CONTOH:
Peluang seorang mahasiswa lulus matematika 2/3 dan peluangnya lulus statistika 4/9. Bila peluang lulus kedua mata kuliah ¼, berapakah peluangnya lulus paling sedikit satu mata kuliah ?

Jawab :
Bila M menyatakan kejadian ‘lulus Matematika’ dan S ‘lulus statistika’ maka
P(M  S) = P(M) + P(S) – P(M  S)
= 2/3 + 4/9 – ¼ =31/36

CONTOH:
Berapakah probabilitas mendapat 7 atau 11 bila dua dadu dilemparkan ?

Jawab :
Misalkan A kejadian jumlah 7 muncul, dan B kejadian jumlah 11 muncul. Jumlah 7 dapat muncul dalam 6 dari 36 titik sampel dan jumlah 11 dalam 2 titik sampel. Karena semua titik berkemungkinan sama maka P(A) = 6/36 = 1/6. dan P(b) = 2/36 = 1/18. Kejadian A dan B saling terpisah karena jumlah 7 dan 11 tidak mungkin terjadi pada lemparan yang sama, sehingga
P(A  B) = P(A) + P(B)
= 1/6 + 1/18 = 2/9

2.4. PROBABILITAS BERSYARAT DAN INDEPENDENSI

PENGERTIAN :
Probabilitas terjadinya suatu kejadian B bila diketahui bahwa kejadian A telah terjadi disebut probabilitas bersyarat dan dinyatakan dengan P(B|A). Lambang P(B|A) biasanya dibaca “peluang B terjadi bila diketahui A terjadi” atau lebih sederhana lagi “peluang B, bila A diketahui”.

Definisi 1 :
Peluang bersyarat B bila A diketahui, dinyatakan dengan P(B|A), ditentukan oleh :

CONTOH:
1. Probabilitas suatu penerbangan yang telah terjadual teratur berangkat tepat waktu P(B) = 0,83; probabilitas sampai tepat waktu P(S) = 0,82; dan probabilitas berangkat dan sampai tepat waktu P(B  S) = 0,78. Carilah probabilitas bahwa pesawat :
a. sampai tepat waktu apabila diketahui berangkat tepat waktu,
b. berangkat tepat waktu jika diketahui sampai tepat waktu.

Jawab :
a. Probabilitas pesawat sampai tepat waktu jika diketahui berangkat tepat waktu adalah :

b. Probabilitas pesawat berangkat tepat waktu apabila diketahui sampai tepat waktu adalah :

Definisi 2 :
Dua kejadian A dan B bebas jika dan hanya jika :
P(B|A) = P(B)
dan
P(A|B) = P(A).
Jika tidak demikian, maka A dan B tak bebas.

CONTOH 13 :
Misalkan diberikan suatu percobaan yang berkaitan dengan pengambilan 2 kartu yang diambil berturutan dari sekotak kartu dengan pengembalian. Kejadian ditentukan sebagai :
A = kartu pertama yang terambil as,
B = kartu kedua sebuah skop (spade).
Karena kartu pertama dikembalikan, ruang sampel untuk kedua pengambilan terdiri dari 52 kartu, berisi 4 as dan 13 skop. Jadi

dan

Jadi, P(B|A) = P(B). Apabila hal ini benar, maka kejadian A dan B dikatakan bebas (independent).

Definisi 3 :
Bila dalam suatu percobaan A dan B dapat terjadi sekaligus, maka :
P(A  B) = P(A) P(BA)
P(A  B) = P(B) P(AB)

CONTOH:
Suatu kantong berisi 4 bola merah dan 3 bola hitam, dan kantong kedua berisi 3 bola merah dan 5 bola hitam. Satu bola diambil dari kantong pertama dan dimasukkan tanpa melihatnya ke kantong kedua. Berapakah probabilitas apabila sekarang diambil bola hitam dari kantong kedua ?

Jawab :
Misalkan H1, H2, dan M1 masing-masing menyatakan mengambil 1 bola hitam dari kantong 1, 1 bola hitam dari kantong 2, dan 1 bola merah dari kantong 1. Ingin diketahui gabungan dari kejadian mutually exclusive H1  H2 dan M1  H2. Berbagai kemungkinan dan probabilitasnya diperlihatkan pada Gambar di bawah ini.

Selanjutnya,

Definisi 4 :
Bila 2 kejadian A dan B bebas, maka :
P(A  B) = P(A) P(B)

CONTOH:
Suatu kota kecil mempunyai sebuah mobil pemadam kebakaran dan sebuah ambulans untuk keadaan darurat. Probabilitas mobil pemadam kebakaran siap setiap waktu diperlukan adalah 0,98; probabilitas mobil ambulans siap setiap waktu dipanggil adalah 0,92. Jika dalam kejadian ada kecelakaan karena kebakaran gedung, maka carilah probabilitas keduanya siap.

Jawab :
Misalkan A dan B masing-masing menyatakan Kejadian mobil pemadam kebakaran dan ambulans siap. Oleh karena itu,
P(A B) = P(A) P(B) = (0,98)(0,92) = 0,9016.

Definisi 5 :
Bila dalam suatu percobaan kejadian-kejadian A1, A2, …, Ak dapat terjadi, maka :
P(A1A2 …Ak) = P(A1).P(A2A1).P(A3 A1A2).
P(Ak A1A2 … Ak-1)

CONTOH:
Tiga kartu diambil satu persatu tanpa pengembalian dari sekotak kartu (yang berisi 52 kartu). Carilah probabilitas bahwa kejadian A1  A2  A3 terjadi, apabila A1 kejadian bahwa kartu pertama as berwarna merah, A2 kejadian bahwa kartu kedua 10 atau jack, dan A3 kejadian bahwa kartu ketiga lebih besar dari 3 tetapi lebih kecil dari 7.

Jawab :
Diketahui bahwa :
A1 : kartu pertama as berwarna merah,
A2 : kartu kedua 10 atau jack,
A3 : kartu ketiga lebih besar dari 3 tetapi lebih kecil dari 7.
Selanjutnya,

sehingga diperoleh bahwa :

Definisi 5 :
Bila A1, A2, …, Ak saling bebas, maka :
P(A1A2 …Ak) = P(A1).P(A2).P(A3) … P(Ak)

Teorema :
Bila kejadian B1, B2, …, Bk merupakan partisi dari ruang sampel S dengan P(Bi)  0 untuk i = 1, 2, …, k, maka untuk setiap kejadian A anggota S :

atau
P(A) = P(B1)P(AB1) + P(B2)P(AB2) +… + P(Bk)P(ABk)

BUKTI :
Perhatikan diagram Venn pada Gambar di bawah ini. Terlihat bahwa kejadian A merupakan gabungan dari sejumlah kejadian yang mutually exclusive B1  A, B2  A, …, Bk  A, yaitu :
A = (B1  A)  (B2  A)  …  (Bk  A).

Dengan menggunakan pernyataan yang mengatakan bahwa :
Apabila E1, E2,…, Ek kejadian yang disjoint, maka P(E1  E2  …  Ek) = P(E1) +
P(E2) + … + P(Ek).
serta
Apabila kejadian E1 dan E2 dapat terjadi pada suatu percobaan, maka P(E1  E2) = P(E1)P(E2| E1).
Sehingga diperoleh :
P(A) = P[(B1  A)  (B2  A)  … (Bk  A)]
= P(B1  A) + P(B2  A) + … + P(Bk  A)
=

CONTOH :
Tiga anggota koperasi dicalonkan menjadi ketua. Probabilitas Pak Ali terpilih adalah 0,3; probabilitas Pak Badu terpilih adalah 0,5; sedangkan probabilitas Pak Cokro adalah 0,2. Apabila Pak Ali terpilih, maka probabilitas kenaikan iuran koperasi adalah 0,8. Apabila Pak Badu atau Pak Cokro yang terpilih, maka probabilitas kenaikan iuran adalah masing-masing 0,1 dan 0,4. Berapakah probabilitas iuran akan naik ?
Jawab :
Perhatikan kejadian sebagai berikut.
A = Orang yang terpilih menaikkan iuran
B1 = Pak Ali yang terpilih
B2 = Pak Badu yang terpilih
B3 = Pak Cokro yang terpilih.
Berdasarkan teorema jumlah probabilitas, maka diperoleh :
P(A) = P(B1)P(A|B1)+ P(B2)P(A|B2)+ P(B3)P(A|B3)
Dengan melihat diagram pohon pada Gambar di bawah ini, terlihat bahwa ketiga cabang mempunyai probabilitas
P(B1)P(A|B1) = (0,3)(0,8) = 0,24
P(B2)P(A|B2) = (0,5)(0,1) = 0,05
P(B3)P(A|B3) = (0,2)(0,4) = 0,08.

Jadi P(A) = 0,24 + 0,05 + 0,08 = 0,37.

2.5. KAIDAH BAYES
Misalkan kejadian B1, B2, …, Bk merupakan suatu partisi dari ruang sampel S dengan P(Bi)  0 untuk i = 1, 2, …, k. Misalkan A suatu kejadian sebarang dalam S dengan P(A)  0, maka :

untuk r = 1, 2, …, k.

BUKTI :
Menurut definisi probabilitas bersyarat :

selanjutnya,

sehingga diperoleh :
.

CONTOH:
Kembali ke contoh sebelumnya (CONTOH 17), apabila seseorang merencanakan masuk menjadi anggota koperasi tersebut, tetapi menundanya beberapa minggu dan kemudian mengetahui bahwa iuran telah naik, berapakah probabilitas Pak Cokro terpilih menjadi ketua ?

Jawab :
Dengan menggunakan Kaidah Bayes, diperoleh bahwa :

Selanjutnya, masukkan probabilitas yang telah dihitung pada contoh sebelumnya, sehingga diperoleh :

Berdasarkan kenyataan bahwa iuran telah naik, maka hasil ini menunjukkan bahwa kemungkinan besar bukan Pak Cokro yang sekarang menjadi ketua koperasi tersebut.

SOAL-SOAL LATIHAN :

1. Misalkan tiga produk diambil secara acak dari proses produksi di pabrik, kemudian setiap produk diperiksa dan digolongkan sebagai cacat (C) dan tidak cacat (B). Tentukan yang dimaksud dengan percobaan, ruang sampel, dan titik sampelnya ! Beri contoh kejadian !
2. Dalam kedokteran dikenal 8 golongan darah, yaitu AB+, AB-, A+, A-, B+, B-, O+, O-; selain itu tekanan darah dikelompokkan atas rendah, normal, dan tinggi. Berdasarkan kedua hal itu ada berapa cara seorang pasien dapat dikelompokkan ?
3. Dalam berapa cara kata “statitika’ dapat dipermutasikan ?
4. Sebuah panitia 3 orang hendak dibentuk dari sejumlah 20 orang. Berapa banyak panitia yang dapat dibentuk ?
5. Terdapat 20 nomor lotere. Ada berapa cara berbeda, bila 2 nomor diambil untuk hadiah pertama dan kedua ?
6. Sebuah sampel harus terdiri dari 5 orang responden. Jika responden tersebut harus dipilih dari suatu populasi yang terdiri dari 6 pria dan 3 wanita, dalam berapa cara sampel diatas dapat dipilih jika harus memiliki komposisi paling sedikit 3 orang responden pria ?
7. Satu tas berisi 2 botol (kecil) aspirin dan 3 botol obat masuk angin. Tas kedua berisi 3 botol aspirin, 2 botol masuk angin dan 1 botol obat rematik. Bila 1 botol diambil secara acak dari setiap tas, carilah probailitas bahwa :
a. kedua botol berisi obat masuk angin
b. tidak ada botol yang berisi obat masuk angin
c. kedua botol berisi obat yang berlainan.

8. Dari 500 mahasiswa tingkat pertama suatu universitas, ternyata 210 mengambil mata kuliah Matematika, 258 mengambil Statistika, 216 mengambil Fisika, 122 mengambil Matematika dan Statistika, 83 mengambil Statistika dan Fisika, 97 mengambil Matematika dan Fisika, dan 52 mengambil ketiga mata kuliah. Bila seorang mahasiswa dipilih secara acak di universitas tersebut, berapa probabilitas bahwa mahasiswa itu
a. mengambil Matematika tapi tidak Statistika
b. mengambil Fisika dan Statistika, tapi tidak Matematika
c. mengambil Statistika atau Fisika.

9. Dalam suatu kotak terdapat 6 obat yang berwarna putih dan 4 obat yang berwarna kuning. Apabila dari kotak tersebut diambil satu per satu secara acak sebanyak 3, hitunglah probailitas mendapatkan semuanya berwarna putih, bila dilakukan dengan :
a. dengan pengembalian
b. tanpa pengembalian.

10. Peluang Tom masih hidup dalam 20 tahun mendatang adalah 0,7 dan peluang Nancy masih hidup dalam 20 tahun mendatang adalah 0,9. Berapakah peluang bahwa keduanya akan meninggal dalam 20 tahun mendatang ?
11. Dalam suatu penelitian untuk mengetahui pengaruh hipertensi pada kebiasaan merokok, dikumpulkan data yang menyangkut 180 orang.
Bukan perokok Perokok sedang Perokok berat
Hipertensi 21 36 30
Tidak hipertensi 48 26 19

Bila seseorang diambil secara acak dari kelompok ini, carilah peluang bahwa orang itu
a. menderita hipertensi, bila diketahui dia perokok berat.
b. bukan perokok, bila diketahui dia tidak menderita hipertensi.

12. Peluang seorang dokter dengan tepat mendiagnosis sejenis penyakit tertentu 0,7. Bila diketahui dokter tadi salah mendiagnosis, peluang pasien akan menuntut ke pengadilan 0,9. Berapakah peluang dokter tersebut salah mendiagnosis dan pasien menuntutnya ?

13. Di suatu daerah, dari pengalaman lalu diketahui bahwa peluang orang dewasa yang berumur di atas 40 tahun menderita kanker adalah 0,02. Peluang seorang dokter mendiagnosis penderita kanker secara tepat sebagai penderita adalah 0,78, dan peluang mendiagnosis bukan penderita kanker secara salah sebagai penderita adalah 0,06.
a. Tentukan peluang bahwa hasil diagnosis bagi seseorang mengatakan bahwa ia menderita kanker.
b. Tentukan berapa peluang seorang yang didiagnosa terserang kanker memang terserang kanker.

BAB III
FUNGSI/DISTRIBUSI PROBABILITAS

3.1 VARIABEL RANDOM
Definisi 1:
Variabel random adalah suatu fungsi yang memetakan ruang sampel (S) ke himpunan bilangan Real (R), dan ditulis X : S  R

CONTOH:
Pelemparan uang logam setimbang sebanyak tiga kali. Ruang sampelnya S = {GGG, GGA, GAG, AGG, GAA, AGA, AAG, AAA}. Dari percobaan ini dapat didefinisikan beberapa variabel random yang mampu memetakan ruang sampelnya ke dalam bilangan real. Salah satu variabel random yang dapat dibuat adalah X = banyaknya sisi gambar yang muncul. Maka nilai numerik 0, 1, 2, atau 3 dapat diberikan pada setiap titik sampel.

Definisi 2 :
Ruang Sampel Diskrit adalah apabila ruang sampelnya mengandung titik sampel yang berhingga atau terhitung banyaknya.
Variabel random yang didefinisikan di atas ruang sampel diskrit disebut variabel random diskrit.

CONTOH:
– banyaknya barang yang cacat, dalam pengambilan sampel sebesar k barang.
– banyaknya yang meninggal karena terserang suatu infeksi pernafasan setiap tahun di Surabaya.

Definisi 3 :
Ruang Sampel Kontinu adalah apabila ruang sampelnya mengandung titik sampel yang tak berhingga banyaknya, dan memuat semua bilangan real dalam suatu interval.
Variabel random yang didefinisikan di atas ruang sampel kontinu disebut variabel random kontinu.

CONTOH:
– lamanya reaksi kimia tertentu
– jarak yang ditempuh sebuah mobil yang diisi dengan 5 liter bensin.

3.2. DISTRIBUSI PROBABILITAS DISKRIT
Himpunan pasangan terurut (x, f(x)) merupakan suatu fungsi probabilitas atau distribusi proabilitas dari variabel random diskrit, jika

Rata-rata dan varians dari variabel random diskrit X

3.3. DISTRIBUSI PROBABILITAS KONTINU

Fungsi f(x) adalah fungsi kepadatan (density) probabilitas untuk variabel kontinu X, jika

Rata-rata dan varians dari variabel random kontinu X

3.4. BEBERAPA DISTRIBUSI PROBABILITAS DISKRIT
3.4.1 Distribusi Binomial
Ciri-ciri percobaan binomial :
1. Percobaan terdiri dari n ulangan
2. Setiap hasil ulangan dapat digolongkan sebagai sukses (S) atau gagal (G)
3. Probabilitas sukses (p) untuk setiap ulangan adalah sama
4. Setiap ulangan harus bersifat independen.

Definisi 4 :
Suatu percobaan dengan n ulangan mempunyai probabilitas sukses p dan gagal q = 1-p. Jika variabel random X menyatakan banyaknya sukses dalam n ulangan yang bebas, maka X berdistribusi Binomial dengan distribusi probabilitas :

Nilai harapan (rata-rata) dan varians dari variabel random yang berdistribusi Binomial
 = np
2 = npq

SOAL 1 :
Uang logam setimbang dilemparkan sebanyak empat kali. Tentukan distribusi probabilitas bagi banyaknya sisi gambar yang muncul.

SOAL 2 :
Probabilitas seseorang sembuh dari suatu penyakit darah adalah 0,4. Jika 15 orang diketahui menderita penyakit ini, tentukan probabilitas :
a. Tepat 5 orang yang sembuh
b. Ada 3 sampai 8 orang yang sembuh
c. Sekurang-kurangnya 3 orang sembuh.

3.4.2 Distribusi Hipergeometrik
Ciri-ciri percobaan Hipergeometrik :
1. Sampel acak berukuran n diambil dari populasi berukuran N
2. Dari populasi berukuran N benda, sebanyak k benda diberi label “sukses”, dan N-k benda diberi label “gagal”.

Definisi 5 :
Dalam populasi N benda, k benda diantaranya diberi label “sukses” dan N-k benda lainnya diberi label “gagal”. Jika variabel random X menyatakan banyaknya sukses dalam sampel acak berukuran n, maka X berdistribusi hipergeometrik dengan distribusi probabilitas

Nilai harapan dan varians dari variabel random yang berdistribusi Hipergeometrik adalah

SOAL 3 :
Sebuah panitia 5 orang akan dipilih secara acak dari 3 mahasiswa farmasi dan 5 mahasiswa kedokteran. Tentukan distribusi probabilitas banyaknya maha-siswa farmasi dalam panitia tersebut.

Bila n relatif kecil dibandingkan dengan N, maka distribusi hipergeometrik dapat dihampiri dengan distribusi binomial
h (x; N, n, k)  b (x; n, p)

SOAL 4 :
Sebuah perusahaan farmasi melaporkan bahwa diantara 5000 pemakai obat tertentu 4000 diantaranya menggunakan obat generik. Jika 10 orang diantara pemakai obat tersebut dipilih secara acak, berapa probabilitas tepat ada 3 orang yang memakai obat non generik ?

3.4.3. Distribusi Poisson
Ciri-ciri percobaan Poisson :
1. Banyaknya hasil percobaan yang terjadi dalam suatu selang waktu tertentu, tidak tergantung pada banyaknya hasil percobaan yang terjadi pada selang waktu lain yang terpisah.
2. Probabilitas terjadinya suatu hasil percobaan selama selang waktu yang singkat, sebanding dengan panjang selang waktu tersebut, dan tidak tergantung pada banyaknya hasil percobaan yang terjadi di luar selang waktu tersebut.
3. Probabilitas lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat, dapat diabaikan.

Definisi 6 :
Jika variabel random X menyatakan banyaknya hasil percobaan yang terjadi dalam selang waktu tertentu, dan  adalah rata-rata banyaknya hasil percobaan dalam selang waktu tersebut, maka X berdistribusi Poisson dengan distribusi probabilitas

Nilai harapan dan varians dari ariable random yang berdistribusi Poisson keduanya sama dengan .

SOAL 5 :
Rata-rata banyaknya partikel radioaktif yang melewati suatu penghitung selama 1 milidetik dalam suatu percobaan di lab adalah 4. Berapa prob 6 partikel melewati penghitung itu dalam 1 milidetik tertentu ?

Misalkan X  b(x; n,p), bila n  , p  0, maka
b(x; n,p)  p(x; )
dengan  = np.

SOAL 6 :
Probabilitas seseorang meninggal karena suatu infeksi pernafasan adalah 0,002. Carilah probabilitas jika 2000 orang yang terserang infeksi tersebut, kurang dari 5 orang akan meninggal ! Tentukan rata-rata dan variansnya.

3.5. DISTRIBUSI PROBABILITAS KONTINU
3.5.1 Distribusi Normal

Definisi 7 :
Variabel random X berdistribusi normal dengan rata-rata  dan varians 2 jika mempunyai fungsi densitas
f(x) =

Sifat-sifat kurva normal :
1. Modus terjadi pada x = 
2. Kurva simetris terhadap x = 
3. Kedua ujung kurva secara asimtotik mendekati sumbu datar x, bila nilai x bergerak menjauhi .
4. Seluruh luas dibawah kurva dan diatas sumbu datar sama dengan 1.

Gambar 1 : Kurva Normal

Misalkan ingin dihitung P (x1 < X < x2) dari variabel random X yang berdistribusi normal, maka berdasar kurva di atas P (x1 < X < x2) = luas daerah yang diarsir.
Untuk menghitung P(x1 < X k) = 0,3015
b. P (k < Z < -0,18) = 0,4197
c. P (-0,93 < Z < k) = 0,7235.

SOAL 9 :
Variabel random X berdistribusi normal dengan rata-rata 50 dan simpangan baku 10. Tentukan
a. P (x < 45)
b. P ( 47 < x 64)

SOAL 10 :
Rata-rata tinggi anjing pudel jenis tertentu adalah 30 cm, dengan simpangan baku 4,1 cm. Berapa persentase banyaknya anjing pudel jenis tersebut yang tingginya melebihi 35 cm,
a. bila tingginya menyebar normal dan dapat diukur sampai ketelitian berapapun ?
b. bila kali ini tingginya diukur sampai cm terdekat ?

3.5.2 Hampiran Normal Terhadap Distribusi Binomial

Jika variabel random X berdistribusi Binomial dengan mean  = np dan varians 2 = npq, maka variabel random untuk n   berdistribusi normal standart.

SOAL 11 :
Probabilitas seorang penderita sembuh dari suatu penyakit darah yang jarang muncul sebesar 0,4. Bila diketahui ada 100 orang yang telah terserang penyakit ini, berapa probabilitas bahwa kurang dari 30 yang sembuh ?

SOAL-SOAL LATIHAN :

1. Menurut teori Mendel tentang sifat-sifat keturunan, perkawinan silang 2 jenis tanaman yang serupa, yang satu berbunga merah dan lainnya berbunga putih, menghasilkan keturunan yang 25% tanamannya berbunga merah. Andaikan seorang ahli tanaman ingin mengawinsilangkan lima pasang berbunga merah dan berbunga putih. Berapa probabilitas bahwa dari 5 keturunan yang dihasilkan
a. Tidak terdapat bunga berwarna merah.
b. Paling sedikit 4 tanaman berbunga merah.
c. Paling banyak 4 tanaman berbunga merah.

2. Suatu perusahaan farmasi mengetahui bahwa secara rata-rata, 5% dari sejenis pil mempunyai campuran dibawah syarat minimum, sehingga tidak memenuhi persyaratan. Berapa probabilitas bahwa kurang dari 10 pil dalam sampel 200 pil tidak memenuhi persyaratan ?

3. Panjang ikan sardine yang diterima suatu pabrik pengalengan ikan mempunyai panjang rata-rata 4,54 inci dan simpangan baku 0,25 inci. Apabila distribusi panjang ikan sardine tersebut mengikuti distribusi normal, berapa persentase dari ikan-ikan tersebut yang panjangnya adalah :
a. Lebih dari 5 inci
b. Kurang dari 5 inci
c. 4,4 sampai 4,6 inci ?

4. Probabilitas seorang mahasiswa gagal dalam tes scoliosis (membengkoknya tulang belakang) adalah 0,004. Diantara 1875 siswa yang dites scoliosis, hitunglah probabilitas terdapat :
a. kurang dari 5 mahasiswa gagal dalam tes itu
b. lebih dari 2 mahasiswa gagal dalam tes tersebut
c. 8, 9 atau 10 mahasiswa gagal dalam tes tersebut.

5. Dalam suatu dos berisi 50 botol obat dan 5 buah diantaranya tidak memenuhi standart. Dari dos tersebut diambil 4 botol obat secara acak, berapa probabilitas mendapat 2 botol yang tidak memenuhi standart ?

6. Dalam suatu ujian statistika, diketahui bahwa nilai rata-ratanya adalah 82 dengan simpangan baku sama dengan 5. Semua mahasiswa dengan nilai dari 88 sampai 94 mendapat nilai B. Bila nilai-nilai statistika tersebut berdistribusi normal, dan 8 siswa mendapat nilai B, berapa banyak mahasiswa yang menempuh ujian tersebut (bila nilai ujian dibulatkan ke bilangan bulat terdekat) ?

7. Secara rata-rata, di Indonesia banyaknya kematian yang disebabkan oleh penyakit tertentu adalah 3 orang perhari . Tentukan probabilitas dalam suatu hari terjadi kematian
a. kurang dari 2 orang
b. lebih dari 5 orang
c. antara 3 sampai 7 orang.

8. Suatu organisasi ilmiah mempunyai 1000 anggota, dimana 100 orang diantaranya adalah sarjana farmasi. Jika 10 orang diambil secara acak untuk diangkat jadi pengurus organisasi itu, maka tentukan probabilitas lebih dari 5 orang sarjana farmasi duduk dalam pengurus itu.

9. Tentukan mean dan varians untuk semua soal diatas yang variabel randomnya diskrit.

10. Tinggi 1000 mahasiswa menyebar normal dengan rata-rata 174,5 cm dan simpangan baku 6,9 cm. Bila tinggi dicatat sampai setengah cm terdekat, berapa banyak diantara mahasiswa tersebut yang memiliki tinggi
a. Kurang dari 160,5 cm
b. Sama dengan 175 cm
c. Antara 171,5 sampai 182 cm.

BAB IV
PENDUGAAN PARAMETER

4.1. INFERENSI STATISTIK
Inferensi statistik mencakup semua metode yang digunakan dalam penarikan kesimpulan atau generalisasi mengenai populasi.
Inferensi statistik dapat dikelompokkan dalam 2 bidang utama:
1. PENDUGAAN PARAMETER
Contoh :
– Seorang calon dalam suatu pemilihan ingin menduga proporsi yang sebenarnya pemilih yang akan memilihnya, dengan cara mengambil 100 orang secara acak untuk ditanyai pendapatnya. Proporsi pemilih yang menyukai calon tersebut dapat digunakan sebagai dugaan bagi proporsi populasi yang sebenarnya.
2. PENGUJIAN HIPOTESIS
Contoh :
– Seorang peneliti masalah kedokteran diminta untuk memutuskan, berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru lebih baik daripada yang sekarang beredar di pasaran.
– Seorang insinyur ingin memutuskan, berdasarkan data contoh apakah ada perbedaan ketelitian antara dua jenis alat ukur.

Metode Pendugaan Parameter suatu populasi dapat dibedakan menjadi dua :
1. METODE PENDUGAAN KLASIK
Pendugaan dilakukan berdasarkan sepenuhnya pada informasi sampel yang diambil dari populasi.
2. METODE PENDUGAAN BAYES
Pendugaan dengan menggabungkan informasi yang terkandung dalam sampel dengan informasi lain yang telah tersedia sebelumnya yaitu pengetahuan subyektif mengenai distribusi probabilitas parameter.

4.2. METODE PENDUGAAN KLASIK
Statistik yang digunakan untuk memperoleh sebuah dugaan bagi parameter populasi disebut penduga atau fungsi keputusan. Sedangkan adalah sebuah nilai dugaan berdasarkan sampel acak berukuran n.
Misal : Fungsi keputusan S2 (yang merupakan fungsi dari sampel acak yang bersangkutan) adalah suatu penduga bagi , sedangkan nilai dugaan s2 merupakan “realisasinya”.

Sifat-sifat yang seharusnya dimiliki oleh penduga :
1. TAKBIAS
Statistik dikatakan penduga takbias bagi parameter bila .
2. EFISIEN
Diantara semua kemungkinan penduga takbias bagi parameter , yang ragamnya terkecil adalah penduga paling efisien bagi .

Dugaan parameter dapat dibagi menjadi :
1. DUGAAN TITIK
Menentukan suatu bilangan tunggal berdasarkan sampel sebagai penduga dari parameter.
2. DUGAAN SELANG
Menentukan suatu interval nilai yang dengan peluang tertentu, (1-), diharapkan memuat parameter  yang diduga.

Jika  parameter populasi, dugaan selang dapat dinyatakan dengan : (untuk 0 <  < 1)

Selang , yg dihitung dari sampel yg terpilih, disebut selang kepercayaan / interval keyakinan / confidence interval 100(1-)% untuk parameter tersebut. nilai pecahan 1- disebut koefisien kepercayaan / derajat kepercayaan / tingkat keyakinan (konfidensi).

4.3. PENDUGAAN MEAN
Penduga titik bagi mean populasi  adalah statistik . Bila adalah mean sampel acak berukuran n yang diambil dari suatu populasi dengan ragam 2 diketahui maka selang kepercayaan 100(1-)% bagi  adalah

dengan adalah nilai z yang luas daerah di sebelah kanan di bawah kurva normal standard adalah .
CATATAN : Jika 2 tidak diketahui, tetapi sampel berukuran besar (n≥30), 2 dapat diganti dengan s2.

Adapun penduga selang kepercayaan 100(1-)% bagi  untuk sampel kecil (n<30); bila 2 tidak diketahui adalah

dengan adalah nilai t yang luas daerah di sebelah kanan di bawah kurva seluas .

SOAL 1 :
Rata-rata Indeks Prestasi (IP) sampel acak 36 mahasiswa tingkat sarjana adalah 2,6. Hitunglah selang kepercayaan 95% dan 99% untuk rata-rata IP semua mahasiswa tingkat sarjana. Anggap simpangan baku populasinya 0,3.

SOAL 2 :
Isi 7 botol asam sulfat (liter) adalah:
9,8 10,2 10,4 9,8 10 10,2 9,6
Carilah selang kepercayaan 95% untuk rata-rata isi semua botol bila distribusinya dianggap normal.

UKURAN SAMPEL BAGI PENDUGAAN 
Bila digunakan untuk menduga , kita yakin 100(1-)% bahwa galatnya tidak akan melebihi . Seringkali kita ingin mengetahui berapa besar sebuah sampel harus diambil agar galat dalam menduga  tidak melebihi suatu nilai tertentu e. Ini berarti kita harus menentukan n sehingga = e.
Jadi, bila digunakan untuk menduga , kita yakin 100(1-)% bahwa galatnya tidak akan melebihi suatu nilai tertentu e, bila ukuran sampelnya diambil sebesar
.
Bila hasilnya bernilai pecahan, harus dibulatkan ke bilangan bulat berikutnya yang lebih besar. Jika ragam populasi tidak diketahui, suatu sampel awal berukuran n30 dapat diambil untuk memberikan dugaan bagi .

SOAL 3 :
Seberapa besar sampel harus diambil dalam contoh 1, bila kita ingin percaya 95% bahwa nilai dugaan kita tidak menyimpang dari  lebih dari 0,05 ?

4.4. PENDUGAAN SELISIH DUA MEAN
Bila kita mempunyai dua populasi saling bebas dengan mean 1 dan 2 dan ragam 12 dan 22 maka penduga titik bagi selisih antara 1 dan 2 diberikan oleh statistik . Bila dan masing-masing adalah mean sampel acak bebas berukuran n1 dan n2 yang diambil dari populasi dengan ragam 12 dan 22 diketahui, maka selang kepercayaan 100(1-)% bagi 1-2 adalah

dengan adalah nilai z yang luas daerah di sebelah kanan di bawah kurva normal standard adalah .
CATATAN : Jika 12 dan 22 tidak diketahui, tetapi n1 dan n2 lebih besar dari 30, maka 12 dan 22 dapat diganti dengan s12 dan s22.

Adapun penduga selang kepercayaan100(1-)% bagi 1-2 untuk sampel kecil; bila 12=22 tapi nilainya tidak diketahui adalah

dengan derajat bebas untuk distribusi t = v =n1 + n2 – 2 dan
.

Selang kepercayaan 100(1-)% bagi 1-2 untuk sampel kecil; bila 1222 tapi nilainya tidak diketahui

dengan derajat bebas untuk distribusi t adalah

.

Bila kita mempunyai dua populasi yang tidak saling bebas (berpasangan), selang kepercayaan 100(1-)% bagi D=1-2 untuk pengamatan berpasangan tersebut adalah

SOAL 4 :
Suatu ujian kimia diberikan kepada 50 siswa wanita dan 75 siswa laki-laki. Siswa perempuan mendapat nilai rata-rata 76 dengan simpangan baku 6, sedangkan siswa laki-laki memperoleh rata-rata 82 dengan simpangan baku 8. Tentukan selang kepercayaan 96% bagi selisih rata-rata nilainya.

SOAL 5 :
Suatu penelitian ingin menaksir selisih banyaknya bahan kimia ortofosfor yang diukur pada dua stasiun yang berlainan di suatu sungai. Sampel berukuran 15 dikumpulkan dari stasiun-1 dan Sampel berukuran 12 dikumpulkan dari stasiun-2. Dari stasiun-1 diperoleh rata-rata kadar ortofosfor 3,84 mg perliter dan simpangan baku 3,07 mg perliter, sedangkan dari stasiun-2 diperoleh rata-rata kadar ortofosfor 1,49 mg perliter dan simpangan baku 0,80 mg perliter. Cari selang kepercayaan 95% untuk selisih rata-rata kadar fosfor sesungguhnya pada kedua stasiun tersebut, anggap bahwa pengamatan berasal dari populasi normal dengan varians yang berbeda.

SOAL 6 :
Data berikut (dalam hari), menyatakan waktu yang diperlukan penderita sampai sembuh. Penderita dipilih secara acak untuk mendapat salah satu dari obat yang dapat menyembuhkan infeksi berat pada saluran kencing .
Obat 1 Obat 2
n1 = 14 n2 = 16
= 17 = 19
s12 = 1,5 s22 = 1,8
Buat selang kepercayaan 99% untuk selisih rata-rata waktu sembuh untuk kedua obat tersebut, anggap populasinya berdistribusi normal dengan varians yang sama.

SOAL 7 :
Dua puluh mahasiswa tingkat satu dibagi menjadi 10 pasang, setiap pasang kira-kira mempunyai IQ yang sama. Salah seorang dari setiap pasangan diambil secara acak dan dimasukkan ke dalam kelas yang menggunakan bahan terprogramkan. Anggota pasangan yang lain dimasukkan ke dalam kelas biasa. Pada akhir semester kedua kelompok tersebut diberikan ujian yang sama dan hasilnya sebagi berikut :

Pasangan Bhn Terprogram Kelas Biasa
1 76 81
2 60 52
3 85 87
4 58 70
5 91 86
6 75 77
7 82 90
8 64 63
9 79 85
10 88 83

Tentukan selang kepercayaan 98% bagi selisih rata-rata sesungguhnya nilai ujian untuk kedua metode pengajaran tersebut.

4.5. PENDUGAAN PROPORSI
Penduga titik bagi proporsi p dalam suatu percobaan binomial diberikan oleh statistik , sedangkan X menyatakan banyaknya keberhasilan dalam n ulangan. Dengan demikian, proporsi sampel akan digunakan sebagai nilai dugaan titik bagi parameter p tersebut.
Bila adalah proporsi keberhasilan dalam suatu sampel acak berukuran n, dan , maka selang Kepercayaan 100(1-)% bagi p untuk sampel besar adalah

dengan adalah nilai z yang luas daerah di sebelah kanan di bawah kurva normal standard adalah .

SOAL 8 :
Dari suatu sampel acak 500 keluarga yang memiliki TV disebuah kota kecil, ditemukan bahwa 340 memiliki TV berwarna. Carilah selang kepercayan 95% bagi proporsi sesungguhnya dari keluarga yang memiliki TV berwarna di kota tersebut.

UKURAN SAMPEL BAGI PENDUGAAN p
Bila digunakan untuk menduga p, maka kita percaya 100(1-)% bahwa galatnya tidak lebih besar dari . Seringkali kita ingin mengetahui berapa besar sebuah sampel harus diambil agar galat dalam menduga p tidak melebihi suatu nilai tertentu e. Ini berarti kita harus menentukan n sehingga = e.
Jadi, apabila digunakan untuk menduga p, maka kita percaya 100(1-)% bahwa galatnya tidak akan melebihi suatu besaran tertentu e bila ukuran sampelnya diambil sebesar

Bila informasi awal tentang dugaan nilai bagi p tidak dipunyai, dapat digunakan rumus
.

SOAL 9 :
Dari contoh 8, berapa ukuran sampel yang diperlukan agar dugaan p meleset kurang dari 0,02 dengan kepercayaan 95% ?

4.6. PENDUGAAN SELISIH DUA PROPORSI
Bila dan masing-masing adalah proporsi keberhasilan dalam sampel acak yang berukuran n1 dan n2 serta dan , maka penduga titik bagi selisih antara kedua proporsi populasi p1 – p2 adalah . Sedangkan selang kepercayaan 100 (1-)% bagi p1 – p2 untuk sampel besar adalah

dengan adalah nilai z yang luas daerah di sebelah kanan di bawah kurva normal standard adalah .

SOAL 10 :
ari suatu sampel acak 500 keluarga yang memiliki TV disebuah kota kecil, ditemukan bahwa 340 memiliki TV berwarna. Carilah selang kepercayan 95% bagi proporsi sesungguhnya dari keluarga yang memiliki TV berwarna di kota tersebut.

SOAL 11 :
Suatu obat baru dibuat untuk mengurangi ketegangan syaraf. Dari sampel acak 100 orang yang menderita ketegangan syaraf menunjukkan bahwa 70 orang merasa tertolong oleh obat tersebut. Buat selang kepercayaan 95% bagi proporsi sesungguhnya penderita ketegangan syaraf yang tertolong oleh obat tersebut.

SOAL 12 :
Suatu pengumpulan pendapat umum dilakukan terhadap penduduk kota dan di pinggiran kota untuk menyelidiki kemungkinan didirikannya suatu pabrik kimia. Ternyata 2400 di antara 5000 penduduk kota, dan 1200 di antara 2000 penduduk di pinggiran kota menyetujui rencana tersebut. Buat selang kepercayaan 90% bagi selisih proporsi sebenarnya yang menyetujui rencana tersebut.

4.7. PENDUGAAN VARIANS
Bila adalah penduga titik bagi varians sampel acak berukuran n yang diambil dari suatu populasi normal dengan varians 2, maka selang kepercayaan 100(1-)% bagi 2 adalah

dengan adalah nilai dengan derajad bebas v = n-1 yang luas daerah di sebelah kanannya sebesar .

SOAL 13 :
Seorang peneliti yakin bahwa alat pengukurnya mempunyai simpangan baku  = 2. Dalam suatu eksperimen dia mencatat pengukuran 4,1; 5,2; 10,2. Buat selang kepercayaan 90% bagi . Apakah data ini sesuai dengan asumsinya ?

4.8. PENDUGAAN RASIO DUA VARIANS
Bila dan masing-masing adalah varians sampel acak bebas berukuran n1 dan n2 yang diambil dari populasi normal dengan varians dan , maka penduga titik bagi rasio adalah , dan selang kepercayaan 100(1-)% bagi 12/22 adalah

dengan adalah nilai f untuk derajad bebas v1 dan v2 yang luas daerah di sebelah kanannya sebesar .

SOAL 14 :
Berdasarkan contoh soal nomor 4, buat selang kepercayaan 98% untuk 12/22. Apakah anggapan bahwa 1222 dapat dibenarkan ?

SOAL – SOAL LATIHAN :

1. Sampel acak 8 batang rokok merk tertentu mempunyai kadar nikotin rata-rata 2,6 mg dengan simpangan baku 0,9 mg. Buat selang kepercayaan 99% untuk rata-rata kadar nikotin yg sesungguhnya rokok merk tersebut.

2. Berdasarkan soal no 1, buat selang kepercayaan 95% untuk 2.

3. Misalkan sampel random terdiri dari pasien yang diberi tablet baru. Setelah 24 jam, diperoleh kenyataan bahwa dari 80 pasien yang diberi tablet baru tersebut, 56 orang diantaranya sembuh. Buat selang kepercayaan 95% bagi proporsi semua pasien yang akan sembuh dengan tablet tersebut

4. Dalam suatu makalah disebutkan bahwa kandungan unsur penting dalam tomat segar dan kalengan ditentukan dengan menggunakan spektrofotometer penyerapan atom. Kandungan tembaga dalam tomat segar dibandingkan dengan kandungan tembaga dalam tomat yang sama setelah dikalengkan dicatat, dan hasilnya sebagai berikut :

Tomat Segar Kaleng
1 0,066 0,085
2 0,079 0,088
3 0,069 0,091
4 0,076 0,096
5 0,071 0,093
6 0,087 0,095
7 0,071 0,079
8 0,073 0,078
9 0,067 0,065
10 0,062 0,068

Cari selang kepercayaan 98% untuk selisih sesungguhnya rata-rata kandungan tembaga dalam tomat segar dan kaleng bila selisihnya dianggap berdistribusi normal.

5. Suatu sampel acak 140 kaleng susu merk “Enak” yang masing-masing berlabel “isi 500 gram”, diperoleh berat rata-rata 480 gram dengan simpangan baku 150 gram. Berdasarkan data tersebut, buat selang kepercayaan 99% untuk rata-rata yang sesungguhnya isi kaleng tersebut. Dapatkah berat menurut label tersebut dianggap benar ?

6. Dalam suatu larutan proses kimia, dua katalisator ingin dibandingkan pengaruhnya terhadap hasil proses reaksi. Sampel yang terdiri dari 12 larutan disiapkan menggunakan katalisator A dan sampel dengan 10 larutan menggunakan katalisator B. Katalisator A menghasilkan rata-rata 85 dengan simpangan baku 4, dan katalisator B menghasilkan rata-rata 81 dengan simpangan baku 7. Buat selang kepercayaan 90% untuk 12/22, anggap populasinya berdistribusi normal.

7. Dari soal nomor 6, buat selang kepercayaan 90% untuk selisih rata-rata kedua populasi.

8. Penelitian dilakukan terhadap penderita tukak lambung di kota Malang dan Surabaya. Hasil penelitian menunjukkan bahwa dari 50 orang penderita di Malang didapat 20 orang menggunakan obat ‘Aldin’, sedangkan dari 75 orang penderita di Surabaya didapat 45 orang menggunakan obat tersebut. tentukan interval kepercayaan 90% bagi selisih proporsi sebenarnya penderita yang mengkonsumsi obat ‘Aldin’ dari Surabaya dan Malang.

BAB V
PENGUJIAN HIPOTESIS

Hipotesis statistik merupakan pernyataan sementara tentang satu populasi atau lebih. Dalam statistika, pengujian hipotesis merupakan bagian terpenting untuk mengambil keputusan. Dengan melakukan pengujian hipotesis seorang peneliti akan dapat menjawab pertanyaan-pertanyaan yang diajukan dengan menyatakan penolakan atau penerimaan terhadap hipotesis. Kebenaran hipotesis secara pasti tidak pernah diketahui kecuali jika dilakukan pengamatan terhadap seluruh anggota populasi. Untuk melakukan hal ini sangatlah tidak efisien apalagi bila ukuran populasinya sangat besar.
Penarikan sejumlah sampel acak dari suatu populasi, diamati karakteristiknya dan kemudian dibandingkan dengan hipotesis yang diajukan merupakan suatu langkah melakukan uji hipotesis. Apabila sampel acak ini memberikan indikasi yang mendukung hipotesis yang diajukan maka hipotesis tersebut diterima, sedangkan bila sampel acak itu memberikan indikasi yang bertentangan dengan hipotesis yang diajukan, maka hipotesis tersebut ditolak.
Dalam pengujian hipotesis ada dua jenis tipe kesalahan yaitu kesalahan jenis I dan kesalahan jenis kedua. Kesalahan jenis I adalah kesalahan yang terjadi akibat menolak H0 padahal H0 benar, sedangkan kesalahan jenis II adalah kesalahan yang terjadi akibat menerima H0 padahal H1 benar. Secara ringkas tabel dari dua jenis tipe kesalahan tersebut adalah :

Ho benar Ho salah
Keputusan Terima Ho Keputusan benar Galat jenis II
Tolak Ho Galat jenis I Keputusan benar
Galat jenis I = P (menolak Ho  Ho benar)
= 
= taraf nyata
Galat jenis II = P (menerima Ho  Ho salah)
= 

SOAL 1 :
Suatu jenis vaksin influenza yang beredar di pasaran diketahui hanya 25% efektif setelah periode dua tahun. Untuk menentukan apakah suatu vaksin baru lebih unggul dalam memberikan perlindungan terhadap virus yang sama untuk periode yang lebih lama, dilakukan penelitian. 20 orang diambil secara acak dan diinokulasi dengan vaksin baru tersebut. Bila 9 atau lebih di antara yang menerima vaksin baru terbebas dari virus tersebut selama periode 2 tahun, maka vaksin baru dinilai lebih unggul.
a. Hitung peluang melakukan galat jenis I.
b. Jika Ho salah, dan yang benar H1 : p = ½, maka hitung peluang melakukan galat jenis II.
c. Jika Ho salah, dan yang benar H1 : p = 0,7, maka hitung peluang melakukan galat jenis II.
d. Misalkan kriteria pengujiannya diubah menjadi : jika 8 atau lebih berhasil melampaui periode 2 tahun dengan baik, maka vaksin baru dinilai lebih unggul. Tentukan peluang melakukan galat jenis I dan II (dengan H1 : p = ½).
e. Misalkan ukuran sampel diperbesar menjadi 100 orang, dan kriteria pengujiannya : jika 37 orang berhasil melampaui periode 2 tahun tersebut, maka vaksin baru dinilai lebih unggul. Tentukan peluang melakukan galat jenis I dan II (dengan H1: p = ½).

Jawab :
a.  = P (galat jenis I)
= P (x  9 bila p = ¼ )
= b(x; 20, ¼) = 1 – b(x; 20, ¼) = 1 – 0,9591
= 0,0409

b.  = P (galat jenis II)
= P (x < 9 bila p = ½ )
= b(x; 20, ½ ) = 0,2517
c.  = P (x < 9 bila p = 0,7 ) = b(x; 20, 0,7 ) = 0,0051

d.  = P (x  8 bila p = ¼ )
= b(x; 20, ¼) = 1 – b(x; 20, ¼) = 1 – 0,8982
= 0,1018

 = P (x 36,5 bila p = ¼ ) = P (z > 2,66) = 0,0039

Bila H1 benar
 = n p = 100 ( ½ ) = 50
2 = n p q = 100 (½) (½) = 25
 = P (galat jenis II)
= P (x < 36,5 bila p = ½ ) = P (z o
atau
Ho :  = o
H1 :  < o
disebut uji satu arah.
Sedangkan uji hipotesis statistik yang alternatifnya bersifat dua-arah seperti
Ho :  = o
H1 :   o
disebut uji dua arah.

Ho selalu dituliskan dengan tanda kesamaan, sehingga menspesifikasi suatu nilai tunggal. Dengan cara ini peluang melakukan galat jenis I dapat dikendalikan.

Langkah-langkah pengujian hipotesis :
1. Nyatakan hipotesis nol (Ho), yaitu Ho : θ = θo
2. Pilih hipotesis alternatif H1 yang sesuai.
3. Tentukan taraf nyatanya ().
4. Pilih statistik uji yang sesuai dan tentukan wilayah kritisnya.
5. Hitung nilai statistik uji berdasarkan data sampel.
6. Ambil keputusan :
a. Tolak Ho bila nilai statistik uji terletak dalam wilayah kritis,
b. Terima Ho bila nilai statistik uji jatuh di luar wilyah kritis.

5.1. PENGUJIAN RATA-RATA
Secara ringkas uji mengenai rata-rata disajikan dalam tabel berikut :

No HIPOTESIS NILAI STATISTIK UJI WILAYAH KRITIS
1. Ho :  = o
lawan
H1 :  o
H1 :   o

,  diketahui atau n30

z z
z z/2
2. Ho :  = o
lawan
H1 :  o
H1 :   o

, v=n-1
 tidak diketahui dan n<30

t t
t t/2
3. Ho : 1-2 = do
lawan
H1 : 1-2 do
H1 : 1-2  do

12 dan 22 diketahui

z z
z z/2
4. Ho : 1-2 = do
lawan
H1 : 1-2 do
H1 : 1-2  do
;
v = n1 + n2 – 2
12 = 22 , tapi tidak diketahui

t t
t t/2
5. Ho : 1-2 = do
lawan
H1 : 1-2 do
H1 : 1-2  do

12  22 , dan tidak diketahui

t’ -t
t’ t/2
6. Ho : D = do
lawan
H1 : D do
H1 : D  do

; v = n – 1
data berpasangan

t t
t t/2

SOAL 2 :
Perusahaan farmasi ‘Pharos’ memproduksi obat jenis tertentu yang masa pakainya menghampiri distribusi normal dengan rata-rata 800 hari dan simpangan baku 40 hari. Sampel acak 30 obat jenis tersebut menghasilkan masa pakai rata-rata 788 hari. Ujilah hipotesis bahwa masa pakai obat tersebut tidak sama dengan 800 hari dengan tingkat signifikan = 4%

Jawab :
1. Ho : = 800 hari
2. H1 : 800 hari
3. = 0,04
4. Daerah kritis : z : 2,06
5. = 788 hari, n = 30, dan = 40 hari
6. Keputusan : Terima Ho
Kesimpulan : masa pakai obat jenis tersebut adalah 800 hari

5.2. PENGUJIAN VARIANS
Secara ringkas uji mengenai varians disajikan dalam tabel berikut :
No HIPOTESIS NILAI STATISTIK UJI WILAYAH KRITIS
1. Ho : 2 = o2
lawan
H1 : 2 o2
H1 : 2  o2
;
dengan v = n – 1

2 2
2 2/2
2. Ho : 12 = 22
lawan
H1 : 12 22
H1 : 12  22

dengan v1 = n1 – 1
v2 = n2 – 1

f f(v1,v2)
f f/2(v1,v2)
catatan :
f1-(v1,v2)= 1 / f(v2,v1)

SOAL 3 :
Sebuah perusahaan farmasi ‘Zeneca’ menyatakan bahwa daya kerja obat tertentu hasil produksinya berdistribusi normal dengan simpangan baku 0,9 menit. Jika sampel acak 10 obat jenis tersebut menghasilkan simpangan baku 1,2 menit, apakah menurut anda > 0,9 menit ? (Gunakan = 5%)
Jawab :
1. Ho : = 0,81 menit
2. H1 : > 0,81 menit
3. = 0,05
4. Daerah kritis atau
5. s2 = 1,44 menit, n = 10
6. Keputusan : Terima Ho
Kesimpulan : simpangan baku daya kerja obat tersebut adalah 0,9 menit.

SOAL 4 :
Sebuah penelitian di perusahaan farmasi ‘Roche’ bermaksud membandingkan waktu yang diperlukan oleh karyawan laki-laki dan wanita untuk membuat obat jenis tertentu dalam jam. Pengalaman lalu menunjukkan distribusi waktu yang diperlukan karyawan tersebut berdistribusi normal, tetapi varians bagi wanita lebih kecil daripada varians bagi laki-laki. Suatu sampel acak 11 karyawan laki-laki dengan simpangan baku 6,1 jam, sedangkan 14 karyawan wanita dengan simpangan baku 5,3 jam. Ujilah hipotesis Ho : = lawan H1 : > , dengan dan masing-masing variansi populasi bagi laki-laki dan wanita ? ( Gunakan = 1% )

Jawab :
= 6,1, = 5,3
= 0,01, n1 = 11, n2 = 14
karena F < , maka terima Ho
Kesimpulan :
Variansi sebenarnya waktu pembuatan obat jenis tertentu bagi karyawan laki-laki dan wanita sama.

5.3. PENGUJIAN PROPORSI
Secara ringkas uji mengenai proporsi untuk sample besar disajikan dalam tabel berikut :
No HIPOTESIS NILAI STATISTIK UJI WILAYAH KRITIS
1. Ho : p = po
lawan
H1 : p po
H1 : p  po

atau

z z
z z/2
2. Ho : p1 = p2
lawan
H1 : p1 p2
H1 : p1  p2

z z
z z/2
3. Ho:p1- p2= d0
lawan
H1:p1- p2 d0
H1:p1-p2  d0

z z
z z/2

SOAL 5 :
Suatu obat penenang ketegangan syaraf diduga hanya 60% efektif. Seorang peneliti bermaksud melakukan percobaan obat penenang jenis baru dengan memberikan kepada 100 orang dewasa penderita ketegangan syaraf yang dipilih secara acak, hasilnya menunjukkan bahwa obat baru tersebut 70% efektif. Apakah ini merupakan bukti yang cukup untuk menyimpulkan bahwa obat baru lebih baik daripada yang beredar sekarang ? (Gunakan = 5%)

Jawab :
1. Ho : p = 0,6
2. H1 : p > 0,6
3. = 0,05
4. Daerah kritis : z > 1,645
5. Untuk x = 70 , n = 100, p0 = 0,6, dan q0 = 0,4, maka

6. Keputusan : Tolak Ho
Kesimpulan : Obat baru tersebut memang lebih manjur

SOAL-SOAL LATIHAN :
1. Sampel acak 100 kematian di negara A selama tahun lalu menunjukkan rata-rata usia mereka 71,8 tahun. Andaikan simpangan baku populasinya 8,9 tahun, apakah hal ini menunjukkan bahwa rata-rata usia dewasa ini lebih besar dari 70 tahun ? Gunakan taraf nyata 5%.

2. Sampel acak 8 batang rokok merk tertentu mempunyai kadar nikotin rata-rata 4,2 mg dengan simpangan baku 1,4 mg. Apakah ini sesuai dengan pernyataan pabriknya bahwa rata-rata kadar nikotin tidak melebihi 3,5 mg ? Gunakan tarf nyata 5%.

3. Untuk menentukan apakah suatu serum baru akan memperlambat leukemia, 9 tikus dipilih semuanya telah kena penyakit tersebut pada tahap lanjut. 5 tikus mendapat serum tadi dan 4 tidak. Umur (dalam tahun) sejak permulaan sebagai berikut :
Perlakuan 2,1 5,3 1,4 4,6 0,9
Tanpa 1,9 0,5 2,8 3,1
Pada taraf nyata 0,05 dapatkah disimpulkan bahwa serum tadi menolong ? Anggap kedua populasi berdistribusi normal dengan varians sama.

4. Seorang peneliti ingin mengetahui pengaruh obat siccinylcholine terhadap kadar peredaran androgen dalam darah. Sampel darah dari rusa liar yang hidup bebas diambil melalui urat nadi leher segera setelah suntikan siccinylcholine diberikan pada otot menggunakan panah dan senapan penangkap. Rusa kemudian diambil lagi darahnya kira-kira 30 menit setelah suntikan dan kemudian dilepaskan. Kadar androgen pada waktu ditangkap dan 30 menit kemudian diukur dalam nanogram per ml (ng/ml) untuk 12 rusa adalah sbb :
Rusa Waktu suntikan 30 mnt stlh suntikan
1 2,76 7,02
2 5,18 3,10
3 2,68 5,44
4 3,05 3,99
5 4,10 5,21
6 7,05 10,26
7 6,60 13,91
8 4,79 18,53
9 7,39 7,91
10 7,30 4,85
11 11,78 11,10
12 3,90 3,74
Anggap bahwa populasi androgen pada waktu suntikan dan 30 menit kemudian berdistribusi normal. Uji pada taraf nyata 0,05, apakah konsentrasi androgen berubah setelah ditunggu 30 menit ?

5. Perusahaan AA menyatakan bahwa kekuatan rentangan tali A melebihi rentangan tali B sebesar sekurang-kurangnya 12 kg. Untuk menguji pernyataan ini, 50 tali dari masing-masing jenis tersebut diuji dibawah kondisi yang sama. Hasil uji memperlihatkan tali A mempunyai kekuatan rentangan rata-rata 86,7 kg dengan simpangan baku 6,28 kg, sedangkan tali B mempunyai rata-rata 77,8 kg dengan simpangan baku 5,61 kg. Ujilah pernyataan perusahaan tersebut dengan menggunakan taraf nyata 0,05.

6. Sebuah perusahaan aki mobil mengatakan bahwa umur aki mobil yang diproduksinya mempunyai simpangan baku 0,9 tahun. Bila suatu sampel acak 10 aki mobil simpangan baku 1,2 tahun, apakah menurut anda pernyataan perusahaan aki tersebut benar ? Gunakan taraf nyata 0,05.

7. Seorang peneliti yakin bahwa alat pengukurnya mempunyai simpangan baku =2. Dalam suatu eksperimen dia mencatat bahwa hasil pengukuran 4,1; 5,2 dan 10,2. Apakah data ini tidak sesuai dengan asumsinya ? Lakukan pengujian hipotesis dengan menggunakan taraf nyata 0,1.

8. Peneliti bermaksud membandingkan variabilitas dari 2 jenis alat uji yang dapat digunakan untuk memonitor output dari proses produksi. Dia menduga bahwa peralatan lama mempunyai varians yang lebih besar dibandingkan dengan alat baru. Dari sampel acak yang diambil diperoleh :
alat lama alat baru
n1 = 12 n2 = 10
s12 = 14,5 s22 = 10,8
Lakukan pengujian hipotesis, dan anggap bahwa populasi hasil pengukuran berdistribusi normal. Gunakan taraf nyata 0,05.

9. Seorang ahli genetika tertarik pada proporsi laki-laki dan perempuan, dalam suatu populasi, yang menderita suatu kelainan darah. Dalam sampel acak 100 laki-laki, ternyata ada 31 yang menderita, sedangkan di antara 100 perempuan hanya 24 yang menderita kelainan tersebut. Dapatkan kita menyimpulkan pada taraf nyata 0,01 bahwa proporsi laki-laki yang menderita kelainan darah dalam populasi itu lebih besar daripada proporsi perempuan yang menderita ?

10. Pemungutan suara diambil dari suatu kota dan kabupaten disekitarnya untuk menentukan apakah suatu rencana pembangunan pabrik kimia boleh diteruskan. Untuk menentukan pakah ada perbedaan yang berarti antara proporsi penduduk kota dan kabupaten yang mendukung rencana tersebut, suatu pol diadakan. Bila 120 dari 200 penduduk kota yang setuju, dan 240 dari 500 penduduk kabupaten yang setuju, apakah anda sependapat bahwa proporsi penduduk kota yang setuju lebih besar dari proporsi penduduk kabupaten yang setuju ? Gunakan taraf nyata 0,025.

BAB VI
ANALISIS KORELASI DAN REGRESI LINIER

6.1. ANALISIS KORELASI
Nilai korelasi adalah nilai yang menggambarkan tingkat keeratan hubungan linier antara dua variabel atau lebih. Nilai korelasi tidak menggambarkan hubungan sebab akibat antara dua variabel atau lebih tetapi semata-mata menggambarkan keterkaitan linier antar variabel. Nilai korelasi sering dinotasikan dengan r dan nilainya dari –1 sampai 1 (-1 r 1), nilai r yang mendekati 1 atau –1 menunjukkan semakin erat hubungan linier antara kedua variabel tersebut. Sedangkan nilai r yang mendekati nol menggambarkan hubungan kedua variabel tersebut tidak linier. Tanda dari nilai r dapat dilihat dari diagram pencar pengamatan dari dua variabel tersebut. Bila titik-titik pengamatan menggerombol mengikuti garis lurus dengan kemiringan positif, maka korelasi antar kedua variabel tersebut positif. Sebaliknya bila titik-titik pengamatan tersebut menggerombol mengikuti garis lurus dengan kemiringan negatif, maka korelasi antar variabel tersebut bertanda negatif.
Beberapa pola hubungan antar variabel dapat dilihat pada gambar berikut:

Gambar (a). r >0 Gambar (b) r <0

Pada Gambar a dan Gambar b terlihat kedua variabel memiliki hubungan yang sangat erat tetapi arah hubungannya berlawanan.
Salah satu ukuran keeratan hubungan linier antara dua variabel adalah Koefisien Korelasi Pearson, rumus untuk menghitung korelasi tersebut dari data sampel adalah sebagai berikut:

dengan –1  r 1

Inferensi terhadap
Nilai r merupakan suatu nilai penduga bagi nilai korelasi populasi yang dilambangkan dengan maka apabila ingin mendapatkan suatu uji yang menyatakan kapan r berada cukup jauh dari suatu nilai tertentu .
Hipotesis untuk menguji apakah dua varibel mempunyai hubungan linier atau tidak adalah sebagai berikut :
Ho : = 0
Statistik uji :
, dengan v = n – 2
Wilayah kritis :
t < -t untuk H1 : t untuk H1 : > 0
t t/2 untuk H1 :  0

6.2. ANALISIS REGRESI LINIER SEDERHANA
Dalam kehidupan sehari-hari seringkali kita ingin melihat hubungan antara dua variabel, seperti hubungan antara panjang bayi dan bobot bayi, protein dan kadar hemoglobin, tinggi badan dan berat badan, IQ anak dan nilai matematikanya. Umumnya suatu variabel bersifat mempengaruhi variabel yang lainnya, variabel pertama disebut variabel bebas (independent variable) sedangkan variabel yang kedua disebut variabel tak bebas (dependent variable). Secara kuantitatif hubungan antara variabel bebas dan variabel tak bebas dapat dimodelkan dalam suatu model matematik. Metode yang digunakan untuk mencari pola hubungan fungsional antara satu variabel bebas (independen / prediktor / X) dengan satu variabel tak bebas (dependen / respons / y) adalah analisis regresi sederhana. Model analisis regresi sederhana Y terhadap X adalah :

dengan yi = variabel respon ke-i
xi = variabel prediktor ke-i
 = parameter intersep
 = parameter slope (kemiringan)
i = error ke-i

Dengan menggunakan metode kuadrat terkecil (least square) persamaan regresi diatas dapat diduga dengan :

dengan

CONTOH 1 :
Hasil proses kimia diperkirakan merupakan fungsi jumlah katalisator yang ditambahkan pada reaksi tersebut. Data yang didapat disajikan pada tabel berikut :

Hasil (%) 60,5 63,9 63,8 60,2 66,7 71,7 70,8 65,7
Katalisator (lb) 0,9 1,4 1,6 1,7 1,8 2,0 2,1 2,3

Tentukan estimasi model regresi linier sederhana berdasarkan data sampel diatas?

Jawab :
Dalam kasus ini variabel respon Y adalah hasil (%), sedangkan variabel bebas X adalah katalisator (lb). Berdasarkan data pada tabel 1, didapat

, , ,

dan sehingga didapat

a = 65,412 – (6,56)(1,725) = 54,096

Didapat estimasi model regresi linier sederhana

Koefisien determinasi
Untuk mengetahui kesesuaian model dan besarnya variasi nilai Y yang dapat dijelaskan oleh model regresi digunakan nilai koefisien determinasi dengan rumus sbb:

dengan 0  R2 1
Untuk analisis regresi linier sederhana :
R2 = r2

SOAL 2 :
Diberikan data tinggi (X) dalam cm dan berat (Y) dalam Kg sebagai berikut :

X 12 10 14 11 12 9
Y 18 17 23 19 20 15

Hitung koefisien korelasi dan koefisien determinasi bagi kedua variabel tersebut serta berikan penjelasan.

Jawab :
, , , , , didapat

r2 = 0,897 artinya keragaman nilai variabel respon Y yang dapat dijelaskan oleh variabel bebas X sebesar 89,7%.

SOAL-SOAL LATIHAN :
1. Sebuah penelitian dilakukan untuk menentukan apakah ada hubungan antara biaya promosi dengan omset. Diperoleh data sebagai berikut :
Biaya Promosi
(Jutaan Rp) Omset
(Jutaan Rp)
1,2 101
0,8 92
1,0 110
1,3 120
0,7 90
0,8 82
1,0 93
0,6 75
0,9 91
1,1 105
a. Buatlah diagram pencarnya.
b. Hitung dan tafsirkan koefisien korelasi antara biaya promosi dengan omset yang dihasilkan.
c. Apakah korelasi tersebut secara signifikan berbeda dari nol ?
d. Tentukan persamaan garis regresinya untuk meramalkan omset berdasarkan biaya promosi.
e. Hitung koef. determinasinya, dan jelaskan artinya.
f. Taksirlah omset yang diperoleh jika biaya promosi sebesar Rp 2 juta.

2. Sebuah penelitian mengukur banyaknya gula yang terbentuk pada berbagai suhu. Berdasarkan data di bawah ini:
a. Buatlah diagram pencarnya.
b. Hitung dan tafsirkan koefisien korelasi antara suhu dengan banyaknya gula yang terbentuk.
c. Apakah korelasi tersebut secara signifikan berbeda dari nol ?
d. Tentukan persamaan garis regresinya dengan menggunakan metode kuadrat terkecil.
e. Hitung koefisien determinasinya, dan jelaskan artinya.
f. Dugalah banyaknya gula yang terbentuk bila suhunya 1,75.

Suhu, x Gula yang terbentuk, y
1,0 8,1
1,1 7,8
1,2 8,5
1,3 9,8
1,4 9,5
1,5 8,9
1,6 8,6
1,7 10,2
1,8 9,3
1,9 9,2
2,0 10,5

3. Tabel berikut menyajikan data sampel yang terdiri dari 12 orang bapak dengan putra tertua mereka usia 3 tahun dengan variabel-variabel yang diukur adalah tinggi badan anak (Y) dan tinggi badan bapak (X) dalam satuan cm.

X 156 181 175 169 162 170 180 168 175 161 159 172
Y 76 100 96 95 85 79 105 82 98 80 90 98
Berdasarkan data sampel diatas dan model regresi , maka :
a. Tentukan model regresinya dengan menggunakan metode kuadrat terkecil.
b. Dugalah tinggi anak jika tinggi bapak 165 cm
c. Hitung koefisien determinasi, dan jelaskan artinya.

 

About these ads
 
Tinggalkan komentar

Ditulis oleh pada April 13, 2012 in Statistik 2

 

Tag: , ,

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Logout / Ubah )

Twitter picture

You are commenting using your Twitter account. Logout / Ubah )

Facebook photo

You are commenting using your Facebook account. Logout / Ubah )

Google+ photo

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

 
Ikuti

Get every new post delivered to your Inbox.

%d bloggers like this: