Bài giảng Lý thuyết xác suất và thống kê ứng dụng - Chương 2: Ước lượng và kiểm định giả thiết
Kiểm ñịnh giả thiết là một bài toán hay gặp trong thống kê. Phạm vi nghiên cứu khá rộng và
về mặt lý thuyết có những vấn ñề khá phức tạp nếu muốn giải quyết thật tỷ mỷ, chính xác.
Trong chương này chỉ trình bầy một vài bài toán kiểm ñịnh giả thiết cụ thể liên quan ñến các
biến ñịnh lượng. Chương sau sẽ tiếp tục kiểm ñịnh giả thiết với biến ñịnh tính. Nhưng trước
hết cần giới thiệu chung về giả thiết và ñối thiết và hai loại sai lầm mắc phải khi kiểm ñịnh.
2.1. Giả thiết và ñối thiết
Khi khảo sát một tổng thể (hoặc nhiều tổng thể) và xem xét một (hoặc nhiều) biến ngẫu nhiên
có thể ñưa ra một giả thiết nào ñó liên quan ñến phân phối của biến ngẫu nhiên hoặc nếu biết
phân phối rồi thì ñưa ra giả thiết về tham số của tổng thể. ðể có thể ñưa ra một kết luận thống
kê nào ñó ñối với giả thiết thì phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa
α sau ñó ñưa ra kết luận.
Bài toán kiểm ñịnh tham số Θ của phân phối có dạng H0 : Θ = Θo với Θo là một số ñã cho nào
ñó. Kết luận thống kê có dạng: “chấp nhận H0” hay “bác bỏ H0”. Nhưng nếu ñặt vấn ñề như
vậy thì cách giải quyết hết sức khó, vì nếu không chấp nhận H0 : Θ = Θo thì ñiều ñó có nghĩa
là có thể chấp nhận một trong vô số Θ khác Θo, do ñó thường ñưa ra bài toán dưới dạng cụ
thể hơn nữa: cho giả thiết H0 và ñối thiết H1, khi kết luận thì hoặc chấp nhận H0 hoặc bác bỏ
H0, và trong trường hợp này, tuy không hoàn toàn tương ñương, nhưng coi như chấp nhận ñối
thiết H1.
Nếu chấp nhận H0 trong lúc giả thiết ñúng là H1 thì mắc sai lầm loại II và xác suất mắc sai
lầm này ñược gọi là rủi ro loại hai β. Ngược lại nếu bác bỏ H0 trong lúc giả thiết ñúng chính
là H0 thì mắc sai lầm loại I và xác suất mắc sai lầm ñó gọi là rủi ro loại một α
về mặt lý thuyết có những vấn ñề khá phức tạp nếu muốn giải quyết thật tỷ mỷ, chính xác.
Trong chương này chỉ trình bầy một vài bài toán kiểm ñịnh giả thiết cụ thể liên quan ñến các
biến ñịnh lượng. Chương sau sẽ tiếp tục kiểm ñịnh giả thiết với biến ñịnh tính. Nhưng trước
hết cần giới thiệu chung về giả thiết và ñối thiết và hai loại sai lầm mắc phải khi kiểm ñịnh.
2.1. Giả thiết và ñối thiết
Khi khảo sát một tổng thể (hoặc nhiều tổng thể) và xem xét một (hoặc nhiều) biến ngẫu nhiên
có thể ñưa ra một giả thiết nào ñó liên quan ñến phân phối của biến ngẫu nhiên hoặc nếu biết
phân phối rồi thì ñưa ra giả thiết về tham số của tổng thể. ðể có thể ñưa ra một kết luận thống
kê nào ñó ñối với giả thiết thì phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa
α sau ñó ñưa ra kết luận.
Bài toán kiểm ñịnh tham số Θ của phân phối có dạng H0 : Θ = Θo với Θo là một số ñã cho nào
ñó. Kết luận thống kê có dạng: “chấp nhận H0” hay “bác bỏ H0”. Nhưng nếu ñặt vấn ñề như
vậy thì cách giải quyết hết sức khó, vì nếu không chấp nhận H0 : Θ = Θo thì ñiều ñó có nghĩa
là có thể chấp nhận một trong vô số Θ khác Θo, do ñó thường ñưa ra bài toán dưới dạng cụ
thể hơn nữa: cho giả thiết H0 và ñối thiết H1, khi kết luận thì hoặc chấp nhận H0 hoặc bác bỏ
H0, và trong trường hợp này, tuy không hoàn toàn tương ñương, nhưng coi như chấp nhận ñối
thiết H1.
Nếu chấp nhận H0 trong lúc giả thiết ñúng là H1 thì mắc sai lầm loại II và xác suất mắc sai
lầm này ñược gọi là rủi ro loại hai β. Ngược lại nếu bác bỏ H0 trong lúc giả thiết ñúng chính
là H0 thì mắc sai lầm loại I và xác suất mắc sai lầm ñó gọi là rủi ro loại một α
Bạn đang xem tài liệu "Bài giảng Lý thuyết xác suất và thống kê ứng dụng - Chương 2: Ước lượng và kiểm định giả thiết", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
File đính kèm:
- bai_giang_ly_thuyet_xac_suat_va_thong_ke_ung_dung_chuong_2_u.pdf
Nội dung text: Bài giảng Lý thuyết xác suất và thống kê ứng dụng - Chương 2: Ước lượng và kiểm định giả thiết
- 28 Thi t k thí nghi m Ví d 2.14: p 100 qu tr ng có 82 qu n . Ki m ñ nh gi thi t H 0: t l n p = 0,80, ñ i thi t H 1: p ≠0,8 v i α = 0,05. n = 100; m = 82; f = 82/100 = 0,82; 0,82 − 0,80 ZTN = = 0,5 ; z(0,025) = 1,96 2,0.8,0 100 K t lu n: Ch p nh n H 0: “T l p n là 0,80”. 2.5.3. Ki m ñ nh gi thi t H 0: p 2 = p 1 Khi dung l ư ng c 2 m u ñ u l n ( n 1 > 100, n 2 > 100) và các p i không bé quá (ho c l n quá) có th ki m ñ nh nh ư sau ( m c ý ngh ĩa α) m m = 1 = 2 Tính các t n su t: f1 ; f 2 n1 n2 m + m Tính t n su t chung: f = 1 2 + n1 n 2 Tìm giá tr t i h n z( α/2) n u ki m ñ nh 2 phía ho c z( α) n u ki m ñ nh m t phía − f 2 f1 Tính giá tr th c nghi m: Z TN = 1 1 f 1( − f )( + ) n1 n2 K t lu n: V i ñ i thi t hai phía H 1: p2 ≠ p 1 N u ZTN ≤ z( α/2) thì ch p nh n H 0, ng ư c l i thì ch p nh n H 1 V i ñ i thi t m t phía H 1: p2 > p 1 N u Z TN ≤ z( α) thì ch p nh n H 0, ng ư c l i thì ch p nh n H 1 V i ñ i thi t m t phía H 1: p2 < p 1 N u ZTN ≥ - z(α) thì ch p nh n H 0, ng ư c l i thì thì ch p nh n H 1 Ví d 2.15: Dùng thu c A ñi u tr cho 200 b nh nhân th y 150 ng ư i kh i b nh. T ươ ng t v i thu c B ñ i v i 100 b nh nhân thì 72 ng ư i kh i b nh. Hãy ki m ñ nh gi thi t H 0: T l kh i b nh c a hai thu c nh ư nhau v i ñ i thi t H 1: t l kh i b nh c a hai thu c khác nhau v i m c ý ngh ĩa α = 0,05. n1 = 200; m 1 = 150; f 1 = 150/ 200 = 0,75; n 2 = 100; m 2 = 72; f 2 = 72 /100 = 0,72 ; 150 + 72 f = = 0,74 200 +100 0,72 − 0,75 ZTN = = − ,0 5584 |Z TN | = 0,5584; z(0,025) = 1,96. 1 1 0,74× 0,26× ( + ) 200 100 K t lu n: Ch p nh n H 0; t c là t l kh i b nh 2 lo i thu c là nh ư nhau.
- Ch ươ ng 2 Ư c l ư ng và ki m ñ nh gi thi t 29 2.6. Phân tích ph ươ ng sai M r ng bài toán so sánh hai trung bình c a hai t ng th m c trên khi có nhi u h ơn 2 trung bình chúng ta có bài toán phân tích ph ươ ng sai m t nhân t . Thí d có a t ng th , ñ kh o sát các bi n X 1, X 2, . . . , X a trên các t ng th ñó chúng ta l y m i t ng th m t m u các quan sát ñ c l p: M u 1 x11 , x 12 , . , x 1r1 M u 2 x21 , x 22 , . , x 2r2 . . M u a xa1 , x a2 , ., x 2ra T t c có n = Σri quan sát. Vi t l i các quan sát x i j d ư i d ng x i j = µi + e i j e i j g i là sai s hay ph n d ư (2.1) 2 Gi thi t các bi n X i ñ c l p, phân ph i chu n N( µi, σ ), các quan sát trong m u ñ c l p.T gi thi t trên có th nêu c th 3 gi thi t sau ñ i v i các sai s e i j a- Các bi n e i j ñ c l p v i nhau b- Các bi n e i j phân ph i chu n v i k ỳ v ng b ng 0 2 c- Các bi n e i j có ph ươ ng sai b ng nhau ( σ ) Bài toán phân tích ph ươ ng sai m t nhân t chính là bài toán ki m ñ nh gi thi t H 0: “Các trung bình µi b ng nhau” v i ñ i thi t H 1: “Có ít nh t m t c p trung bình khác nhau”. N u g i µ là trung bình c a các µi thì có th vi t (2.1) l i nh ư sau: xi j = µ + a i + e i j (2.2) v i a i = µi - µ; Σai = 0 Gi thi t H 0 bây gi là : “Các a i ñ u b ng 0” còn H 1 là “Không ph i t t c các a i ñ u b ng 0”. _ ð phân tích ph ươ ng sai chúng ta g i các trung bình c ng c a các m u quan sát là x i . N u 2 gi thi t H 0 ñúng thì các X i có cùng phân ph i N( µ,σ ) và có th coi các m u quan sát nói trên ñư c l y ra t cùng m t t ng th . _ G i x là trung bình chung c a t t c các m u. Tính t ng bình ph ươ ng t t c các sai s (g i là t ng bình ph ươ ng toàn b SS TO ) a ni a ni = − 2 = 2 − 2 SS TO ∑∑(xij x) ∑∑ xij xn i=1j = 1 i=1j = 1 ðem t ng bình ph ươ ng này chia cho (n - 1) ñư c m t ư c l ư ng c a σ2. 2 2 SS TO / σ phân ph i χ v i df TO = (n - 1) b c t do. ð i v i m i m u quan sát chúng ta tính t ng bình ph ươ ng sai s trong m u (mà n u ñem chia 2 cho b c t do t ươ ng ng (n i - 1) thì ñư c m t ư c l ư ng c a σ ) sau ñó g p l i thành t ng 2 bình ph ươ ng do sai s SS E (Gi ng nh ư cách ñã làm khi ñi tìm ph ươ ng sai chung s c trong tr ư ng h p m u bé và hai ph ươ ng sai b ng nhau m c 2.4.2.3 ) a ni = − 2 SS E ∑∑(xij xi ) i=1j = 1
- 30 Thi t k thí nghi m 2 ðem SS E chia cho n - a ñư c m t ư c l ư ng c a σ 2 2 SS E / σ phân ph i χ v i df E = (n - a) b c t do. Có th ch ng minh h th c sau: a ni a ni a ni − 2 = − 2 + − 2 ∑∑(xij x ) ∑∑(xij xi ) ∑∑(xi x) i=1j = 1 i=1j = 1 i=1j = 1 T ng th ba g i là t ng bình ph ươ ng do nhân t SS A. _ 2 2 N u x i j phân ph i chu n N( µi, σ ) thì các trung bình c ng xi. phân ph i chu n N( µi, σ /n i). 2 T ñó suy ra n u ñem SS A chia cho (a - 1) thì ñư c ư c l ư ng c a σ . 2 2 T ng SS A/σ phân ph i χ v i df A = (a-1) b c t do. Nh ư v y chúng ta ñã tách t ng bình ph ươ ng toàn b ra hai t ng: SS TO = SS A + SS E ð ng th i b c t do toàn b c ũng tách thành 2 b c t do: df TO = df A + df E M i t ng bình ph ươ ng chia cho b c t do t ươ ng ng s cho m t ư c l ư ng c a ph ươ ng sai σ2 2 2 và m i t ng sau khi chia cho σ s phân ph i χ v i s b c t do t ươ ng ng. Bây gi xét t s MS A / MS E v i MS A = SS A / df A và MS E = SS E / df E 2 D a trên lý thuy t v phân ph i Khi bình ph ươ ng ( χ ) và phân ph i F có k t lu n sau: MS A / MS E phân ph i Fisher- Snederco (F). T ñó có cách ki m ñ nh sau ñây ñ i v i gi thi t H 0 (ñ i thi t H 1): + Tính giá tr th c nghi m F TN = MS A / MS E + Tìm giá tr t i h n F (α,dfA,dfE) + N u F TN ≤ F (α,dfA,dfE) thì ch p nh n H 0, ng ư c l i thì ch p nh n H 1 Toàn b quy trình phân tích ph ươ ng sai ñư c tóm t t trong b ng phân tích ph ươ ng sai sau: T ng bình Trung bình Ngu n bi n ñ ng B c t do F F t i h n ph ươ ng bình ph ươ ng TN Nhân t df A = a-1 SS A MS A = SS A/df A MS A/MS E F(α,dfA,dfE) Sai s ng u nhiên df E = n-a SS E MS E = SS E/df E T ng bi n ñ ng df TO = n-1 SS TO ð thu n ti n th ư ng k b ng ch a d li u và tính theo th t sau: _ 2 + Tính dung l ư ng n i, t ng hàng TH i, trung bình xi. , TH i / n i + T ng các dung l ư ng n = Σni , t ng t t c các x i j ST = ΣΣ x i j + S ñi u ch nh G = ST 2 / n 2 + SS TO = ΣΣ x i j - G b c t do df TO = n - 1 2 + SSA = ΣTH i / n i - G b c t do df A = a - 1 + SS E = SS TO - SS A b c t do df E = df TO - df A = n - a + Tính các trung bình MS A = SS A / df A và MS E = SS E / df E + Tính F TN = MS A / MS E + Tìm giá tr F (α,dfA,dfE) + So sánh F TN v i F (α,dfA,dfE) .
- Ch ươ ng 2 Ư c l ư ng và ki m ñ nh gi thi t 31 Ví d 2.16: Kh i l ư ng (kg) c a 20 l n 90 ngày tu i ñư c nuôi 5 ch ñ khác nhau t lúc cai s a 21 ngày tu i. Bi t r ng 20 l n ñư c ch n ñ ng ñ u nhau vào th i ñi m cai s a và b trí ng u nhiên v m t trong 5 công th c thí nghi m. S li u ñư c trình bày trong b ng d ư i. Gi thi t kh i l ư ng tuân theo phân ph i chu n. Ki m ñ nh gi thi t H 0: Kh i l ư ng trung bình c a l n 90 ngày tu i 5 ch ñ ch ăm sóc b ng nhau v i ñ i thi t H1: Kh i l ư ng trung bình c a l n 90 ngày tu i 5 ch ñ ch ăm sóc không b ng nhau. M c ý ngh ĩa α = 0,05. 2 _ Công th c Kh i l ư ng (kg) ni TH i TH i /n i xi. A 32,2 34,9 29,7 3 96,8 3123,413 32,27 B 28,4 28,0 22,8 28,5 29,4 5 137,1 3759,282 27,42 C 28,8 29,5 23,1 20,1 4 101,5 2575,563 25,38 D 41,5 36,3 31,7 31,0 38,2 5 178,7 6386,738 35,74 E 33,0 26,0 30,6 3 89,6 2676,053 29,87 T ng 20 603,7 18521,0492 2 n = 20 ST = 603,7 ΣTH i / n i = 18521,0492 S ñi u ch nh G = 603,7 2 / 20 = 18222,6845 2 T ng các bình ph ươ ng ΣΣ x i j = 18727,6900 SS TO = 18727,69 - 18222,68 = 505,0055; b c t do df TO = 20 -1 = 19 SS A = 18521,0492 - 18222,6845 = 298,3647; b c t do df A = 5 - 1 = 4 SS E = 505,0055 - 298,3647 = 206,6408; b c t do df E = 19 - 4 = 15 MS A = 298,3647 / 4 = 74,5912; MS E = 206,6408 / 15 = 13,7761 FTN = 74,5912/ 13,7761 = 5,4145 F(0,05;4;15) = 3,056 Có th t ng h p các k t qu thu ñư c theo b ng phân tích ph ươ ng sai (ANOVA) sau: T ng bình Trung bình Ngu n bi n ñ ng B c t do F F t i h n ph ươ ng bình ph ươ ng TN Công th c 4 298,3647 74,5912 3,056 F(0,05;4;15) = 3,056 Sai s ng u nhiên 15 206,6408 13,7761 T ng bi n ñ ng 19 505,0055 K t lu n: Bác b H 0, nh ư v y là bác b gi thi t “Kh i l ư ng trung bình c a l n 90 ngày tu i 5 ch ñ ch ăm sóc b ng nhau”. Sau khi có k t lu n nh ư trên thì v n ñ ñ t ra là ph i so sánh 5 trung bình c a 5 lô ñ tìm ra các trung bình nào b ng nhau, các trung bình nào khác nhau. V n ñ này s ñư c trình b y k ph n sau. Qua cách làm nh ư trên chúng ta th y ñ ki m ñ nh gi thi t H 0: “Các trung bình b ng nhau” v i ñ i thi t H 1: “Có ít nh t m t c p trung bình khác nhau” ph i tìm cách tách t ng bình ph ươ ng toàn b SS TO thành các t ng bình ph ươ ng SS A và SS E c ăn c vào 2 ngu n bi n ñ ng c a s li u: bi n ñ ng do s khác nhau gi a các m u và bi n ñ ng do s khác nhau gi a các s li u trong cùng m t m u. ð ng th i ph i tách b c t do toàn b df TO thành các b c t do df A và df E t ươ ng ng v i các t ng SS A, SS E. T ñó có tên phân tích ph ươ ng sai. Trong ph n sau khi có nhi u ngu n bi n ñ ng thì ph i tách SS TO thành nhi u t ng ng v i các ngu n bi n ñ ng và tách b c t do df TO thành nhi u b c t do, sau ñó ki m ñ nh các gi thi t tươ ng ng v i các ngu n bi n ñ ng nh phân ph i Fisher- Snederco.
- 32 Thi t k thí nghi m 2.7. Bài t p 2.7.1 Tăng tr ng trung bình (gram/ngày) c a 36 l n nuôi v béo gi ng Landrace ñư c rút ng u nhiên t m t tr i ch ăn nuôi. S li u thu ñư c nh ư sau: 577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 Cán b k thu t tr i cho r ng t ăng tr ng trung bình c a toàn ñàn l n trong tr i là 607 gram/ngày. Theo anh ch k t lu n ñó ñúng hay sai, vì sao? 2.7.2 Anh ch hãy ki m tra k t lu n v i bài t p t ươ ng t nh ư 2.7.1, bi t r ng ñ l ch chu n c a tính tr ng này Landrace là 24 gram/ngày. 2.7.3 T l th thai b ng th tinh nhân t o t tinh trùng c a 2 bò ñ c gi ng ñư c xác ñ nh trên nhóm bò cái g m 50 con; 18 nhóm bò cái s d ng tinh trùng c a bò ñ c A và 16 ñ i v i bò ñ c B. T l th thai (%) thu ñư c nh ư sau: Bò ñ c A 74,2 62,1 57,7 71,7 62,0 76,1 70,6 68,3 68,4 79,8 71,1 70,9 65,5 61,2 60,8 73,9 51,9 63,7 Bò ñ c B 49,6 49,2 53,2 56,5 69,1 54,2 80,7 62,7 71,5 67,5 64,6 75,4 79,6 59,8 68,8 60,2 Hãy cho bi t t l th thai c a 2 bò ñ c nêu trên. 2.7.4 N ng ñ fructoza (mg%) trong tinh d ch bò tr ư c và sau khi ñư c xác ñ nh trên 12 m u tinh bò ñ c; các giá tr thu ñư c nh ư sau: M u s 1 2 3 4 5 6 7 8 9 10 11 12 Tr ư c khi 116 190 570 375 236 505 120 322 429 102 167 299 Sau khi 30 58 100 48 58 153 54 66 67 34 69 82 K t lu n v n ng ñ fructoza trong tinh d ch bò tr ư c và sau khi . 2.7.5 M t thí nghi m ñư c ti n hành nh m nghiên c u nh h ư ng c a progesterone lên chu k ỳ ñ ng d c c a c u Merino. S d ng 4 li u khác nhau (0, 10, 25 và 40 mg/ngày) tiêm d ư i da liên t c trong 4 ngày tính t ngày ñ ng d c. Chu k ỳ ñ ng d c (ngày) c a 8 c u trong m i nhóm thu ñư c nh ư sau: Li u 0 mg/ngày 18 14 18 18 18 18 18 19 Li u 10 mg/ngày 15 14 17 14 12 13 12 13 Li u 25 mg/ngày 11 13 11 11 12 11 11 12 Li u 40 mg/ngày 9 10 12 10 11 11 10 11 Cho bi t nh h ư ng c a progesterone lên chu k ỳ ñ ng d c c u Merino.