Bài giảng Lý thuyết xác suất và thống kê ứng dụng - Chương 2: Ước lượng và kiểm định giả thiết

Kiểm ñịnh giả thiết là một bài toán hay gặp trong thống kê. Phạm vi nghiên cứu khá rộng và
về mặt lý thuyết có những vấn ñề khá phức tạp nếu muốn giải quyết thật tỷ mỷ, chính xác.
Trong chương này chỉ trình bầy một vài bài toán kiểm ñịnh giả thiết cụ thể liên quan ñến các
biến ñịnh lượng. Chương sau sẽ tiếp tục kiểm ñịnh giả thiết với biến ñịnh tính. Nhưng trước
hết cần giới thiệu chung về giả thiết và ñối thiết và hai loại sai lầm mắc phải khi kiểm ñịnh.
2.1. Giả thiết và ñối thiết
Khi khảo sát một tổng thể (hoặc nhiều tổng thể) và xem xét một (hoặc nhiều) biến ngẫu nhiên
có thể ñưa ra một giả thiết nào ñó liên quan ñến phân phối của biến ngẫu nhiên hoặc nếu biết
phân phối rồi thì ñưa ra giả thiết về tham số của tổng thể. ðể có thể ñưa ra một kết luận thống
kê nào ñó ñối với giả thiết thì phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa
α sau ñó ñưa ra kết luận.
Bài toán kiểm ñịnh tham số Θ của phân phối có dạng H0 : Θ = Θo với Θo là một số ñã cho nào
ñó. Kết luận thống kê có dạng: “chấp nhận H0” hay “bác bỏ H0”. Nhưng nếu ñặt vấn ñề như
vậy thì cách giải quyết hết sức khó, vì nếu không chấp nhận H0 : Θ = Θo thì ñiều ñó có nghĩa
là có thể chấp nhận một trong vô số Θ khác Θo, do ñó thường ñưa ra bài toán dưới dạng cụ
thể hơn nữa: cho giả thiết H0 và ñối thiết H1, khi kết luận thì hoặc chấp nhận H0 hoặc bác bỏ
H0, và trong trường hợp này, tuy không hoàn toàn tương ñương, nhưng coi như chấp nhận ñối
thiết H1.
Nếu chấp nhận H0 trong lúc giả thiết ñúng là H1 thì mắc sai lầm loại II và xác suất mắc sai
lầm này ñược gọi là rủi ro loại hai β. Ngược lại nếu bác bỏ H0 trong lúc giả thiết ñúng chính
là H0 thì mắc sai lầm loại I và xác suất mắc sai lầm ñó gọi là rủi ro loại một α 
pdf 15 trang thiennv 10/11/2022 2300
Bạn đang xem tài liệu "Bài giảng Lý thuyết xác suất và thống kê ứng dụng - Chương 2: Ước lượng và kiểm định giả thiết", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_ung_dung_chuong_2_u.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê ứng dụng - Chương 2: Ước lượng và kiểm định giả thiết

  1. 28 Thi t k thí nghi m Ví d 2.14: p 100 qu tr ng có 82 qu n . Ki m ñ nh gi thi t H 0: t l n p = 0,80, ñ i thi t H 1: p ≠0,8 v i α = 0,05. n = 100; m = 82; f = 82/100 = 0,82; 0,82 − 0,80 ZTN = = 0,5 ; z(0,025) = 1,96 2,0.8,0 100 Kt lu n: Ch p nh n H 0: “T l p n là 0,80”. 2.5.3. Ki m ñ nh gi thi t H 0: p 2 = p 1 Khi dung l ưng c 2 m u ñ u l n ( n 1 > 100, n 2 > 100) và các p i không bé quá (ho c l n quá) có th ki m ñ nh nh ư sau ( m c ý ngh ĩa α) m m = 1 = 2 Tính các t n su t: f1 ; f 2 n1 n2 m + m Tính t n su t chung: f = 1 2 + n1 n 2 Tìm giá tr t i h n z( α/2) n u ki m ñnh 2 phía ho c z( α) n u ki m ñ nh m t phía − f 2 f1 Tính giá tr th c nghi m: Z TN = 1 1 f 1( − f )( + ) n1 n2 Kt lu n: Vi ñ i thi t hai phía H 1: p2 ≠ p 1 Nu ZTN  ≤ z( α/2) thì ch p nh n H 0, ng ưc l i thì ch p nh n H 1 Vi ñ i thi t m t phía H 1: p2 > p 1 Nu Z TN ≤ z( α) thì ch p nh n H 0, ng ưc l i thì ch p nh n H 1 Vi ñ i thi t m t phía H 1: p2 < p 1 Nu ZTN ≥ - z(α) thì ch p nh n H 0, ng ưc l i thì thì ch p nh n H 1 Ví d 2.15: Dùng thu c A ñiu tr cho 200 b nh nhân th y 150 ng ưi kh i b nh. T ươ ng t vi thu c B ñi v i 100 b nh nhân thì 72 ng ưi kh i b nh. Hãy ki m ñ nh gi thi t H 0: T l kh i b nh c a hai thu c nh ư nhau v i ñ i thi t H 1: t l kh i b nh c a hai thu c khác nhau vi m c ý ngh ĩa α = 0,05. n1 = 200; m 1 = 150; f 1 = 150/ 200 = 0,75; n 2 = 100; m 2 = 72; f 2 = 72 /100 = 0,72 ; 150 + 72 f = = 0,74 200 +100 0,72 − 0,75 ZTN = = − ,0 5584  |Z TN | = 0,5584; z(0,025) = 1,96. 1 1 0,74× 0,26× ( + ) 200 100 Kt lu n: Ch p nh n H 0; t c là t l kh i b nh 2 lo i thu c là nh ư nhau.
  2. Ch ươ ng 2 Ưc l ưng và ki m ñnh gi thi t 29 2.6. Phân tích ph ươ ng sai M r ng bài toán so sánh hai trung bình c a hai t ng th m c trên khi có nhi u h ơn 2 trung bình chúng ta có bài toán phân tích ph ươ ng sai m t nhân t . Thí d có a t ng th , ñ kh o sát các bi n X 1, X 2, . . . , X a trên các t ng th ñó chúng ta l y m i t ng th m t m u các quan sát ñc l p: Mu 1 x11 , x 12 , . , x 1r1 Mu 2 x21 , x 22 , . , x 2r2 . . M u a xa1 , x a2 , ., x 2ra Tt c có n = Σri quan sát. Vi t l i các quan sát x i j d ưi d ng x i j = µi + e i j e i j g i là sai s hay ph n d ư (2.1) 2 Gi thi t các bi n X i ñc l p, phân ph i chu n N( µi, σ ), các quan sát trong m u ñ c l p.T gi thi t trên có th nêu c th 3 gi thi t sau ñi v i các sai s e i j a- Các bi n e i j ñc l p v i nhau b- Các bi n e i j phân ph i chu n v i k ỳ v ng b ng 0 2 c- Các bi n e i j có ph ươ ng sai b ng nhau ( σ ) Bài toán phân tích ph ươ ng sai m t nhân t chính là bài toán ki m ñ nh gi thi t H 0: “Các trung bình µi b ng nhau” v i ñ i thi t H 1: “Có ít nh t m t c p trung bình khác nhau”. Nu g i µ là trung bình c a các µi thì có th vi t (2.1) li nh ư sau: xi j = µ + a i + e i j (2.2) vi a i = µi - µ; Σai = 0 Gi thi t H 0 bây gi là : “Các a i ñu b ng 0” còn H 1 là “Không ph i t t c các a i ñu b ng 0”. _ ð phân tích ph ươ ng sai chúng ta g i các trung bình c ng c a các m u quan sát là x i . N u 2 gi thi t H 0 ñúng thì các X i có cùng phân ph i N( µ,σ ) và có th coi các m u quan sát nói trên ñưc l y ra t cùng m t t ng th . _ Gi x là trung bình chung c a t t c các m u. Tính t ng bình ph ươ ng t t c các sai s (g i là t ng bình ph ươ ng toàn b SS TO ) a ni a ni = − 2 = 2 − 2 SS TO ∑∑(xij x) ∑∑ xij xn i=1j = 1 i=1j = 1 ðem t ng bình ph ươ ng này chia cho (n - 1) ñưc m t ưc l ưng c a σ2. 2 2 SS TO / σ phân ph i χ v i df TO = (n - 1) b c t do. ði v i m i m u quan sát chúng ta tính t ng bình ph ươ ng sai s trong m u (mà n u ñem chia 2 cho b c t do t ươ ng ng (n i - 1) thì ñưc m t ưc l ưng c a σ ) sau ñó g p l i thành t ng 2 bình ph ươ ng do sai s SS E (Gi ng nh ư cách ñã làm khi ñi tìm ph ươ ng sai chung s c trong tr ưng h p m u bé và hai ph ươ ng sai b ng nhau m c 2.4.2.3 ) a ni = − 2 SS E ∑∑(xij xi ) i=1j = 1
  3. 30 Thi t k thí nghi m 2 ðem SS E chia cho n - a ñưc m t ưc l ưng c a σ 2 2 SS E / σ phân ph i χ vi df E = (n - a) b c t do. Có th ch ng minh h th c sau: a ni a ni a ni − 2 = − 2 + − 2 ∑∑(xij x ) ∑∑(xij xi ) ∑∑(xi x) i=1j = 1 i=1j = 1 i=1j = 1 Tng th ba g i là t ng bình ph ươ ng do nhân t SS A. _ 2 2 Nu x i j phân ph i chu n N( µi, σ ) thì các trung bình c ng xi. phân ph i chu n N( µi, σ /n i). 2 T ñó suy ra n u ñem SS A chia cho (a - 1) thì ñưc ưc l ưng c a σ . 2 2 Tng SS A/σ phân ph i χ v i df A = (a-1) b c t do. Nh ư v y chúng ta ñã tách t ng bình ph ươ ng toàn b ra hai t ng: SS TO = SS A + SS E ðng th i b c t do toàn b c ũng tách thành 2 b c t do: df TO = df A + df E Mi t ng bình ph ươ ng chia cho b c t do t ươ ng ng s cho m t ưc l ưng c a ph ươ ng sai σ2 2 2 và m i t ng sau khi chia cho σ s phân ph i χ v i s b c t do t ươ ng ng. Bây gi xét t s MS A / MS E v i MS A = SS A / df A và MS E = SS E / df E 2 Da trên lý thuy t v phân ph i Khi bình ph ươ ng ( χ ) và phân ph i F có k t lu n sau: MS A / MS E phân ph i Fisher- Snederco (F). T ñó có cách ki m ñ nh sau ñây ñ i v i gi thi t H 0 (ñi thi t H 1): + Tính giá tr th c nghi m F TN = MS A / MS E + Tìm giá tr t i h n F (α,dfA,dfE) + N u F TN ≤ F (α,dfA,dfE) thì ch p nh n H 0, ng ưc l i thì ch p nh n H 1 Toàn b quy trình phân tích ph ươ ng sai ñưc tóm t t trong b ng phân tích ph ươ ng sai sau: Tng bình Trung bình Ngu n bi n ñ ng Bc t do F F t i h n ph ươ ng bình ph ươ ng TN Nhân t df A = a-1 SS A MS A = SS A/df A MS A/MS E F(α,dfA,dfE) Sai s ng u nhiên df E = n-a SS E MS E = SS E/df E Tng bi n ñ ng df TO = n-1 SS TO ð thu n ti n th ưng k b ng ch a d li u và tính theo th t sau: _ 2 + Tính dung l ưng n i, t ng hàng TH i, trung bình xi. , TH i / n i + T ng các dung l ưng n = Σni , t ng t t c các x i j ST = ΣΣ x i j + S ñiu ch nh G = ST 2 / n 2 + SS TO = ΣΣ x i j - G b c t do df TO = n - 1 2 + SSA = ΣTH i / n i - G b c t do df A = a - 1 + SS E = SS TO - SS A b c t do df E = df TO - df A = n - a + Tính các trung bình MS A = SS A / df A và MS E = SS E / df E + Tính F TN = MS A / MS E + Tìm giá tr F (α,dfA,dfE) + So sánh F TN v i F (α,dfA,dfE) .
  4. Ch ươ ng 2 Ưc l ưng và ki m ñnh gi thi t 31 Ví d 2.16: Kh i l ưng (kg) c a 20 l n 90 ngày tu i ñưc nuôi 5 ch ñ khác nhau t lúc cai s a 21 ngày tu i. Bi t r ng 20 l n ñưc ch n ñng ñu nhau vào th i ñim cai s a và b trí ng u nhiên v m t trong 5 công th c thí nghi m. S li u ñưc trình bày trong b ng d ưi. Gi thi t kh i l ưng tuân theo phân ph i chu n. Ki m ñnh gi thi t H 0: Kh i l ưng trung bình c a l n 90 ngày tu i 5 ch ñ ch ăm sóc b ng nhau v i ñi thi t H1: Kh i l ưng trung bình c a l n 90 ngày tu i 5 ch ñ ch ăm sóc không b ng nhau. M c ý ngh ĩa α = 0,05. 2 _ Công th c Kh i l ưng (kg) ni TH i TH i /n i xi. A 32,2 34,9 29,7 3 96,8 3123,413 32,27 B 28,4 28,0 22,8 28,5 29,4 5 137,1 3759,282 27,42 C 28,8 29,5 23,1 20,1 4 101,5 2575,563 25,38 D 41,5 36,3 31,7 31,0 38,2 5 178,7 6386,738 35,74 E 33,0 26,0 30,6 3 89,6 2676,053 29,87 T ng 20 603,7 18521,0492 2 n = 20 ST = 603,7 ΣTH i / n i = 18521,0492 S ñiu ch nh G = 603,7 2 / 20 = 18222,6845 2 Tng các bình ph ươ ng ΣΣ x i j = 18727,6900 SS TO = 18727,69 - 18222,68 = 505,0055; bc t do df TO = 20 -1 = 19 SS A = 18521,0492 - 18222,6845 = 298,3647; bc t do df A = 5 - 1 = 4 SS E = 505,0055 - 298,3647 = 206,6408; bc t do df E = 19 - 4 = 15 MS A = 298,3647 / 4 = 74,5912; MS E = 206,6408 / 15 = 13,7761 FTN = 74,5912/ 13,7761 = 5,4145 F(0,05;4;15) = 3,056 Có th t ng h p các k t qu thu ñưc theo b ng phân tích ph ươ ng sai (ANOVA) sau: Tng bình Trung bình Ngu n bi n ñ ng Bc t do F F t i hn ph ươ ng bình ph ươ ng TN Công th c 4 298,3647 74,5912 3,056 F(0,05;4;15) = 3,056 Sai s ng u nhiên 15 206,6408 13,7761 Tng bi n ñ ng 19 505,0055 Kt lu n: Bác b H 0, nh ư v y là bác b gi thi t “Kh i l ưng trung bình c a l n 90 ngày tu i 5 ch ñ ch ăm sóc b ng nhau”. Sau khi có k t lu n nh ư trên thì v n ñ ñ t ra là ph i so sánh 5 trung bình c a 5 lô ñ tìm ra các trung bình nào b ng nhau, các trung bình nào khác nhau. Vn ñ này s ñưc trình b y k ph n sau. Qua cách làm nh ư trên chúng ta th y ñ ki m ñ nh gi thi t H 0: “Các trung bình b ng nhau” vi ñ i thi t H 1: “Có ít nh t m t c p trung bình khác nhau” ph i tìm cách tách t ng bình ph ươ ng toàn b SS TO thành các t ng bình ph ươ ng SS A và SS E c ăn c vào 2 ngu n bi n ñ ng ca s li u: bi n ñ ng do s khác nhau gia các m u và bi n ñ ng do s khác nhau gi a các s li u trong cùng m t m u. ð ng th i ph i tách b c t do toàn b df TO thành các b c t do df A và df E t ươ ng ng v i các t ng SS A, SS E. T ñó có tên phân tích ph ươ ng sai. Trong ph n sau khi có nhi u ngu n bin ñ ng thì ph i tách SS TO thành nhi u t ng ng v i các ngu n bi n ñ ng và tách b c t do df TO thành nhi u b c t do, sau ñó ki m ñ nh các gi thi t tươ ng ng v i các ngu n bi n ñ ng nh phân ph i Fisher- Snederco.
  5. 32 Thi t k thí nghi m 2.7. Bài t p 2.7.1 Tăng tr ng trung bình (gram/ngày) c a 36 l n nuôi v béo gi ng Landrace ñưc rút ng u nhiên t m t tr i ch ăn nuôi. S li u thu ñưc nh ư sau: 577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 Cán b k thu t tr i cho r ng t ăng tr ng trung bình c a toàn ñàn l n trong tr i là 607 gram/ngày. Theo anh ch k t lu n ñó ñúng hay sai, vì sao? 2.7.2 Anh ch hãy ki m tra k t lu n v i bài t p t ươ ng t nh ư 2.7.1, bi t r ng ñ l ch chu n c a tính tr ng này Landrace là 24 gram/ngày. 2.7.3 T l th thai bng th tinh nhân t o t tinh trùng c a 2 bò ñc gi ng ñưc xác ñnh trên nhóm bò cái g m 50 con; 18 nhóm bò cái s d ng tinh trùng c a bò ñc A và 16 ñi v i bò ñc B. T l th thai (%) thu ñưc nh ư sau: Bò ñc A 74,2 62,1 57,7 71,7 62,0 76,1 70,6 68,3 68,4 79,8 71,1 70,9 65,5 61,2 60,8 73,9 51,9 63,7 Bò ñc B 49,6 49,2 53,2 56,5 69,1 54,2 80,7 62,7 71,5 67,5 64,6 75,4 79,6 59,8 68,8 60,2 Hãy cho bi t t l th thai c a 2 bò ñc nêu trên. 2.7.4 Nng ñ fructoza (mg%) trong tinh d ch bò tr ưc và sau khi ñưc xác ñnh trên 12 m u tinh bò ñc; các giá tr thu ñưc nh ư sau: Mu s 1 2 3 4 5 6 7 8 9 10 11 12 Tr ưc khi 116 190 570 375 236 505 120 322 429 102 167 299 Sau khi 30 58 100 48 58 153 54 66 67 34 69 82 Kt lu n v n ng ñ fructoza trong tinh d ch bò tr ưc và sau khi . 2.7.5 Mt thí nghi m ñưc ti n hành nh m nghiên c u nh h ưng c a progesterone lên chu k ỳ ñng d c c a c u Merino. S d ng 4 li u khác nhau (0, 10, 25 và 40 mg/ngày) tiêm d ưi da liên tc trong 4 ngày tính t ngày ñng d c. Chu k ỳ ñng d c (ngày) c a 8 c u trong m i nhóm thu ñưc nh ư sau: Li u 0 mg/ngày 18 14 18 18 18 18 18 19 Li u 10 mg/ngày 15 14 17 14 12 13 12 13 Li u 25 mg/ngày 11 13 11 11 12 11 11 12 Li u 40 mg/ngày 9 10 12 10 11 11 10 11 Cho bi t nh h ưng c a progesterone lên chu k ỳ ñng d c c u Merino.