Bài giảng Tin học ứng dụng trong sinh học - Bùi Hồng Quân
CÁC ĐỊNH NGHĨA
• Khoảng quan sát: là khác biệt giữa hai giá trị
quan sát: lớn nhất và nhỏ nhất.
• r = Max – Min
• Giá trị trung bình giống nhau, khoảng quan sát
giống nhau?
• Nếu khoảng quan sát lớn thì độ phân tán sẽ cao.
CÁC ĐỊNH NGHĨA
• Giá trị trung vị (Median) là giá trị diễn tả khái
niệm trung tâm của chuỗi dữ liệu
• Khoảng quan sát: là khác biệt giữa hai giá trị
quan sát: lớn nhất và nhỏ nhất.
• r = Max – Min
• Giá trị trung bình giống nhau, khoảng quan sát
giống nhau?
• Nếu khoảng quan sát lớn thì độ phân tán sẽ cao.
CÁC ĐỊNH NGHĨA
• Giá trị trung vị (Median) là giá trị diễn tả khái
niệm trung tâm của chuỗi dữ liệu
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng trong sinh học - Bùi Hồng Quân", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
File đính kèm:
- bai_giang_tin_hoc_ung_dung_trong_sinh_hoc_bui_hong_quan.pdf
Nội dung text: Bài giảng Tin học ứng dụng trong sinh học - Bùi Hồng Quân
- CÁC NH NGH ĨA • l ch chu n (Standard deviation): phân tán c a d li u th ư ng ư c di n t b i ph ươ ng sai (variance) hay l ch chu n (căn s b c 2 c a ph ươ ng sai) N 2 ∑(X i − X ) SD = S = i=1 (N − )1
- CÁC NH NGH ĨA • Sai s chu n c a giá tr trung bình (Std. error of the mean - SEM): giá tr trung bình c a m u g n b ng giá tr trung bình c a dân s hơn l à các giá tr quan sát riêng bi t. S SEM = SD (X ) = S = X N
- CÁC NH NGH ĨA • Gi i h n và kho ng tin c y: V i m t m c tin c y (confidence level) nh t nh là α, gi i h n tin c y (confidence limits) c a m t giá tr trung bình ư c cho b i tích s (khi N<30: phân ph i student): LCL/UCL tα S X
- CÁC NH NGH ĨA • Kho ng tin c y c a giá tr trung bình: X ± tα S X = (X − tα S X , X + tα S X ) Giá tr th ng kê t α (phân ph i student) c n ư c thay b i giá tr th ng kê z α (phân ph i chu n) trong tr ư ng h p N>30.
- CÁC NH NGH ĨA • H s phân tán (Coefficient of variation): sai s tươ ng i (relative deviation) S CV = 100 X H s phân tán liên quan n l ch chu n (c ũng nh ư chính xác c a ph ươ ng pháp o l ư ng) và giá tr trung bình c a các k t qu .
- CÁC NH NGH ĨA • Giá tr y u v (Mode): là giá tr có t n s cao nh t trong chu i d li u. • Giá tr Kurt (Kurtosis): di n t c i m thu c v nh c a d ng phân ph i d li u. + có nh, - b ng ph ng. 4 2 N(N + )1 X − X (3 N − )1 KURT = ∑ i − (N 1− )(N −2 )(N − )3 S (N −2 )(N − )3
- CÁC NH NGH ĨA • Giá tr SKEW (Skewness): ph n ánh m c b t i x ng c a d ng phân ph i d li u xung quanh giá tr trung bình. Skew + b t i x ng, uôi l ch v giá tr dươ ng. Ng ư c l i. 3 N X − X SKEW = ∑ i (N 1− )(N − )2 S
- CÁC NH NGH ĨA • chính xác S (precision): l p l i P =100 − CV = 1( − )100 c a các giá tr quan X sát. • úng (Aceuracy): trùng h p gi a các Gia tri trung binh giá tr quan sát (hay A = 100 th c nghi m) v i giá Gia _ tri _ ly _ thuyet tr lý thuy t.
- Ch ươ ng 4 NG D NG TIN H C TRONG PHÂN TÍCH TH NG KÊ SINH H C Ths. B ùi H ng Quân 09.09.25.24.19/09.17.27.26.25 Email: buihongquan@hui.edu.vn Website: www.buihongquan.tk / www.gbd.edu.vn
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI BI T TR Ư C 2 •N u N>30 thì ph ươ ng sai m u S i có th ư c xem là ph ươ ng sai dân s σ2, khi ó dùng tr c nghi m z test so sánh giá tr trung bình c a hai m u v i ph ươ ng sai bi t tr ư c. Z nh ch p nh n Ho. •Ho : µ1= µ2 •H : µ ≠ µ (X 1 − X 2 ) − (µ1 − µ2 ) o 1 2 z = σ 2 σ 2 1 + 2 N1 N2
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI BI T TR Ư C
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI BI T TR Ư C
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI BI T TR Ư C
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI BI T TR Ư C
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI BI T TR Ư C
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI BI T TR Ư C
- SO SÁNH GIÁ TR TRUNG BÌNH D LI U T ƯƠ NG NG T NG C P •“t test: paired two sample for means” - N<30, ph thu c, không gi nh ph ươ ng sai c a hai m u b ng nhau. Dùng tr c nghi m t so sánh.t nh ch p nh n Ho. D − µD t = ; Di = X i −Yi (i =1→ N) SD / N N N 2 ∑ Di ∑(Di − D) D = i=1 ;S = i=1 N D (N − )1 Phan _ phoi _ Student _ γ = N −1
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- KI M NH S NG NH T C A HAI PH ƯƠ NG SAI • “F-Test Two-Sample for variances”: Th ư ng dùng so sánh chính xác c a hai ph ươ ng pháp nh lư ng. 2 2 2 F nh ch p nh n Ho: σ1 = σ2 (1-α)100%; H1: σ1 > σ 2. 2 2 2 2 σ 2 S1 S1 F = 2 2 = 2 σ1 S2 S2 Phan _ phoi _ Fischer γ 1 = N1 − ;1 γ 2 = N2 − 2
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU • “t test: Two Sample Assuming Equal Variances”: N<30, c l p, có phương sai b ng nhau. t nh ch p nh n H o. (X 1 − X 2 ) − (µ − µ ) t = 1 2 S 2 S 2 p + p N1 N2 2 2 (N1 − )1 S1 + (N2 − )1 S2 S p = N1 + N2 − 2 Phan _ phoi _ Student _ γ = N1 + N2 − 2
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI KHÁC NHAU (X 1 − X 2 ) − (µ − µ ) • “t test: Two Sample t = 1 2 S 2 S 2 Assuming Unequal 1 + 2 Variances”: N <30, N1 N2 c l p, có phương sai Phan _ phoi _ Student kh ác nhau. t nh ch p nh n H . (S 2 / N + S 2 / N )2 o γ = 1 1 2 2 (S 2 / N )2 (S 2 / N )2 1 1 + 2 2 N1 −1 N2 −1 (Smith − Satterthwa ite )
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI KH ÁC NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI KH ÁC NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI KH ÁC NHAU
- SO SÁNH GIÁ TR TRUNG BÌNH V I PH ƯƠ NG SAI B NG NHAU
- SO SÁNH T S 2 • Tr c nghi m χ : χ nh hơn ch p nh n H o. P (dùng hàm chitest) l n h ơn α ch p nh n H o. • T n s lý thuy t = (t ng hàng x t ng c t)/ t ng c ng k (O − E )2 χ 2 = ∑ i i i=1 Ei r c (O − E )2 χ 2 = ∑∑ ij ij j=1j = 1 Eij P(X > χ 2 ) _ voi _ df = (r 1− ()c − )1
- SO SÁNH T S
- SO SÁNH T S
- SO SÁNH T S
- SO SÁNH T S
- SO SÁNH T S
- KI M NH S NG NH T C A NHI U PH ƯƠ NG SAI • Th ư ng dùng so sánh chính xác c a m ph ươ ng pháp nh l ư ng (cùng s m u. G nh ch p nh n H o: 2 2 2 σ1 = σ2 = σm (1-α)100%. G tra t b ng phân v phân b Cochran. S 2 G = max N
- KI M NH S NG NH T C A NHI U PH ƯƠ NG SAI 2 • Khác s m u, χ nh , ch p nh n H o. m m 2 ,2 3026 2 2 χ = ∑ ni − mlg s − ∑(ni −1)lg s1 C i=1 i=1 1 m 1 1 C =1+ − ∑ m (3 m − )1 i=1 ni −1 ∑ ni − m i=1 m 2 ∑(ni − )1 si 2 i=1 s = m ∑(ni − m) i=1
- PHÂN TÍCH PH ƯƠ NG SAI M T Y U T • “Anova: Single factor”: So sánh giá tr trung bình c a hai hay nhi u m u ư c l y t các dân s . M r ng c a tr c nghi m t hay z. M c ích: ánh giá m c nh h ư ng c a m t y u t (bi n) lên giá tr quan sát (hàm áp ng). F nh ch p nh n H o: µ1= µ2= µk . MSF (Mean _ square _ of _ factor ) F = MSE (Mean _ square _ of _ error )
- PHÂN TÍCH PH ƯƠ NG SAI M T Y U T
- PHÂN TÍCH PH ƯƠ NG SAI M T Y U T
- PHÂN TÍCH PH ƯƠ NG SAI M T Y U T
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T KHÔNG L P •“Anova: Two factor without replication”: ánh giá s nh h ư ng c a hai y u t (bi n) lên các giá tr quan sát (hàm áp ng). F nh ch p nh n H o: µ1= µ2= µk .
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T KHÔNG L P
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T KHÔNG L P
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T KHÔNG L P
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T CÓ L P •“Anova: Two factor with replication”: Trong m i m c có s l p l i c a k l n thí nghi m. ánh giá s nh h ư ng c a hai y u t (bi n) lên các giá tr quan sát (hàm áp ng). F nh ch p nh n H o: µ1= µ2= µk . • Trong b ng ANOVA có thêm i l ư ng t ươ ng tác (interaction term) gi a hai y u t .
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T CÓ L P
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T CÓ L P
- PHÂN TÍCH PH ƯƠ NG SAI HAI Y U T CÓ L P
- Ch ươ ng 5 NG D NG TIN H C TRONG MÔ HÌNH HOÁ SINH H C Ths. B ùi H ng Quân 09.09.25.24.19/09.17.27.26.25 Email: buihongquan@hui.edu.vn Website: www.buihongquan.tk / www.gbd.edu.vn
- PHÂN TÍCH T ƯƠ NG QUAN • Correlation: kh o sát khuynh h ư ng và m c liên quan. R 0,9 xu t s c. N COV (X ,Y) 2 1 2 Px, y = ;σ x = ∑(X i − µx ) σ xσ y N i=1 N N 2 1 2 ˆ 1 σ y = ∑(Yi − µ y ) ;COV (X ,Y ) = ∑(X i − X () Yi −Y) N i=1 N −1 i=1 Th i gian m Nhi t Th i gian 1 ? ? m 0.974654 1 ? Nhi t 0.77133 0.652367 1
- PHÂN TÍCH T ƯƠ NG QUAN
- PHÂN TÍCH T ƯƠ NG QUAN
- PHÂN TÍCH H I QUY • Regression: xác nh s liên quan nh l ư ng gi a hai bi n s ng u nhiên. • Phân tích h i quy tuy n tính (linear regression). •H s h i quy B i ư c ánh giá b ng tr c nghi m t. t nh , ch p nh n H o: h s h i quy không có ý ngh ĩa. •S phù h p c a ph ươ ng trình h i quy v i th c nghi m ư c ánh giá b ng tr c nghi m F. F nh ch p nh n H o: phươ ng trình h i quy không t ươ ng thích.
- CÁC GIÁ TR TH NG KÊ B − β B S 2 t = i i = ; S 2 = 2 2 b (X − X )2 Sb Sb ∑ i Phan _ phoi _ Student :γ = N − 2 MSR F = ; Phan _ phoi _ Fischer : v = ;1 v = N − 2 MSE 1 2