Bài giảng Tin học ứng dụng trong công nghệ sinh học thực phẩm

Tin học ứng dụng trong CNSHTP
2. Mô tả đại lượng thống kê bằng phần
mềm tin học
3. Mô tả dữ kiện thí nghiệm bằng phần
mềm tin học
4. Bố trí thí nghiệm nghiên cứu thực phẩm
5. Xử lý số liệu thí nghiệm kiểu hoàn toàn
ngẫu nhiên bằng phần mềm Statgraphics
Noäi dung
6. Xử lý số liệu thí nghiệm kiểu khối ngẫu
nhiên đầy đủ bằng phần mềm Statgraphics
7. Xử lý số liệu thí nghiệm kiểu bình phương
Latin bằng phần mềm Statgraphics
8. Xử lý số liệu thí nghiệm đa yếu tố bằng phần
mềm Statgraphics
9. Xử lý số liệu thí nghiệm hồi quy và tương
quan tuyến tính bằng phần mềm Statgraphics
10. Giải một số bài toán công nghệ bằng phần
mềm EXCEL 
pdf 297 trang thiennv 10/11/2022 5080
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng trong công nghệ sinh học thực phẩm", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_tin_hoc_ung_dung_trong_cong_nghe_sinh_hoc_thuc_pha.pdf

Nội dung text: Bài giảng Tin học ứng dụng trong công nghệ sinh học thực phẩm

  1. Bảng phân phối tần số  Sắp xếp, trình bày dữ liệu một cách có hệ thống  Phân chia dữ liệu thành từng nhóm khác nhau  Căn cứ để hình thành biểu đồ phân phối tần số
  2. Sơ đồ tổng quát của bảng phân phối tần số Trị số của biến Tần số (số lần xuất (Xi) hiện của trị số - fi) X1 f1 X2 f2 Xk fk
  3. Sơ đồ tổng quát của bảng phân phối tần số điểm số sinh viên 1 2 2 4 10 9
  4. Sơ đồ tổng quát của bảng phân phối tần số Năng Tần Tần số Tần số Tần số tương suất số tương tích đối tích lũy đối (%) lũy (%) 152 7 17,5 7 17,5 159 19 47,5 26 65,0 166 8 20 34 85,0 173 6 15 40 100 40
  5. Biểu đồ trong thống kê  Biểu diễn toàn bộ số liệu  Thể hiện nét đặc trưng của tập hợp số liệu  Biểu diễn mối quan hệ giữa tính trạng nghiên cứu và chỉ tiêu theo dõi
  6. Biểu đồ phân phối tần số  Biểu đồ cột  Trình bày số quan sát lớn  Có thể trình bày tần số tương đối, tần số tích lũy, tần số tương đối tích lũy
  7. Biểu đồ phân phối tần số
  8. Biểu đồ phân phối tần số 19 20 15 10 8 7 6 5 0 152 159 1 166 173
  9. Biểu đồ tần số tích lũy 45 40 40 35 34 30 25 26 20 15 10 7 5 0 150 155 160 165 170 175
  10. Biểu đồ tần số tương đối tích lũy 120 100 100 80 85 65 60 40 20 17,5 0 150 155 160 165 170 175
  11. Biểu đồ hộp  Khảo sát sơ lược dữ liệu  Tổng quát về phân phối của mẫu/ tổng thể  thể hiện ví trí tập trung, phân tán, bất thường
  12. Biểu đồ hộp
  13. Biểu đồ hộp  Khối hộp ‘box’ kéo dài từ giá trị phân vị ¼ đến giá trị phân vị ¾ , khoảng 50% giá trị nẳm trong ‘box’  Đường thẳng đứng ở vị trí trung bị mẫu, chia dãy số liệu thành 2 phần bằng nhau, nếu mẫu phân bố đối xứng thì đường này nằm gần trung tâm của khối hộp
  14. Biểu đồ hộp  Dấu + ở vị trí trung bình của mẫu  Sự khác biệt đáng kể giữa trung bình và trung vị cho thấy có một vài số liệu có khả năng gây ra sai số làm phân bố của mẫu bị lệch  Đoạn thẳng hai đầu gọi là ‘whisker’ nối từ giá trị cực tiểu đến điểm phân vị ¼ và từ điểm phân vị ¾ đến giá trị cực đại
  15. Biểu đồ điểm
  16. 1.3 Phần mềm ứng dụng trong xử lý thống kê  Phần mềm xử lý thống kê Statgraphics  Thao tác cơ bản trong phần mềm  Xử lý thống kê số liệu nghiên cứu  Thao tác sao chép kết quả xử lý vào phần mềm văn bản WORD
  17. 1.4 Phần mềm ứng dụng trong biểu diễn công thức hóa học  Phần mềm ChemWindow  Thao tác cơ bản trong phần mềm
  18. 2. Mô tả đại lượng thống kê bằng phần mềm tin học  Phân tích thống kê  Đại lượng đo lường xu hướng trung bình  Đại lượng đo lường sự biến thiên  Xác định các đại lượng thống kê bằng phần mềm tin học
  19. 2.1 Phân tích thống kê  Các con số tóm lược thông tin định lượng  Phương pháp tính toán để giúp chúng ta tóm lược hoặc khái quát hoá thông tin  Kỹ thuật giúp quyết định vấn đề như phân tích phương sai, tương quan hồi qui, trắc nghiệm,
  20. Hạn chế của thống kê  Sử dụng thống kê phải biết rành về lĩnh vực chuyên môn của người nghiên cứu  Thống kê chỉ là phương tiện, công cụ  Thống kê trình bày những số liệu hoặc hiện tượng rời rạc một cách hệ thống hơn, chứ không nói được bản chất của sự việc  Thống kê không thay thế được cho suy nghĩ và kết luận của người nghiên cứu
  21. Thống kê mô tả  Là một trong những bước đầu tiên để phân tích vấn đề và thực hiện một quyết định.  Gồm các tính toán cơ bản mang tính chất mô tả như trung bình, phương sai, độ lệch chuẩn, nhằm tổng kết về kết quả của thí nghiệm.
  22. Thống kê mô tả  Phương pháp tóm lược thông tin để làm cho chúng trở nên dễ hiểu tức giảm một số lớn các số liệu phức tạp thành một số nhỏ hơn gồm các giá trị tóm tắt  Mô tả mối quan hệ giữa các biến số
  23. Thống kê suy diễn  Khái quát hoá thông tin của một mẫu cho toàn dân số của mẫu tức là chỉ đo đếm trên một tiểu tập hợp rồi suy luận cho toàn bộ với một độ tin cậy nào đó  Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thông tin này để suy rộng ra các đặc tính của toàn bộ dân số
  24. 2.2 Đại lượng đo lường xu hướng trung bình  Mốt (mode)  Trung vị (median)  Trung bình cộng (average)  Trung bình nhân (geometric mean)
  25. Mode: (Mo)  Là giá trị xuất hiện nhiều nhất trong một biến số Ví dụ: Phân phối xác suất: 5, 6, 7, 7, 8, 8, 8, 9, 10 có mode là 8  Dùng để đo độ tập trung  Không phụ thuộc vào giá trị ở 2 đầu của dãy số
  26. Mode: (Mo)  Biến số đơn thức là biến số khi gần như mọi trường hợp đều tập trung về một giá trị  Biến số nhị thức là biến số khi gần như có hai hay nhiều trường hợp nhất và gần như tương đương nhau
  27. Số trung vị: (Me)  số nằm ở chính giữa khi dãy số xếp từ nhỏ - lớn  Là giá trị chia đôi tổng số các giá trị của biến số thành 2 phần bằng nhau  cho kết quả nhanh về ước lượng trung bình.
  28. Trung bình cộng X  Cộng các giá trị của các trường hợp và chia cho tổng trường hợp  Trường hợp dị biệt có thể làm trung bình mất đi tính đại diện  Tổng các độ lệch giữa các giá trị với trung bình luôn bằng 0  Tổng các độ lệch bình phương có giá trị nhỏ nhất
  29. Trung bình cộng X  Đại diện cho cả một tập hợp lớn số liệu  Nêu lên đặc điểm chung nhất của hiện tượng  Dùng để so sánh các hiện tượng không có cùng qui mô
  30. Trung bình cộng số học n  X i X i 1 n
  31. Trung bình có trọng số  Là trường hợp đặc biệt của trung bình số học khi gía trị của biến xuất hiện nhiều lần k  X i fi i 1 X k  fi i 1
  32. Trung bình của dữ liệu phân nhóm có khoảng cách  mi là trị số giữa của nhóm i  fi tần số của nhóm i k mi fi i 1 X k  fi i 1
  33. Trung bình nhân (trung bình hình học) GM  Căn bậc n cho n giá trị n GM X1 X 2 X n  Thay cho trung bình cộng trong trường hợp dãy số liệu có phân phối lệch (giá trị đột biến)
  34. Phần tư vị (quartile)  Xếp dữ kiện từ nhỏ đến lớn, chia dãy n dữ kiện làm 4 phần  Phần tư vị dưới (low quartile): lấy giá trị của đơn vị ở vị trí ¼ (25%) dãy dữ kiện.  Phần tư vị trên (upper quartile): lấy giá trị của đơn vị ở vị trí ¾ (75%) dãy dữ kiện.
  35. 2.3 Đại lượng đo lường sự biến thiên  Phương sai  Độ lệch chuẩn  Hệ số biến dị  Độ lệch  Độ nhọn
  36. Phương sai (variance)  Phương sai là trung bình của các độ lệch bình phương giữa các giá trị so với giá trị trung bình. (X )2  2  i N
  37. Phương sai  Tính giá trị trung bình  Trừ giá trị trung bình cho từng giá trị (hiệu số)  Bình phương từng hiệu số  Cộng các hiệu số được bình phương  Lấy tổng của các hiệu số bình phương chia tổng giá trị
  38. Ý nghĩa của phương sai  Nếu các giá trị được phân phối một cách dàn trãi trên diện rộng và cách xa trung bình thì độ lệch sẽ lớn và phương sai sẽ rất lớn  Nếu các giá trị quần tụ gần giá trị trung bình thì độ lệch sẽ nhỏ và phương sai sẽ nhỏ.
  39. Độ lệch chuẩn (standard deviation)  Biểu thị mức độ phân tán (cùng bản chất của tính trạng)  Độ lệch càng lớn mức độ phân tán càng cao, tính đại diện trung bình càng nhỏ
  40. Độ lệch chuẩn  Là căn bậc hai của phương sai (X )2   i N
  41. Mô tả biến thiên  Mô tả biến thiên chính là đo lường sự khác biệt của các giá trị với một giá trị chuẩn nào đó tức là điểm trung bình
  42. Mô tả biến thiên Nhóm 1 (tương Nhóm 2 (giữa 2 Nhóm 3 (tương đối đồng nhất) xu hướng) đối khác biệt) 64 44 34 68 63 58 70 80 90 71 91 101 69 74 79 66 56 46 Trung bình 68 Trung bình 68 Trung bình 68
  43. Mô tả biến thiên Nhóm 1 (tương đối Nhóm 2 (giữa 2 xu Nhóm 3 (ttương đối đồng nhất) hướng) khác biệt) 64 44 34 68 63 58 70 80 90 71 91 101 69 74 79 66 56 46 Trung bình 68 Trung bình 68 Trung bình 68 p.Sai 6,8 290,80 686,80
  44. Mô tả biến thiên Nhóm 1 (tương đối Nhóm 2 (giữa 2 xu Nhóm 3 (tương đối đồng nhất) hướng) khác biệt) 64 44 34 68 63 58 70 80 90 71 91 101 69 74 79 66 56 46 Trung bình 68 Trung bình 68 Trung bình 68 p.Sai 6,8 290,80 686,80 SD 2,61 SD 17,05 SD 26,21
  45. Mô tả biến thiên  Thông thường làm tròn giá trị của độ lệch chuẩn và phương sai ở chữ số thập phân thứ 2  Biến thiên càng lớn thì độ lệch chuẩn và phương sai càng lớn  Khi viết báo cáo kết quả phân tích thống kê, thường dùng độ lệch chuẩn
  46. Hệ số biến dị  So sánh mức độ phân tán của các tính trạng có bản chất khác nhau SD CV 100% X
  47. Độ lệch (skewness)  Là tiêu chuẩn đánh giá tính đối xứng của số liệu  Độ lệch = 0 (đối xứng)  Độ lệch > 0 (các giá trị có xu hướng tập trung về phía bên phải của đồ thị)  Độ lệch < 0 (các giá trị có xu hướng tập trung về phía bên trái của đồ thị)
  48. Độ nhọn (kurtosis)  Là tiêu chuẩn để xác định hình dạng của phân bố đối xứng.  Độ nhọn = 0 (phân bố chuẩn)  Độ nhọn > 0 (phân bố có đồ thị nhọn hơn phân bố chuẩn)  Độ nhọn < 0 (phân bố có đồ thị bẹt hơn phân bố chuẩn)
  49. 2.4 Xác định các đại lượng thống kê bằng phần mềm tin học  Phần mềm EXCEL  Phần mềm STATGRAPHICS
  50. 3. Mô tả dữ kiện thí nghiệm bằng phần mềm tin học  Mô tả dữ kiện  Phương pháp xử lý số liệu ban đầu  Xử lý số liệu của thí nghiệm so sánh 2 mẫu bằng phần mềm STATGRAPHICS
  51. 3.1 Mô tả dữ kiện  Hai biến số có giá trị trung bình như nhau nhưng độ phân tán không giống nhau  Độ phân tán cho biết thông tin để đánh giá độ tin cậy của giá trị tập trung
  52. Các đặc trưng thống kê thường dùng trong mô tả dữ kiện Các giá trị của một biến số có sự phân phối là phân tán hay tập trung.  Giá trị đồng nhất (các giá trị của một biến số có xu hướng quần tụ)  Giá trị không đồng nhất (các giá trị của một biến số có xu hướng phân tán)
  53. Các đặc trưng thống kê thường dùng trong mô tả dữ kiện  Trung bình mẫu ước lượng giá trị trung tâm của phân bố  Độ lệch chuẩn của mẫu liên quan đến sự phân tán của số liệu
  54. Các đặc trưng thống kê thường dùng trong mô tả dữ kiện  Trung bình mẫu và Độ lệch chuẩn chỉ có giá trị đại diện cho mẫu khi mẫu có phân phối chuẩn  Độ lệch (skewness) và độ nhọn (kurtosis) dùng để kiểm tra mẫu có phân bố chuẩn hay không
  55. Mẫu và dân số  Dữ liệu của dân số là những dữ liệu liên quan đến mọi trường hợp  Dữ liệu của mẫu đại diện có thể khái quát cho toàn bộ dân số
  56. Mẫu (sample)  Được chọn ngẫu nhiên từ dân số  Mẫu là một phần và là đại diện của dân số.  Phân tích mẫu có thể suy ra các đặc tính của dân số với một mức độ tin cậy xác định nào đó
  57. Mẫu ngẫu nhiên  Mẫu lấy từ dân số mà các đơn vị đều có cơ hội đồng đều nhau, nó mang tính khách quan trong thu thập dữ kiện
  58. Dân số (population)  Là tập hợp những thông tin về người, sự vật hoặc sự việc riêng biệt kết hợp với nhau trên cơ sở một đặc điểm chung nào đó mà người nghiên cứu đang quan tâm.  Là tập hợp toàn bộ các đối tượng nghiên cứu, điều tra, khảo sát.
  59. Dân số  Thường rất lớn và không thể kiểm tra hết  Muốn biết thông tin về dân số chỉ có thể đo đếm trên một tiểu tập hợp gọi là mẫu
  60. Biến số  Là một đặc trưng mà giá trị của nó khác nhau tùy theo trường hợp  Tùy nhu cầu nghiên cứu mà có thể tạo ra các biến số mới  đặc trưng quan sát mà cuộc nghiên cứu quan tâm đến,  có 02 loại biến số (liên tục, rời rạc)
  61. Biến số liên tục  Là các số nguyên dương và thập phân.  Các số đo về chiều dài, trọng lượng, thể tích,
  62. Biến số rời rạc  Là các số nguyên dương.  Các biến biểu thị tính chất hay số đếm
  63. Đơn vị  đối tượng cụ thể để đo đếm và thu nhập dữ kiện.  Một mẫu thăm dò sẽ có nhiều đơn vị.  Đơn vị thống kê là một phần tử của một tập hợp mẫu thống kê điều tra khảo sát.
  64. Phương sai của mẫu  Công thức đo lường biến thiên của mẫu (phương sai) (X X )2 S 2  i n 1  n-1 gọi là bậc tự do của phương sai
  65. Phương sai của mẫu  Đối với một phương sai, có n-1 các độ lệch có thể biến đổi một cách tự do một khi chúng đã được nhận biết, độ lệch sau cùng chắc chắn sẽ được xác định.  Vì vậy có n-1 bậc tự do
  66. Độ lệch chuẩn  độ lệch chuẩn liên quan đến mẫu (X X )2 S  i n 1
  67. Ñieåm số chuẩn hoaù  Được dùng để đo lường độ lệch của một điểm số nào đó khi được so sánh với trung bình bằng độ lệch chuẩn.
  68. Ñieåm số chuẩn hoaù  Chuyển một điểm số nào đó thành một điểm số chuẩn hoá theo công thức: X X Z i i S
  69. Ñieåm số chuẩn hoaù Điểm cuûa sinh Điểm cuûa sinh viên lôùp A vieân lôùp B 87 81 6 83 76 7 Z Zi i 6 6 4 4 = 1,00 = 1,75
  70. Biến số chuẩn hoá  Là biến số mà các điểm số của nó đều được chuyển thành điểm số chuẩn hoá  Tổng các điểm số chuẩn hoá bằng 0  Tổng bình phương của các điểm số chuẩn hoá luôn bằng n là tổng số trường hợp trong mẫu
  71. Sai biệt chuẩn  độ lệch chuẩn của một phân phối mẫu quan trọng đến mức phải đặt cho nó một tên gọi riêng là sai biệt chuẩn (standard error) được viết là:  x
  72. Sai biệt chuẩn  Là sai số của số trung bình (sai số chọn mẫu)  Có đơn vị như số trung bình  Biểu thị mức độ đại diện của mẫu đối với dân số
  73. Sai biệt chuẩn  SE lớn biểu thị mức độ đại diện của mẫu đối với dân số nhỏ và ngược lại  Biểu thị mức độ tin cậy của mẫu  Ước lượng số trung bình của tổng thể
  74. Sai biệt chuẩn  Sai biệt chuẩn của trung bình là toàn bộ độ lệch chuẩn của phân phối mẫu của các trung bình của toàn bộ mẫu có kích cỡ nhất định trong dân số, được tính bằng công thức:   x n
  75. Khoảng tin cậy  Trung bình của một dân số có thể được tìm ra ở phía dưới và hoặc phía trên của trung bình mẫu, do đó bên cạnh biết được trị trung bình của mẫu cần phải biết khoảng tin cậy.
  76. Khoảng tin cậy  Chính sai biệt chuẩn sẽ cho biết khoảng tin cậy.  Khoảng tin cậy 95% (X 1,96 x ) Khẳng định với độ chắc chắn rằng 95% trung bình của dân số sẽ nằm trong khoảng này
  77. Khoảng tin cậy  Tương tự 99%: (X 2,58 x )
  78. Mô tả dữ kiện  Phân phối dân số  Phân phối mẫu  Phân phối chuẩn
  79. Phân phối dân số  là phân phối của những điểm số trong một dân số
  80. Phân phối mẫu  là phân phối của những điểm số trong một mẫu có kích cỡ nhất định  là phân phối của một thống kê nào đó của tất cả các mẫu có cùng một kích cỡ trong dân số
  81. Phân phối chuẩn  Khi vẽ biểu đồ tương quan giữa tần số và kết quả thu nhận, hình dạng đường cong thông thường có dạng hình chuông gọi là phân phối chuẩn
  82. Phân phối chuẩn  Là một phân phối đối xứng có dạng hình chuông, biểu diễn bằng phương trình: 2 2 e ( x  ) / 2  Y  2
  83.  Hai phân phối chuẩn với độ lệch chuẩn khác nhau: độ lệch chuẩn nhỏ cho phép khái quát hoá những kết quả của mẫu cho toàn dân số với độ tin cậy cao
  84. Phân phối chuẩn -2 -3 -1 0 +1 +2 +3 68% 95% 99,7%
  85. Phân phối chuẩn Trong một phân phối chuẩn, khoảng:  68% số liệu trong khoảng X ±SD  95% số liệu trong khoảng X ±2SD  99% số liệu trong khoảng X ±3SD
  86. Phân phối chuẩn Trong một phân phối chuẩn:  Có 95% số trường hợp nằm trong độ lệch chuẩn ±1,96 so với giá trị trung bình  Có 99% số trường hợp nằm trong độ lệch chuẩn ±2,58 so với giá trị trung bình
  87. 3.2 Phương pháp xử lý số liệu ban đầu  Gọi a là trị thực của đại lượng đo, X là kết quả đo  Sai số tuyệt đối (X-a) có thể gồm 3 thành phần là sai số hệ thống, sai số thô, sai số ngẫu nhiên
  88. Sai số hệ thống  Sai số hệ thống là sai số không đổi hoặc thay đổi theo một qui luật nhất định.  Sai số hệ thống có thể hiệu chỉnh được
  89. Sai số thô  Sai số thô là sai số do bất cẩn, trục trặc kỹ thuật, thay đổi điều kiện đột ngột, Đặc điểm đơn lẻ, có trị số tuyệt đối lớn hoặc nhỏ một cách bất thường.  Cần loại bỏ các số đo chứa sai số thô để khỏi ảnh hưởng không trung thực đến kết quả chung
  90. Sai số ngẫu nhiên  Sai số ngẫu nhiên là sai số không thể tiên đoán được cụ thể, do rất nhiều nhân tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng.  Sai số ngẫu nhiên là sai số mà người làm thí nghiệm không thể loại bỏ được, phải chấp nhận
  91. 3.3 Xử lý số liệu của thí nghiệm so sánh 2 mẫu bằng phần mềm STATGRAPHICS  Bố trí thí nghiệm so sánh 2 mẫu  Xử lý số liệu của thí nghiệm so sánh 2 mẫu bằng phần mềm STATGRAPHICS
  92. Bố trí thí nghiệm so sánh 2 mẫu  Giả thuyết không Ho (Null Hypothesis) giả thuyết được đặt ra từ đầu với mục đích trắc nghiệm xem nó đúng hay sai dựa vào kết quả thí nhgiệm  Giả thuyết chọn lựa H1 (Alternative Hypothesis) Là giả thuyết ngược lại Ho nghĩa là khi bác bỏ Ho thì chấp nhận H1
  93. Xử lý số liệu của thí nghiệm so sánh 2 mẫu bằng phần mềm STATGRAPHICS  Nhập dữ liệu  Chọn lệnh xử lý  Đọc kết quả  Chép kết quả vào WORD
  94. 4. Bố trí thí nghiệm nghiên cứu thực phẩm  Khoa học thực phẩm  Các dạng nghiên cứu thực phẩm  Các bước trong nghiên cứu thực nghiệm  Khái quát về thí nghiệm nghiên cứu  Kiểu bố trí thí nghiệm trong nghiên cứu thực nghiệm
  95. 4.1 Khoa học thực phẩm  Nghiên cứu các tác động qua lại của các yếu tố ảnh hưởng đến chất lượng thực phẩm  Kỹ thuật thực phẩm liên quan đến qui trình, thiết bị, con người, vi sinh vật  Giải quyết vấn đề: Chất lượng, An toàn, Kỹ thuật chế biến
  96. 4.2 Các dạng nghiên cứu thực phẩm  Bố trí thí nghiệm bảo quản & chế biến sản phẩm thực phẩm  Phân tích diễn biến chất lượng qua thời gian bảo quản  Điều tra các yếu tố vật lý, hóa học, sinh học ảnh hưởng đến chất lượng sản phẩm, đánh giá hiệu quả của biện pháp xử lý, khắc phục
  97. 4.3 Các bước trong nghiên cứu thực nghiệm  Xác định nhiệm vụ, đối tượng, dân số  Tính toán số lượng đơn vị cần thu thập theo qui định thống kê  Thu thập dữ kiện  Lưu trữ và xử lý số liệu  Phân tích kết quả và viết báo cáo
  98. Xác định nhiệm vụ, đối tượng, dân số  Trước khi tiến hành thu thập dữ kiện, phải hiểu mình muốn biết gì khi điều tra nghiên cứu.  xác định nhiệm vụ là việc hàng đầu trước khi thu thập dữ kiện.
  99. Tính toán số lượng đơn vị cần thu thập theo qui định thống kê  Việc xác định dung lượng mẫu cần thiết cho cuộc điều tra có ảnh hưởng đến kết quả đánh giá và suy diễn kết luận về quần thể thông qua tập hợp mẫu.  Thu thập không đủ số lượng đơn vị cho mẫu điều tra sẽ làm lệch sự suy diễn, phi khoa học và dẫn đến sự ngộ nhận gây ra những hậu quả không lường được
  100. Thu thập dữ kiện  Khi điều tra nghiên cứu, phải thực hiện việc thu thập dữ kiện.  Trong khi thu thập dữ kiện phải thực hiện việc ghi chép thông qua các bảng ghi số liệu khảo sát.
  101. Lưu trữ và xử lý số liệu Hình thức, phương pháp lưu trữ dữ kiện thu thập ngoài hiện trường hay kết quả phân tích trong phòng thí nghiệm đa dạng tùy theo mục đích điều tra nghiên cứu:  Dưới dạng bảng tính  Dưới dạng cơ sở dữ liệu  Lưu trữ trực tiếp vào phần mềm xử lý thống kê.