ứng dụng tin học trong tính toán số liệu hóa phân tích
52
Häc viÖn kü thuËt qu©n sù
BµI GI¶NG
tin häc øng dông
TRONG c«ng nghÖ HãA HäC
Hµ néi - 2017
Môc lôc
Chương 1...............................................................................................................................5
PHÂN TÍCH VÀ XỬ LÝ SỐ LIỆU THỰC NGHIỆM.....................................................5
1.1. CÁC ĐẶC TRƯNG THỐNG KÊ CỦA TẬP SỐ LIỆU ĐO..................................................5
1.1.1. Các tham số đặc trưng về sự tập trung của tập số liệu.......................................................5
1.1.2. Các tham số đặc trưng về sự phân tán của tập số liệu........................................................7
1.1.3. Các đặc trưng phân phối thống kê của tập số liệu..............................................................9
1.2. ĐÁNH GIÁ TẬP SÓ LIỆU KỂT QUẢ ĐO........................................................................................14
1.2.1. Sai sốố đo................................................................................................................................14
1.2.2. Độ chính xác của tập sốố liệu kếốt quả đo.................................................................................14
1.2.3. Độ sai biệt của tập sốố liệu kếốt quả đo....................................................................................15
1.2.4. Sai sốố tốối đa cho phép............................................................................................................15
1.2.5. Khoảng chính xác tn cậy........................................................................................................16
1.2.6. Khoảng giới hạn tin cậy của một tập số liệu kết quả đo...................................................16
1.3. SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU KẾT QUẢ ĐO......18
1.3.1. So sánh 2 trung bình với phương sai đã biếết hay mẫẫu lớn (N > 30) .........................18
1.3.2. So sánh 2 trung bình với dữ liệu từng cặp.........................................................................20
1.3.3. So sánh trung bình với phương sai bằng nhau..................................................................21
1.3.4. So sánh 2 trung bình với phương sai khác nhau...............................................................22
1.3.5. So sánh 2 phương sai...........................................................................................................24
1.4. BÀI TOÁN PHÂN TÍCH PHƯƠNG SAI (ANOVA)...........................................................25
1.4.1. Phân tích phương sai 1 nhân tố..........................................................................................25
1.4.2. Phân tích phương sai 2 nhân tố..........................................................................................28
1.4.3. Phân tích phương sai 2 nhân tố có lặp...............................................................................31
1.5. PHÂN TÍCH TƯƠNG QUAN, HỒI QUY............................................................................34
1.5.1. Phân tích tương quan..........................................................................................................34
1.5.2. Phân tích hồi quy.................................................................................................................36
1.6. TÌM HÀM HỒI QUY.............................................................................................................43
1.6.1. Sử dụng các hàm SLOPE, INTERCEPT và RSQ.............................................................43
1.6.2. Sử dụng Trendline...............................................................................................................43
1.6.3. Kết hợp hàm INDEX và LINEST.......................................................................................44
1.6.4. Sử dụng hàm LINEST.........................................................................................................45
1.6.5. Sử dụng chức năng “Solver”...............................................................................................46
Chương 2.............................................................................................................................50
QUY HOẠCH THỰC NGHIỆM......................................................................................50
2.1. CÁC PHƯƠNG PHÁP QUY HOẠCH THỰC NGHIỆM.......................................50
2.1.1. Một số khái niệm..................................................................................................................50
2.1.2. Qui hoạch thực nghiệm yếu tố toàn phần 2k......................................................................54
2.1.3. Qui hoạch thực nghiệm yếu tố từng phần 2k - p...................................................................55
2.1.4. Qui hoạch trực giao cấp 2...................................................................................................56
2.1.5. Qui hoạch thực nghiệm để tìm cực trị................................................................................58
2.2. XÁC ĐỊNH CÁC HỆ SỐ CỦA PHƯƠNG TRÌNH HỒI QUY...........................................60
2.2.1. Tính hệ số hồi qui bj của phương trình hồi qui tuyến tính...............................................61
2.2.2. Tính hệ số hồi qui bj của phương trình hồi qui bậc 2........................................................61
2.3. ỨNG DỤNG EXCEL ĐỂ TỐI ƯU HÓA THỰC NGHIỆM................................................61
Chương 3.............................................................................................................................75
PHƯƠNG PHÁP SỐ GIẢI CÁC BÀI TOÁN.................................................................75
TRONG HÓA HỌC VÀ CÔNG NGHỆ HÓA HỌC......................................................75
3.1. CÁC BÀI TOÁN LIÊN QUAN ĐẾN PHƯƠNG TRÌNH ĐẠI SỐ PHI TUYẾN...............75
3.1.1. Phương pháp số giải phương trình đại số phi tuyến.........................................................75
3.1.2. Sử dụng “Goal Seek” tìm nghiệm phương trình đại số phi tuyến....................................77
3.2.3. Thể tích mol và hệ số chịu nén nhờ phương trình trạng thái...........................................78
3.1.4. Vận tốc giới hạn của bi cầu rơi vào trong chất lỏng..........................................................79
3.2. CÁC BÀI TOÁN LIÊN QUAN ĐẾN HỆ PHƯƠNG TRÌNH ĐẠI SỐ...............................80
3.2.1. Phương pháp số giải hệ phương trình đại số.....................................................................80
3.2.2. Sử dụng “Solver” của Excel để giải hệ phương trình đại số.............................................84
3.2.3. Cân bằng vật chất trong hệ thống phân tách ở chế độ ổn định........................................89
3.2.4. Cân bằng hóa học trong hệ đa cấu tử.................................................................................90
3.3. CÁC BÀI TOÁN LIÊN QUAN ĐẾN HỆ PHƯƠNG TRÌNH VI PHÂN THƯỜNG.........91
3.3.1. Các phương pháp số giải phương trình và hệ phương trình vi phân thường.................91
3.3.2. Tính toán động học phản ứng.............................................................................................95
3.3.3. Trao đổi nhiệt trong dãy thùng trộn ở chế độ không ổn định..........................................96
3.3.4. Sự khuếch tán cùng phản ứng hóa học trong không gian một chiều...............................99
Chương 4...........................................................................................................................101
ỨNG DỤNG PHẦN MỀM DESIGN-II TRONG TÍNH TOÁN VÀ MÔ HÌNH HÓA
QUÁ TRÌNH CÔNG NGHỆ HÓA HỌC.......................................................................101
4.1. SƠ LƯỢC QUÁ TRÌNH PHÁT TRIỂN CÁC HỆ THỐNG TỰ ĐỘNG HÓA THIẾT KẾ
CÔNG NGHỆ HÓA HỌC..........................................................................................................101
4.2. GIỚI THIỆU MỘT SỐ MÔ-ĐUN CÔNG NGHỆ TRONG PHẦN MỀM DESIGN-II. .103
4.2.1. Các mô đun thiếết bị cơ bản............................................................................................103
4.2.2. Các thiếết bị phản ứng.....................................................................................................108
4.2.3. Các thiếết bị cẫn bằằng lỏng - hơi....................................................................................109
4.2.4. Các thiếết bị công nghệ phụ trợ khác............................................................................111
4.3. CƠ SỞ DỮ LIỆU TÍNH CHẤT NHIỆT ĐỘNG HỌC CÁC CHẤT................................112
4.3.1. Phân tích nhiệt động học...................................................................................................112
4.3.2. Sử dụng cơ sở dữ liệu của DESIGN-II làm sổ tay tra cứu..............................................115
4.4. CÁC BƯỚC SỬ DỤNG PHẦN MỀM DESIGN-II............................................................115
4.4.1. Khởi động DESIGN-II......................................................................................................115
4.4.2. Tạo một tài liệu mới...........................................................................................................116
4.4.3. Sắp đặt các mẫu thiết bị lên trang làm việc.....................................................................116
4.4.4. Liên kết các mô-đun thiết bị bằng dòng công nghệ và định hướng dòng công nghệ....117
4.4.5. Lựa chọn hệ đơn vị đo.......................................................................................................118
4.4.4. Lựa chọn các chất và các thông số của dòng vào.............................................................119
4.4.7. Lựa chọn phương pháp nhiệt động để tính toán tính chất các cấu tử...........................122
4.4.8. Thiết lập các thông số đầu vào của thiết bị......................................................................122
4.4.9. Xác định phương pháp hội tụ khi tính toán lặp..............................................................124
4.4.10. Lưu và thực thi tính toán................................................................................................125
4.4.11. Hiển thị giá trị các dòng lên trang làm việc...................................................................126
TÀI LIỆU THAM KHẢO...................................................................................................3
Phô lôc..............................................................................................................................4
Chương 1
PHÂN TÍCH VÀ XỬ LÝ SỐ LIỆU THỰC NGHIỆM
1.1. CÁC ĐẶC TRƯNG THỐNG KÊ CỦA TẬP SỐ LIỆU ĐO
1.1.1. Các tham số đặc trưng về sự tập trung của tập số liệu
a) Tần suất pi
Giả thiết có một tập gồm có N số liệu kết quả đo, trong đó có ni giá trị
Xi (Xi xuất hiện ni lần) ni gọi là tần số của giá trị Xi, khi đó, tần suất của giá
trị Xi được tính như sau:
n
pi i
N;
0 < pi < 1
(1.1)
Khi N thì pi Pi (Pi là xác suất, xuất hiện giá trị Xi).
Để tìm tần số của từng giá trị khác nhau trong dãy số liệu, có thể sử dụng
hàm FREQUENCY (data_array, bins_array). Trong đó, data_array là địa chỉ
mảng dữ liệu; bins_array là địa chỉ mảng các giá trị khác nhau của dữ liệu.
Ví dụ 1: Cho một tập số liệu kết quả đo:
33
32
30
31
22
29
32
24
34
33
33
25
34
26
29
35
33
34
Tìm tần suất và tần suất dồn của từng giá trị?
Giải:
N = 18.
Dãy các giá trị của tập số liệu đo được sắp xếp lại theo thứ tự tăng dần
và tính tần suất, tần suất dồn theo bảng sau:
Tần số
Tần suất
Tần suất dồn
Xi
Giá trị
ni
pi
pi
Giá trị TB ni
22
1
22.00
0.056
0.056
24
1
23.00
0.056
0.111
25
1
23.67
0.056
0.167
26
1
24.25
0.056
0.222
29
2
25.83
0.111
0.333
30
1
26.43
0.056
0.389
31
1
27.00
0.056
0.444
32
2
28.00
0.111
0.556
33
4
29.43
0.222
0.778
34
3
30.24
0.167
0.944
35
1
30.50
0.056
1.000
Vẽ biểu đồ tần suất
- Chọn menu: Insert/ Chart…/ Line/ Next;
- Nhập vào Data Range : $E$2:$E$12 và chọn mục Column
- Chọn Tab Series , nhập địa chỉ cột giá trị: $F$3:$F$8 vào Category (X)
axis labels;
- Chọn Next, Finish
0.250
0.200
0.150
0.100
0.050
0.000
22
24
25
26
29
30
31
32
33
34
35
b) Số trội Mo
Sổ trội là số có tần suất lớn nhất trong tập số liệu kết quả đo. Hàm Excel
tính số trội: MODE (number1, number2, ...).
Số trội của tập số liệu trong ví dụ 1: Mo = 33 (pi = 4).
c) Số trung vị
Số trung vị Med là số đứng giữa tập sổ liệu đã được sắp xếp theo thứ
tự từ bé đến lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu.
Giả sử X1, X2, X3, XN là dãy các giá trị của tập số liệu kết quả đo, được
sắp xếp theo thứ tự tăng dần, thì:
- Số trung vị của tập N số lẻ được tính theo công thức sau:
Med = X(N+1)/2
- Số trung vị của tập N số chẵn được tính theo công thức sau:
1
Med X N /2 X N /21
2
Hàm Excel tính trung vị: MEDIAN (number1, number2, ...).
1
1
Med X N /2 X N /21 32 32 32
2
2
Trong ví dụ 1, số trung vị:
d) Trung bình cộng
Gọi X là giá trị trung bình cộng của một tập số liệu không phân nhóm
thì X được tính theo công thức sau:
1 N
X Xi
N i 1
(1.2)
Hàm Excel tính trung bình cộng: AVERAGE (number1, number2, ...).
Trong ví dụ 1, số trung bình cộng:
1 N
1
X X i 22 24 ... 35 30,5
N i 1
18
e) Trung bình nhân
GMx N X 1 X 1... X N
(1.3)
Giá trị trung bình nhân thường dùng để tính tốc độ tăng trung bình, sự
pha loãng v.v...
Hàm Excel tính trung bình nhân: GEOMEAN (number1, number2, ...).
f) Trung bình điều hòa
1
HMx N
1
1
N i 1 X i
(1.4)
Trung bình điều hòa thường dùng để tính vận tốc, thời gian trung bình.
Hàm Excel tính trung bình điều hòa: HARMEAN (number1, number2, ...).
g) Trung bình gia quyền (có trọng số)
N X N B X B ... N k X k
Xh A A
N A N B ... N k
(1.5)
Trong đó NA, NB, v.v... là các trọng số tương ứng của từng tập số liệu; X A ,
X B , v.v... là giá trị trung bình của từng tập số liệu.
Trung bình gia quyền thường được dùng để tính trung bình của hệ gồm
nhiều tập số liệu hoặc tập số liệu có trọng số.
1.1.2. Các tham số đặc trưng về sự phân tán của tập số liệu
a) Phương sai (2 hay S2)
Phương sai là trung bình của tổng bình phương sai khác giữa các giá trị
của tập số liệu so với giả trị trung bình của tập số liệu kết quả đo:
2
1 N
2
S ' Xi - X
N i 1
(1.6)
Với N’ = N khi N > 30 (phương sai ký hiệu là 2); N’ = N - 1 khi N < 30
(phương sai ký hiệu là S2); N’ – bậc tự do của tập số liệu đo.
Công thức thực dụng để tìm phương sai:
2
N
X i
1 N 2 i 1
2
S ' Xi
N i 1
N
(1.7)
Phương sai đặc trưng cho sự sai biệt của các số liệu trong kết quả đo.
Phương sai càng lớn, sai biệt càng lớn. Ngược lại phương sai càng nhỏ thì sai
biệt càng nhỏ.
Phương sai còn biểu diễn độ phân tán của tập sổ liệu kết quả đo đối với
giá trị trung bình. Phương sai càng lớn độ phân tán xung quanh giá trị trung
bình càng lớn và ngược lại.
Hàm Excel tính phương sai: VAR(number1, number2, ...).
Trong ví dụ 1, giá trị phương sai:
S2
2
1 N
1 N
2
2
Xi - X
22 - 30,5 35 - 30,5 15, 088
N - 1 i 1
18 - 1 i 1
b) Độ lệch chuẩn (f hay Sf)
Độ lệch chuẩn của một tập số liệu kết quả đo là giá trị căn bậc 2 trị sổ
phương sai của nó:
f 2
Sf S2
hay
(1.8)
Độ lệch chuẩn có cùng thứ nguyên và cũng có ý nghĩa như phương sai.
Trong thực tế, người ta hay tính độ lệch chuẩn theo công thức sau đây:
S
X
i
- X
N
2
d
2
N
(1.9)
Hàm Excel tính độ lệch chuẩn: STDEV(number1, number2, ...).
S f S 2 15, 088 3,9
Trong ví dụ 1, giá trị độ lệch chuẩn:
S
c) Độ sai chuẩn ( X hay X )
S
X f
SX f
N
N
hay
(1.10)
Độ sai chuẩn có thể hiểu là trung bình phân tán của các giá trị kết quả đo.
3,9
SX
0,919
18
Trong ví dụ 1, giá trị độ sai chuẩn:
d) Hệ số biến thiên
Hệ số biến thiên là tỷ số giữa độ lệch chuẩn với giá trị trung bình:
CV
Sf
X
100
(1.11)
Vì hệ số biến thiên không có thứ nguyên, cho nên có thể dựa vào hệ số
biến thiên để so sánh gần đúng độ sai biệt của các kết quả đo nhận được bằng
các cách khác nhau.
Khi độ lệch chuẩn lớn (Sf) (tức sai biệt của các số liệu đo lớn), thì CV lớn
và ngược lại.
ví dụ 1, hệ số biến thiên:
CV
Sf
X
100
3,9
100 12, 7%
30, 5
Trong
Bài tập
Kết quả xác định hàm lượng (%) P2O5 trong hệ (NH 4)2HPO4-K2CO3H2O bằng phương pháp so màu được cho trong bảng dưới đây:
Số thí
Số mẫu
1
2
3
4
5
6
7
8
nghiệ
m
1
27.9
19,3
4,5
22,3
10,8
16,3
8,8
12,6
2
27.2
19,7
5,2
23,5
8,9
15,8
8,7
13,5
3
26.8
4,8
21,7
17,2
9,2
13,3
Tính độ lệch chuẩn cho toàn bộ phép đo. Biết rằng phương sai cho 8
mẫu đo bằng được tính theo công thức:
8
2
tb
S
S
2
j
fj
j 1
8
f
j
, trong đó fj – bậc tự do của mỗi mẫu.
Đáp số: SX = 0,654.
1.1.3. Các đặc trưng phân phối thống kê của tập số liệu
Đặc trung phân phối thống kê của một tập số liệu kết quả đo là quy
luật phân bố ngẫu nhiên của các giá trị kêt quả đo trên trục số thực. Đặc
trưng phân phối thống kê là quy luật, nên về mặt toán học nó thường được
biểu diễn bằng một hàm số và có đồ thị tương ứng.
Mỗi tập số liệu kết quả nghiên cứu là một tập số ngẫu nhiên (thường là
rời rạc) có những đặc trưng phân phối thống kê riêng. Dưới đây trình bày các
quy luật phân phối thống kê ngẫu nhiên phổ biến nhất.
a) Phân phối chuẩn Gauss
j 1
1
Y X
e
2
X - 2
2
2
2
u
1
Y u
e 2
2
hay
(1.12)
Trong đó: X là biến số ngẫu nhiên; là hằng số, bằng giá trị kỳ vọng
của biến ngẫu nhiên; là hằng số, bằng giá trị phương sai của biến ngẫu
nhiên;
u
X-
.
Hàm phân phối chuẩn có đặc diểm là: X Mo Med .
Đồ thị hàm phân phối chuẩn có dạng như hình 1.1. Diện tích nằm dưới
đường cong phân phối chuẩn chính là tần suất dồn của các giá trị nằm trong
vùng lấy tích phân. Diện tích này cũng biểu diễn xác suất xuất hiện của các
giá trị X, nằm trong vùng lấy tích phân.
Hình 1.1. Đồ thị phân phối chuẩn Gauss
Xác suất thống kê gắn liền với khái niệm độ tin cậy thống kê (P). Diện
tích giới hạn bởi đường cong cũng chính là độ tin cậy thống kê để xuất hiện
Xi trong khoảng tích phân. Kí hiệu độ tin cậy thống kê để xuất hiện giá trị Xi
nằm trong vùng (- , Xi) là P(Xi). Độ tin cậy thống kê luôn là một số nhỏ hơn
hoặc bằng 1 tức là P(Xi) < 1.
Nếu kí hiệu là độ không tin cậy thống kê, thì:
P + = 1 hay P = 1 - hoặc = 1 – P.
Trong xác suất, người ta qui ước:
Biến cố có P = 0,9999 là biến cố hoàn toàn chắc chắn.
Biến cố có P = 0,999 là biến cố hết sức chắc chắn.
Biến cố có P = 0,99 là biến cố rất chắc chắn.
Biến cố có P = 0,95 là biến cố chắc chắn.
Biến cố có P = 0,90 là biến cố có chiều hướng chắc chắn.
Từ hàm phân phổi chuẩn, khi cho một giá trị ui(X) thì ta tính được độ tin
cậy thống kê Pi, ứng với một diện tích Pi. Ngược lại, khi cho giá trị Pi thì có
thể tính được một giá trị ui(X). Thay cho tính toán, người ta lập sẵn những
bảng số để tra giá trị u khi biết giá trị P hoặc ngược lại.
Hàm Excel trả về giá trị hàm phân phối chuẩn: NORMDIST(x, mean,
standard_dev, cumulative).
b) Phân phối Student
Hàm phân phối Student có dạng:
2
t
y t , f B 1
f
-
f 1
2
tf
X-
Sx
tf
Xi - X
Sf
;
hoặc
(1.13)
Trong đó: t là một biến ngẫu nhiên; f là bậc tự do (f = N - 1); B là hằng số.
Khi X là số có tần suất rất lớn thì có thể coi X i X . Đồ thị của hàm
i
Student giống như hàm phân phối chuẩn. Tuy nhiên, độ nhọn của đồ thị hàm
phân phối Student phụ thuộc vào bậc tự do.
Hình 1.2. Đồ thị phân phối Student
Bậc tự do càng lớn thì độ nhọn càng nhỏ và ngược lại. Do độ nhọn phụ
thuộc vào bậc tự do, nên giá trị chuẩn t cũng phụ thuộc vào bậc tự do. Trong
thực tế, người ta nhận thấy:
N > 30: tuân theo phân phối chuẩn.
N < 30: tuân theo phân phối Student.
Đối với phân phổi Student cũng có bảng tra chuẩn Student tính sẵn. Dựa
vào bảng này, khi biết hai trong ba giá trị t, f và P thì xác định được giá trị
còn chưa biết.
c) Phân phối Khi bình phương
Hàm phân phối Khi bình phương có dạng:
Y , f Ce
2
2
2
2
f-2
2
(1.35)
2
N
X - X
2 i
i 1
f
Với:
Khi lấy các giá trị: 0 < < +
(1.36)
Hàm Khi bình phương chỉ phụ thuộc vào 1 bậc tự do. Đồ thị của hàm
phân phối Khi bình phương có dạng:
Nếu cho trước độ tin cậy thống kê P và giá trị f, tra bảng sẽ tìm được giá
trị và ngược lại.
d) Phân phối Fisher
Hàm số của phân phối Fisher có dạng:
2
Y F , f1 , f 2 A
F
f1 - 2
2
f 2 - f1
f1 f 2
2
(1.14)
Trong đó: F là biến số ngẫu nhiên; f1, f2 là các bậc tự do; A là hằng số phụ
thuộc f1 và f2. F phụ thuộc vào hai loại bậc tự do và được tính theo công thức
sau:
F
2
1
2
2
2
f1
S
2
S
f2
Đồ thị của hàm Fisher có dạng
với 0 F +
(1.34)
Tùy thuộc vào bậc tự do mà đồ thị có các dạng khác nhau. Hàm phân
phối Fisher cũng có các tính chất như các hàm phân phôi khác. Diện tích giới
hạn bởi đường cong cũng biêu diễn độ tin cậy thống kê.
Người ta cũng lập các bảng tra sẵn, khi cho (P, f 1 và f2 ) sẽ tra được giá
trị của chuẩn F, ngược lại cho 3 trong 4 thông số ( F, P, f 1,f2 ) sẽ tra được số
thứ 4 chưa biết. Có 2 loại bảng số chính để tra chuẩn F: Bảng F(0.95, f 1, f2 )
và bảng F(0.99, f1, f2 ).
e) Phân phối Poisson
- Hàm số cùa phân phối Poisson có dạng:
X e-
Y X
X!
với
Tức là kỳ vọng và phương sai bằng nhau. X là số tự nhiên.
(1.14)
Hình 1.3. Đồ thị hàm phân phối Poisson
Cần phân biệt khái niệm hàm phân phối và chuẩn phân phối (chuẩn
thống kê):
-Hàm phân phối là qui luật phân bổ số liệu kết quả đo có tính ngẫu
nhiên (các biến ngẫu nhiên).
-Chuẩn phân phối là những giá trị của hàm phân phối tính được theo
điều kiện cho trước.
Như vậy chuẩn phân phối có 2 dạng:
+ Giá trị tra bảng;
+ Giá trị tính được.
Người ta so sánh giữa giá trị tra bảng và giá trị tính được để đánh giá độ tin
cậy thống kê của một sự kiện theo điều kiện cho trước (theo giá trị tra bảng).
Ta có nhận xét, một tập số liệu kết quả thực nghiệm phụ thuộc vào
bậc tự do:
+ 1 bậc tự do thì tuân theo hàm Student;
+ Không phụ thuộc vào bậc tự do thì tuân theo hàm Gauss hoặc Poisson.
Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập
số liệu kết quả đo như sau:
Nếu N > 30 và có 1 trong 3 tính chất sau thì tập số liệu kết quả đo có
qui luật phân phối chuẩn Gauss:
1) Đồ thị phân phối tần suất có dạng chuông;
2) Mo = Med = X;
3) Xi nhận các giá trị ở ngoài khoảng X ± 2 là 5% hoặc Xi nhận các
giá trị nằm trong khoảng X ± 2 là 95%.
Nếu N < 30 và có 1 trong 3 tính chất trên thì tập số liệu kết quả đo có
qui luật phân phối Student.
1.2. ĐÁNH GIÁ TẬP SÓ LIỆU KỂT QUẢ ĐO
Một tập số liệu kết quả đo có thể được phân tích đánh giá thông qua
các đại lượng chính sau đây.
1.2.1. Sai số đo
Có 4 loại sai số đo:
- Sai số tuyệt đối:
A X i - X X i -
(1.15
Sai số tuyệt đổi là sự sai khác của một giá trị đo nào đó với giá trị trung bình
(hoặc giá trị thật). Sai khác này có thể là âm hoặc dương.
- Sai số tương đối:
X - X
X -
R i
100 i
100
X
X
(1.16)
Sai số tương đối là tỷ số của sai số tuyệt đối đối với giá trị trung bình.
Sai số này không có thử nguyên cho nên được dùng để so sánh sai sổ tương
đối của các phương pháp đo cho kết quả không cùng thứ nguyên.
- Sai số hệ thống:
X X - 0
(1.17)
Nếu hiệu số này đáng tin cậy thì số đo đã mắc sai số hệ thống, Khi đó
giá tri Xi tập trung về một phía của giá trị thực trên trục số. Có thể tìm được
nguyên nhân gây sai số hệ thống để loại bỏ.
- Sai số ngẫu nhiên:
X X - 0
(1.18)
Phép đo mắc sai số ngẫu nhiên khi hiệu số giữa giá trị trung bỉnh cộng
X với giá trị thật gần bằng không. Khi đó các giá trị Xi phân bổ đều hai phía
của giá trị thực trên trục số. Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ
có thể tìm các giải pháp để giảm sai số ngẫu nhiên.
1.2.2. Độ chính xác của tập số liệu kết quả đo
Vì trung bình cộng biểu diễn độ tập trung của các giá trị thực nghiệm
nên độ chính xác (Accuracy) của tập sổ liệu kết quả đo được đánh giá thông
qua giá trị trung bình cộng. Giá trị trung bình cộng mà sai khác với giá trị
thật càng nhỏ thì độ chính xác của số đo càng lớn và ngược lại.
Nguyên nhân dẫn đến độ chính xác kém có thể là:
- Chọn mẫu không đúng về chất lượng và số lượng;
- Giải pháp đo số liệu không chính xác.
1.2.3. Độ sai biệt của tập số liệu kết quả đo
Vì phương sai biểu diễn độ sai biệt trung bình (Precision) của các giá
trị trong tập số liệu kết quả đo so với giá trị trung bình nên phương sai càng
nhỏ thì độ sai biệt càng nhỏ và ngược lại.
Nguyên nhân chính dẫn đến độ sai biệt lớn:
- Chọn mẫu có chất lượng, số lượng không đặc trưng cho mục tiêu đo;
- Tay nghề người đo kém, không thu thập được số đo.
Thực ra giá trị trung bình cộng X cũng phản ánh phần nào độ sai biệt
khi so với giá trị thật và ngược lại giá trị phương sai S2 cũng phản ánh phần
nào độ chính xác khi độ sai biệt nhỏ. Tuy nhiên mỗi đại lượng có tính trội
biểu diễn cho độ chính xác và độ sai biệt khác nhau: X có tính trội phản ánh
độ chính xác, S2 có tính trội phản ánh độ sai biệt:
Hình 1.4. Minh họa tính trội của độ chính xác và độ sai biệt
Độ sai biệt
Rất nhỏ
Lớn
Nhỏ
Độ chính xác Rất tốt
Tốt
Kém
Kết luận
Đúng-Tốt
Sai số ngẫu nhiên
Sai số hệ thống
1.2.4. Sai số tối đa cho phép
Sai số tối đa cho phép P(X) của một tập số liệu kết quả đo được qui
định: cho phép lấy các giá trị Xi sai khác với giá trị trung bình X lớn nhất là
±3. Sai số tối đa cho phép chia làm hai loại:
+ Sai số tối đa cho phép tuyệt đối:
P(X) = ±3
(1.19)
P X 3
100
X
X
+ Sai số tối đa cho phép tương đối:
(1.20)
Sai số tối đa tương đối cho phép được biểu diễn dưới dạng phần trăm
(%) do đó không còn thứ nguyên, dùng để so sánh sai số tối đa cho phép
tương đối của phương pháp đo này với sai số tối đa cho phép tương đối của
phương pháp đo khác. Những giá trị kết quả đo nào nằm ngoài khoảng sai số
tối đa cho phép tuyệt đối thì phải loại bỏ (các giá trị đó đã mắc sai số thô).
1.2.5. Khoảng chính xác tin cậy
Khoảng chính xác tin cậy được tính theo công thức sau:
X P, f X - t P, f S X
(1.21)
Trong đó: P là độ tin cậy thống kê; f là bậc tự do cùa tập số liệu kết quả đo;
S X là độ sai chuẩn.
Khoảng chính xác tin cậy của một tập sổ liệu kết quả đo chính là
khoảng sai khác giữa giá trị trung bình với giá trị có một độ tin cậy thống kê
cho trước. Như vậy khoảng chính xác tin cậy của 1 tập số liệu kết quả đo
phụ thuộc vào độ tin cậy thống kê (P) và bậc tự do (f).
Khoảng chính xác tin cậy của mỗi giá trị kết quả đo được tính như sau:
X P, f X i - X t P, f S f
(1.22)
Trong đó: t(P, f) là giá trị tra ở bảng phân vị cùa hàm phân phối Student.
Khi một tập số liệu kết quả đo có khoảng chính xác tin cậy không thoả
mãn với độ tin cậy thống kê (P) cho trước thì có thể tăng thêm số mẫu đo
(N). Số mẫu đo cần thiết để có khoảng chính xác tin cậy trùng với khoảng
chính xác tin cậy lý thuyết cho trước, được tính theo công thức sau:
t P, f S f
N
X
2
Trong đó: X là giá trị cho trước.
1.2.6. Khoảng giới hạn tin cậy của một tập số liệu kết quả đo
(1.23)
Khoảng giới hạn tin cậy của một tập số liệu kết quả đo được qui định
nằm trong khoảng:
X X P, f X t P, f S X
(1.24)
Giá trị Xi bất kỳ của một tập sổ liệu kết quả đo được chấp nhận theo độ
tin cậy thống kê p cho trước, có bậc tự do f = N - l phải luôn nằm trong
khoảng giới hạn tin cậy.
Trong ví dụ 1, khoảng giới hạn tin cậy được tính như sau:
Với độ tin cậy 95%:
t p, f t 0.95,18 - 1 t 0.95,17 2,11
Tra bảng phân vị Student:
95%CL X t P, f S X X t P, f
Sf
3,884
30,5 2,11
30,5 1,93
N
18
Hay 28,57 X i 32, 43
Với độ tin cậy 99%:
t p, f t 0.95,18 - 1 t 0.95,17 2,898
Tra bảng phân vị Student:
95%CL X t P, f S X X t P, f
Sf
3,884
30,5 2,898
30,5 2, 65
N
18
Hay 27,85 X i 33,15
Như vậy, rõ ràng yêu cầu độ tin cậy càng cao thì khoảng giá trị tin cậy
sẽ càng rộng.
Ngoài cách sử dụng các hàm của Excel, chúng ta còn có thể sử dụng
chúng ta còn có thể sử dụng công cụ Data Analysis để tính đặc trưng thống
kê số liệu như sau:
- Nhập dữ liệu trong cột A1:A12;
- Chọn menu Data/Data Analysis…/Descriptive Statistics;
- Nhập các mục:
Input Range: địa chỉ tuyệt đối chứa dữ liệu $A$1:$A$12
Output Range: địa chỉ xuất kết quả
Confidence Level for Mean (Độ tin cậy cho trung bình).
Kết quả bao gồm: Kỳ vọng (trung bình), phương sai, trung vị, mode, độ
lệch chuẩn, độ nhọn, độ nghiêng (hệ số bất đối xứng so với phân phối chuẩn),
khoảng biến thiên, max, min, sum, số mẫu (count), khoảng tin cậy của trung
bình ở mức 95% .
Sau đây là kết quả tính các đặc trưng thống kê của ví dụ 1 khi sử dụng
các hàm của Excel và sử dụng Data Analysis
Chú ý: khi số mẫu n > 30, ta sẽ sử dụng hàm CONFIDENCE.NORM
thay cho hàm CONFIDENCE.T (sử dụng chuẩn phân bố Gauss thay vì phân
bố Student).
Bài tập 1
Giá trị nhiệt độ trung bình của lò nung xác định được qua 4 lần đo độc
lập bằng hỏa quang kế là 2250 oC với độ lệch chuẩn Sf = 10 oC. Xác định
khoảng tin cậy của nhiệt độ lò nung với độ tin cậy 95%?
Đáp số: 2240,2 T 2259,8
Bài tập 2
Tạp chất độc hại có trong các muối photphat dùng làm thực phẩm là flo.
Dưới đây là kết quả phân tích hàm lượng flo trong sản phẩm thương mại
(%): 0,18; 1,12; 0,13; 0,15. Hãy xác định giới hạn trên của hàm lượng flo
trong sản phẩm này với độ tin cậy 95%.
Đáp số: F(%) < 0,19.
1.3. SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU
KẾT QUẢ ĐO
1.3.1. So sánh 2 trung bình với phương sai đã biếết hay mẫẫu l ớn (N >
30)
Dùng menu: Tools/ Data Analysis… / z-test:Two Sample for Means
z
X1 - X 2
12 22
N1 N 2
Tiêu chuẩn kiểm định:
Phân vị 2 phía z/2 là: z Critical two-tail
Nếu
z z /2
z z
thì bác bỏ H0 , chấp nhận H1 (trung bình hai mẫu khác nhau)
/2
Nếu
thì chấp nhận H0 , bác bỏ H1 (trung bình hai mẫu như nhau)
Ví dụ:
Người ta chọn 2 mẫu, mỗi mẫu 10 máy lấy từ hai lô (I và II được sản
xuất với phương sai biết trước tương ứng là 1 và 0,98) để khảo sát thời gian
hoàn thành công việc theo phút của chúng:
I
6 8 9 10 6 15 9 7 13 11
II
5 5 4 3
9 9 6 13 17 12
Hỏi khả năng hoàn thành công việc của hai máy có khác nhau hay không?
với = 0,05.
Nhập và xử lý dữ liệu
- Variable 1 Range , Variable 2 Range: địa chỉ tuyệt đối của vùng dữ
liệu của I, II
- Variable 1 Variance (known), Variable 2 Variance (known):
phương sai của I, II
- Labels: chọn khi có tên biến ở đầu cột hoặc hàng
- Alpha: mức ý nghĩa .
- Output options: chọn cách xuất kết quả
Kết quả
z z
/2
Do
nên trung bình hai mẫu không bằng nhau, nói một cách khác
là khả năng làm việc của hai lô máy này khác nhau (lô I lớn hơn lô II).
1.3.2. So sánh 2 trung bình với dữ liệu từng cặp
Được dùng khi mẩu bé, phụ thuộc, phương sai 2 mẫu không bằng nhau
và mỗi phần tử khảo sát có 2 chỉ tiêu X (trước), Y (sau) khi thay đổi điều
kiện thí nghiệm.
Dùng menu: Tools/Data Analysis…/ t-test:Paired Two Sample for
Means
N
N
t
D
SD N ;
X
D i 1
Tiêu chuẩn kiểm định:
Phân vị 2 phía t/2 là: t Critical two-tail
Nếu
t t /2
i
N
- Yi
D - D
2
i
;
SD
i 1
N-1
thì bác bỏ H0 , chấp nhận H1 (trung bình hai mẫu khác nhau)
- Xem thêm -