Tài liệu Bài tập lớn XSTK Bách Khoa HCM
MỤC LỤC
Bài 1A: …...........................................................................................................2
1. Đề bài: ............................................................................................................2
2. Dạng bài:.........................................................................................................2
3. Cơ sở lý thuyết: ..............................................................................................2
4. Giải bài toán bằng phần mềm IBM SPSS: .....................................................4
Bài 1B: ...............................................................................................................8
1. Đề bài: ............................................................................................................8
2. Dạng bài:……………………………………………….................................8
3.Cơ sở lý thuyết:................................................................................................8
4. Giải bài toán bằng phần mềm IBM SPSS: ...................................................10
Bài 2:.................................................................................................................18
1. Đề bài: ..........................................................................................................18
2. Dạng bài .......................................................................................................18
3. Cơ sở lí thuyết:..............................................................................................18
4. Giải bài toán bằng phần mềm MS EXCEL: .................................................20
5. Giải bài toán bằng phần mềm IBM SPSS: ...................................................24
Bài 3:.................................................................................................................27
1. Đề bài: ..........................................................................................................27
2. Dạng bài:.......................................................................................................27
3. Cơ sở lý thuyết: ............................................................................................27
4. Giải bài toán bằng phần mềm IBM SPSS: ...................................................29
Bài 4: ................................................................................................................32
1. Đề bài: ..........................................................................................................32
2. Dạng bài:.......................................................................................................32
3. Cơ sở lý thuyết: ............................................................................................32
4. Giải bài toán bằng phần mềm IBM SPSS:....................................................35
BÀI 5: ...............................................................................................................40
1. Đề bài: ..........................................................................................................40
2. Dạng bài:.......................................................................................................40
3. Cơ sở lý thuyết: ............................................................................................40
4. Giải bài toán bằng phần mềm MS EXCEL: .................................................41
5. Giải bài toán bằng phần mềm IBM SPSS: ...................................................44
TÀI LIỆU THAM KHẢO.................................................................................55
1
Bài 1A: (Vd 10 trang 172 SGK XSTK)
1. Đề bài:
Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo
ba yếu tố: pH (A) nhiệt độ (B) và chất xúc tác (C) được trình bày trong
bảng sau:
Yếu tố B
Yếu
tố A
B1
B2
C2
C3
C4
C1
B3
B4
C1
9
14
C3
16
C4
A1
C2
12
15
C4
12
C1
A2
C3
13
14
C1
11
C2
A3
C4
10
11
C2
13
C3
A4
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ?
12
10
14
13
2. Dạng bài: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ.
3. Cơ sở lý thuyết:
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố
trên các giá trị quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2...r: yếu tố B: k =
1, 2...r: yếu tố C).
Mô hình:
Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người
ta dùng mô hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4:
B
C
D
A
C
D
A
B
D
A
B
C
A
B
C
D
Mô hình vuông la tinh ba yếu tố được trình bày như sau:
Yếu tố
A
Yếu tố B
A2
A3
C3
Y313
C4
Y324
C1
Y331
C2
Y342 T3..
A4
T.i.
C4
Y414
C1
Y421
C2
Y432
C3
Y443 T4..
A1
T.1.
B2
C2 Y122
C3 Y223
T.2.
2
B3
C3 Y133
C4 Y234
Ti..
B4
C4 Y144 T1..
C1 Y241 T2..
B1
C1 Y111
C2 Y212
T.3.
T.4.
Bảng ANOVA:
Nguồn sai
số
Tổng số bình
phương
Bậc tự do
Bình phương
trung bình
Giá trị
thống kê
𝑟
(r-1)
Yếu tố A
𝑇2𝑖.. 𝑇2..
− 2
𝑟
𝑟
𝑖=1
𝑆𝑆𝑅 = ∑
(Hàng)
𝑀𝑆𝑅 =
𝑆𝑆𝑅
𝑟−1
𝑀𝑆𝐶 =
𝑆𝑆𝐶
𝑟−1
𝑟
Yếu tố B
(r-1)
𝑇2𝑗.. 𝑇2..
𝑆𝑆𝑅 = ∑
− 2
𝑟
𝑟
𝑗=1
(Cột)
𝑟
Yếu tố C
(r-1)
𝑆𝑆𝑅 = ∑
𝑘=1
Sai số
(r-1)(r-2)
Tổng cộng
(r2-1)
𝑇2𝑘.. 𝑇2..
− 2
𝑟
𝑟
SSE = SST –
(SSF+SSR+SSC)
𝐹=
𝑆𝑆𝐹
𝑟−1
𝐹=
𝑀𝑆𝑅
𝑀𝑆𝐸
𝐹=
𝑀𝑆𝐶
𝑀𝑆𝐸
𝐹=
𝑀𝑆𝐹
𝑀𝑆𝐸
MSE =
SSE
(r −1)(r − 2)
Trắc nghiệm
• Giả thiết:
H0: μ1 = μ2 = ...= μk ↔ Các giá trị trung bình bằng nhau
H1: μi μj
↔ Có ít nhất hai giá trị trung bình khác nhau.
• Giá trị thống k: FR, FC, F
• Biện luận:
Nếu FR< Fα[r-1,(r-1)(r-2)] → Chấp nhận H0 đối với yếu tố A. Nếu FC <
Fα[r-1,(r-1)(r-2)] → Chấp nhận H0 đối với yếu tố B. Nếu F < Fα[r-1,(r1)(r-2)] → Chấp nhận H0 đối với yếu tố C.
3
4. Giải bài toán bằng phần mềm IBM SPSS:
Bước 1: Gọi:
- H1 là giả thiết: “Trung bình hiệu suất phần trăm (%) của
các phản ứng ở các pH khác nhau là như nhau”.
- H2 là giả thiết: “Trung bình hiệu suất phần trăm (%) các
phản ứng ở các nhiệt độ khác nhau là như nhau”.
- H3 là giả thiết: “Trung bình hiệu suất phần trăm (%) của
các phản ứng với các chất xúc tác khác nhau là như nhau”.
Đối giả thiết:
̅1 “Có ít nhất hai giá trị trung bình hiệu suất (%) của các
-𝐻
phản ứng ở các pH khác nhau là khác nhau nhau”.
̅2 : “Có ít nhất hai giá trị trung bình hiệu suất (%) của các
-𝐻
phản ứng ở các Nhiệt độ khác nhau là khác nhau nhau”.
̅3 : “Có ít nhất hai giá trị trung bình hiệu suất (%) của các
-𝐻
phản ứng với các chất xúc tác khác nhau là khác nhau
nhau”.
Bước 2: Khai báo các biến dữ liệu trong cửa sổ Variable View.
Bước 3: Nhập số liệu vào cửa sổ Data View.
4
Bước 4: Chọn Analyze →General Linear Model → Univariate
Bước 5: Đưa biến Hieu_suat vào khung Dependent Variable; đưa các
biến pH, Nhiet_do và Chat_xuc_tac vào khung Fixed Factor(s).
5
Bước 6: Chọn Model→Kick chọn Custom→đưa các biến pH, Nhiet_do
và Chat_xuc_tac vào khung Model→Continue.
Bước 7: Chọn Options→ Descriptive statistic→nhập mức ý nghĩa ở ô
Significance level = 0,05→Continue.
Cuối cùng chọn OK.
6
Bước 8: Kết quả và biện luận.
- Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do
[(r – 1, (r – 1)(r – 2)]= (3;6) ta được 𝐹0.05(3; 6) = 4,76
- Bảng Test of Between-Subjects Effects cho ta kết quả
FR = FpH = 3,105
FC = FNhiet_do = 11,947
F = FChat_xuc_tac = 30,053
- Vì FR < F0,05 nên ta chấp nhận giả thiết H1 (pH)
- Vì FC > F0,05 nên ta bác bỏ giả thiết H2 (nhiệt độ)
- Vì F > F0,05 nên ta bác bỏ giả thiết H3 (chất xúc tác)
➢ Kết luận: Trung bình hiệu suất phần trăm (%) của các phản ứng
ở các pH khác nhau là như nhau. Có ít nhất hai giá trị trung bình hiệu suất
(%) của các phản ứng ở các nhiệt độ khác nhau là khác nhau nhau. Có ít
nhất hai giá trị trung bình hiệu suất (%) của các phản ứng với chất xúc tác
khác nhau là khác nhau nhau. Suy ra chỉ có nhiệt độ và chất xúc tác gây
ảnh hưởng đến hiệu suất.
7
Bài 1B: (Vd12 trang 181 SGK XSTK)
1. Đề bài:
Người ta đã dùng ba mức nhiệt độ gồm 105, 120, 135℃ kết hợp
với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một
phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình
bày trong bảng sau đây:
Thời gian (phút)
X1
15
30
60
15
30
60
15
30
60
Nhiệt độ (℃)
X2
105
105
105
120
120
120
135
135
135
Hiệu suất (%)
Y
1.87
2.02
3.28
3.05
4.07
5.54
5.03
6.45
7.26
Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan
tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện
nhiệt độ 115℃ trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
2. Dạng bài: HỒI QUY TUYẾN TÍNH ĐA THAM SỐ.
3. Cơ sở lý thuyết: Chúng ta xem xét mối liên hệ tuyến tính giữa một
biến phụ
thuộc Y và các biến độc lập Xi (i = 1, 2,...k). Đồ thị phân tán giữa các
biến là
một gợi ý cho chúng ta loại hàm số toán học thích hợp để mô tả và tóm
tắt các
dữ liệu quan sát .
Phương trình tổng quát:
Y |𝑋0,𝑋1,…,𝑋𝑘 = B0 + 𝐵1𝑋1 + 𝐵2𝑋2+. . . +𝐵𝑘𝑋𝑘
8
Bảng ANOVA:
Nguồn sai
số
Bậc tự
do
Tổng số bình
phương
k
SSR= (Y 'i − Y ' )2
n
Hồi quy
Bình phương
trung bình
_
MSR=SSR
i =1
n
Sai số
F=
MSR
MSE
_
SSE= (Yi − Y ' )2
N-k-1
Giá trị
thống kê
MSE=SSE/(N-2)
i =1
Tổng cộng
N-1
I. Giá trị thống kê:
-Giá trị R bình phương:
-Giá trị R2 được hiệu chỉnh (Adjusted R square)
R2 =
SSR
kF
=
SST (N− k − 1) + kF
Giá trị R2 được hiệu chỉnh (Adjusted R square)
R 2ii =
(N− 1) R 2 − k
k (1 − R 2 )
= R2 −
N − k −1
(N− k − 1)
( Rii2 sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ)
II. Độ lệch chuẩn:
S=
III.
IV.
SSE
(S 0,30 là khá tốt)
(N − k − 1)
Trắc nghiệm thống kê:
Đối với một phương trình hồi quy Y |𝑿 = 𝐁𝟎 + 𝐁𝐗, ý nghĩa
thống kê của các hệ số Bi (B0 hay B) được đánh giá bằng trắc
nghiệm t (phân phối Student) trong khi tính chất thích hợp của
phương trình Y |𝑿 = (𝑿) được đánh giá bằng trắc nghiệm F
(phân bố Fischer).
Trắc nghiệm t:
+ Giả thiết:
H0: βi = 0 “Các hệ số hồi quy không có ý nghĩa”
H0: βi ≠ 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa”
Bậc tự do của giá trị t: 𝛾 =N – k – 1.
+ Giá trị thống kê:
t=
Bi − i
Sn2
; Sn2 =
S2
(Xi − X )2
Phân bố Student = N – k – 1.
+ Biện luận:
Nếu t < tα (N – k – 1) chấp nhận giả thiết H0
9
V.
Trắc nghiệm F:
+ giả thiết:
H0: βi = 0 “Phương trình hồi quy không thích hợp”.
H0: βi ≠ 0 “Phương trình hồi quy thích hợp” với ít nhất vài Bi.
+ Giá trị thống kê:
F=
MSR
MSE
Phân bố Fischer v1 = k, v2 = N – k –1.
+ Biện luận:
Nếu F < Fα (k, N – k –1) chấp nhận giả thiết H0
4. Giải bài toán bằng phần mềm IBM SPSS:
• Bước 1: Gọi Ho là giả thiết: “Phương trình hồi quy không thích hợp”
Đối giả thiết H̅0: “Phương trình hồi quy thích hợp”
5.
• Bước 2: Khai báo các biến dữ liệu trong cửa sổ Variable View.
• Bước 3: Nhập số liệu vào cửa sổ Data View.
10
• Bước 4: Chọn Analyze →Regression →Linear Regression.
• Bước 5: Hộp thoại Linear Regression hiện lên, ta đưa biến phụ thuộc Y
vào ô Dependent, biến độc lập X1, X2 vào ô Independent(s).
• Bước 6: Chọn Statistics→kick chọn R squared chage và
Descriptives...→Continue.
Với mức ý nghĩa mặc định là 0,05 chọn OK.
11
• Bước 7: Vẽ đồ thị: trong cửa sổ Output chọn Graphs →Legacy Dialogs
→Scatter/Dot... →Simple Scatter →Define
• Bước 8: Chọn hai biến tương ứng hai trục X, Y →OK
12
• Bước 9: Kết quả và biện luận.
❖ Phương trình hồi quy: Y |𝑿𝟏 = (𝑿𝟏)
13
Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số :
B0 = 2,73; B1 = 0,04
Suy ra phương trình hồi quy:
Y |𝑋1 = 2,73 + 0,04𝑋1
(R2 = 0,102; S = 1,8112)
Dò bảng phân phối Fischer ở mức ý nghĩa 5%
với bậc tự do (1; N-k-1) = (1; 7) ( N=9 và k=1 là số biến độc lập), ta được
F0.05(1;7) = 5,59
Dò bảng phân phối Student ở mức ý nghĩa 5%
với bậc tự do (N-k-1) = 7 ( N=9 và k=1 là số biến độc lập), ta được
t0.05 = 2,365
▪ t0 = 2,129 < t0,05 = 2,365 (Hay Sig.=p-value = 0,071 > 𝛼 = 0,05)
➔ Chấp nhận giả thiết H0.
▪ t1 =1,38 < t0,05 = 2,365 (Hay Sig.=p-value = 0,21 > 𝛼 = 0,05)
➔ Chấp nhận giả thiết H0.
▪ F = 1,905 < F0,05 = 5,590 (Hay Sig.=Fs=0,21 > 𝛼 = 0,05)
➔ Chấp nhận giả thiết H0.
➢ Kết luận: Vậy các hệ số 2,37(B0); 0,04(B1) của phương trình
hồi quy Ŷ|X1 = 2,73 + 0,04X1 đều không có ý nghĩa thống kê.
Nói cách khác phương trình hồi quy này không thích hợp. Suy
ra yếu tố thời gian không có liên quan tuyến tính với hiệu suất
của phản ứng tổng hợp.
14
❖ Phương trình hồi quy: Y |𝑿𝟐 = 𝒇(𝑿𝟐)
15
Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số :
B0 = -11,14; B2 = 0,13
Suy ra phương trình hồi quy:
𝑌̂|𝑋1 = -11,14 + 0,13𝑋1
(R2 = 0,73; S = 0,9929)
Dò bảng phân phối Fischer ở mức ý nghĩa 5%
với bậc tự do (1; N-k-1) = (1; 7) ( N=9 và k=1 là số biến độc lập), ta được
F0.05(1;7) = 5,59
Dò bảng phân phối Student ở mức ý nghĩa 5%
với bậc tự do (N-k-1) = 7 ( N=9 và k=1 là số biến độc lập), ta được
t0.05 = 2,365
▪ t0 = 3,418 > t0,05 = 2,365 (Hay Sig.=p-value = 0,011 < 𝛼 = 0,05)
➔ Bác bỏ giả thiết H0.
▪ t2 =4,757 > t0,05 = 2,365 (Hay Sig.=p-value = 0,002 < 𝛼 = 0,05)
➔ Bác bỏ giả thiết H0.
▪ F = 22,631 > F0,05 = 5,590 (Hay Sig.=Fs=0,002 < 𝛼 = 0,05)
➔ Bác bỏ giả thiết H0.
➢ Kết luận: Vậy các hệ số -11,14(B0); 0,13(B2) của phương trình hồi
quy Ŷ|X1 = -11,14 + 0,13X2 đều có ý nghĩa thống kê. Nói cách khác
phương trình hồi quy này thích hợp. Suy ra yếu tố nhiệt độ có liên quan
tuyến tính với hiệu suất của phản ứng tổng hợp.
❖ Phương trình hồi quy: Y |𝑿𝟏,𝑿𝟐 = 𝒇(𝑿𝟏, 𝑿𝟐)
16
Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số :
B0 = -12,70; B1 = 0,04; B2 = 0,13
Suy ra phương trình hồi quy:
𝑌̂|𝑋1,𝑋2 = -12,70 + 0,04𝑋1 + 0,13𝑋2
(R2 = 0,97; S = 0,3297)
Dò bảng phân phối Fischer ở mức ý nghĩa 5%
với bậc tự do (k; N-k-1) = (2; 6) ( N=9 và k=2 là số biến độc lập), ta được
F0.05(2;6) = 5,14
Dò bảng phân phối Student ở mức ý nghĩa 5%
với bậc tự do (N-k-1) = 6( N=9 và k=2 là số biến độc lập), ta được
t0.05 = 2,447.
▪ t0 = 11,528 > t0,05 = 2,447 (Hay Sig.=p-value = 2,26.10-5 < 𝛼 = 0,05)
➔ Bác bỏ giả thiết H0.
▪ t1 =7,583 > t0,05 = 2,447 (Hay Sig.=p-value = 2,74.10-4 < 𝛼 = 0,05)
➔ Bác bỏ giả thiết H0.
▪ t2 =14,328 > t0,05 = 2,447 (Hay Sig.=p-value =7,233.10-6 < 𝛼 = 0,05)
➔ Bác bỏ giả thiết H0.
▪ F = 131,392 > F0,05 = 5,140 (Hay Sig.=Fs=1,1.10-5 < 𝛼 = 0,05)
➔ Bác bỏ giả thiết H0.
➢ Kết luận: Vậy các hệ số -12,70(B0); 0,04(B1); 0,13(B2) của phương
trình hồi quy Ŷ|X1,X2 = -12,70 + 0,04X1 + 0,13X2 đều có ý nghĩa thống
kê. Nói cách khác phương trình hồi quy này thích hợp. Suy ra hiệu suất
của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời
gian và nhiệt độ.
-Nếu có thì điều kiện nhiệt độ 115℃ trong vòng 50 phút thì hiệu suất
phản ứng sẽ là :
Ŷ|50,115 =-12,7 +0.04*50 + 0.13*115= 2,45%
17
Bài 2:
1. Đề bài:
Đo đường kính X và chiều cao Y của 20 cây ta thu được số liệu sau:
X
2.3
2.5
2.6
3.1
3.4
3.7
7.3
3.9
4
4.1
4.1
4.2
4.4
4.7
5.1
5.5
5.8
6.2
6.9
6.9
Y
7
8
4
4
6
6
14
12
8
5
7
8
7
9
10
13
7
11
11
16
a) Tìm đường hồi quy của Y đối với X.
b) Tính sai số tiêu chuẩn của đường hồi quy.
c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X.
2. Dạng bài: HỒI QUY TUYẾN TÍNH MỘT THAM SỐ.
3. Cơ sở lí thuyết:
Chúng ta xem xét mối liên hệ tuyến tính giữa một biến phụ thuộc Y và
một biến độc lập X. Đồ thị phân tán giữa hai biến là một gợi ý cho chúng
ta loại hàm số toán học thích hợp để mô tả và tóm tắt các dữ liệu quan sát.
Phương trình tổng quát:
18
GIÁ TRỊ THỐNG KÊ:
- Giá trị R - bình phương (R- square):
- Độ lệch chuẩn (Standard Error):
(Sự phân tán của dữ liện càng ít thì giá trị của S càng gần zero).
- Trắc nghiệm thống kê: Đối với một phương trình hồi quy
, ý nghĩa thống kê của các hệ số Bi (B0 hay B) được đánh giá bằng trắc
nghiệm t (phân phối Student) trong khi tính chất thích hợp của phương
trình
được đánh giá bằng trắc nghiệm F (phân bố Fischer).
- Trắc nghiệm t:
+ Giả thiết:
H0: βi = 0 “Hệ số hồi quy không có ý nghĩa”
H0: βi ≠ 0 “Hệ số hồi quy có ý nghĩa”
+ Giá trị thống kê:
Phân bố Student
+ Biện luận:
Nếu
-> chấp nhận giả thiết H0.
19
4. Giải bài toán bằng phần mềm MS-Excel
a) Tìm đường hồi quy:
Bước1: Nhập bảng số liệu như sau:
20
- Xem thêm -