QUY ĐỊNH CHUNG
1. VỀ HÌNH THỨC BẢN BÁO CÁO VÀ THỜI HẠN BÁO CÁO:
-
-
Mỗi nhóm SV nộp lại 1 file word qua địa chỉ email của cô:
[email protected], trước buổi báo cáo 3 ngày , và nộp 1 bản in
vào ngày báo cáo. Sau buổi báo cáo, cuốn đề tài chỉ để lưu trữ nên để tránh
lãng phí, các nhóm có thể in trên cả 2 mặt giấy A4, đóng bìa giấy, không cần
in màu, không đóng bìa mica. Sau khi nộp file lần đầu để không bị trừ điểm
thời hạn, SV vẫn có thể chỉnh sửa để hoàn thiện bài báo cáo và nộp lại lần
cuối ngay trước buổi báo cáo.
Ở trang bìa, SV cần lưu ý ghi đầy đủ danh sách SV, in đậm tên nhóm trưởng
(hoặc có đánh dấu), sắp xếp tên các thành viên theo thứ tự abc, đánh số thứ tự
trong danh sách các thành viên. Nếu nhóm có sinh viên từ các lớp khác nhau
thì cần ghi chú thêm Nhóm/Tổ của mỗi thành viên như L01; L02…
( Khi cô nhập điểm mà thấy nhóm nào trình bày bìa không đúng yêu cầu thì cô sẽ trừ bớt
0.5 đ của nhóm đó nhé).
-
-
-
Các nhóm nên nộp bài từ email cá nhân mà trường cấp để khi cần tìm kiếm sẽ
thuận lợi hơn cho cô.
Khi gửi bài vào email của cô các em sẽ nhận được 1 mail trả lời tự động, xác
nhận mail của nhóm đã đến hộp thư của cô, nên đừng đề nghị cô gửi thêm 1
mail xác nhận nữa nhé.
Nếu có vấn đề gì cần hỏi thêm thì các em nên viết thêm 1 email khác, không
nên để cùng mail nộp bài vì có thể cô chưa mở hết các mail nộp bài ngay khi
nhận được.
Thời hạn báo cáo: 2 tuần cuối cùng. Các nhóm sẽ đăng ký hoặc bốc thăm thứ
tự báo cáo vào tuần học cuối.
2. VỀ NỘI DUNG BẢN BÁO CÁO:
-
SV phải thực hiện các bài tập trong Excel, sau đó mô tả các bước thực hiện
(viết gọn thôi nhé), có copy hình ảnh các kết quả minh họa vào word.
-
Bài 1 không phải trình bày cơ sở lý thuyết. Các bài khác phải trình bày cơ sở
lý thuyết của bài (viết gọn). Lưu ý rằng một số bài khi thực hiện cần bổ sung
thêm giả thiết thích hợp về số liệu mẫu.
-
Đối với mỗi bài kiểm định, dựa vào kết quả sau khi thực hiện trên Excel, SV
cần trình bày lại theo đầy đủ các bước: Đặt các giả thiết kiểm định; các miền
bác bỏ tương ứng; các tiêu chuẩn kiểm định ( hoặc giá trị P); và kết luận.
-
Điểm cộng cho các nhóm lấy ví dụ về tập dữ liệu có nội dung liên quan rất
gần đến chuyên ngành học.
3. VỀ CÁCH CHẤM ĐIỂM:
- Điểm nội dung đề tài + nộp đúng hạn + trả lời đúng các câu hỏi liên quan
đến đề tài khi báo cáo: 7 điểm.
- Điểm thực hành : nhận dạng bài toán + thực hành bài cụ thể (tương tự
các bài trong 10 đề tài) + trả lời câu hỏi trực tiếp: 3 điểm.
Hình thức kiểm tra thực hành: Mỗi nhóm sẽ có từ 2-4 SV được gọi ngẫu
nhiên để kiểm tra thực hành. Mỗi SV sẽ bốc thăm 1 câu hỏi chứa một trong
các nội dung sau:
- Nhập trực tiếp vào Excel 1 mẫu định lượng bất kỳ, dùng chức năng Data
Analysic/ Descriptive Statistics để tìm các đặc trưng mẫu và giải thích
các số liệu thu được, vẽ đồ thị.
- Nhận dạng bài toán để chọn test phù hợp: t-test; z-test; F-test.
- Nhận dạng bài toán để chọn phân tích phương sai 1 yếu tố; 2 yếu tố;
- Kiểm định tính độc lập ( so sánh các tỷ lệ).
ĐỀ TÀI 1
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1) Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 91% (A).
4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Theo dõi doanh số bán hàng ( triệu đồng/ ngày) của một cửa hàng trong 12 ngày của
tháng 4 và 12 ngày của tháng 10, người ta thu được kết quả sau:
Ngày trong
tháng
1
Tháng 4
7,6 10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5
Tháng 10
6,3 8,8
3
5
6
8
10
13
17
20
24
27
30
9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7
Với mức ý nghĩa 3%, có thể cho rằng doanh số bán trung bình hàng ngày trong tháng 10
có giảm sút so với tháng 4 hay không? Tìm thêm giá trị P trong kiểm định.
Bài 3:
Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành:
Ngày khảo sát
Các quận nội thành
Quận 1
Quận 2
Quận 3
Quận 4
Quận 5
Thứ hai
254
236
267
223
245
Thứ ba
245
212
256
213
234
Thứ tư
236
223
245
230
232
Thứ năm
235
197
243
213
224
Thứ 6
250
210
232
215
233
Thứ 7
247
196
223
207
242
Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu
tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5 %.
Bài 4:
Ba loại vật liệu được thử sức bền dưới ảnh hưởng của việc thay đổi nhiệt độ vô cùng lớn,
chúng ta có số liệu:
Kết cục
Vật liệu 1
Vật liệu 2
Vật liệu 3
Vỡ vụn
25
45
41
Bị phá hủy một phần
40
35
33
Còn toàn vẹn
35
20
26
Hãy kiểm định xem có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi
nhiệt độ không? Sử dụng mức ý nghĩa 2%.
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 2
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 92% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Ở một nhà máy sản xuất thuốc lá, người ta kiểm tra hàm lượng nicotine trong 2 hiệu
thuốc lá sợi khác nhau và có được các kết quả như sau ( đơn vị: mg/100 g).
Hiệu A: 24; 26; 25; 27; 28; 25; 21 ; 22,5; 25; 27
Hiệu B: 27; 24; 25; 23; 26; 24.5; 26; 25.5; 27
Với mức ý nghĩa 4%, có thể coi như hàm lượng nicotine trong thuốc lá hiệu A là cao
hơn so với hiệu B hay không? Tìm thêm giá trị P trong kiểm định.
Bài 3:
Với mức ý nghĩa 1%, hãy so sánh doanh thu (triệu đồng/ngày) của một số ngành nghề ở
4 quận nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau:
Ngành nghề
Kinh doanh
Điện lạnh
Vật liệu xây
dựng
Dịch vụ tin
học
Cơ khí
Q1
2,5 ; 2,7;
2,0 ; 3,0
0,6 ; 10,4;
11,2 ; 8,3
4,2 ; 5,0;
6,2 ; 3,3
0,6 ; 10,4;
11,3 ; 8,2
Q2
3,1 ; 3,5;
2,7 ; 3,2
1,2 ; 1,0;
9,8 ; 1,8
3,2 ; 2,0;
7,8 ; 2,5
1,2 ; 1,0;
9,8 ; 1,7
Quận
Q3
2,2 ; 2,0;
9,5 ; 2,1
3,3 ; 2,3;
6,7 ; 1,9
0,4 ; 3,0;
9,8 ; 2,8
3,3 ; 2,3;
6,7 ; 1,8
Q4
11,2 ; 12,0;
19,8 ; 15,8
4,2 ; 1,0;
3,8 ; 2,5
3,1 ; 1,0;
3,6 ; 3,9
4,2 ; 1,0;
3,8 ; 2,4
Bài 4:
Quan sát 400 người về màu tóc và màu mắt, người ta được bảng số liệu sau:
Hoàn cảnh GĐ
Tình trạng
Đen
Nâu
Vàng
Nâu
Đen
12
38
65
59
121
105
Với mức ý nghĩa 0,05, có thể cho rằng màu tóc và màu mắt không có liên quan gì với
nhau hay không?
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 3
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 93% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Một giám đốc doanh nghiệp quyết định gửi 8 nhân viên của mình đi dự một lớp tập huấn
về “Dịch vụ khách hàng”. Dưới đây là phản hồi của bộ phận chăm sóc khách hàng về các
nhân viên được cử đi tập huấn.
Tên nhân
viên
Số lần phàn nàn của khách hàng
3 tháng trước tập huấn
3 tháng sau tập huấn
A
3
2
B
5
4
C
12
10
D
8
6
E
6
6
F
5
3
G
7
3
H
9
4
Hãy nhận xét hiệu quả của quyết định trên với mức ý nghĩa 5%. Tìm thêm giá trị P trong
kiểm định.
Bài 3:
Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành, số liệu lấy ở một
đại lý bán lẻ:
Ngày khảo sát
Các quận nội thành
Quận 1
Quận 2
Quận 3
Quận 4
Quận 5
Thứ hai
254; 232
236;245
267;258
223;224
245;247
Thứ ba
245;235
212;246
256;276
213;219
234;251
Thứ tư
236;255
223;264
245;275
230;244
232;254
Thứ năm
235;209
197;223
243;234
213;223
224;242
Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu
tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5%.
Bài 4:
Khảo sát ngẫu nhiên 300 sinh viên đã tốt nghiệp cùng một chuyên ngành từ 3 trường A,
B và C sau một năm ra trường, người ta có kết quả:
Trường
A
B
C
Đã đi làm
Học tiếp
Chưa có việc làm
60
55
65
12
10
6
28
35
29
Với mức ý nghĩa 3%, hãy cho biết có thể coi tình trạng việc làm của sinh viên 3 trường
trên là như nhau không?
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 4
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 94% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Hàm lượng (%) của chất C trong cùng một loại sản phẩm của 2 công ty được công bố
xấp xỉ nhau. Đo kiểm tra hàm lượng chất C có trong một số sản phẩm được chọn ngẫu
nhiên trên thị trường, người ta thu được số liệu sau:
Sản phẩm của
công ty A
Sản phẩm của
công ty B
37
38
35
40
42
34
37
39
42
35
40
38
36
43
38
41
Hãy so sánh mức độ đồng đều của hàm lượng chất C trong các sản phẩm của 2 công ty
với mức ý nghĩa 3%. Giả thiết hàm lượng này phân bố theo quy luật chuẩn.
Bài 3:
Nồng độ chì trong không khí đo được ở một số giao lộ trong thành phố được thể hiện
trong kết quả sau:
Địa điểm
Nồng độ chì ( mg/m3)
I
0,42
0,53
0,62
0,71
0,83
0,61
0,51
II
0,70
0,32
0,64
0,44
0,53
III
0,39
0,37
0,43
0,45
0.41
0,52
0.42
IV
0,35
0,45
0,54
0,56
0,6
0,62
0,32
Có thể coi nồng độ chì trong không khí ở các giao lộ là giống nhau hay không, với mức ý
nghĩa 5%? Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó.
Bài 4:
Một nông trường nuôi 3 giống bò sữa A,B,C. Lượng sữa của các con bò này được thể
hiện trong bảng theo dõi sau:
Loại bò
A
B
C
Ít
Lượng sữa
Trung bình
Nhiều
92
53
75
37
15
19
46
19
12
Với mức ý nghĩa = 0,05, hãy nhận định xem có phải 3 giống bò này thuần như nhau về
phương diện sản lượng sữa hay không?
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 5
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 95% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Theo dõi doanh số bán hàng trong mỗi ngày của 2 cửa hàng, người ta thu được kết quả
sau:
Cửa hàng
1
10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5 6,2 7,4 7,5
Cửa hàng
2
8,8
9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7 7,6
Với mức ý nghĩa 3%, có thể cho rằng doanh số bán hàng của 2 cửa hàng có sự phân tán
như nhau hay không? Giả thiết doanh số bán hàng mỗi ngày của các cửa hàng tuân theo
quy luật chuẩn.
Bài 3:
Đo mức độ bụi trong không khí tại các khu vực trong thành phố tại cùng một thời điểm,
người ta được số liệu sau, ( đơn vị mg/m3):
Số thứ tự
quan sát
Các khu vực
KV1
KV2
KV3
KV4
1
0,54
0,48
0,56
0,47
2
0,60
0,49
0,62
0,52
3
0,72
0,55
0,60
0,56
4
0,67
0,62
0,71
0,53
5
0,83
0,57
0,73
6
0,63
0,59
Mức độ nhiễm bụi của các khu vực trên có được coi là như nhau hay không? Hãy kết
luận bằng giá trị P. Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó.
Bài 4:
Bảng số liệu sau cho biết số người chết về bệnh ung thư ở 3 nước Mỹ, Nhật, Anh trong
thời gian khảo sát. Người chết được phân loại theo cơ quan bị ung thư.
Bộ phận bị ung
thư
Ruột
Ngực
Dạ dày
Bộ phận khác
Nước
Mỹ
Nhật
Anh
11
15
3
41
5
3
22
30
5
7
3
15
Với mức ý nghĩa = 1%, hãy so sánh phân bố tỉ lệ chết về ung thư của 3 nước nói
trên.
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 6
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 96% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Người ta dùng 2 loại nguyên liệu A và B để sản xuất thử đế của 10 đôi giày trẻ em, các
đôi có trọng lượng ban đầu như nhau. Sau đó người ta cho cho các em đi thử trong vòng
6 tháng với cường độ sử dụng tương tự như nhau. Sau thử nghiệm, trọng lượng đế giày
còn lại được cho trong bảng sau:
Thứ tự
Loại vật liệu
Giày trái
Giày phải
1
A
180
183
2
A
162
154
3
A
203
189
4
A
194
181
5
A
205
200
6
B
189
185
7
B
168
171
8
B
185
179
9
B
176
175
10
B
169
173
Với mức ý nghĩa 0,07 có thể cho rằng dùng loại nguyên liệu A làm đế giày bền hơn dùng
loại nguyên liệu B hay không? Tìm thêm giá trị P trong kiểm định.
Bài 3:
Doanh số bán hàng ( triệu đồng) của 4 cửa hàng trong 6 tuần đầu của mùa hè được cho
trong bảng số liệu:
Tuần
Cửa hàng 1
Cửa hàng 2
Cửa hàng 3
Cửa hàng 4
1
1430
980
1780
2300
2
2200
1400
2890
2682
3
1140
1200
1500
2000
4
880
1300
1470
1900
5
1670
1350
2380
1540
6
990
650
1930
1900
Hãy sử dụng mức ý nghĩa 5% để so sánh doanh thu của các cửa hàng có như nhau
không; và có sự liên quan giữa yếu tố doanh thu và yếu tố thời gian hay không.
Bài 4:
Trong một thí nghiệm khoa học, người ta đo độ dày của lớp mạ kền khi dùng 3 loại bể
mạ khác nhau. Sau một thời gian mạ, người ta đo được độ dày của lớp mạ nhận được ở
các bể như sau:
Độ dày lớp mạ kền
(m)
4-8
8 - 12
12 - 16
16 - 20
20 - 24
A
32
123
10
41
19
Số lần đo ở bể mạ
B
51
108
26
24
20
C
68
80
26
28
28
Hãy kiểm định giả thiết độ dày lớp mạ kền sau khoảng thời gian nói trên không phụ
thuộc loại bể mạ được dùng, với mức ý nghĩa = 0,05.
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 7
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 97% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Trong một hội thảo định hướng nghề nghiệp, một trung tâm đào tạo chọn ngẫu nhiên 36
học sinh để tham khảo ý kiến về mức độ yêu thích các ngành nghề của trung tâm trước
và sau khi học sinh tham dự hội thảo. Mức độ yêu thích được đo bằng thang đo khoảng
cách 10 điểm, trong đó 1 là hoàn toàn không thích và 10 là rất thích. Các phiếu trả lời
được thu về như sau:
Trước 3
4
5
7
8
5
6
4
3
9
3
6
Sau
5
5
6
5
8
8
5
6
7
9
4
5
Trước 1
2
4
7
6
4
5
5
4
3
7
6
Sau
4
6
7
8
7
5
3
7
8
9
7
8
Trước 5
6
7
8
2
3
6
4
3
4
3
1
Sau
8
5
7
6
5
7
7
5
5
7
2
7
Hãy dùng một kiểm định phù hợp để xem việc tham dự hội thảo có làm tăng sự yêu thích
của học sinh đối với các ngành nghề mà trung tâm đào tạo hay không, với mức ý nghĩa
2%? Tìm thêm giá trị P trong kiểm định.
Bài 3:
Với mức ý nghĩa = 2%, hãy so sánh thu nhập hàng tháng của người lao động trên cơ
sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau
sau đây, (đơn vị USD/ 1 người):
Loại ngành
nghề
1
2
3
4
V1
212
222
241
240
Nơi làm việc
V2
V3
200
230
205
222
250
245
228
230
V4
220
225
235
240
Bài 4:
Nghiên cứu sự ảnh hưởng của gia đình đối với tình trạng phạm tội của trẻ em tuổi vị
thành niên qua 148 em nhỏ, người ta thu được số liệu:
Hoàn cảnh GĐ
Tình trạng
Không phạm tội
Phạm tội
Bố hoặc mẹ
đã chết
Bố mẹ đã ly hôn
Còn cả bố mẹ
20
29
25
43
13
18
Với mức ý nghĩa 0,05, có thể coi hoàn cảnh gia đình của trẻ em độc lập với tình trạng
phạm tội của trẻ hay không?
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 8
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 98% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Điểm đánh giá của 20 người dùng thử về 2 loại sản phẩm đậu phộng trước và sau cải
tiến được thu thập trên thang điểm 10 như sau:
Trước cải tiến
7
8
6
8
7
7
7
6
8
6
Sau cải tiến
8
9
5
9
5
6
8
7
8
7
Trước cải tiến
6
9
6
4
6
7
8
5
4
3
Sau cải tiến
8
8
8
7
6
7
7
6
7
6
Hãy cho biết hiệu quả của việc cải tiến sản phẩm với mức ý nghĩa 6%. Tìm thêm giá trị P
trong kiểm định.
Bài 3:
Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái mùa (khô và mưa:
trong mỗi mùa lấy mẫu ba lần - đầu. giữa và cuối) và từ ba miền (nam. trung và bắc)
được tóm tắt như sau:
Mùa
Thời điểm
Đầu mùa
Mùa khô Giữa mùa
Cuối mùa
Đầu mùa
Mùa mưa Giữa mùa
Cuối mùa
Nam
2.4
2.3
2.5
2.4
2.5
2.7
Miền
Trung
2.1
2.2
2.3
2.2
2.1
2.3
Bắc
3.2
3.2
3.4
3.3
3.5
3.4
Hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền? Nếu có thì hai yếu
tố mùa và miền có sự tương tác với nhau hay không? Sử dụng mức ý nghĩa 2%.
Bài 4:
Bệnh đau mắt hột được chia làm 4 thời kỳ T1, T2, T3 và T4. Một kết quả kiểm tra các bệnh
nhân đau mắt hột được cho trong bảng sau:
Mức độ đau mắt hột
Địa
phương
T1
T2
T3
T4
A
B
47
53
189
746
807
1387
1768
946
C
16
228
438
115
Hãy nhận xét xem tình hình đau mắt hột ( cơ cấu phân bố 4 mức độ) ở 3 địa phương
trên có giống nhau hay không, sử dụng mức ý nghĩa 1%.
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.
ĐỀ TÀI 9
Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 96% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào
đó hay không.
Bài 2:
Hai máy cùng gia công một loại chi tiết. Để kiểm tra xem 2 máy này có củng độ chính
xác như nhau hay không, người ta lấy ngẫu nhiên từ mỗi máy 7 chi tiết, đem đo và thu
được kết quả sau (đơn vị mm):
Máy A
Máy B
137
142
138
135
135
140
140
138
138
136
137
138
139
141
Có thể cho rằng 2 máy có độ chính xác như nhau hay không, với mức ý nghĩa 2%? Giả
thiết rằng kích thước chi tiết có phân phối chuẩn.
Bài 3:
Theo giới thiệu của nhà phân phối, mức tiêu thụ nhiên liệu trung bình của 4 loại xe ô tô
là như nhau. Sau một thời gian chạy xe, người ta đo lại trên các quãng đường như nhau
thì được kết quả sau:
Loại xe
Mức tiêu thụ nhiên liệu
I
20
21,2
18,7
19,5
20,1
22
21
II
21,2
21,2
20,4
19.6
22
21,1
20
III
21,5
21,2
21
21,5
22
20,7
IV
19,9
22
21
23
21,2
20,6
21,7
21,3
Có thể coi mức tiêu thụ nhiên liệu của 4 loại xe này còn giống nhau hay không, với mức
ý nghĩa 4%? Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó.
Bài 4:
Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A,B,C,D,E. Người ta yêu cầu
những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang
sống. Kết quả được cho như sau:
Mức độ thỏa mãn
Thành phố
A
B
C
D
E
Rất thỏa
mãn
220
130
84
156
122
Tương đối
Không
121
207
54
95
164
63
75
24
43
73
Với mức ý nghĩa = 3%, Hãy kiểm định xem mức độ thỏa mãn có phân bố giống nhau ở 5
thành phố trên hay không?
Bài 5:
Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi
quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước
lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.
3) Tìm sai số chuẩn của ước lượng.