Đăng ký Đăng nhập

Tài liệu đề xstk tổng hợp

.PDF
22
467
53

Mô tả:

xác suất
QUY ĐỊNH CHUNG 1. VỀ HÌNH THỨC BẢN BÁO CÁO VÀ THỜI HẠN BÁO CÁO: - - Mỗi nhóm SV nộp lại 1 file word qua địa chỉ email của cô: [email protected], trước buổi báo cáo 3 ngày , và nộp 1 bản in vào ngày báo cáo. Sau buổi báo cáo, cuốn đề tài chỉ để lưu trữ nên để tránh lãng phí, các nhóm có thể in trên cả 2 mặt giấy A4, đóng bìa giấy, không cần in màu, không đóng bìa mica. Sau khi nộp file lần đầu để không bị trừ điểm thời hạn, SV vẫn có thể chỉnh sửa để hoàn thiện bài báo cáo và nộp lại lần cuối ngay trước buổi báo cáo. Ở trang bìa, SV cần lưu ý ghi đầy đủ danh sách SV, in đậm tên nhóm trưởng (hoặc có đánh dấu), sắp xếp tên các thành viên theo thứ tự abc, đánh số thứ tự trong danh sách các thành viên. Nếu nhóm có sinh viên từ các lớp khác nhau thì cần ghi chú thêm Nhóm/Tổ của mỗi thành viên như L01; L02… ( Khi cô nhập điểm mà thấy nhóm nào trình bày bìa không đúng yêu cầu thì cô sẽ trừ bớt 0.5 đ của nhóm đó nhé). - - - Các nhóm nên nộp bài từ email cá nhân mà trường cấp để khi cần tìm kiếm sẽ thuận lợi hơn cho cô. Khi gửi bài vào email của cô các em sẽ nhận được 1 mail trả lời tự động, xác nhận mail của nhóm đã đến hộp thư của cô, nên đừng đề nghị cô gửi thêm 1 mail xác nhận nữa nhé. Nếu có vấn đề gì cần hỏi thêm thì các em nên viết thêm 1 email khác, không nên để cùng mail nộp bài vì có thể cô chưa mở hết các mail nộp bài ngay khi nhận được. Thời hạn báo cáo: 2 tuần cuối cùng. Các nhóm sẽ đăng ký hoặc bốc thăm thứ tự báo cáo vào tuần học cuối. 2. VỀ NỘI DUNG BẢN BÁO CÁO: - SV phải thực hiện các bài tập trong Excel, sau đó mô tả các bước thực hiện (viết gọn thôi nhé), có copy hình ảnh các kết quả minh họa vào word. - Bài 1 không phải trình bày cơ sở lý thuyết. Các bài khác phải trình bày cơ sở lý thuyết của bài (viết gọn). Lưu ý rằng một số bài khi thực hiện cần bổ sung thêm giả thiết thích hợp về số liệu mẫu. - Đối với mỗi bài kiểm định, dựa vào kết quả sau khi thực hiện trên Excel, SV cần trình bày lại theo đầy đủ các bước: Đặt các giả thiết kiểm định; các miền bác bỏ tương ứng; các tiêu chuẩn kiểm định ( hoặc giá trị P); và kết luận. - Điểm cộng cho các nhóm lấy ví dụ về tập dữ liệu có nội dung liên quan rất gần đến chuyên ngành học. 3. VỀ CÁCH CHẤM ĐIỂM: - Điểm nội dung đề tài + nộp đúng hạn + trả lời đúng các câu hỏi liên quan đến đề tài khi báo cáo: 7 điểm. - Điểm thực hành : nhận dạng bài toán + thực hành bài cụ thể (tương tự các bài trong 10 đề tài) + trả lời câu hỏi trực tiếp: 3 điểm. Hình thức kiểm tra thực hành: Mỗi nhóm sẽ có từ 2-4 SV được gọi ngẫu nhiên để kiểm tra thực hành. Mỗi SV sẽ bốc thăm 1 câu hỏi chứa một trong các nội dung sau: - Nhập trực tiếp vào Excel 1 mẫu định lượng bất kỳ, dùng chức năng Data Analysic/ Descriptive Statistics để tìm các đặc trưng mẫu và giải thích các số liệu thu được, vẽ đồ thị. - Nhận dạng bài toán để chọn test phù hợp: t-test; z-test; F-test. - Nhận dạng bài toán để chọn phân tích phương sai 1 yếu tố; 2 yếu tố; - Kiểm định tính độc lập ( so sánh các tỷ lệ). ĐỀ TÀI 1 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1) Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 91% (A). 4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Theo dõi doanh số bán hàng ( triệu đồng/ ngày) của một cửa hàng trong 12 ngày của tháng 4 và 12 ngày của tháng 10, người ta thu được kết quả sau: Ngày trong tháng 1 Tháng 4 7,6 10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5 Tháng 10 6,3 8,8 3 5 6 8 10 13 17 20 24 27 30 9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7 Với mức ý nghĩa 3%, có thể cho rằng doanh số bán trung bình hàng ngày trong tháng 10 có giảm sút so với tháng 4 hay không? Tìm thêm giá trị P trong kiểm định. Bài 3: Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành: Ngày khảo sát Các quận nội thành Quận 1 Quận 2 Quận 3 Quận 4 Quận 5 Thứ hai 254 236 267 223 245 Thứ ba 245 212 256 213 234 Thứ tư 236 223 245 230 232 Thứ năm 235 197 243 213 224 Thứ 6 250 210 232 215 233 Thứ 7 247 196 223 207 242 Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5 %. Bài 4: Ba loại vật liệu được thử sức bền dưới ảnh hưởng của việc thay đổi nhiệt độ vô cùng lớn, chúng ta có số liệu: Kết cục Vật liệu 1 Vật liệu 2 Vật liệu 3 Vỡ vụn 25 45 41 Bị phá hủy một phần 40 35 33 Còn toàn vẹn 35 20 26 Hãy kiểm định xem có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi nhiệt độ không? Sử dụng mức ý nghĩa 2%. Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 2 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 92% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Ở một nhà máy sản xuất thuốc lá, người ta kiểm tra hàm lượng nicotine trong 2 hiệu thuốc lá sợi khác nhau và có được các kết quả như sau ( đơn vị: mg/100 g). Hiệu A: 24; 26; 25; 27; 28; 25; 21 ; 22,5; 25; 27 Hiệu B: 27; 24; 25; 23; 26; 24.5; 26; 25.5; 27 Với mức ý nghĩa 4%, có thể coi như hàm lượng nicotine trong thuốc lá hiệu A là cao hơn so với hiệu B hay không? Tìm thêm giá trị P trong kiểm định. Bài 3: Với mức ý nghĩa 1%, hãy so sánh doanh thu (triệu đồng/ngày) của một số ngành nghề ở 4 quận nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau: Ngành nghề Kinh doanh Điện lạnh Vật liệu xây dựng Dịch vụ tin học Cơ khí Q1 2,5 ; 2,7; 2,0 ; 3,0 0,6 ; 10,4; 11,2 ; 8,3 4,2 ; 5,0; 6,2 ; 3,3 0,6 ; 10,4; 11,3 ; 8,2 Q2 3,1 ; 3,5; 2,7 ; 3,2 1,2 ; 1,0; 9,8 ; 1,8 3,2 ; 2,0; 7,8 ; 2,5 1,2 ; 1,0; 9,8 ; 1,7 Quận Q3 2,2 ; 2,0; 9,5 ; 2,1 3,3 ; 2,3; 6,7 ; 1,9 0,4 ; 3,0; 9,8 ; 2,8 3,3 ; 2,3; 6,7 ; 1,8 Q4 11,2 ; 12,0; 19,8 ; 15,8 4,2 ; 1,0; 3,8 ; 2,5 3,1 ; 1,0; 3,6 ; 3,9 4,2 ; 1,0; 3,8 ; 2,4 Bài 4: Quan sát 400 người về màu tóc và màu mắt, người ta được bảng số liệu sau: Hoàn cảnh GĐ Tình trạng Đen Nâu Vàng Nâu Đen 12 38 65 59 121 105 Với mức ý nghĩa 0,05, có thể cho rằng màu tóc và màu mắt không có liên quan gì với nhau hay không? Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 3 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 93% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Một giám đốc doanh nghiệp quyết định gửi 8 nhân viên của mình đi dự một lớp tập huấn về “Dịch vụ khách hàng”. Dưới đây là phản hồi của bộ phận chăm sóc khách hàng về các nhân viên được cử đi tập huấn. Tên nhân viên Số lần phàn nàn của khách hàng 3 tháng trước tập huấn 3 tháng sau tập huấn A 3 2 B 5 4 C 12 10 D 8 6 E 6 6 F 5 3 G 7 3 H 9 4 Hãy nhận xét hiệu quả của quyết định trên với mức ý nghĩa 5%. Tìm thêm giá trị P trong kiểm định. Bài 3: Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành, số liệu lấy ở một đại lý bán lẻ: Ngày khảo sát Các quận nội thành Quận 1 Quận 2 Quận 3 Quận 4 Quận 5 Thứ hai 254; 232 236;245 267;258 223;224 245;247 Thứ ba 245;235 212;246 256;276 213;219 234;251 Thứ tư 236;255 223;264 245;275 230;244 232;254 Thứ năm 235;209 197;223 243;234 213;223 224;242 Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5%. Bài 4: Khảo sát ngẫu nhiên 300 sinh viên đã tốt nghiệp cùng một chuyên ngành từ 3 trường A, B và C sau một năm ra trường, người ta có kết quả: Trường A B C Đã đi làm Học tiếp Chưa có việc làm 60 55 65 12 10 6 28 35 29 Với mức ý nghĩa 3%, hãy cho biết có thể coi tình trạng việc làm của sinh viên 3 trường trên là như nhau không? Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 4 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 94% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Hàm lượng (%) của chất C trong cùng một loại sản phẩm của 2 công ty được công bố xấp xỉ nhau. Đo kiểm tra hàm lượng chất C có trong một số sản phẩm được chọn ngẫu nhiên trên thị trường, người ta thu được số liệu sau: Sản phẩm của công ty A Sản phẩm của công ty B 37 38 35 40 42 34 37 39 42 35 40 38 36 43 38 41 Hãy so sánh mức độ đồng đều của hàm lượng chất C trong các sản phẩm của 2 công ty với mức ý nghĩa 3%. Giả thiết hàm lượng này phân bố theo quy luật chuẩn. Bài 3: Nồng độ chì trong không khí đo được ở một số giao lộ trong thành phố được thể hiện trong kết quả sau: Địa điểm Nồng độ chì ( mg/m3) I 0,42 0,53 0,62 0,71 0,83 0,61 0,51 II 0,70 0,32 0,64 0,44 0,53 III 0,39 0,37 0,43 0,45 0.41 0,52 0.42 IV 0,35 0,45 0,54 0,56 0,6 0,62 0,32 Có thể coi nồng độ chì trong không khí ở các giao lộ là giống nhau hay không, với mức ý nghĩa 5%? Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó. Bài 4: Một nông trường nuôi 3 giống bò sữa A,B,C. Lượng sữa của các con bò này được thể hiện trong bảng theo dõi sau: Loại bò A B C Ít Lượng sữa Trung bình Nhiều 92 53 75 37 15 19 46 19 12 Với mức ý nghĩa  = 0,05, hãy nhận định xem có phải 3 giống bò này thuần như nhau về phương diện sản lượng sữa hay không? Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 5 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 95% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Theo dõi doanh số bán hàng trong mỗi ngày của 2 cửa hàng, người ta thu được kết quả sau: Cửa hàng 1 10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5 6,2 7,4 7,5 Cửa hàng 2 8,8 9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7 7,6 Với mức ý nghĩa 3%, có thể cho rằng doanh số bán hàng của 2 cửa hàng có sự phân tán như nhau hay không? Giả thiết doanh số bán hàng mỗi ngày của các cửa hàng tuân theo quy luật chuẩn. Bài 3: Đo mức độ bụi trong không khí tại các khu vực trong thành phố tại cùng một thời điểm, người ta được số liệu sau, ( đơn vị mg/m3): Số thứ tự quan sát Các khu vực KV1 KV2 KV3 KV4 1 0,54 0,48 0,56 0,47 2 0,60 0,49 0,62 0,52 3 0,72 0,55 0,60 0,56 4 0,67 0,62 0,71 0,53 5 0,83 0,57 0,73 6 0,63 0,59 Mức độ nhiễm bụi của các khu vực trên có được coi là như nhau hay không? Hãy kết luận bằng giá trị P. Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó. Bài 4: Bảng số liệu sau cho biết số người chết về bệnh ung thư ở 3 nước Mỹ, Nhật, Anh trong thời gian khảo sát. Người chết được phân loại theo cơ quan bị ung thư. Bộ phận bị ung thư Ruột Ngực Dạ dày Bộ phận khác Nước Mỹ Nhật Anh 11 15 3 41 5 3 22 30 5 7 3 15 Với mức ý nghĩa  = 1%, hãy so sánh phân bố tỉ lệ chết về ung thư của 3 nước nói trên. Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 6 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Người ta dùng 2 loại nguyên liệu A và B để sản xuất thử đế của 10 đôi giày trẻ em, các đôi có trọng lượng ban đầu như nhau. Sau đó người ta cho cho các em đi thử trong vòng 6 tháng với cường độ sử dụng tương tự như nhau. Sau thử nghiệm, trọng lượng đế giày còn lại được cho trong bảng sau: Thứ tự Loại vật liệu Giày trái Giày phải 1 A 180 183 2 A 162 154 3 A 203 189 4 A 194 181 5 A 205 200 6 B 189 185 7 B 168 171 8 B 185 179 9 B 176 175 10 B 169 173 Với mức ý nghĩa 0,07 có thể cho rằng dùng loại nguyên liệu A làm đế giày bền hơn dùng loại nguyên liệu B hay không? Tìm thêm giá trị P trong kiểm định. Bài 3: Doanh số bán hàng ( triệu đồng) của 4 cửa hàng trong 6 tuần đầu của mùa hè được cho trong bảng số liệu: Tuần Cửa hàng 1 Cửa hàng 2 Cửa hàng 3 Cửa hàng 4 1 1430 980 1780 2300 2 2200 1400 2890 2682 3 1140 1200 1500 2000 4 880 1300 1470 1900 5 1670 1350 2380 1540 6 990 650 1930 1900 Hãy sử dụng mức ý nghĩa 5% để so sánh doanh thu của các cửa hàng có như nhau không; và có sự liên quan giữa yếu tố doanh thu và yếu tố thời gian hay không. Bài 4: Trong một thí nghiệm khoa học, người ta đo độ dày của lớp mạ kền khi dùng 3 loại bể mạ khác nhau. Sau một thời gian mạ, người ta đo được độ dày của lớp mạ nhận được ở các bể như sau: Độ dày lớp mạ kền (m) 4-8 8 - 12 12 - 16 16 - 20 20 - 24 A 32 123 10 41 19 Số lần đo ở bể mạ B 51 108 26 24 20 C 68 80 26 28 28 Hãy kiểm định giả thiết độ dày lớp mạ kền sau khoảng thời gian nói trên không phụ thuộc loại bể mạ được dùng, với mức ý nghĩa  = 0,05. Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 7 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 97% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Trong một hội thảo định hướng nghề nghiệp, một trung tâm đào tạo chọn ngẫu nhiên 36 học sinh để tham khảo ý kiến về mức độ yêu thích các ngành nghề của trung tâm trước và sau khi học sinh tham dự hội thảo. Mức độ yêu thích được đo bằng thang đo khoảng cách 10 điểm, trong đó 1 là hoàn toàn không thích và 10 là rất thích. Các phiếu trả lời được thu về như sau: Trước 3 4 5 7 8 5 6 4 3 9 3 6 Sau 5 5 6 5 8 8 5 6 7 9 4 5 Trước 1 2 4 7 6 4 5 5 4 3 7 6 Sau 4 6 7 8 7 5 3 7 8 9 7 8 Trước 5 6 7 8 2 3 6 4 3 4 3 1 Sau 8 5 7 6 5 7 7 5 5 7 2 7 Hãy dùng một kiểm định phù hợp để xem việc tham dự hội thảo có làm tăng sự yêu thích của học sinh đối với các ngành nghề mà trung tâm đào tạo hay không, với mức ý nghĩa 2%? Tìm thêm giá trị P trong kiểm định. Bài 3: Với mức ý nghĩa  = 2%, hãy so sánh thu nhập hàng tháng của người lao động trên cơ sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau sau đây, (đơn vị USD/ 1 người): Loại ngành nghề 1 2 3 4 V1 212 222 241 240 Nơi làm việc V2 V3 200 230 205 222 250 245 228 230 V4 220 225 235 240 Bài 4: Nghiên cứu sự ảnh hưởng của gia đình đối với tình trạng phạm tội của trẻ em tuổi vị thành niên qua 148 em nhỏ, người ta thu được số liệu: Hoàn cảnh GĐ Tình trạng Không phạm tội Phạm tội Bố hoặc mẹ đã chết Bố mẹ đã ly hôn Còn cả bố mẹ 20 29 25 43 13 18 Với mức ý nghĩa 0,05, có thể coi hoàn cảnh gia đình của trẻ em độc lập với tình trạng phạm tội của trẻ hay không? Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 8 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 98% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Điểm đánh giá của 20 người dùng thử về 2 loại sản phẩm đậu phộng trước và sau cải tiến được thu thập trên thang điểm 10 như sau: Trước cải tiến 7 8 6 8 7 7 7 6 8 6 Sau cải tiến 8 9 5 9 5 6 8 7 8 7 Trước cải tiến 6 9 6 4 6 7 8 5 4 3 Sau cải tiến 8 8 8 7 6 7 7 6 7 6 Hãy cho biết hiệu quả của việc cải tiến sản phẩm với mức ý nghĩa 6%. Tìm thêm giá trị P trong kiểm định. Bài 3: Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái mùa (khô và mưa: trong mỗi mùa lấy mẫu ba lần - đầu. giữa và cuối) và từ ba miền (nam. trung và bắc) được tóm tắt như sau: Mùa Thời điểm Đầu mùa Mùa khô Giữa mùa Cuối mùa Đầu mùa Mùa mưa Giữa mùa Cuối mùa Nam 2.4 2.3 2.5 2.4 2.5 2.7 Miền Trung 2.1 2.2 2.3 2.2 2.1 2.3 Bắc 3.2 3.2 3.4 3.3 3.5 3.4 Hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền? Nếu có thì hai yếu tố mùa và miền có sự tương tác với nhau hay không? Sử dụng mức ý nghĩa 2%. Bài 4: Bệnh đau mắt hột được chia làm 4 thời kỳ T1, T2, T3 và T4. Một kết quả kiểm tra các bệnh nhân đau mắt hột được cho trong bảng sau: Mức độ đau mắt hột Địa phương T1 T2 T3 T4 A B 47 53 189 746 807 1387 1768 946 C 16 228 438 115 Hãy nhận xét xem tình hình đau mắt hột ( cơ cấu phân bố 4 mức độ) ở 3 địa phương trên có giống nhau hay không, sử dụng mức ý nghĩa 1%. Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. ĐỀ TÀI 9 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài 2: Hai máy cùng gia công một loại chi tiết. Để kiểm tra xem 2 máy này có củng độ chính xác như nhau hay không, người ta lấy ngẫu nhiên từ mỗi máy 7 chi tiết, đem đo và thu được kết quả sau (đơn vị mm): Máy A Máy B 137 142 138 135 135 140 140 138 138 136 137 138 139 141 Có thể cho rằng 2 máy có độ chính xác như nhau hay không, với mức ý nghĩa 2%? Giả thiết rằng kích thước chi tiết có phân phối chuẩn. Bài 3: Theo giới thiệu của nhà phân phối, mức tiêu thụ nhiên liệu trung bình của 4 loại xe ô tô là như nhau. Sau một thời gian chạy xe, người ta đo lại trên các quãng đường như nhau thì được kết quả sau: Loại xe Mức tiêu thụ nhiên liệu I 20 21,2 18,7 19,5 20,1 22 21 II 21,2 21,2 20,4 19.6 22 21,1 20 III 21,5 21,2 21 21,5 22 20,7 IV 19,9 22 21 23 21,2 20,6 21,7 21,3 Có thể coi mức tiêu thụ nhiên liệu của 4 loại xe này còn giống nhau hay không, với mức ý nghĩa 4%? Tìm hệ số xác định R2 của bài toán và giải thích ý nghĩa của nó. Bài 4: Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A,B,C,D,E. Người ta yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang sống. Kết quả được cho như sau: Mức độ thỏa mãn Thành phố A B C D E Rất thỏa mãn 220 130 84 156 122 Tương đối Không 121 207 54 95 164 63 75 24 43 73 Với mức ý nghĩa  = 3%, Hãy kiểm định xem mức độ thỏa mãn có phân bố giống nhau ở 5 thành phố trên hay không? Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng.
- Xem thêm -

Tài liệu liên quan