lOMoARcPSD|15978022
Xstk nhóm 2 - bài thảo luận
Xác suất thống kê (Trường Đại học Thương mại)
StuDocu is not sponsored or endorsed by any college or university
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA KẾẾ TOÁN – KIỂM TOÁN
---------------oOo----------------
BÀI THẢO LUẬN NHÓM MÔN LÝ THUYẾẾT XÁC SUẤẾT THÔNG KẾ TOÁN
ĐẾỀ TÀI:
Giảng viên hướng dẫẫn
: Đàm Thị Thu Trang
Nhóm thực hiện
: Nhóm 2
Tên lớp học phẫần
: Lý thuyêết xác suẫết và thốếng kê toán
Mã lớp học phẫần :
Chi tiêu
hàng tháng của sinh viên
Trường Đại học Thương mại
HÀ NỘI, 2022
1
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
MỤC LỤC
MỤC LỤC.......................................................................................................................................................... 2
LỜI MỞ ĐẤỀU................................................................................................................................................... 3
PHẦN I: CƠ SỞ LÝ THUYẾT......................................................................................................... 5
1.
Ước lượng các tham số của ĐLNN..............................................................5
1.1. Ước lượng điểm....................................................................................................5
1.2. Ước lượng bằng khoảng tin cậy................................................................................................5
1.2.1. Ước lượng k礃 v漃⌀ng to愃Ān c甃ऀa ĐLNN...................................................................................5
1.2.2. Ước lượng tỷ lệ............................................................................................................................ 8
1.2.3. Ước lượng phương sai c甃ऀa ĐLNN phân phối theo quy luật chuẩn.......................11
2.
Kiểm định về giả thuyết thống kê.............................................................12
2.1. Giả thiết thống kê................................................................................................12
2.2. Mức ý nghĩa, miền b愃Āc bỏ......................................................................................................... 14
2.3. Sai lầm loại 1 và sai lầm loại 2...............................................................................................15
2.4. Kiểm định giả thuyết về kì v漃⌀ng to愃Ān c甃ऀa một ĐLNN........................................16
2.5. Kiểm định giả thuyết về tỉ lệ đ愃Ām đông...............................................................18
2.6. Kiểm định giả thuyết về phương sai c甃ऀa ĐLNN phân phối chuẩn......................19
PHẤỀN II: BÀI TOÁN.............................................................................................................................. 20
KẾẾT LUẬN...................................................................................................................................................... 23
BẢNG ĐÁNH GIÁ THÀNH VIẾN.......................................................................................................... 24
2
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
LỜI MỞ ĐẤỀU
Trong đời sống thực tế có rất nhiều biến cố có thể xảy ra, và con người không thể
nào lường trước được hết những biến cố. Vì vậy, thường có những giả thuyết ước lượng
hay những kiểm định mang tính định tính kết quả đúng sai về c愃Āc trường hợp xảy ra c甃ऀa
c愃Āc biến cố. Chính vì lý do đó, việc nghiên cứu việc nghiên cứu ước lượng c愃Āc tham số
c甃ऀa đại lượng ngẫu nhiên và kiểm định giả thuyết thống kê là điều rất cần thiết.
Lý thuyết ước lượng, lý thuyết kiểm định c愃Āc giả thuyết thống kê là những bộ phận
quan tr漃⌀ng c甃ऀa thống kê to愃Ān. Đây là phương tiện giúp ta giải quyết c愃Āc bài to愃Ān nhìn từ
góc độ kh愃Āc liên quan đến dấu hiệu cần nghiên cứu trong tổng thể.
Để ước lượng k礃 v漃⌀ng to愃Ān c甃ऀa “đại lượng ngẫu nhiên” (ĐLNN) X, người ta giả
sử trên đ愃Ām đông có E(X) = μ và Var(X) =σ2
Trong đó μ chưa biết cần ước lượng. Từ đ愃Ām đông ta lấy ra kích thước n: W =
(X1, X2…, Xn).
Từ mẫu này ta tìm được trung bình mẫu và phương sai mẫu điều chỉnh S’2.
Dựa vào đặc trưng mẫu này ta tìm được trung bình mẫu và phương sai mẫu điều
chỉnh S’.
Dựa vào những đặc trưng mẫu này, ta xây dứng thống kê G thích hợp.
Với vấn đề 1 c甃ऀa đề tài thảo luận, đó là “Ước lượng mức chi tiêu trung bình
hàng tháng của sinh viên trường Đại học Thương Mại”, nhóm chúng tôi đã x愃Āc định
dùng phương ph愃Āp ước lượng μ khi chưa biết quy luật phân phối c甃ऀa ĐLNN, kích
thước mẫu n>30.
Lấy một mẫu cụ thể w = (x1, … xn) từ mẫu này ta tính được u tn với wα để b愃Āc bỏ
hay không b愃Āc bỏ H0, chấp nhận hay không chấp nhận H1.
Đó là phương ph愃Āp làm trong vấn đề 2 c甃ऀa nhóm chúng tôi: “Hiện nay tỷ lệ sinh
viên trường Đại học Thương Mại có mức chi tiêu hàng tháng từ 5 triệu đồng trở
lên chiếm khoảng 60% với mức ý nghĩa 5%. Hãy kiểm lại khẳng định trên”.
3
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
1) Tầm quan trọng của việc nghiên cứu đề tài
Trường Đại h漃⌀c Thương Mại là một ngôi trường có quy mô lớn với số lượng sinh
viên theo h漃⌀c đông đảo. Trong đó đa phần là c愃Āc bạn sinh viên ngoại tỉnh theo h漃⌀c, còn
lại số ít là những bạn sinh viên sống trong địa bàn c甃ऀa trường. C愃Āc bạn sinh viên đã phải
tự lo từ việc ăn ở đến c愃Āc vấn đề kh愃Āc trong cuộc sống ngoài nhiệm vụ chính là h漃⌀c tập.
Cuộc sống h漃⌀c tập, sinh hoạt hàng ngày khiến c愃Āc bạn sinh viên phải tự lên kế hoạch chi
tiêu hàng th愃Āng cho bản thân sao cho hợp lý. Trước thực trạng đó nhóm 2 đã ch漃⌀n và
nghiên cứu hai đề tài nêu trên.
2) Mục tiêu nghiên cứu
Đề tài được thực hiện với mục tiêu: “Tìm hiểu mức chi tiêu c甃ऀa sinh viên Đại h漃⌀c
Thương Mại và so s愃Ānh với mức chi tiêu c甃ऀa sinh viên nói chung. Qua đó đưa ra một số
giải ph愃Āp giúp sinh viên cân bằng mức chi tiêu cho hợp lý”.
3) Phương pháp nghiên cứu
Nhóm đã tiến hành lấy mẫu ngẫu nhiên n = 191 trên đ愃Ām đông là toàn thể sinh
viên trường Đại h漃⌀c Thương Mại. Mẫu được điều tra trên nhiều khoa, nhiều khóa sinh
viên c甃ऀa trường để có tính x愃Āc thực nhất. Từ đó kết luận được mức chi tiêu trung bình
c甃ऀa sinh viên trường Đại h漃⌀c Thương Mại và kiểm định giả thuyết đề tài đưa ra.
4
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
PHẦN I: CƠ SỞ LÝ THUYẾT
1. Ước lượng các tham số của ĐLNN
1.1.
Ước lượng điểm
Giả sử ta cần ước lượng tham số c甃ऀa ĐLNN trên một đ愃Ām đông thì ta tiến hành theo c愃Āc
bước sau:
-
Bước 1: Lấy mẫu NN, kích thước N: W = (x1, x2,…xn)
-
Bước 2: Tùy vào tham số ta x愃Āc định hàm thống kê μ*= f (x1, x2, …xn)
-
Bước 3 Khi n đ甃ऀ lớn với mẫu cụ thể: W = (x1, x2, …xn), tính to愃Ān:
μtn = f (x1, x2, …xn)
1.2.
Bước 4: Ta lấy μtn làm ước lượng cho tham số.
Ước lượng bằng khoảng tin cậy
Kh愃Āi niệm: Giả sử cần ước lượng cho tham số c甃ऀa ĐLNN X xét trên một đ愃Ām đông nào
đó. Để ước lượng cho θ ta thực hiện theo c愃Āc bước sau đây:
Bước 1: Lấy mẫu ngẫu nhiên kích thước n: W = (X1, X2, …Xn)
XDTK: G = f (X1, X2, …Xn, θ) sao cho quy luật phân phối c甃ऀa G hoàn toàn x愃Āc định và
không phụ thuộc vào tham số θ.
Bước 2: Đưa ra khoảng tin cậy
-
Với độ tin cậy 1 – ta tìm được cặp gi愃Ā trị với Khi đó cặp gi愃Ā trị phân vị: ;
P (g1. G ) =
-
Biến đổi tương đương: P ( ) =
Bước 3: Với số liệu mẫu cụ thể tính to愃Ān và đưa ra kết luận.
1.2.1. Ước lượng k礃 vọng toán của ĐLNN
Xét ĐLNN X có E(X) = µ và Var(X) = 2. Trong đó µ chưa biết, cần ước lượng.
Từ đ愃Ām đông ta lấy ra mẫu kích thước n: W = (X 1, X2, …, Xn). Từ mẫu này ta tìm được
trung bình mẫu và phương sai mẫu điều chỉnh S’ 2. Dựa vào những đă ̣c trưng mẫu này ta
s攃̀ xây dựng thống kê G thích hợp. Ta lần lượt xét ba trường hợp sau:
TH1: Trươꄀng hơꄣp ĐLNN gĀc X phân phĀi theo quy luâ ̣t chuऀn, 2 đ愃̀ biĀt
5
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
Bước 1: Vì X ~ N (µ, 2) nên ta có ~ N (µ, 2/n). Khi đó XDTK: U = ~ N (0,1)
Bước 2: Đưa ra khoảng tin cậy:
a. Kho愃ऀng tin câ ̣y đĀi xư뀁ng (lấy α1 = α2 = α/2)
Với γ = 1- α ta tìm được phân vị uα/2 sao cho:
Thay U, ta được :
P (-uα/2< U < uα/2) =
P ( - < µ < + ) = (1)
Trong đó : = α/2
Như vâ ̣y, khoảng tin câ ̣y đối xứng c甃ऀa µ là ( - , +)
b. Kho愃ऀng tin câỵ ph愃ऀi (lấy α1 = 0, α2 = α) ước lượng µmin
Với đô ̣ tin câ ̣y γ= 1- α cho trước ta tìm được đô ̣ phân vị chuẩn uα sao cho :
P (U < uα) = 1 – α=γ
Thay biểu thức U vào công thức trên ta có:
P ( < uα) = 1 – α=γ
P ( - α < µ) = 1 – α=γ
Vâ ̣y khoảng tin câ ̣y phải với đô ̣ tin câ ̣y γ=1 – α c甃ऀa µ là: ( - α ; +∞)
c. Kho愃ऀng tin câỵ tr愃Āi (lấy α1 = α, α2 = 0) dùng ước lượng µmax
Với đô ̣ tin câ ̣y γ=1- α cho trước ta tìm được đô ̣ phân vị chuẩn uα sao cho
P (-uα< U) = 1 – α= γ
Thay biểu thức U vào công thức trên ta có:
P (uα ) = 1 – α=γ
P ( + α < µ) = 1 – α=γ
Vâ ̣y khoảng tin câ ̣y tr愃Āi với đô ̣ tin câ ̣y γ=1 – α c甃ऀa µ là: (-∞, + α)
TH2: Chưa biĀt quy luâ ̣t phân phĀi c甃ऀa X trên đ愃Ām đông, nhưng k椃Āch thươꄁc m̀u
n > 30
Bước 1: Vì n > 30 nên N (;)
XDTK: U = ~ N (0,1)
Bước 2: Bước 3 làm tương tự trường hợp 1.
*Chú ý: nếu σ chưa biết, vì n>30 nên ta lấy s
6
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
TH3: Trươꄀng hơꄣp ĐLNN gĀc X phân phĀi theo quy luâ ̣t chuऀn, phương sai 2 chưa
biĀt
Bước 1: Vì X có phân phối chuẩn nên
XDTK:
T=
Bước 2: Đưa ra khoảng tin cậy
a. Kho愃ऀng tin câỵ đĀi xư뀁ng (lấy α1 = α2 = α/2)
Với đô ̣ tin câ ̣y γ=1 – α ta tìm được phân vị t1-α/2(n-1) và tα/2(n-1) sao cho
P(T> t1-α/2(n-1)) = 1- α và P(T> tα/2(n-1)) = α/2.
Vì hàm mâ ̣t đô ̣ c甃ऀa phân phối Student là hàm chẵn, nên t1-α/2(n) = t1-α/2(n)
Khi đó ta có P (|T| < tα/2(n-1)) = 1 - α
Thay biểu thức c甃ऀa T vào công thức trên và biến đổi tương đương ta được
P (| - µ| < tα/2(n-1)) = 1- α
Hay P ( - < µ < +) = 1- α
Trong đó = tα/2(n-1)
Khoảng tin cậy đối xứng c甃ऀa µ là : (X − ; X + )
b. Kho愃ऀng tin cậy ph愃ऀi (α1 =0; α2 = α); dùng để ước lượng gi愃Ā trị tối thiểu c甃ऀa µ)
Với đô ̣ tin câ ̣y γ= 1 – α cho trước, ta tìm được phân vị tα(n-1) sao cho
P (T < tα(n-1)) = 1- α
Thay biểu thức c甃ऀa T vào công thức trên ta có
P ( < tα(n-1)) = 1- α
Hay P ( - tα(n-1) < µ) = 1 – α
Vâ ̣y khoảng tin câ ̣y tr愃Āi c甃ऀa µ là ( - tα(n-1) ; +∞)
c. Kho愃ऀng tin câỵ tr愃Āi (lấy α1 =α, α2 = 0) ; dùng để ước lượng gi愃Ā trị tối đa c甃ऀa µ)
Với đô ̣ tin câ ̣y γ=1 – α cho trước ta tìm đô ̣ phân vị tα(n-1) sao cho
P (- tα(n-1) < T) = 1- α=γ
Thay biểu thức T vào công thức trên ta có
P (- tα(n-1) < ) = 1 – α=γ
Hay P (µ < + tα(n-1)) = 1 – α= γ
7
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
Vâ ̣y khoảng tin câ ̣y tr愃Āi c甃ऀa µ là (-∞; + tα(n-1)).
1.2.2. Ước lượng tỷ lệ
Giả sử ta cần nghiên cứu một đ愃Ām đông kích thước N, trong đó có M phần tử
mang dấu hiệu A. Khi đó là tỷ lệ phẩn tử mang dấu hiệu A trên đ愃Ām đông. Vì không
điều tra cả đ愃Ām đông nên thường chưa biết . Từ đ愃Ām đông ta lấy ra mẫu kích thước n,
điều tra trên mẫu này thấy có phần tử mang dấu hiệu A. Khi đó tần suất xuất hiện dấu
hiệu A trên mẫu là . Ta đi ước lượng thông qua .
Bước 1: Vì n kh愃Ā lớn thì
XDTK: . Trong đó
Bước 2: Đưa ra khoảng tin cậy
a. Kho愃ऀng tin cậy đĀi xư뀁ng
Với độ tin cậy cho trước ta tìm được phân vị chuẩn , lập luận tương tự như trong mục
2.2.1 ta có:
=γ
Thay vào biểu thức trên ta có:
=γ
=γTrong đó: là sai số c甃ऀa ước lượng.
Khi chưa biết, n lớn để tính sai số ta thay xấp xỉ bằng ước lượng hiệu quả nhất c甃ऀa nó
là và . Khi đó:
-
Độ tin cậy c甃ऀa ước lượng là
-
Khoảng tin cậy đối xứng c甃ऀa là
-
Độ dài c甃ऀa khoảng tin cậy là
Chú ý: Để tr愃Ānh dùng công thức gần đúng, ta biến đổi tương đương bằng c愃Āch bình
phương hai vế bất đẳng thức , chuyển vế và xét dấu tam thức bậc hai đối với ta được
Trong đó:
8
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
Ở đây ta cũng có ba bài to愃Ān cần giải quyết như trong ước lượng k礃 v漃⌀ng to愃Ān c甃ऀa
ĐLNN và c愃Āch giải quyết cũng hoàn toàn tương tự. Riêng bài to愃Ān tìm kích thước mẫu
để có ta phải giả thiết có phân phối chuẩn. Sau đó từ ta có
Trong trường hợp chưa biết , vì và đều là những số không âm mà nên tích lớn
nhất bằng . Vì vậy ta luôn có . Do đó ta có thể lấy:
Tuy nhiên nếu tính kích thước mẫu theo công thức trên thì thường làm cho n tăng
lên kh愃Ā nhiều so với mức cần thiết. Vì vậy trong thực tế người ta thường điều tra một
mẫu sơ bộ kích thước không lớn lắm, từ mẫu này tìm được rồi tìm theo công thức sau
khi thay đổi và . Sau đó ta chỉ cần điều tra thêm một mẫu kích thước
Chú ý:
-
Nếu biết , cần ước lượng thì ta có
Từ đó ta có khoảng tin cậy đối xứng c甃ऀa là:
-
Từ khoảng tin cậy c甃ऀa : , vì , nên nếu biết ta có khoảng tin cậy c甃ऀa là:
Đương nhiên, nếu biết ta cũng có thể tìm được khoảng tin cậy c甃ऀa là:
-
Nếu biết khoảng tin cậy : , vì ta có khoảng tin cậy c甃ऀa là:
b. Kho愃ऀng tin cậy ph愃ऀi (); dùng để ước lượng gi愃Ā trị tối thiểu c甃ऀa )
Ta vẫn dùng thống kê . Với độ tin cậy cho trước ta tìm được sao cho:
Thay biểu thức c甃ऀa và biến đổi tương đương ta có:
Vì chưa biết khi lớn ta lấy . Ta có khoảng tin cậy phải c甃ऀa là:
c. Kho愃ऀng tin cậy tr愃Āi (); dùng để ước lượng gi愃Ā trị tối đa c甃ऀa )
Ta vẫn dùng thống kê . Với độ tin cậy cho trước ta tìm được sao cho:
=γ
Thay biểu thức c甃ऀa và biến đổi tương đương ta có:
9
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
Vì chưa biết khi lớn ta lấy . Ta có khoảng tin cậy tr愃Āi c甃ऀa là:
1.2.3. Ước lượng phương sai của ĐLNN phân phối theo quy luật chuẩn
Giả sử trên một đ愃Ām đông ĐLNN X có phân phối chuẩn với phương sai chưa biết. Để
ước lượng , từ đ愃Ām đông ta lấy ra mẫu ngẫu nhiên kích thước n:
Từ mẫu này ta tìm được .
Ta có :
a. Kho愃ऀng tin cậy c甃ऀa (lấy
Với độ tin cậy cho trước ta tìm được c愃Āc phân vị và sao cho:
và
Từ đó ta có :
Thay biểu thức c甃ऀa rồi biến đổi tương đương ta có:
Ở đây là độ tin cậy c甃ऀa ước lượng.
Vậy khoảng tin cậy c甃ऀa là:
Chú ý: Khoảng tin cậy này không đối xứng qua gốc t漃⌀a độ
b. Kho愃ऀng tin cậy ph愃ऀi c甃ऀa (lấy ); dùng để ước lượng gi愃Ā trị tối thiểu c甃ऀa )
Ta vẫn dùng thống kê . Với độ tin cậy cho trước ta tìm được phân vị sao cho: =γ
Thay biểu thức c甃ऀa vào công thức và biến đổi tương đương ta có:
Vậy khoảng tin cậy phải c甃ऀa là:
c. Kho愃ऀng tin cậy tr愃Āi c甃ऀa (lấy ); dùng để ước lượng gi愃Ā trị tối đa c甃ऀa )
Ta vẫn dùng thống kê . Với độ tin cậy cho trước ta tìm được phân vị sao cho:
Thay biểu thức c甃ऀa vào công thức và biến đổi tương đương ta có:
Vậy khoảng tin cậy tr愃Āi c甃ऀa là:
10
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
2. Kiểm định về giả thuyết thống kê
2.1.
Giả thiết thống kê
Giả thiết thống kê là những giả thiết nói về c愃Āc tham số, phân phối x愃Āc suất, hoặc
tính độc lập c甃ऀa c愃Āc đại lượng ngẫu nhiên. Việc tìm ra kết luận b愃Āc bỏ hay chấp nhận
một giả thiết g漃⌀i là kiểm định giả thiết thống kê. Kiểm định giả thiết thống kê là một
trong c愃Āc bài to愃Ān cơ bản c甃ऀa thống kê to愃Ān.
Cách đặt giả thiết thống kê:
Ta có 2 c愃Āch để chứng minh một chân lý, nghĩa là có 2 c愃Āch để thuyết phục người
kh愃Āc thấy được chân lý đó.
Cách thứ nhất: Đưa ra giả thiết: A ≠ B rồi tìm dữ kiện để chứng tỏ rằng giả thiết
ấy là đúng, là phù hợp (tức là có ý đề nghị người kh愃Āc chấp nhận giả thiết đó)
Cách thứ hai: Đưa ra giả thiết là: A = B và tìm dữ kiện để chứng tỏ rằng giả thiết
này là không phù hợp và ta b愃Āc bỏ giả thiết này (tức là có ý đề nghị người kh愃Āc chấp
nhận A ≠ B). Vậy cùng một chân lý, ta có thể đưa ra 2 giả thiết. Vậy c愃Āch nào là hợp lý
hơn?
- Thống kê to愃Ān sử dụng phương ph愃Āp qui nạp, nghĩa là đi từ trường hợp c愃Ā biệt
(mẫu) để suy ra trường hợp tổng qu愃Āt (tổng thể), bằng c愃Āch dùng dữ kiện c甃ऀa
mẫu để chứng minh giả thiết về tổng thể đó.
-
Khi dữ kiện phù hợp với giả thiết thì điều này không là cơ sở để thuyết phục
chấp nhận giả thiết đó vì khi dữ liệu phù hợp với giả thiết này, nó cũng đồng thời
phù hợp với giả thiết kh愃Āc. Cho nên khi dữ kiện phù hợp với giả thiết ta cũng
chưa chứng minh được giả thiết là đúng một c愃Āch chắc chắn.
-
Còn khi dữ kiện không phù hợp với giả thiết thì điều này chắc chắn là cơ sở để
b愃Āc bỏ giả thiết đó.
-
Hơn nữa, một giả thiết khi nó đúng thì bao giờ nó cũng phù hợp với thực tiễn.
Khi có bằng chứng rút từ thực tiễn thấy không phù hợp thì ta có thể kết luận giả
thiết đó là không đúng.
11
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
-
Trong thống kê to愃Ān, việc b愃Āc bỏ một giả thiết dựa vào x愃Āc suất xảy ra biến cố có
liên quan đến giả thiết đó. Một giả thiết chỉ có thể xảy ra với x愃Āc suất rất nhỏ thì
trên thực tế giả thiết đó hầu như không đúng, nên ta b愃Āc bỏ giả thiết ấy.
Dựa vào c愃Āc lý l攃̀ trên, khi đặt giả thiết thống kê ta lưu ý một số vấn đề sau:
-
Giả thiết đặt ra với ý đồ b愃Āc bỏ nó, nghĩa là giả thiết đặt ra ngược lại với điều ta
muốn chứng minh, muốn thuyết phục. Vì vậy khi b愃Āc bỏ được giả thiết có nghĩa
là ta đã chứng minh được điều ngược lại.
-
Giả thiết đặt ra sao cho khi chấp nhận hoặc b愃Āc bỏ nó s攃̀ có t愃Āc dụng trả lời được
câu hỏi mà bài to愃Ān thực tế đặt ra.
-
Giả thiết đặt ra nếu nó đúng thì ta s攃̀ x愃Āc định được qui luật phân phối x愃Āc suất
c甃ऀa đại lượng ngẫu nhiên được ch漃⌀n làm tiêu chuẩn kiểm định.
-
Khi đặt giả thiết ta thường so s愃Ānh c愃Āi chưa biết với c愃Āi đã biết. C愃Āi chưa biết là
điều ta cần kiểm định, cần kiểm tra, làm rõ. “C愃Āi đã biết” mà ta nói ở đây thường
là những thông tin qu愃Ā khứ, c愃Āc định mức kinh tế, kỹ thuật.
-
Giả thiết đặt ra thường mang nghĩa: “không kh愃Āc nhau”, hoặc “kh愃Āc mà không có
ý nghĩa” hoặc “bằng nhau”.
Nhiệm vụ c甃ऀa lý thuyết kiểm định giả thiết thống kê là: Bằng thực nghiệm (thông
qua mẫu cụ thể) kiểm ưa tính đúng (sai) c甃ऀa giả thiết Ho2.2.
Mức ý nghĩa, miền bác bỏ
Có thể mô tả phương ph愃Āp kiểm định giả thiết thông kê như sau:
Xuất ph愃Āt từ yêu cầu c甃ऀa bài to愃Ān thực tế, ta nêu ra một giả thiết H0H0 và giả thiết đối
c甃ऀa nó.
Giả sử rằng H0H0 đúng, từ đó tìm một biến cố có x愃Āc suất đ甃ऀ bé để có thể tin rằng biến
cố đó hầu như không thể xảy ra trong một phép thử. Muốn vậy, từ mẫu ngẫu nhiên:
Wx = (X1, X2, ..., Xn)
ta ch漃⌀n:
Z = f (X1, X2, ...., Xn, θ0)
12
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
Z được ch漃⌀n sao cho: nếu Ho đúng thì ta s攃̀ x愃Āc định được qui luật phân phối x愃Āc suất
c甃ऀa Z và với mẫu cụ thể ta có thể tính được gi愃Ā trị c甃ऀa Z. Đại lượng ngẫu nhiên Z được
g漃⌀i là tiêu chuẩn kiểm định giả thiết Ho.
Do qui luật phân phối x愃Āc suất c甃ऀa Z đã biết, nên với αα bé tùy ý ta có thể tìm được
miền Wα sao cho P (Z∈Wα) = α. Miền Wα được g漃⌀i là miền b愃Āc bỏ giả thiết H0. Trong
thực tế thường ch漃⌀n α trong khoảng (1%; 5%). α được g漃⌀i là mức ý nghĩa c甃ऀa kiểm
định.
Thực hiện một phép thử đối với mẫu ngẫu nhiên Wx, ta thu được mẫu cu thể Wx = (X1,
X2, ..., Xn). Từ mẫu cụ thể này ta tính được gi愃Ā trị c甃ऀa Z (ký hiệu là z) và g漃⌀i là gi愃Ā trị
thực nghiệm:
z=f (x1, x2, ..., xn, θ0)
Nếu z∈Wα thì ta b愃Āc bỏ giả thiết Ho thừa nhận H1
Nếu z∉Wα thì ta chấp nhận Ho
2.3.
Sai lầm loại 1 và sai lầm loại 2
Khi kiểm định một giả thiết thống kê, chúng ta có thể mắc phải một trong hai loại sai
lầm sau đây:
Sai lầm loại 1: Là sai lầm mắc phải khi ta b愃Āc bỏ một giả thiết Ho trong khi thực tế thì
giả thiết Ho đúng.
X愃Āc suất mắc phải sai lầm loại này bằng mức ý nghĩa αα. Tức là:
P(Z∈Wα) = α
(X愃Āc suất để tiêu chuẩn Z thuộc miền b愃Āc bỏ Wα nếu giả thiết Ho đúng). Nếu α càng bé
thì khả năng phạm phải sai lầm loại 1 càng ít.
Sai lầm loại 2: Là sai lầm mắc phải khi ta chấp nhận giả thiết Ho trong khi thực tế thì
giả thiết Ho sai.
X愃Āc suất mắc phải sai lầm loại 2 là x愃Āc suất để z nhận gi愃Ā trị không thuộc miền b愃Āc
bỏ Wα khi Ho sai (tức H1 đúng).
P(Z∉Wα/H1) = 1 − P(G∈Wα/H1) = 1− β
13
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
β được g漃⌀i là lực kiểm định giả thiết Ho. Nó chính là x愃Āc suất “không mắc sai lầm loại
2”. β càng lớn thì x愃Āc suất sai lầm loại 2 càng nhỏ.
C愃Āc trường hợp xảy ra khi tiến hành kiểm định giả thiết thống kê có thể tóm tắt dưới
dạng bảng sau:
Tình huống H0 đúng H0 sai Kết luận Bác bỏ Sai lầm loại 1 (x愃Āc suất là αα) Kết luận
đúng (x愃Āc suất là 1− β) Chấp nhận Kết luận đúng (x愃Āc suất là 1-α) Sai lầm loại 2 (x愃Āc
suất là β)
Cả hai loại sai lầm đều gây ra t愃Āc hại. Chẳng hạn:
Chấp nhận một lô hàng xấu hoặc từ chối một lô hàng tốt đều là tai hại.
Cho đậu một thí sinh yếu kém (mà đ愃Āng l攃̀ ra phải rớt) hoặc cho rớt một thí sinh
giỏi (mà đ愃Āng l攃̀ ra phải đậu) đều là những sai lầm tai hại.
Tu礃 theo hoàn cảnh cụ thể, sai lầm này có thể là tai hại hơn sai lầm kia. Chẳng hạn:
đang lúc thiếu hàng, thì việc từ chối một lô hàng tốt là tai hại hơn việc chấp nhận một lô
hàng kém chất lượng.
Dĩ nhiên ta cố gắng hạn chế c愃Āc sai lầm, hạ thấp x愃Āc suất mắc phải sai lầm. Nhưng nếu
ta muốn giảm x愃Āc suất sai lầm loại 1 thì s攃̀ làm tăng x愃Āc suất sai lầm loại 2 và ngược lại.
Chẳng hạn: Để tr愃Ānh sai lầm cho rớt thí sinh giỏi (rớt oan) ta cứ cho đậu một c愃Āch dễ
dàng, rộng rãi. Nhưng khi đó khả năng sai lầm cho đậu một h漃⌀c sinh yếu kém (đ愃Āng l攃̀
ra phải rớt) lại tăng lên.
Có 2 cách khống chế khả năng mắc phải sai lầm:
Cách thứ nhất: Ta ấn định trước mức x愃Āc suất sai lầm loại 1 và sai lầm loại 2 rồi
tính to愃Ān tìm một mẫu có kích thước nhỏ nhất ứng với 2 mức x愃Āc suất sai lầm
này.
Cách thứ hai: Ta ấn định trước x愃Āc suất sai lầm loại 1 (tức cho trước mức ý
nghĩa a) ch漃⌀n miền b愃Āc bỏ Wα sao cho có x愃Āc suất sai lầm loại 2 cực tiểu. C愃Āc
miền b愃Āc bỏ Wα trong gi愃Āo trình này thỏa mãn yêu cầu đó nhưng không có điều
kiện để trình bầy cơ sở lý thuyết to愃Ān h漃⌀c c甃ऀa nó. Bạn đ漃⌀c muốn đi sâu nghiên
cứu vấn đề này cần đ漃⌀c thêm c愃Āc tài liệu chuyên sâu về lý thuyết kiểm định.
Cần lưu ý rằng: b愃Āc bỏ hay chấp nhận một giả thiết tùy thuộc vào gi愃Ā trị thực
nghiệm c甃ऀa tiêu chuẩn Z và mức ý nghĩa α. Kiểm định giả thiết thống kê chỉ là một qui
14
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
tắc giúp ta kết luận một vấn đề c甃ऀa bài to愃Ān thực tế đặt ra sao cho kết luận đó có khả
năng mắc phải sai lầm nhỏ (ở mức nào đó) chứ không phải là phép chứng minh logic
một mệnh đề.
2.4.
Kiểm định giả thuyết về kì vọng toán của một ĐLNN
a, ĐLNN X trên đ愃Ām đông tuân theo quy luật phân phối chuẩn đã biết
-
Bước 1: X愃Āc định tiêu chuẩn kiểm định
vì X N () nên X )
XDTCĐK
U = . Nếu H0 đúng X
-
Bước 2: Tìm miền b愃Āc bỏ
* Bài to愃Ān 1
Với mức ý nghĩa ta tìm được phân vị c甃ऀa sao cho P () =
=>W =
* Bài to愃Ān 2
Với mức ý nghĩa ta tìm được phân vị sao cho P (U>
=>
* Bài to愃Ān 3
Với mức ý nghĩa ta tìm được phân vị
sao cho P (U<
=>
Bước 3: Với mẫu cụ thể tính, kết luận theo mẫu kiểm định
+ Nếu
+ Nếu
b, TH2: ĐLNN X trên đ愃Ām đông có phân phối chuẩn chưa biết
- Bước 1: Xây dựng tiêu chuẩn kiểm định
Vì n>30 nên
XDTCKĐ: U=
- Bước 2, Bước 3 tương tự như TH1
c, TH3: ĐLNN X tuân theo phân phối chuẩn chưa biết , n<30
15
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
- Bước 1: Vì X)
XDTCKĐ
T=
-
Bước 2: Bảng tóm tắt
P (G
Miền b愃Āc bỏ
P(
P(
P(
-Bước 3: Tính
2.5.
Kiểm định giả thuyết về tỉ lệ đám đông
Xét 1 đ愃Ām đông có tỷ lệ phần tử mang dấu hiệu A là p, trong đó p chưa biết. Từ 1
cơ sở nào đó người ta tìm được p=p o nhưng nghi ngờ về điều này. Với mức ý nghĩa α
cần kiểm định giả thiết: Ho: p=po. G漃⌀i f là tỉ lệ phần tử mang dấu hiệu A trên mẫu ngẫu
nhiên kích thước n. Như ta đã biết khi kích thước n đ甃ऀ lớn thì f có phân phối xấp xỉ
chuẩn:
f N(p;)
Xây dựng tiêu chuẩn kiểm định:
U=
Trong đó q0= 1 - po
Nếu Ho đúng thì U N(0,1).
Xét những bài to愃Ān cụ thể sau:
-
Bài to愃Ān 1:
Với cho trước, ta có thể tìm được uα/2 sao cho P(|U| > uα/2) = α
Theo nguyên lý x愃Āc suất nhỏ ta có miền b愃Āc bỏ: Wα = tn: |utn| > uα/2}
Trong đó =
Nếu : ta b愃Āc bỏ H1, chấp nhận H0
Nếu Utn : ta b愃Āc bỏ H0, chấp nhận H1
-
Bài to愃Ān 2:
Với cho trước, ta có thể tìm được sao cho
16
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
Theo nguyên lý x愃Āc suất nhỏ ta có miền b愃Āc bỏ là Wα = tn: utn> uα}
Trong đó =
Nếu : ta b愃Āc bỏ H1, chấp nhận H0
Nếu Utn : ta b愃Āc bỏ H0, chấp nhận H1
-
Bài to愃Ān 3:
Với cho trước, ta có thể tìm được sao cho
Theo nguyên lý x愃Āc suất nhỏ ta có miền b愃Āc bỏ là Wα = tn: utn< - uα}
Trong đó =
Nếu : ta b愃Āc bỏ H1, chấp nhận H0
Nếu Utn : ta b愃Āc bỏ H0, chấp nhận H1
2.6.
Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn
Giả sử ta có mẫu ngẫu nhiên cỡ mẫu n được lấy ra từ tập hợp chính tuân theo
phân phối chuẩn có phương sai là . G漃⌀i là phương sai c甃ऀa mẫu , ta có 3 trường hợp
kiểm định với mức ý nghĩa
TH1:
Ho : =
H1 :
R: b愃Āc bỏ Ho nếu
Với
tuân theo phân phối với độ tự do n-1
TH2:
Ho : =
H1:
R : b愃Āc bỏ Ho nếu
TH3 :
Ho : =
H1:
R: b愃Āc bỏ Ho nếu
hay
PHẤỀN II: BÀI TOÁN
Câu 1: Khảo sát 182 sinh viên thì có 83 sinh viên có mức chi tiêu cho ăn ở trong 1
tháng hết từ 1.000.000- dưới 3.000.000. Với độ tin cậy 95% ước lượng số sinh viên
17
Downloaded by Quang Quang (
[email protected])
lOMoARcPSD|15978022
có mức chi tiêu cho ăn ở trong 1 tháng hết từ 1.000.000- dưới 3.000.000 của trường
Đại học Thương mại. Biết toàn trường có tất cả 20.000 sinh viên.
Giải:
G漃⌀i M là số sinh viên có mức chi tiêu cho ăn ở trong 1 th愃Āng hết từ 1.000.000- dưới
3.000.000 c甃ऀa trường Đại h漃⌀c Thương mại
f là tỉ lệ sinh viên có mức chi tiêu cho ăn ở trong 1 th愃Āng hết từ 1.000.000- dưới
3.000.000 c甃ऀa trường Đại h漃⌀c Thương mại trên mẫu
p là tỉ lệ sinh viên có mức chi tiêu cho ăn ở trong 1 th愃Āng hết từ 1.000.000- dưới
3.000.000 c甃ऀa trường Đại h漃⌀c Thương mại trên đ愃Ām đông.
Vì n= 182 kh愃Ā lớn nên fN(p, ) => U= N (0,1)
Khi đó ta tìm được sao cho:
P ( ) 1 P ( - < U< )1P (-< < ) 1 –
P (f - < p < f + ) 1
P (f – ε < p < f+ ε)1Trong đó .
Vì chưa biết p, n lớn nên ta lấy p và q
Vì
= 0,025
= 1.96
Vậy khoảng tin cậy c甃ऀa p là p
p
Mà p = và N = 20.000 ta được: 7.672
30 kh愃Ā lớn nên f có phân phối xấp xỉ chuẩn f N (p; )
Với mức ý nghĩa = 0.05, cần kiểm định giả thuyết:
: p = (=0,6)
:p>
Xây dựng TCKĐ: U = , trong đó = 1 - = 0,4
Nếu đúng thì U N (0;1). X愃Āc định phân vị sao cho P ( U > ) =
Vì kh愃Ā bé nên theo nguyên lí x愃Āc xuất nhỏ ta có miền b愃Āc bỏ:
=
Ta có
: >
trong đó =
= 0,05
= 0,5824
=
-0.4847
Chấp nhận
19
Downloaded by Quang Quang ([email protected])