Bài giảng môn học
PHÂN TÍCH
SỐ LIỆU THỐNG KÊ
Giảng viên: Ths. Dƣơng Thị Mai Thƣơng
Bộ môn: Khoa học máy tính – CNTT
Email:
[email protected]
Mobile: 0945373858
1
MÔN HỌC TIỀN ĐỀ
• Toán cao cấp
• Xác suất thống kê
• Lập trình căn bản
2
MỤC TIÊU MÔN HỌC
• Cung cấp kiến thức cơ bản về phân tích thống
kê dữ liệu
–
–
–
–
Ước lượng
Kiểm định
Phân tích hồi quy và tương quan
Phân tích chuỗi thời gian
• Cung cấp kỹ năng sử dụng phần mềm SPSS
3
YÊU CẦU & ĐÁNH GIÁ
• 100% sinh viên lên lớp và thực hành
• Thực hiện chia nhóm để thảo luận, làm bài tập
lớn, tiểu luận môn học.
• Kết thúc môn sinh viên có thể phân tích thống
kê số liệu dựa trên phần mềm SPSS 19.
• Đánh giá:
–
–
–
–
Chuyên cần: 10%
Giữa kỳ: 10%
Báo cáo bài tập lớn: 20%
Thi hết học phần: 60%
4
TÀI LIỆU THAM KHẢO
• [1] Dang Quang A and Bui The Hong, Statistical data analysis,
• www.netnam.vn/unescocourse/statistics.htm, 1999 ( Giáo trình điện tử
theo đặt hàng của UNESCO).
• [2] Bùi Thế Hồng, Giáo trình phân tích thống kê dữ liệu và SPSS for
Windows, Hà Nội, 1999.
• [3] Trần Bá Nhẫn, Đinh Thái Hoàng, Lý thuyết thống kê, NXB Thống kê,
1998.
• [4] Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như, Thống kê toán học,
NXB ĐHQG Hà Nội, 2004.
• [5] Nguyễn Văn Liệu, Nguyễn Đình Cừ, Nguyễn Quốc Anh, SPSS - ứng
dụng phân tích dữ liệu trong quản trị kinh doanh và khoa học tự nhiên –
xã hội, NXB Giao thông vận tải, 2000.
• [6] Hoàng Trọng, Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu nghiên
cứu với SPSS, NXB Hồng Đức, 2008.
5
Thời
gian
NỘI DUNG
Nội dung
Tuần 1 Giới thiệu môn học, ôn tập các kiến thức
cơ bản
Chƣơng 1. Phân loại dữ liệu, mã hóa,
nhập liệu và một số xử lý trên biến
Lý thuyết
Tuần Chƣơng 2. Làm sạch dữ liệu
2,3 Chƣơng 3. Tóm tắt và trình bày dữ liệu
Lý thuyết
thực hành
Tuần 4 Chƣơng 4. Kiểm định mối liên hệ giữa
hai biến định tính.
Lý thuyết
thực hành
Tuần 5 Chƣơng 5. Phân tích liên hệ giữa biến
nguyên nhân định tính và biến kết quả
định lượng:
Kiểm định trung bình quần thể
Lý thuyết
thực hành
6
Thời
gian
NỘI DUNG
Tuần 6 Chương 6. Phân tích liên hệ giữa biến
nguyên nhân định tính và biến kết quả
định lượng: Phân tích phƣơng sai
Nội dung
Lý thuyết
thực hành
Tuần 7 Kiểm tra bài 1
Tuần 8 Chƣơng 7: Kiểm định phi tham số
Tuần 9 Chƣơng 8. Kiểm định tỷ lệ
Chƣơng 9. Tương quan và hồi quy
tuyến tính
Tuần 10, Báo cáo bài tập lớn
11, 12 Kiểm tra bài 2
Ôn Tập
Lý thuyết
thực hành
Lý thuyết
thực hành
Báo cáo
7
NỘI DUNG MÔN HỌC (đọc thêm)
•
•
•
•
•
•
Chương 10: Hồi qui Bianry Logistic
Chương 11: Đánh giá độ tin cậy của thang đo
Chương 12: Phân tích nhân tố
Chương 13: Phân tích biệt số
Chương 14: Phân tích cụm
Chương 15: Lập bản đồ nhận thức với đo lường đa
hướng và phân tích tương hợp
• Chương 16: Các tiện ích
8
GIỚI THIỆU PHÂN TÍCH DỮ LIỆU
• Nghiên cứu và phân tích dữ liệu
1. Xác định vấn đề cần nghiên cứu
2. Thu thập dữ liệu
3. Xử lý dữ liệu
4. Phân tích dữ liệu
5. Báo cáo kết quả
9
GIỚI THIỆU PHÂN TÍCH DỮ LIỆU
• Bản chất của phân tích dữ liệu
Mức độ chính xác của
mô hình thống kê
Hiểu biết, tri thức
Sự kiện
Thông tin
Dữ liệu
Mức độ cải thiện
của các quyết định
10
BẢN CHẤT CỦA PT DỮ LIỆU (cont.)
• Dữ liệu trở thành thông tin khi nó liên quan
đến vấn đề nhận thức, kết luận và quyết định
của người nghiên cứu
• Thông tin trở thành sự kiện khi thông tin hỗ
trợ cho việc ra quyết định
• Sự kiện trở thành tri thức khi nó được sử dụng
để hoàn tất quá trình ra quyết định một cách
thành công.
11
THỐNG KÊ VÀ PHÂN TÍCH DỮ LIỆU
• Thống kê: tập hợp các phương pháp dùng để
thu thập, phân tích, trình bày và diễn giải dữ
liệu
• Phân tích dữ liệu: cung cấp kinh nghiệm thực
hành được đúc kết để đẩy mạnh việc ứng dụng
tư duy thống kê và kỹ thuật thống kê nhằm
hiểu rõ các hiện tượng nghiên cứu, từ đó hỗ trợ
cho việc ra quyết định
12
Chƣơng 1
PHÂN LOẠI DỮ LIỆU, MÃ HÓA
NHẬP LIỆU VÀ MỘT SỐ XỬ LÝ
TRÊN BIẾN
13
PHÂN LOẠI DỮ LIỆU
Dữ liệu
Dữ liệu định
tính
Thang đo
danh nghĩa
Thang đo
thứ bậc
Dữ liệu định
lượng
Thang đo
khoảng cách
Thang đo tỉ
lệ
14
PHÂN LOẠI DỮ LIỆU (cont.)
• Dữ liệu định tính:
– Phản ánh tính chất, sự hơn kém, không tính đc giá
trị trung bình của dữ liệu dạng định tính.
– Ví dụ: Nam/ Nữ, Giỏi/ Khá/ TBK/ TB/ Yếu/ Kém
• Dữ liệu định lƣợng
– Phản ánh mức độ, mức độ hơn kém, tính được trị
trung bình.
– Ví dụ: Tuổi, Thu nhập trong tháng…
15
CÁC LOẠI THANG ĐO
• Thang đo danh nghĩa (phân loại) – nominal scale
– Các con số mang ý nghĩa phân loại đối tượng
– Ví dụ: Vui lòng cho biết tình trạng hôn nhân của bạn?
1
Độc thân
2
Đang có gia đình
3
Ở góa
4
Ly thân hoặc ly dị
– Chứng minh các thang đo trên là biến phân loại
– Thứ tự thang đo phân loại có quan trọng ko?
16
CÁC LOẠI THANG ĐO
• Thang đo thứ bậc – ordinal scale
– Các con số được sắp xếp theo một quy ước nào đó về
thứ bậc hay sự hơn kém, nhưng không biết được
khoảng cách giữa chúng?
– Ví dụ: Mức độ hài lòng của bạn về GV giảng dậy?
•
•
•
•
1. Rất hài lòng
2. Hài lòng
3. Bình thường
4. Không hài lòng
– Chứng minh đây là thang đo thứ bậc?
– Thang đo thứ bậc có phải là thang đo phân loại?
17
CÁC LOẠI THANG ĐO
• Thang đo khoảng cách – interval scale
– Là một dạng đặc biệt của thang đo thứ bậc, cho biết
khoảng cách giữa các thứ bậc.
– Ví dụ: Theo bạn tầm quan trọng của việc chăm chỉ
đối với kết quả học tập? (1 = không quan trọng, 10 =
rất quan trọng)
• Thang đo khoảng cách không có điểm 0 tuyệt đối.
– Thang đo khoảng cách hay thứ bậc cho nhiều thông
tin hơn?
18
CÁC LOẠI THANG ĐO
• Thang đo tỉ lệ - ration scale
– Thang đo tỉ lệ = thứ tự + khoảng cách + điểm
“0” là giá trị thật
– Ví dụ:
• Bạn đang có bao nhiêu tiền?
• Điểm trung bình học tập của bạn đạt bao nhiêu?
19
VÍ DỤ THANG ĐO
• Giá trị 0 của biến có mang nghĩa tự nhiên.
– Tôi hết sạch tiền
– Lương tôi chỉ bằng ½ sếp tôi
– Dân số Việt Nam gấp 10 lần dân số NewDilan
• Giá trị 0 không mang nghĩa tự nhiên.
– 00 F là một điểm 0 nhân tạo.
– 320 F = 00 C
– Nếu nói 320 F nóng gấp đôi 160 F thì ko có ý nghĩa vì
chúng đều đóng băng.
– So sánh hai vật ở 500 C ( (0+100)/2 và
1220 F ((32+212)/2) đều ở điểm giữa nhiệt độ sôi và đóng
băng.
20