Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Tin học Skkn xây dựng hệ thống dự đoán kết quả học tập của học sinh...

Tài liệu Skkn xây dựng hệ thống dự đoán kết quả học tập của học sinh

.DOC
19
1560
108

Mô tả:

Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam SỞ GIÁO DỤC VÀ ĐÀO TẠO ĐỒNG NAI Đơn vị: Trung Tâm GDTX Nhơn Trạch Mã số: …………………………… (Do HĐKH sở GD&ĐT ghi) SÁNG KIẾN KINH NGHIỆM XÂY DỰNG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA HỌC SINH Người thực hiện: Nguyễn Bảo Nam Lĩnh vực nghiên cứu : Quản lý giáo dục:  Phương pháp dạy học bộ môn:  Phương pháp giáo dục:  Lĩnh vực khác: Tin học Có đính kèm:   Mô hình  Phần mềm  Phim ảnh  Hiện vật khác Năm học: 2012 – 2013 Trang 1 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam SƠ LƯỢC LÝ LỊCH KHOA HỌC I. THÔNG TIN CHUNG VỀ CÁ NHÂN 1. Họ và tên: Nguyễn Bảo Nam 2. Ngày tháng năm sinh: 21/03/1975 3. Nam, nữ: Nữ 4. Điạ chỉ: Xã Hiệp Phước, Huyện Nhơn Trạch, Tỉnh Đồng Nai 5. Điện thoại: (CQ): 6. Fax: (NR) ĐTDĐ: 0909269820 E-mail:[email protected] 7. Chức vụ: Giáo viên 8. Đơn vị công tác: Trung Tâm GDTX Nhơn Trạch II. TRÌNH ĐỘ ĐÀO TẠO - Học vị: Thạc sĩ - Năm nhận bằng: 2013 - Chuyên ngành đào tạo: Tin học III. KINH NGHIỆM KHOA HỌC - Lĩnh vực chuyên môn có kinh nghiệm: Tin học - Số năm có kinh nghiệm: 15 - Các sáng kiến kinh nghiệm đã có trong 5 năm gần đây: Trang 2 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam ĐỀ TÀI: XÂY DỰNG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA HỌC SINH I. LÝ DO CHỌN ĐỀ TÀI Hiện nay các trường Trung học phổ thông và Trung tâm GDTX việc tính toán và lưu trữ điểm của học sinh được tiến hành đều đặn vào cuối học kỳ. Công việc này chủ yếu dùng để đánh giá học lực của từng học sinh theo qui định của Bộ Giáo Dục & Đào Tạo, đánh giá tương đối chính xác học lực của từng học sinh, kết quả chất lượng đào tạo của trường thể hiện qua tỉ lệ phần trăm được thống kê từ bảng điểm tổng kết. Đánh giá chất lượng giáo dục là công việc mà ngành giáo dục rất quan tâm việc đánh giá trên còn thiên về cảm tính và mang tính bình quân, tương đối. Các phương pháp đánh giá truyền thống hiện nay có nhiều ý kiến cho rằng chưa được chặt chẽ và chưa đánh giá đúng thật chất kết quả học tập, rèn luyện của học sinh. Nếu đưa được phương pháp cho phép cung cấp các thông tin giúp cho việc đánh giá dự đoán kết quả giáo dục chặt chẽ đạt độ tin cậy cao bằng những tính toán khoa học sẽ giúp đỡ cho các nhà quản lý rất nhiều trong việc hoạch định những chiến lược giáo dục trong tương lai. Để khai thác các thông tin hữu ích từ nguồn dữ liệu to lớn chúng ta cần công cụ và kỹ thuật thích hợp. Những kỹ thuật truyền thống trước đây không thể khai thác triệt để những thông tin hữu ích mà cơ sở dữ liệu mang lại. Trong những năm gần đây nhiều nhà nghiên cứu đã đề xuất những phương pháp, kỹ thuật mới nhằm phân tích xử lý một cách hiệu quả trên các cơ sở dữ liệu để tìm các thông tin tìm ẩn, tuy rất ít so với khối lượng dữ liệu rất lớn nhưng rất quan trọng. Có thể xem cơ sở dữ liệu điểm học sinh như là một cơ sở dữ liệu chuỗi thời gian. Kết quả học tập của học sinh được đánh giá theo từng học kỳ từ lớp 6 đến lớp 12 theo thứ tự thời gian, kết quả học tập của học sinh toàn trường là một cơ sở dữ liệu chuỗi thời gian. Sau đó sử dụng kỹ thuật khai phá dữ liệu để khám phá tri thức từ cơ sở dữ liệu điểm học sinh. Đây chính là mục tiêu của đề tài : “Xây dựng hệ thống dự đoán kết quả học tập của học sinh”. II. TỔ CHỨC THỰC HIỆN ĐỀ TAI 1. Cơ sở lý luận - Huyện Nhơn Trạch, tỉnh Đồng Nai là huyện có 10 trường trung học cơ sở, 3 trường trung học phổ thông và 1 Trung tâm GDTX, huyện có tỷ lệ đậu tốt nghiệp trung học phổ thông rất thấp so với các huyện trong tỉnh Đồng Nai. Đa số các em có học lực từ yếu đến trung bình ở những năm học cấp hai. Làm thế nào đó để sau khi học xong chương trình phổ thông các em có thể đậu tốt nghiệp trung học phổ thông đó là đều rất mong muốn của phụ huynh cũng như những nhà quản lí giáo dục ở địa phương. - Với mong muốn được giúp đỡ cho các em và phụ huynh thấy được con đường học vấn trong tương lai, đó là khả năng đậu tốt nghiệp của mình như thế nào để ngay từ ban đầu học sinh có ý thức hơn trong việc học. Cùng với sự cố gắng của Trang 3 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam học sinh, không thể thiếu sự quan tâm, tạo điều kiện thuận lợi từ phía phụ huynh. Hơn nữa, về phía lãnh đạo nhà trường cũng đề ra các biện pháp nhằm giúp đỡ các em có một kết quả học tập tốt hơn trong tương lai. - Một trong các cách đó là chúng ta cần cho học sinh thấy trước kết quả học tập trong tương lai dựa vào một hệ thống có khả năng dự đoán khả năng đậu tốt nghiệp trung học phổ thông của các em. Ứng dụng trên cơ sở dữ liệu điểm học sinh cho phép ta dự đoán kết quả đạt được trong học kỳ tiếp theo hay năm học tiếp theo từ kết quả học tập của học kỳ trước đó. Với kết quả hiện tại thì kết quả đạt được tiếp theo như thế nào? Chương trình giúp đưa ra các thông tin cho phép dự đoán kết quả căn cứ vào kết quả của từng học kỳ để dự đoán học kỳ tiếp theo hay năm học tiếp theo, cũng có thể dựa vào dự đoán đó mà các nhà quản lý giáo dục có thể có các quyết định như: đào tạo học sinh giỏi, tổ chức lớp học và phân loại học sinh cá biệt, . . . Qua mỗi năm học phổ thông học sinh sẽ biết được khả năng lên lớp ở năm học tiếp theo hoặc đậu tốt nghiệp của mình ở mức nào trong kỳ thi tốt nghiệp trung học phổ thông. Từ dữ liệu đã lưu trữ ở những năm trước, ứng dụng luật kết hợp để khai phá dữ liệu, tìm ra các luật có ích cho hệ thống dự đoán. 2. Nội dung, biện pháp thực hiện các giải pháp của đề tài a. Nội dung thực hiện Bài toán dự đoán kết quả học tập của học sinh được trình bày theo các bước sau: - Đầu vào là các bảng điểm tổng kết của học sinh theo từng học kỳ và điểm tổng kết từng học kỳ của các môn học: Toán, Lý, Anh văn, . . . trong suốt 7 năm học phổ thông.( Từ lớp 6 đến lớp 12, có 14 học kỳ) - Xử lý các dữ liệu điểm được lưu trữ trong 7 năm học phổ thông để được cơ sở dữ liệu phù hợp cho mục tiêu dự đoán. Kết quả của mỗi môn học được chứa trong một bảng được sắp xếp theo thứ tự thời gian. Các bảng của các môn học đều giống nhau. Như vậy từ cơ sở dữ liệu điểm tổng kết thông thường ta chuyển về dạng cơ sở dữ liệu theo thời gian. Trong cơ sở dữ liệu này kết quả của mỗi học sinh được sắp xếp theo thứ tự chuỗi thời gian là các học kỳ trong bảy năm học phổ thông. Cấu trúc cơ sở dữ liệu được trình bày như sau: MaSV Toan1 Ly1 AV1 HK1 1 3.5 4.0 4.2 4.6 2 5.0 5.1 6.0 5.8 3 5.0 5.2 5.3 5.4 4 4.0 4.1 4.4 4.5 5 4.0 4.1 4.4 4.3 6 4.0 3.5 4.5 4.9 7 5.0 5.2 6.0 5.6 8 3.6 4.0 4.2 4.5 9 3.5 3.7 4.0 4.5 … … … … … … … … … … … Toan14 Ly14 AV14 HK14 5.3 5.4 5.3 5.3 6.4 6.5 6.5 6.5 5.6 6.0 6.4 5.6 5.7 6.0 6.1 5.7 4.3 4.6 4.6 4.6 6.5 6.6 6.5 6.5 6.0 6.1 5.9 6.0 6.0 5.7 6.0 5.7 4.8 4.8 4.4 4.8 … … … … - Sử dụng các kỹ thuật khai phá trên cơ sở dữ liệu chuỗi thời gian để khám phá tri thức trên cơ sở dữ liệu mới nhận được dạng này. Trang 4 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam - Kết quả nhận được là các luật biểu diễn mối quan hệ giữa các kết quả theo thời gian. Với kết quả hiện có thì kết quả đạt được tiếp theo là gì? Kết quả nhận được như sau: If HK1, Toán = Kém  HK2, Toán = Kém, . . .  HK14, Toán = Kém If HK1, Lý = TB  HK2, Lý = TB, . . .  HK14, Lý = TB If HK1, AnhVan = K  HK2, AnhVan = K, . . .  HK14, Anh văn = Khá ... If HK1, DiemTB = G  HK2, DiemTB = G, . . .  HK14, DiemTB = G Mục tiêu là đưa ra thông tin của các luật sẽ hữu dụng cho quá trình quản lý giáo dục, nhất là dự đoán và hoạch định phương pháp nâng cao chất lượng trong trường phổ thông. b. Biện pháp thực hiện Dữ liệu sử dụng trong chương trình được thu thập trên 10 trường THCS, 3 trường trung học phổ thông và 1 Trung tâm GDTX trong huyện Nhơn Trạch. Do các kết quả tổng kết điểm của học sinh trong các trường phổ thông được thực hiện và lưu trữ bằng nhiều phần mềm khác nhau như Microsoft Access, Excel, Foxpro, …nên ta cần chuyển dữ liệu về một dạng thống nhất là SQL Server. Trong các bảng điểm tổng kết này thứ tự các môn học được thực hiện theo qui định của Bộ giáo dục. Các bảng điểm thì có nhiều cột điểm như: điểm miệng, 15 phút, 1 tiết và điểm thi, ta cần lọc các thông tin này. Trên cơ sở dữ liệu, mỗi dòng biểu diễn kết quả của một học sinh. Kết quả của mỗi học kỳ được lưu trữ trong một bảng, có tất cả 14 học kỳ được lưu trữ trong 14 bảng là kết quả điểm của học sinh trong quá trình học tập từ lớp 6 đến lớp 12. Dữ liệu dự đoán sẽ được đưa vào chung một bảng để tiện xử lý. Vì các trường có thể lưu trữ điểm bằng các phần mềm khác nhau nên ta cần đưa các điểm về dạng thống nhất. Ta chia công việc này thành hai bước: - Ta cần chuyển các dữ liệu thu thập được về một dạng thống nhất trên SQL Server và xóa đi các thông tin không phù hợp như các giá trị trống, các cột không cần thiết, . . . - Tiếp theo đặt tên các học kỳ theo các năm học phổ thông lần lượt Toan1, Ly1, AV1, HK1, Toan2, Ly2, AV2, HK2, . . . ,Toan14, Ly14, AV14, KH14 dữ liệu khi đưa vào chương trình phải được sắp xếp lại theo cấu trúc sau: MaSV Toan1 Ly1 AV1 HK1 1 3.5 4.0 4.2 4.6 2 5.0 5.1 6.0 5.8 3 5.0 5.2 5.3 5.4 4 4.0 4.1 4.4 4.5 5 4.0 4.1 4.4 4.3 6 4.0 3.5 4.5 4.9 7 5.0 5.2 6.0 5.6 8 3.6 4.0 4.2 4.5 9 3.5 3.7 4.0 4.5 … … … … … … … … … … … Trang 5 Toan14 Ly14 AV14 HK14 5.3 5.4 5.3 5.3 6.4 6.5 6.5 6.5 5.6 6.0 6.4 5.6 5.7 6.0 6.1 5.7 4.3 4.6 4.6 4.6 6.5 6.6 6.5 6.5 6.0 6.1 5.9 6.0 6.0 5.7 6.0 5.7 4.8 4.8 4.4 4.8 … … … … Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam Ví dụ: Toan1, Ly1, AV1, HK1_Lop6, Toan2, Ly2, AV2, HK2_Lop6, . . ., Toan13, Ly13, AV13, HK13_Lop12, Toan14, Ly14, AV14, HK14_Lop12. Có tất cả 13 môn học theo thứ tự Toán, Lý, Hóa, Sinh, Tin, Văn, Sử, Địa, Ngoại ngữ, GDCD, Công nghệ, Thể dục và GDQP được đưa vào một bảng tổng hợp các dữ liệu để thuận tiện cho việc dự đoán. Quá trình dự đoán sẽ tiến hành trên các môn học để dự đoán các thông tin về mối quan hệ giữa các kết quả theo thời gian thể hiện sự biến động về năng lực học sinh. Việc dự đoán tiến hành trên toàn bộ cơ sở dữ liệu cho thông tin về dự báo kết quả học tập của học sinh. Trong đề tài này chỉ tập trung dự đoán điểm tổng kết theo từng học kỳ của ba môn học Toán, Lý, Anh văn và điểm tổng kết từng học kỳ của 13 môn học. Kết quả học tập của học sinh được được đánh giá làm 5 loại: Giỏi, Khá, TB, Yếu, Kém. Tiêu chuẩn xếp loại như sau: DiemTB>=8.0: Xếp loại Giỏi DiemTB>=6.5 và DiemTB<8.0: Xếp loại Khá DiemTB>=5.0 và DiemTB<6.5: Xếp loại TB DiemTB>=3.5 và DiemTB<5.0: Xếp loại Yếu DiemTB<3.5: Xếp loại Kém Ta chỉ cần duyệt qua cơ sở dữ liệu một lần, mỗi lần gặp một giá trị điểm ta thay nó bằng loại tương ứng. Sau bước này ta xây dựng được cơ sở dữ liệu có dạng: MaSV Toan1 Ly1 AV1 HK1 1 Y TB K Kem 2 TB K Kem TB 3 Y TB Kem K … … … … … … … … … … … Toan14 Ly14 AV14 HK14 K TB G G G K Y K G TB K TB … … … … Khi cài đặt chương trình dùng các số nguyên để ghi nhận các giá trị phân loại như sau: Số 1 đại diện loại Kém, số 2 đại diện loại Yếu, số 3 đại diện loại TB, số 4 đại diện loại Khá, số 5 đại diện loại Giỏi. MaSV Toan1 Ly1 AV1 HK1 1 2 3 4 1 2 3 4 1 3 3 2 3 1 4 … … … … … … … … … … … Toan14 Ly14 AV14 HK14 4 3 5 5 5 4 2 4 5 2 4 3 … … … … Toàn bộ kết quả phân loại đặt trong một mảng 2 chiều và được sử dụng cho nhiều thuật toán khác nhau. 3. Chương trình mô phỏng dự đoán học sinh a. Môi trường làm việc - Máy tính cần cài đặt các chương trình sau: + SQL Server 2008 + Visual Studio 2010 (C#). Trang 6 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam + Dữ liệu điểm học sinh được lưu trữ trên Microsoft Excel tên là DLHS1.xls cần Import vào SQL Server 2008 và đặt tên là QLHS.(Hướng dẫn phần phụ lục) - Số học sinh đưa vào để dự đoán khoảng 3000 học sinh. - Chương trình dự đoán kết quả học tập của học sinh được viết bằng ngôn ngữ Visual Studio 2010 (C#). b. Khởi động chương trình - Vào thư mục Thu nghiem, chọn thu nghiem.sln - Chọn biểu tượng Start Debugging trên thanh công cụ hoặc nhấn phím F5. c. Các chức năng chính của chương trình - Màn hình chính của chương trình: + Chức năng Hiển thị: Dùng để kết nối dữ liệu + Chức năng Cluster Data: Dùng để gom cụm dữ liệu + Chức năng Apriori: Tìm tất cả các luật + Chức năng Quit: Thoát chương trình khai phá Hình 1 Giao diện màn hình chính Trang 7 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam - Màn hình hiển thị (kết nối) : Trang 8 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam Hình 2. Hiện dữ liệu khai phá - Để thực hiện quá trình dự đoán, ta chọn chức năng Hiển thị dữ liệu rồi mới thực hiện các công việc khác chương trình sẽ liệt kê như sau: + Dữ liệu gốc là các điểm tổng kết từng học kỳ của 3 môn học Toán, Lý, Anh văn và điểm tổng kết theo từng học kỳ (từ lớp 6 đến lớp 12). + Dữ liệu đã qua biến đổi được phân loại như sau: Kém (số 1), Yếu( số 2), TB(số 3), Khá(số 4), Giỏi(số 5). Trang 9 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam - Màn hình gom cụm (Cluster): Hình 3. Giao diện gom cụm dữ liệu - Chọn “Cluster Data” để gom cụm dữ liệu, nhập số lượng cần gom cụm (tùy ý), sau đó chọn chức năng “Gom cụm”. - Kết quả xuất là trọng tâm của nhóm là 14 học kỳ, gồm điểm TB, Toán, Lý, Anh văn sau khi gom cụm và tỉ lệ phần trăm của chúng trong cơ sở dữ liệu. Trang 10 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam - Màn hình dự đoán kết quả: - Chọn chức năng “Dự đoán TB”: Xuất kết quả dự đoán điểm trung bình của học sinh qua 14 học kỳ. Hình 4. Giao diện dự đoán điểm trung bình Trang 11 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam - Chọn chức năng “Dự đoán Toán”: Xuất kết quả dự đoán điểm Toán của học sinh qua 14 học kỳ. Hình 5. Giao diện dự đoán điểm toán Trang 12 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam - Chọn chức năng “Dự đoán Lý”: Xuất kết quả dự đoán điểm Lý của học sinh qua 14 học kỳ. Hình 6. Giao diện dự đoán điểm lý Trang 13 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam - Chọn chức năng “Dự đoán AV”: Xuất kết quả dự đoán điểm Anh văn của học sinh qua 14 học kỳ. Hình 7. Giao diện dự đoán điểm Anh văn - Màn hình khai phá luật bằng thuật toán Apriori - Các tham số nhập vào chương trình: HK Vào, HK tiếp theo, Minsupp(Độ hỗ trợ tối thiểu) và Minconf(Độ tin cậy tối thiểu). - Ví dụ: HK vào là HK=1, Dự đoán HK tiếp theo=1, Minsupp= 10 và Minconf = 50( Ta có thể chọn tùy ý). - Chọn chức năng “Rules”: Tìm tất cả các luật thỏa mãn điều kiện ở trên. Trang 14 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam Hình 8. Giao diện tìm luật thuật toán Apriori III. HIỆU QUẢ CỦA ĐỀ TÀI a. Kết quả đạt được - Chương trình dự đoán kết quả học tập của học sinh trong suốt 7 năm học phổ thông( Từ lớp 6 – lớp 12), cho phép ta dự đoán tương đối chính xác kết quả học tập của học sinh. Từ đó cho ta thấy được mối quan hệ giữa kết quả của các học kỳ, từ học kỳ này ta có thể dự đoán học kỳ tiếp theo. Dựa vào kết quả này từ đó giúp cho các nhà quản lý giáo dục có hướng điều chỉnh nhằm nâng cao chất lượng học sinh cũng như tỉ lệ đậu tốt nghiệp cao hơn phục vụ cho mục đích quản lý, điều hành trong trường. - Chương trình được thiết kế dùng để minh họa cho thuật toán nên dễ sử dụng và đảm bảo độ tin cậy cao. Chương trình không tìm tất cả các itemset nên tốc độ xử lý rất nhanh. - Người dùng có thể thay đổi kích thước các mẫu theo từng năm học, mục tiêu khi dự đoán để nhận được các thông tin phù hợp. - Trong quá trình gom cụm có thể chủ động chọn số nhóm gom cụm, điều này cho phép người dùng nhận các thông tin đa dạng hơn. - Qua các kết quả gom cụm ta có thể nhận ra các mẫu phổ biến nào chiếm tỷ lệ cao trong cơ sở dữ liệu, nhờ đó mà giáo viên có thể đánh giá chính xác về tình hình chất lượng của học sinh để có hướng giảng dạy tốt hơn trong giai đoạn sắp tới. Trang 15 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam b. Đánh giá kết quả thử nghiệm Kết quả thử nghiệm dự đoán kết quả học tập của học sinh đã được trình bày ở trên. Dữ liệu đưa vào khai phá khoảng 3.000 học sinh, ta thu được kết quả như sau: Dùng thuật toán K-Mean để gom cụm dữ liệu học sinh: Dữ liệu đầu vào: - Dữ liệu đưa vào khai phá 3.000 học sinh. - Số cụm n = 4, thực hiện gom cụm trong 4 lần. Kết quả: - Gom cụm theo điểm TB: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ trong khoảng từ 18% - 19% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB, khá chiếm tỉ lệ trong khoảng 20% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 9% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 21% - 55% trong toàn bộ dữ liệu. - Gom cụm theo điểm Toán: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ trong khoảng từ 16% - 30% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB, khá chiếm tỉ lệ trong khoảng 35% - 44% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 10% - 18% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 29% - 55% trong toàn bộ dữ liệu. - Gom cụm theo điểm Lý: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ trong khoảng từ 12% - 17% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB, khá chiếm tỉ lệ trong khoảng 41% - 49% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 9% - 11% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 28% - 32% trong toàn bộ dữ liệu. - Gom cụm theo điểm Anh văn: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ trong khoảng từ 16% - 19% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB, khá chiếm tỉ lệ trong khoảng 42% - 45% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 10% - 11% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 25% - 28% trong toàn bộ dữ liệu. Nhận xét chung qua các lần gom cụm khác nhau kết quả học tập của học sinh thường ít có sự biến đổi đột ngột mà nó thể hiện sự ổn định nói lên năng lực của bản thân các học sinh trong cả quá trình học tập từ lớp 6 đến lớp 12. Dùng thuật toán Apriori để tìm các luật: Dữ liệu đầu vào: Dữ liệu đưa vào khai phá 3.000 học sinh. Chọn Minsupp(Độ hỗ trợ tối thiểu) =10, Minconf(Độ tin cậy tối thiếu) = 50%. Kết quả: Nếu Học kỳ 1 Giỏi Thì khả năng đạt Giỏi ở học kỳ tiếp theo là (Conf 95,3%). Nếu Học kỳ 1 Yếu Thì khả năng đạt TB hoặc Khá ở học kỳ tiếp theo là (Conf 35,3%). Nếu Học kỳ 1 TB Thì khả năng đạt Khá ở học kỳ tiếp theo là (Conf 53,2%) Trang 16 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam Nếu Học kỳ 1 Khá Thì khả năng đạt TB ở học kỳ tiếp theo là (Conf 27.5%) Nếu Học kỳ 1 TB Thì khả năng đạt Yếu ở học kỳ tiếp theo là (Conf 28.14%) Nếu Học kỳ 1 Khá Thì khả năng đạt Yếu ở học kỳ tiếp theo là (Conf 8.6%) Nếu Học kỳ 1 Yếu Thì khả năng đạt TB ở học kỳ tiếp theo là (Conf 49.14%) Nhận xét chung do quá trình học phổ thông kết quả thường trãi đều từ thấp đến cao và được chia thành 5 loại ( Kém, Yếu, Khá, TB, Giỏi) , do đó một loại chiếm tỉ lệ lớn 10% - 20% là tương đối, từ đó việc chọn minsupp 10% - 20% coi như là phù hợp. Để đạt được độ tin cậy của một số luật cao có thể cung cấp thông tin hữu ích cho việc dự đoán. IV. ĐỀ XUẤT, KIẾN NGHỊ KHẢ NĂNG ÁP DỤNG - Do thời gian thực hiện đề tài có hạn nên mới chỉ tập trung dự đoán một số môn như: Toán, Lý, Anh văn và điểm TB từng học kỳ( 14 học kỳ) còn các môn còn lại chưa đưa vào chương trình để dự đoán. Hướng tới có thể dự đoán tất cả các môn học còn lại. - Chương trình còn mang tính minh họa cho thuật toán, giao diện chưa được đẹp mắt, để sử dụng hiệu quả cần cài đặt thêm vài chức năng và các hướng dự đoán khác để hoàn chỉnh và ứng dụng hiệu quả cho nhiều lĩnh vực khác nhau. Giúp đỡ rất nhiều cho giáo viên và các nhà quản lý giáo dục trong việc cải thiện chất lượng đào tạo. - Bản thân tôi cũng mới bước đầu xây dựng phần mềm này trong quá trình viết chương trình còn nhiều thiếu sót, nhưng được sự giúp đỡ của các đồng nghiệp và đặc biệt là được sự hướng dẫn tận tình của PGS. TS Đỗ Phúc Trưởng ban đối ngoại Đại học Quốc Gia TP. Hồ Chí Minh đến nay phần mềm đã hoàn thành. Cuối cùng xin chân thành cảm ơn các đồng nghiệp và PGS.TS Đỗ Phúc đã giúp đỡ và tạo điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện đề tài “Xây dựng hệ thống dự đoán kết quả học tập của học sinh”. Một lần nữa xin chân thành cám ơn. V. TÀI LIỆU THAM KHẢO 1. Thông tư số: 58/2011/TT-BGDĐT ngày 12 tháng 12 năm 2011của Bộ trưởng Bộ Giáo dục và Đào tạo. 2. Quyết định số 02/2007/QĐ-BGDĐT ngày 23/01/2007 của Bộ trưởng Bộ GD&ĐT V/v ban hành Qui chế đánh giá xếp loại học viên theo học chương trình GDTX cấp THCS và cấp THPT 3. Nhà kho và khai mỏ dữ liệu, Đỗ Phúc (2003), NXB Đại học quốc gia TP Hồ Chí Minh. 4. Phát triển một số ứng dụng khai thác dữ liệu vào giáo dục đào tạo, Nguyễn Quốc Thông (2002), Luận văn thạc sĩ, Trường Đại Học Khoa Học Tự Nhiên TP. Hồ Chí Minh. Nhơn Trạch, ngày 8 tháng 05 năm 2013 Người viết Nguyễn Bảo Nam Trang 17 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam PHỤ LỤC 1. Máy tính cần cài đặt - SQL Server 2008 - Visual Studio 2010 (C#). 2. Dữ liệu Dữ liệu điểm học sinh được lưu trữ trên Microsoft Excel tên là DLHS1.xls được lưu trữ trong thư mục Thu nghiem trong đĩa CD 3. Các bước thực hiện chạy chương trình - Import dữ liệu từ file Excel DLHS1.xls vào SQL Server 2008 + Khởi động SQL Server 2008 + Chọn Connect + Chọn Database + Chọn New Database + Đặt tên Database name: QLHS + Chọn Add – Chọn Ok + Click phải chuột vào Database QLHS + Chọn Task + Chọn Import Data – Chọn Next + Mục Data Source – Chọn Microsoft Excel + Chọn Browse trong mục Excel file path + Chọn file Excel QLHS1.xls + Chọn Next – Next – Next – Chọn Sheet 1 + Chọn Finish – Chọn Close - Khởi động Visual Studio 2010 + Vào thư mục Thu nghiem, chọn file Thu nghiem.sln + Chọn biểu tượng Start Debugging trên thanh công cụ hoặc nhấn phím F5. Trang 18 Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam BM04-NXĐGSKKN CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc SỞ GD&ĐT ĐỒNG NAI ………, Trạch, ngày tháng … năm 2013 PHIẾU NHẬN XÉT, ĐÁNH GIÁ SÁNG KIẾN KINH NGHIỆM Năm học: 2012 - 2013 ––––––––––––––––– Tên sáng kiến kinh nghiệm: Xây dựng hệ thống dự đoán kết quả học tập của học sinh Họ và tên tác giả: Nguyễn Bảo Nam... Đơn vị (Tổ): GDTX Nhơn Trạch (Hướng Nghiệp Nghề) Lĩnh vực: Quản lý giáo dục  Phương pháp dạy học bộ môn: …………...........  Phương pháp giáo dục  Lĩnh vực khác: Tin học.......................................  1. Tính mới - Có giải pháp hoàn toàn mới  - Có giải pháp cải tiến, đổi mới từ giải pháp đã có  2. Hiệu quả - Hoàn toàn mới và đã triển khai áp dụng trong toàn ngành có hiệu quả cao  - Có tính cải tiến hoặc đổi mới từ những giải pháp đã có và đã triển khai áp dụng trong toàn ngành có hiệu quả cao  - Hoàn toàn mới và đã triển khai áp dụng tại đơn vị có hiệu quả cao  - Có tính cải tiến hoặc đổi mới từ những giải pháp đã có và đã triển khai áp dụng tại đơn vị có hiệu quả  3. Khả năng áp dụng - Cung cấp được các luận cứ khoa học cho việc hoạch định đường lối, chính sách: Tốt  Khá  Đạt  - Đưa ra các giải pháp khuyến nghị có khả năng ứng dụng thực tiễn, dễ thực hiện và dễ đi vào cuộc sống: Tốt  Khá  Đạt  - Đã được áp dụng trong thực tế đạt hiệu quả hoặc có khả năng áp dụng đạt hiệu quả trong phạm vi rộng: Tốt  Khá  Đạt  XÁC NHẬN CỦA TỔ CHUYÊN MÔN (Ký tên và ghi rõ họ tên) Trang 19 THỦ TRƯỞNG ĐƠN VỊ (Ký tên, ghi rõ họ tên và đóng dấu)
- Xem thêm -

Tài liệu liên quan