Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây xoài...

Tài liệu ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây xoài

.PDF
26
466
130

Mô tả:

ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA  NGUYỄN THỪA PHÁT TÀI ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng – Năm 2018 Công trình đƣợc hoàn thành tại TRƢỜNG ĐẠI HỌC BÁCH KHOA Ngƣời hƣớng dẫn khoa học: TS. HUỲNH HỮU HƢNG Phản biện 1: PGS. TS. HUỲNH CÔNG PHÁP Phản biện 2: TS. NGUYỄN THÁI SƠN Luận văn sẽ đƣợc bảo vệ trƣớc Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Khoa học máy tính tại Trƣờng Đại học Bách khoa vào ngày 03 tháng 02 năm 2018. Có thể tìm hiểu luận văn tại:  Trung tâm Học liệu, Đại học Đà Nẵng tại Trƣờng Đại học Bách khoa.  Thƣ viện Khoa Công nghệ thông tin, Trƣờng Đại học Bách khoa – ĐHĐN. -1MỞ ĐẦU 1. Lý do chọn đề tài Hiện nay nông dân tại các tỉnh đồng bằng sông Cửu Long nói chung và tỉnh Trà Vinh nói riêng chỉ canh tác và trồng trọt chủ yếu chỉ dựa vào kinh nghiệm mà chƣa biết ứng dụng khoa học và công nghệ vào trong sản xuất để nâng cao chất lƣợng sản phẩm, hiệu quả kinh tế nhằm giảm chi phí sản xuất. Chính vì vậy việc triển khai nghiên cứu các ứng dụng nhận dạng và xử lý ảnh để chẩn đoán bệnh trên cây Xoài, một loại cây trồng có giá trị kinh tế cao, nhằm giải phóng sức lao động, tiết kiệm thời gian, nâng cao năng suất là một việc làm hết sức có ý nghĩa trong giai đoạn này. Từ hiện trạng và những lý do trên tôi xin đề xuất đề tài: “Ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài” 2. Mục tiêu và nhiệm vụ nghiên cứu 2.1 Mục tiêu nghiên cứu Nghiên cứu ứng dụng máy vectơ hỗ trợ trong việc chẩn đoán bệnh trên cây Xoài thông qua hình ảnh. 2.2 Nhiệm vụ nghiên cứu - Nghiên cứu tổng quan về xử lý ảnh số, nhận dạng mẫu, thuật toán SVM. - Tìm hiểu và thu thập hình ảnh các loại bệnh trên Xoài ngoài thực địa. - Phƣơng pháp huấn luyện, nhận dạng và xử lý ảnh số. 3. Đối tƣợng và phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu - Hình ảnh, các đặc trƣng của cây Xoài bị bệnh và không bị bệnh ngoài thực địa. - Nghiên cứu và áp dụng thuật toán SVM trong phân lớp và nhận dạng. -2- 3.2 Phạm vi nghiên cứu - Dùng thuật toán SVM trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài. 4. Phƣơng pháp nghiên cứu 4.1 Phương pháp nghiên cứu lý thuyết - Tham khảo các đề tài, bài báo liên quan đến lĩnh vực nhận dạng trái cây. - Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trƣng ảnh, xác định biên, nghiên cứu các kỹ thuật nhận dạng mẫu. 4.2 Phương pháp nghiên cứu thực nghiệm - So sánh và phân tích hình ảnh trái, lá cây Xoài có bệnh và không bệnh ngoài thực địa. - Triển khai và cài đạt chƣơng trình. 5. Ý nghĩa khoa học và thực tiễn của luận văn 5.1 Ý nghĩa khoa học Nghiên cứu nhằm ứng dụng khoa học và công nghệ vào sản xuất nông nghiệp, đƣa ra giải pháp nhằm góp phần ứng dụng kỹ thuật nhận dạng và xử lý ảnh vào sản xuất nông nghiệp tại tỉnh Trà Vinh. 5.2 Ý nghĩa thực tiễn Góp thêm một giải pháp mới để nông dân chẩn đoán bệnh trên cây Xoài tại tỉnh Trà Vinh, góp phần giải phóng sức lao động, tiết kiệm chi phí và nâng cao năng suất cây trồng, tăng thu nhập cho nông dân. -3CHƢƠNG 1 -TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH 1.1 Các bƣớc cơ bản trong xử lý ảnh số: Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tƣơng tác ngƣời máy. Hình 1. 1 Các bƣớc trong xử lý ảnh 1.1.1 Thu nhận ảnh 1.1.2 Tiền xử lý 1.1.3 Phân đoạn hay phân vùng ảnh 1.1.4 Biểu diễn ảnh 1.1.5 Nhận dạng và nội suy ảnh 1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số 1.2.1 Điểm ảnh 1.2.2 Ảnh đen trắng 1.2.3 Ảnh nhị phân 1.2.4 Ảnh màu 1.3 Cải thiện ảnh sử dụng toán tử điểm: 1.3.1 Tăng giảm độ sáng Hình 1. 2 Ảnh tăng/giảm độ sáng -41.3.2 Tăng độ tương phản Hình 1. 3 Ảnh khi tăng tƣơng độ phản 1.3.3 Biến đổi âm bản Hình 1. 4 Ảnh âm bản 1.3.4 Biến đổi ảnh đen trắng Hình 1. 5 Ảnh trắng đen 1.3.5 Lược đồ xám(Histogram) Hình 1. 6 Cân bằng mức xám của ảnh 1.3.6 Kỹ thuật cải thiện ảnh nhị phân Hình 1. 7 Minh hoạ của phép giãn ảnh -5- Hình 1. 8 Ứng dụng của phép co ảnh 1.4 Trích rút đặt trƣng ảnh 1.4.1 Đặc trưng màu sắc Hình 1. 9 Không gian màu HSV 1.4.2 Đặc trưng kết cấu Một số trích chọn đặc điểm kết cấu suy ra từ GLCM 1.5 Phƣơng pháp nhận dạng. 1.5.1 Khái niệm nhận dạng. Quá trình nhận dạng dựa vào những mẫu học biết trƣớc gọi là nhận dạng có thầy hay học có thầy, trong những trƣờng hợp ngƣợc lại gọi là học không có thầy. -61.5.2 Support vector machine (SVM) SVM là một phƣơng pháp phân lớp xuất phát từ lý thuyết học thống kê. SVM sẽ cố gắng tìm cách phân lớp dữ liệu sao cho có lỗi xảy ra trên tập kiểm tra là nhỏ nhất. Ý tƣởng của nó là ánh xạ (tuyến tính hoặc phi tuyến) dữ liệu vào không gian các vector đặc trƣng mà ở đó một siêu phẳng tối ƣu đƣợc tìm ra để tách dữ liệu thuộc hai lớp khác nhau. Hình 1. 10 H2 là siêu phẳng tốt nhất 1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors) 1.5.4 Mô hình Markov ẩn (Hidden Markov Models) 1.5.5 Mạng nơ-ron nhân tạo 1.6 Đánh giá ƣu điểm của thuật toán SVM • SVM rất hiệu quả để giải quyết bài toán dữ liệu có số chiều lớn. • SVM giải quyết vấn đề overfitting rất tốt (dữ liệu có nhiễu và tách dời nhóm hoặc dữ liệu huấn luyện quá ít) • Là phƣơng pháp phân lớp nhanh • Có hiệu suất tổng hợp tốt và hiệu suất tính toán cao KẾT CHƢƠNG Chƣơng 1 tác giả đã trình bày tổng quan về các vấn đề liên quan tới nhận dạng và xử lý ảnh số. Tiếp theo chƣơng 2, tác giả sẽ trình bày chi tiết về nhận dạng và phân tích mẫu, ứng dụng thuật toán SVM để chẩn đoán bệnh trên cây Xoài. -7CHƢƠNG 2 – PHƢƠNG PHÁP NHẬN DẠNG VÀ PHÂN LOẠI 2.1 Các công trình nghiên cứu liên quan 2.2 Trích xuất đặc trƣng trong đánh và phân loại trái cây: 2.2.1 ử dụng đặc trưng màu sắc 2.2.2 Trích chọn đặc trưng màu cho bài toán so màu lá lúa Hình 2. 1 Minh họa trích đặc trƣng màu với moment thứ nhất Hình 2.2 Minh họa trích đặc trƣng màu với 3 moment màu 2.2.3 2.2.4 ử dụng đặc trưng kết cấu ử dụng đặc trưng Gist và Gist descriptor. 2.3 Các phƣơng pháp phân loại trái cây: 2.3.1 Phân biệt phần cuống và khiếm khuyết thực tế trên trái cây. -8- Hình 2.3 Mô hình phân biệt phần cuống với các khiếm khuyết trên trái cây 2.3.2 Kết hợp các thống kê màu sắc và đặc trưng kết cấu để nhận biết bệnh táo -92.3.3 Nghiên cứu xây dựng hệ thống h trợ nông dân so màu lá lúa Hình 2.4 Mô hình hệ thống 2.4 KẾT CHƢƠNG Trong chƣơng 2, tác giả tìm hiểu một số bài toán về nhận dạng và phân loại, kết quả thực nghiệm trên các loại trái cây nhƣ táo, cam quýt, bài toán nhận dạng trên lá và so màu lá l a. Thông qua các công trình nghiên cứu hiện tại tác giả đã hiểu biết đƣợc một số thuật toán và các đặc trƣng cần trích xuất cho một bài toán nhận dạng và phân loại. -10CHƢƠNG 3 – ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG CHẨN ĐOÁN BỆNH TRÊN XOÀI 3.1 Phƣơng pháp phân lớp dữ liệu máy vector hỗ trợ SVM 3.1.1 Giới thiệu SVM thực hiện chuyển tập mẫu từ không gian biểu diễn Rn của ch ng sang một không gian Rd có số chiều lớn hơn. Trong không gian Rd tìm một siêu phẳng tối ƣu để phân hoạch tập mẫu này dựa trên phân lớp của ch ng. 3.1.2 Ý tưởng của phương pháp Cho trƣớc một tập huấn luyện, đƣợc biểu diễn trong không gian vector, trong đó mỗi tài liệu là một điểm, phƣơng pháp này tìm ra một siêu phẳng f quyết định tốt nhất có thể chia các điểm trên không gian này thành hai lớp riêng biệt tƣơng ứng là lớp + và lớp -. Chất lƣợng của siêu phẳng này đƣợc quyết định bởi khoảng cách (gọi là biên) của điểm dữ liệu gần nhất của mỗi lớp đến mặt phẳng này. Khi đó khoảng cách biên càng lớn thì mặt phẳng quyết định càng tốt, đồng thời việc phân loại càng chính xác. -113.1.3 Các bước chính của phương pháp Phƣơng pháp SVM yêu cầu dữ liệu đƣợc diễn tả nhƣ các vector của các số thực. Nhƣ vậy nếu đầu vào chƣa phải là số thì ta cần phải tìm cách chuyển ch ng về dạng số của SVM. • Tiền xử lý dữ liệu: Thực hiện biến đổi dữ liệu phù hợp cho quá trình tính toán, tránh các số quá lớn mô tả các thuộc tính. Thƣờng nên co giãn (scaling) dữ liệu chuyển về đoạn [-1,1] hoặc [0,1]. • Chọn hàm hạt nhân: Lựa chọn hàm hạt nhân phù hợp tƣơng ứng cho từng bài toán cụ thể để đạt độ chính xác cao trong quá trình phân lớp. • Thực hiện việc kiểm tra chéo để xác định các tham số cho ứng dụng: Điều này cũng quyết định đến tính chính xác của quá trình phân lớp. • Sử dụng các tham số cho việc huấn luyện với tập mẫu: Trong quá trình huấn luyện sẽ sử dụng thuật toán tối ƣu hóa khoảng cách giữa các siêu phẳng trong quá trình phân lớp, xác định hàm phân lớp trong không gian đặc trƣng nhờ việc ánh xạ dữ liệu vào không gian đặc trƣng bằng cách mô tả hạt nhân và cuối cùng là kiểm thử tập dữ liệu. 3.1.4 Cơ sở lý thuyết Hình 3. 1 Minh họa cho bài toán phân hai lớp 3.2 Chẩn đoán bệnh trên xoài với máy vetor hỗ trợ SVM: 3.2.1 Mô tả bài toán -12Để nhận dạng và chẩn đoán bệnh trên xoài, tác giả đề xuất thực hiện các bƣớc xử lý nhƣ sau: Bước 1: thu nhận tạp ảnh huấn luyện và ảnh kiểm tra Bước 2: thực hiện các bƣớc tiền xử lý, nâng cao chất lƣợng ảnh, chuyển ảnh màu RGB sang ảnh màu HSV, tách các kênh H, S, V riêng biệt. Bước 3: Trích xuất đặc trƣng, tính giá trị trung của mỗi kênh màu HSV và độ lệch chuẩn của mỗi kênh màu trong không gian màu HSV làm tham số cho màu sắc, Ảnh màu kênh màu V đƣợc dùng trích lọc đặc trƣng kết cấu, ảnh V làm tham số đầu vào kết hợp sóng con Gabor và lƣợc đồ mức xám đƣợc tính toán bằng ma trận GLCM để trích lọc đặc trƣng kết cấu đƣa vào huấn luyện. Bước 4: thuật toán SVM đƣợc sử dụng để thực hiện phân lớp, so khớp các tham số đặc trƣng của mẫu xoài cần kiểm tra với tập CSDL các đặc trƣng của lá/trái xoài đã đƣợc phân lớp, kết quả trả về là/trái xoài bị bệnh gì hoặc không bệnh. 3.2.2 Mô hình giải quyết bài toán Hình 3. 2 Mô hình chẩn đoán bệnh trên cây xoài 3.3 Tiền xử lý 3.3.1 Tăng/giảm độ tương phản của ảnh -13Nếu ảnh có độ tƣơng phản kém so với nền, ta có thể thay đổi theo các hàm. Trong Matlab, để thực hiện nâng cao độ tƣơng phản của ảnh đầu vào in_img ta sử dụng câu lệnh sau: Out_img = imadjust(in_img); Hình 3. 3 Độ tƣơng phản của ảnh 3.3.2 Thực hiện phép co/giãn ảnh Hình 3. 4 Co giãn ảnh 3.3.3 Chuyển và tách ảnh màu RGB sang các kênh H-S-V Chuyển ảnh màu RGB sang ảnh màu HSV và tách cách kênh màu Hình 3. 5 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các kênh màu -14Giá trị của S và V nằm trong khoảng 0 (màu đen) và 1 (màu trắng), giá trị của H nằm trong khoảng 0 đến 360. 3.4 Trích chọn đặc trƣng 3.4.1 Đặc trưng màu sắc Để tách đƣợc đặc trƣng về màu sắc, tác giả đề xuất ảnh màu RGB đƣợc chuyển đổi sang không gian màu và tách các kênh H, S, V riêng biệt. Tính giá trị trung của ba kênh màu H, S, V và độ lệch chuẩn của các kênh màu trong không gian màu HSV làm tham số đặc trƣng cho màu sắc. Phƣơng pháp tính độ lệch chuẩn (Standard Deviation) từ một dãy n giá trị cho trƣớc x1, x2,...xn: Bước 1: Tìm mean của dãy số đã cho (x1+x2+...+xn) / n Bước 2: Với mỗi x trong dãy số đã cho, tính độ lệch (deviation) của nó so với mean bằng phép tính (x - mean) Bước 3: Tính bình phƣơng của các giá trị thu đƣợc ở bƣớc 2. Bước 4: Tìm mean của các bình phƣơng độ lệch tìm đƣợc ở bƣớc 3. Giá trị này đƣợc biết đến nhƣ là phƣơng sai (Variance) σ2. Bước 5: Tính căn bậc hai (square root) của phƣơng sai (Variance) ta đƣợc kết quả cần tìm. 3.4.2 Đặc trưng kết cấu Ảnh màu RGB đầu vào sau khi đƣợc chuyển đổi sang không gian màu HSV và đƣợc tách ra từng kênh H, S, V riêng biệt thì kênh đơn màu V đƣợc dùng làm đầu vào cho sóng con Gabor để trích lọc đặc trƣng kết cấu, sóng con Gabor có rất nhiều tham số khác nhau, vì vậy tại bƣớc này phải thực hiện để điều chỉnh và chọn lọc các giá trị tham số đầu vào của sóng con Gabor sao cho kết quả xử lý ảnh đơn -15màu V nổi rõ kết cấu nhất. Sau đƣa vào sóng con Gabor một ảnh đơn kênh mới có kết cấu rõ nhất đƣợc tạo ra (ảnh V’), ảnh V’ này đƣợc đƣa vào ma trận đồng hiện mức xám để đo lƣờng các giá trị kết cấu của ảnh V’. Kết quả từ ma trận đồng hiện mức xám đƣợc dùng làm dữ liệu đầu xây dựng tập CSDL huấn luyện hoặc làm tham số đầu vào để phân lớp đối tƣợng. 3.4.2.1 Sóng con Gabor – Gabor Wavelet Trong xử lý ảnh, sóng con Gabor là một bộ lọc tuyến tính thƣờng đƣợc sử dụng để phát hiện biên, phần vùng ảnh, phân tích đặc trƣng ảnh, phân lớp ảnh,...Tần số và hƣớng đƣợc thể hiện trong các sóng con Gabor tƣơng tự nhƣ hệ thống thị giác của con ngƣời. Tập hợp các sóng con Gabor với tần số và hƣớng khác nhau có thể trợ gi p cho việc trích lọc đầy đủ các đặc trƣng trong ảnh. Sóng con Gabor hai chiều (2-D Gabor) đƣợc áp dụng trong ảnh với tỉ lệ và tần số khác nhau. Hàm Gabor 2-D đƣợc biến đổi từ đƣờng hình sin phức tạp của hàm Gaussian 2-D. Hàm sóng con Gabor trong miền không gian có dạng nhƣ sau: Bƣớc sóng (λ - lamda) đại diện cho sóng của các tác nhân cosine của hàm Gaussian, hƣớng (θ - theta) đại diện cho hƣớng của các đƣờng gạch sọc song song của hàm Gabor tại một góc nào đó (độ), độ lệch pha – phase offset (φ - phi) theo góc, và tỉ lệ hƣớng (γ - gamma) là tỷ -16lệ co giãn trong không gian và nó xác định tính đơn giản của hàm Gabor, và độ lệch chuẩn σ xác định kích thƣớc của hàm Gaussian tuyến tính. Băng thông (b) bán đáp ứng (half-response) trong không gian tần số và tỉ lệ giữa σ/  có quan hệ nhƣ sau: Bảng 3. 1 Tham số hàm Gabor Wavelet và đặc trƣng kết cấu ảnh V Ảnh màu RGB Gabor Wavelet    8,   [0 2 ],   0.5, b  1, N  10,   36    8,   [0 2 ],   0.5, b  1, N  10,   72    8,   [0 2 ],   0.5, b  1, N  10,   108    8,   [0 2 ],   0.5, b  1, N  10,   144    8,   [0 2 ],   0.5, b  1, N  10,   180 Ảnh kết cấu -173.4.2.2 Ma trận đồng hiện mức xám Co-occurrence GLCM là một trong những phƣơng pháp trích lọc đặc trƣng quan trọng trong lĩnh vực phân tích kết cấu ảnh đƣợc đề xuất từ rất sớm bởi Haralick vào năm 1973. GLCM của ảnh f(x,y) có kích thƣớc MxM và có G mức độ xám là một ma trận hai chiều C(i, j). Mỗi phần tử của ma trận thể hiện xác suất xảy ra cùng giá trị cƣờng độ sáng i và j tại một khoảng cách d và một góc θ xác định. Do đó, có thể có nhiều ma trận GLCM khác nhau phụ thuộc vào cặp giá trị d và θ Một số đặt trƣng quan trọng có thể kể đến nhƣ năng lƣợng (energy), độ tƣơng phản (contrast), entropy, độ tƣơng đồng (Correlation), tính đồng nhất (homogeneity). Bảng 3. 2 Các giá trị tham số của GLCM Các giá trị tham số của Ảnh màu RGB Gabor Wavelet GLCM Entropy: 0.265715 Contrast: 0.143287 Correlation: 0.716450    8,   [0 2 ],   0.5, Energy: 0.625673 b  1, N  10,   36 Homogeneity: 0.632575    8,   [0 2 ],   0.5, b  1, N  10,   72    8,   [0 2 ],   0.5, b  1, N  10,   108    8,   [0 2 ],   0.5, b  1, N  10,   144 Entropy: 0.596124 Contrast: 0.343675 Correlation: 0.574691 Energy: 0.626423 Homogeneity: 0.451565 Entropy: 0.365885 Contrast: 0.241668 Correlation: 0.724789 Energy: 0.621576 Homogeneity: 0.594648 Entropy: 0.357885 Contrast: 0.341568 Correlation: 0.615239 Energy: 0.632326 -18-    8,   [0 2 ],   0.5, b  1, N  10,   180 Homogeneity: 0.548535 Entropy: 0.432624 Contrast: 0.241714 Correlation: 0.527460 Energy: 0.621873 Homogeneity: 0.628845 3.5 Thực nghiệm 3.5.1 Một số hình ảnh tập mẫu huấn luyện trái xoài 3.5.1.1 Mẫu xoài không bệnh Hình 3. 6 Xoài không bệnh 3.5.1.2 Mẫu bệnh thối trái trên xoài do nấm Hình 3. 7 bệnh thối trái 3.5.1.3 Mẫu bệnh nứt trái trên xoài Hình 3. 8 bệnh nứt trái 3.5.2 Một số hình ảnh tập mẫu huấn luyện lá xoài 3.5.2.1 Mẫu lá không bệnh Hình 3. 9 lá xoài không bệnh 3.5.2.2 Mẫu lá bệnh ghẻ lồi
- Xem thêm -

Tài liệu liên quan