i
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
TRẦN XUÂN TRƢỜNG
KHÔI PHỤC ẢNH MÀU BỊ MỜ VÀ NHIỄU
BẰNG CÁC BỘ LỌC CÓ HƢỚNG
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01
LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. ĐÀO NAM ANH
Thái Nguyên, năm 2015
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
ii
LỜI CẢM ƠN
Trên thực tế không có thành công nào mà không gắn liền với những
sự hỗ trợ, giúp đỡ trong suốt thời gian từ khi bắt đầu học tập tại trƣờng đến
nay, em đã nhận đƣợc rất nhiều sự quan tâm, giúp đỡ của quý Thầy Cô
Khoa phòng đào tạo Đại học Công nghệ Thông tin và Truyền thông – Đại
học Thái Nguyên đã cùng với tri thức và tâm huyết của mình để truyền đạt
vốn kiến thức quý báu cho chúng em trong suốt thời gian học tập tại
trƣờng, và luôn luôn tạo mọi điều kiện tốt nhất cho chúng em trong suốt
quá trình học. Em xin chân thành cảm ơn quý Thầy Cô và Ban lãnh đạo
nhà trƣờng!
Với lòng biết ơn sâu sắc nhất em xin gửi lời cảm ơn tới TS. Đào
Nam Anh, Khoa Công nghệ Thông tin – Đại học Điện Lực, là cán bộ trực
tiếp hƣớng dẫn khoa học cho em. Thầy đã dành nhiều thời gian cho việc
hƣớng dẫn em cách nghiên cứu, đọc tài liệu, cài đặt các thuật toán và giúp
đỡ em trong việc xây dựng chƣơng trình, em xin chân thành cảm ơn Thầy!
Và cuối cùng em xin bày tỏ lòng chân thành và biết ơn tới lãnh đạo
khoa Công nghệ Thông tin trƣờng Đại học Kinh doanh và Công nghệ Hà
Nội cùng bạn bè đồng nghiệp đã luôn ở bên cạnh những lúc em khó khăn
và tạo điều kiện thuận lợi giúp em hoàn thành luận văn.
Hà Nội, Ngày 01 tháng 6 năm 2015
Học viên
Trần Xuân Trƣờng
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
iii
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn là kết quả nghiên cứu của tôi, không sao
chép của ai. Nội dung luận văn có tham khảo và sử dụng các tài liệu liên
quan, các thông tin trong tài liệu đƣợc đăng tải trên các tạp chí và các trang
website theo danh mục tài liệu của luận văn.
Tác giả luận văn
Trần Xuân Trƣờng
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
iii
MỤC LỤC
LỜI CẢM ƠN ................................................................................................. i
LỜI CAM ĐOAN ..........................................................................................iii
MỤC LỤC .....................................................................................................iii
DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT ........................... v
DANH MỤC HÌNH VẼ ...............................................................................vi
CHƢƠNG I. MÔ HÌNH ẢNH BỊ MỜ VÀ NHIỄU ..................................... 3
1.1. Xử lý ảnh và mô hình biểu diễn ảnh .............................................. 3
1.1.1. Ảnh và điểm ảnh ......................................................................... 4
1.1.2. Mức xám của ảnh ....................................................................... 5
1.1.3. Các lân cận của điểm ảnh ........................................................... 5
1.1.4. Các mối liên kết điểm ảnh .......................................................... 8
1.1.5. Đo khoảng cách giữa các điểm ảnh ............................................ 8
1.2. Các phép toán hình thái học cơ bản ............................................... 9
1.2.1. Định nghĩa phép giãn (Dilation) ................................................. 9
1.2.2. Định nghĩa phép co (Erosion) .................................................. 10
1.2.3. Định nghĩa phép mở (Open) ..................................................... 10
1.2.4. Định nghĩa phép đóng (Close).................................................. 10
1.3. Mờ ảnh.......................................................................................... 11
1.3.1. Mờ trung bình (Average Blur) ................................................. 11
1.3.2. Mờ do chuyển động (Motion Blur) .......................................... 12
1.3.3. Mờ Gaussian ............................................................................. 12
1.3.4. Mờ ngoài tiêu cự....................................................................... 13
1.4. Nhiễu ảnh ..................................................................................... 14
1.4.1. Nhiễu cộng ................................................................................ 14
1.4.2. Nhiễu nhân ................................................................................ 14
1.4.3. Nhiễu xung ............................................................................... 15
1.4.4. Tiêu chí đánh giá tỉ lệ nhiễu, so sánh với ảnh gốc ................... 15
1.5. Mờ ảnh và nhiễu ảnh .................................................................... 15
1.6. Một số phƣơng pháp khôi phục ảnh cơ bản ................................. 15
1.6.1. Phƣơng pháp Fourier nghịch đảo ............................................. 16
1.6.2. Phƣơng pháp Wavelets ............................................................. 17
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
iv
1.6.3. Phƣơng pháp dùng nhân nhỏ .................................................... 18
1.6.4. Phƣơng pháp Quick Pixon ........................................................ 19
1.6.5. Phƣơng pháp lọc Wiener .......................................................... 19
1.6.6. Phƣơng pháp thống kê .............................................................. 21
1.7. Kết luận chƣơng I ......................................................................... 21
CHƢƠNG II. KHÔI PHỤC ẢNH MÀU BỊ MỜ VÀ NHIỄU, GIỮ
CẠNH ............................................................................................................. 23
2.1. Khôi phục ảnh dùng bộ lọc có hƣớng .......................................... 23
2.1.1. Bƣớc tiền xử lý khử mờ ............................................................ 24
2.1.2. Xây dựng bộ lọc có hƣớng ....................................................... 26
2.1.3. Tìm bộ lọc có hƣớng ƣớc lƣợng kernel nhiễu .......................... 27
2.1.4. Khử nhiễu sau khi có bộ lọc ƣớc lƣợng nhiễu.......................... 30
2.1.5. So sánh với một số thuật toán................................................... 31
2.2. Một số phƣơng pháp khác ............................................................ 32
2.2.1. Khôi phục ảnh dùng Tổng biến thể .......................................... 32
2.2.2. Khôi phục ảnh dùng phƣơng pháp Richardson-Lucy .............. 34
2.2.3. Khôi phục ảnh dùng phƣơng pháp Picard ................................ 35
2.2.4. Khôi phục ảnh dùng Maximum Entropy .................................. 38
2.2.5. Khôi phục ảnh dùng TV và phép lặp Bregman ........................ 39
2.3. Kết luận chƣơng 2 ........................................................................ 42
CHƢƠNG III. CÀI ĐẶT THỬ NGHIỆM .................................................. 43
3.1.
3.2.
3.3.
3.4.
Môi trƣờng cài đặt ........................................................................ 43
Kết quả thực nghiệm .................................................................... 43
So sánh ......................................................................................... 57
Kết luận chƣơng III ...................................................................... 58
KẾT LUẬN .................................................................................................... 59
TÀI LIỆU THAM KHẢO ............................................................................ 60
PHỤ LỤC: TRÍCH MÃ NGUỒN ................................................................ 62
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
v
DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT
Các thuật ngữ
Ý nghĩa
Debluring
Khôi phục ảnh màu bị nhiễu
Wavelet
Sóng nhỏ
Inpainting
Khôi phục ảnh
Kernel
Nhân
Total variation
biến thể
Average Blur
Mờ trung bình
Motion Blur
Mờ do chuyển động
Các từ viết tắt
Ý nghĩa
XLA
Xử lý ảnh
PDE
Partial differential equation
ODE
Ordinary differential equations
PSRN
Peak Signal to Noise Ratio
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
vi
DANH MỤC HÌNH VẼ
Hình 1-1: Khôi phục ảnh ................................................................................ 3
Hình 1-2: Lân cận các điểm ảnh có tọa độ (x, y) ............................................ 6
Hình 1-3: Đƣờng 8 nối 4 điểm........................................................................ 7
Hình 1-4: Mờ trung bình (Average Blur) ...................................................... 12
Hình 1-5: Mờ do chuyển động (Motion Blur) ............................................... 12
Hình 1-6: Mờ Gaussian ................................................................................ 13
Hình 1-7: Mờ ngoài tiêu cự .......................................................................... 13
Hình 1-8: Bên trái - ảnh gốc, bên phải ảnh nhiễu cộng ................................. 14
Hình 1-9: Bên trái trên - ảnh gốc, bên trái dƣới - ảnh nhiễu, bên phải ảnh nhiễu nhân .................................................................................................... 15
Hình 1-10: Fourier nghịch đảo ..................................................................... 16
Hình 1-11: Khôi phục ảnh dùng Phép chập Fourier ...................................... 17
Hình 1-12: Wavelets – Các sóng nhỏ ........................................................... 18
Hình 1-13: Khôi phục ảnh bằng phƣơng pháp Quick Pixon .......................... 19
Hình 1-14: Khôi phục ảnh bằng phƣơng pháp lọc Wiener bên trái là ảnh gốc,
bên phải là ảnh đƣợc khôi phục .................................................................... 21
Hình 1-15: Khôi phục ảnh bằng phƣơng pháp thống kê bên trái là ảnh gốc,
bên phải là ảnh đƣợc khôi phục .................................................................... 21
Hình 2-1: Thuật toán khôi phục ảnh mờ và nhiễu dùng bộ lọc có hƣớng ...... 29
Hình 2-2: Khôi phục ảnh dùng tổng biến thể bên trái là ảnh gốc, bên phải là
ảnh đƣợc khôi phục ...................................................................................... 34
Hình 2-3: Khôi phục ảnh Richardson – Lucy bên trái là ảnh gốc, bên phải là
ảnh đƣợc khôi phục ...................................................................................... 35
Hình 2-4: Khôi phục ảnh dùng phƣơng pháp Picard bên trái là ảnh gốc, bên
phải là ảnh đƣợc khôi phục........................................................................... 37
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
vii
Hình 2-5: Khôi phục ảnh dùng phƣơng pháp Maximum Entropy bên trên là
ảnh gốc, bên dƣới là ảnh đƣợc khôi phục ..................................................... 38
Hình 2-6: Khôi phục ảnh dùng phƣơng pháp của Lin và cộng sự bên trái là
ảnh gốc, bên phải là ảnh đƣợc khôi phục ...................................................... 39
Hình 2-7: Khôi phục ảnh dùng phƣơng pháp Fish và cộng sự ...................... 40
Hình 2-8: Khôi phục ảnh dùng phƣơng pháp Osher và Rudin ...................... 40
Hình 2-9: Khôi phục ảnh dùng phƣơng pháp Chan và cộng sự bên trái là ảnh
gốc, bên phải là ảnh đƣợc khôi phục ............................................................ 41
Hình 2-10: Khôi phục ảnh dùng phƣơng pháp của You, Kaveh, Chan và
Wong bên trái là ảnh gốc, bên phải là ảnh đƣợc khôi phục ........................... 42
Hình 3-1: Khôi phục ảnh dùng phƣơng pháp lọc có hƣớng bên trên là ảnh
gốc, bên phải là kênh lọc, bên dƣới là ảnh đƣợc khôi phục ........................... 44
Hình 3-2: Ảnh gốc có dạng texture rừng cây bị mờ do chuyển động ........... 45
Hình 3-3: Ảnh gốc có dạng texture các đám mây bị mờ do chuyển động .... 46
Hình 3-4: Ảnh gốc có dạng cấu trúc vân vỏ sò bị mờ do chuyển động ....... 47
Hình 3-5: Ảnh gốc có sự tham gia của nhiều ngƣời chuyển động ................ 48
Hình 3-6: Ảnh gốc có sự tham gia của máy xúc hoạt động .......................... 49
Hình 3-7: Ảnh gốc là khung cảnh có kiến trúc của một nhà máy, bị mờ do
chuyển động ................................................................................................. 50
Hình 3-8: Ảnh gốc là khung cảnh có kiến trúc cầu, bị mờ do chuyển động 51
Hình 3-9: Ảnh gốc là khung cảnh dạng kiến trúc các công trình xây dựng, bị
mờ do chuyển động ...................................................................................... 52
Hình 3-10: Ảnh gốc có sự tham gia của nhiều máy xúc hoạt động ............. 53
Hình 3-11: Ảnh gốc có sự tham gia của một tàu biển đang chạy ................. 54
Hình 3-12: Ảnh gốc có sự tham gia của nhiều tàu biển đang chạy nhiều
hƣớng ........................................................................................................... 55
Hình 3-13: Ảnh gốc là các cột bị rung, nhiễu do chuyển động..................... 56
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
1
LỜI MỞ ĐẦU
Lĩnh vực toán ứng dụng đã phát triển rất nhiều trong thế kỷ qua. Với sự sẵn có
của thiết bị máy tính giá thành hạ trong những năm gần đây, toán ứng dụng đã mở
rộng sang nhiều lĩnh vực liên quan. Trong số này có ngành sinh học và vật lý, khoa
học vật liệu, và tính toán hình học. Lĩnh vực phân tích số đƣợc phát triển cho các vấn
đề ngoài toán học. Phân tích số có nhiều chủ đề thú vị nhƣ tìm đƣờng cong kỹ thuật
phù hợp, phân tích sự phù hợp và sự khác biệt, và các giải pháp phƣơng trình vi phân.
Ngoài ra còn có các hệ thống tuyến tính và giá trị đặc trƣng, cũng nhƣ các phƣơng
pháp tối ƣu và các thuật toán tổ hợp. Một trong những lĩnh vực liên quan có sự phát
triển nhanh gần đây là lĩnh vực xử lý ảnh. Với sự gia tăng của máy ảnh kỹ thuật số,
máy quét, và ảnh kỹ thuật số, các phƣơng pháp tốt xử lý ảnh càng trở nên cần thiết.
Khôi phục ảnh màu bị mờ và nhiễu là quá trình xây dựng lại các bộ phận bị
nhòe, bị nhiễu hoặc xuống cấp của ảnh và video. Trong trƣờng hợp một bức tranh có
giá trị, nhiệm vụ này sẽ đƣợc thực hiện bởi một nghệ sĩ có tay nghề cao phục hồi
tranh. Trong thế giới công nghệ thông tin, khôi phục ảnh màu bị nhiễu đề cập đến
việc áp dụng các thuật toán phức tạp để khôi phục lại các phần ảnh ban đầu, trƣớc khi
bị nhiễu.
Trọng tâm của luận văn này là tìm hiểu các vấn đề liên quan đến việc khôi
phục ảnh màu hỏng do bị mờ và nhiễu, nghiên cứu một số thuật toán khôi phục ảnh
màu bị mờ và nhiễu và tập trung tìm hiểu thuật toán sử dụng các bộ lọc có hƣớng để
tạo ra ảnh ban đầu. Trong đó, các bộ lọc đƣợc áp dụng vào các hƣớng khác nhau theo
các đánh giá về hƣớng nhiễu của từng phần của ảnh. Thuật toán sẽ đƣợc thực nghiệm
với chƣơng trình sử dụng ngôn ngữ Matlab.
Ngoài phần mở đầu và kết luận, luận văn đƣợc chia làm 3 chƣơng, luận văn có
các chƣơng nhƣ sau:
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
2
Chƣơng 1: Mô hình ảnh bị mờ và nhiễu. Trình bày các vấn đề đặt ra cần giải
quyết trong bài toán khôi phục ảnh màu bị mờ và nhiễu.
Chƣơng 2: Khôi phục ảnh màu bị mờ và nhiễu, giữ cạnh
Các hƣớng tiếp cận chính xử lý nhiễu ảnh và khôi phục phần ảnh bị mờ và
nhiễu. Trình bày một số phƣơng pháp, phân tích thuật toán khôi phục ảnh màu bị mờ
và nhiễu bằng cách áp dụng các bộ lọc có hƣớng theo các đánh giá về hƣớng của từng
phần của ảnh. Phƣơng pháp này dựa trên kết quả quan sát thực nghiệm: áp dụng các
bộ lọc tần số thấp làm giảm nhiễu ảnh, nhƣng hầu nhƣ không ảnh hƣởng đến thông
tin ở tần số cao, trong đó có các thông tin ảnh bị mờ. Thuật toán đầu tiên đánh giá
hƣớng của các kênh nhiễu cục bộ. Từ đó khôi phục nhiễu theo hƣớng cục bộ đã tìm
đƣợc.
Chƣơng 3: Thực nghiệm và đánh giá
Trình bày về việc cài đặt chƣơng trình, xây dựng dữ liệu thực nghiệm khôi
phục ảnh màu bị mờ và nhiễu bằng các bộ lọc có hƣớng, các quá trình thực nghiệm,
kết quả thực nghiệm và các kết quả đánh giá, nhận xét các xử lý từ thực nghiệm.
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
3
CHƢƠNG I. MÔ HÌNH ẢNH BỊ MỜ VÀ NHIỄU
1.1. Xử lý ảnh và mô hình biểu diễn ảnh
Lĩnh vực xử lý ảnh rất rộng và có nhiều ứng dụng thực tiễn. Một số lĩnh vực
ứng dụng xử lý ảnh phổ biến là phục hồi ảnh, nén ảnh, và phân vùng ảnh. Một lĩnh
vực xử lý ảnh khác là phục hồi ảnh. Trong phục hồi ảnh, ảnh bị biến dạng đƣợc phục
hồi về hình thức ban đầu của nó. Sự biến dạng này thƣờng đƣợc gây ra do nhiễu khi
truyền dữ liệu, hiệu chuẩn ống kính, chuyển động của máy ảnh, hay tuổi ảnh gốc. Ví
dụ ảnh chụp trong điều kiện thiếu ánh sáng là một loại thách thức. Vì ánh sáng càng ít
thì cần nhiều thời gian để ngắm – và nếu không có chân máy thì camera sẽ dễ bị rung
và tạo ra ảnh mờ. Khi tăng độ nhạy ánh sáng của camera, nghĩa là sử dụng ISO cao
hơn, có thể làm giảm thời gian ngắm, nhƣng lại có mức nhiễu cao hơn, dẫn đến nhiều
bức ảnh bị mờ và nhiễu.
Hình 1-1: Khôi phục ảnh
Một dạng phục hồi ảnh khác là khôi phục các vùng bị mất trong ảnh. Các vùng
bị mất có thể do tuổi của ảnh, hoặc một phần đối tƣợng trong ảnh bị che khuất. Tuy
nhiên luận văn này chỉ tập trung vào vấn đề phục hồi ảnh bị mờ và nhiễu.
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
4
1.1.1. Ảnh và điểm ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ là đặc
trƣng cƣờng độ sáng, độ xám hay một dấu hiệu nào đó tại một vị trí nào đó của đối
tƣợng trong không gian và nó có thể xem nhƣ một hàm n biến P(c1, c2,..., cn). Do đó,
ảnh trong xử lý ảnh có thể xem nhƣ ảnh n chiều.
Ảnh có thể đƣợc biểu diễn dƣới dạng một ma trận 2 chiều, mỗi phần tử của ma
trận tƣơng ứng với một điểm ảnh. Mỗi phần tử này đƣợc gọi là một pixel (picture
element).
Ảnh có thể đƣợc định nghĩa là một hàm 2 chiều f(x, y), trong đó x và y là các tọa
độ trong không gian (spatial) hoặc mặt phẳng (plane), và độ lớn (amplitude) của hàm
f đƣợc gọi là độ sáng (intensity) hay độ xám (gray level) của ảnh tại điểm đó. Các
dạng ảnh gồm 2 loại ảnh màu và ảnh xám. Ảnh màu là ảnh tại mỗi điểm là cấu trúc
gồm nhiều kênh màu khác nhau.
Ảnh có thể đƣợc mô tả phƣơng trình vi phân từng phần (Partial differential
equation -PDE):
u0 k u
( 1-1)
Trong đó u0 là ảnh đƣợc quan sát, u là ảnh thực, k là hàm mờ hay dạng là nhân
(kernel), và là nhiễu. Miền của ảnh ký hiệu là , thƣờng là hình chữ nhật. Với ảnh
xám, phạm vi các hàm là số thực. Trong công thức 1.1, dấu biểu diễn toán tử phức
đƣợc định nghĩa nhƣ sau:
(k u )( x, y )
k ( x s, y t )u ( s, t )dsdt
( 1-2)
Với giả thiết rằng :
u 0, k 0
và
k ( x, y)dxdy 1
( 1-3)
Sử dụng mô hình PDE này, cần tìm cực tiểu của hàm năng lƣợng. Hàm năng
lƣợng sử dụng trung bình tổng các biến thể với mục đích để tìm tối thiểu số lƣợng các
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
5
dao động trong ảnh u qua cực tiểu của hàm này. Ngoài ra cần đặt một số điều kiện
ràng buộc để có đƣợc lời giải gần với ảnh đƣợc quan sát, vừa khôi phục ảnh vừa giữ
đƣợc các nét cạnh của ảnh.
1.1.2. Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trƣng cơ bản là vị trí (x, y) của điểm ảnh và độ
xám của nó. Dƣới đây chúng ta xem xét một số khái niệm và thuật ngữ thƣờng dùng
trong xử lý ảnh.
Định nghĩa: Mức xám của điểm ảnh là cƣờng độ sáng của nó đƣợc gán bằng
giá trị số tại điểm đó.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là
mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám:
Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255).
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức
xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 2
mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế
giới màu, ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
28*3=224≈ 16,7 triệu màu.
1.1.3. Các lân cận của điểm ảnh
Để có căn cứ kiểm tra quan hệ mới này ngƣời ta định ra một tập giá trị tham
chiếu mà các điểm ảnh gọi là lân cận phải có giá trị cùng thuộc về tập đó. Ví dụ với
một ảnh nhị phân ta có thể đặt V={1}, có nghĩa là ta xét các điểm lân cận với giá trị
tham chiếu là 1 (cƣờng độ điểm ảnh đã gọi là lân cận với nhau thì phải cùng có giá trị
1). Trong ảnh đa mức xám, ta có thể đặt V chứa nhiều giá trị hơn nhƣ V={ a >= 200
& a <= 255 }. Cho p có tọa độ (x, y)
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
6
Một ảnh số giả sử đƣợc biểu diễn bằng hàm f(x, y). Tập con của điểm ảnh S;
cặp điểm ảnh có quan hệ với nhau có kí hiệu là p, q. Chúng ta nêu một số khái niệm
[1]:
Các lân cận của điểm ảnh (image neightbor)
Giả sử có điểm ảnh p tại tọa độ (x, y), p có 4 điểm lân cận gần nhất theo chiều
đứng và ngang (coi nhƣ lân cận 4 hƣớng: đông, tây, nam, bắc).
Đông
Nam
y
Bắc
Tây
x
(x-1, y-1)
(x, y-1)
(x+1, y-1)
(x-1, y)
(x, y)
(x+1, y)
(x-1, y+1)
(x, y+1)
(x+1, y+1)
Hình 1-2: Lân cận các điểm ảnh có tọa độ (x, y)
Các lân cận chéo: Các điểm lân cận chéo Np(p) (coi nhƣ lân cận chéo là 4
hƣớng: Đông – Nam, Đông – Bắc, Tây – Nam, Tây – Bắc)
Np(p) = {(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1) }
Tập kết hợp: N8(p) = N4(p) + Np(p) là tập hợp 8 lân cận của điểm p
Đƣờng: một đƣờng nối 2 điểm p (x0, y0) với điểm q (xn, yn) là một tập tuần tự các
điểm ảnh có tọa độ lần lƣợt là (x0, y0), (x1, y1), (x2, y2),..., (xn, yn) trong đó:
Hai điểm liền kề (xi, yi), (xi-1, yi-1) với (1 <= i <= n) có quan hệ lân cận, tùy
theo loại quan hệ lân cận đƣợc xem xét mà ta có các loại đƣờng 4 (4 Path),
đƣờng 8 (8 Path) hay đƣờng M (M Path).
n đƣợc gọi là độ dài của đƣờng.
Nếu hai điểm đầu và cuối của đƣờng trùng nhau, (x 0, y0) = (xn, yn) thì ta gọi đó
là đƣờng khép kín (Closed Path).
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
7
Hình 1-3: Đƣờng 8 nối 4 điểm
Chú ý: Nếu (x, y) nằm ở biên mép ảnh; một số điểm sẽ nằm ngoài ảnh.
Kết nối: Gọi S là một nhóm, tập các điểm ảnh nào đó trong một hình (S có thể là toàn
bộ ảnh).
Hai điểm ảnh p và q đƣợc gọi là kết nối với nhau qua S nếu tồn tại đƣờng giữa
chúng đƣợc thiết lập bởi các điểm ảnh thuộc S.
p nằm trong S, tập các điểm ảnh kết nối với p và thuộc S đƣợc gọi là thành
phần đƣợc kết nối (connected component).
Nếu S chỉ có 1 thành phần kết nối, có nghĩa là mỗi điểm ảnh thuộc S thì kết nối
với tất cả các điểm ảnh còn lại ta gọi S là tập kết nối (Connected Set).
Vùng:
Gọi R là một tập điểm ảnh nào đó trong hình, R đƣợc gọi là vùng ảnh nếu nó là
một tập kết nối thỏa định nghĩa ở trên.
Hai vùng Ri và Rj đƣợc coi là lân cận (Adjacency) nếu hợp của chúng là một
tập kết nối.
Các vùng không lân cận (not adjacent) thì gọi là disjoint.
Cũng tƣơng tự nhƣ với điểm ảnh việc xét vùng lân cận cũng cần sự chỉ định
kiểu 4, 8 hay M.
Đƣờng bao (boundary)
Là tập các điểm có quan hệ liên kết với điểm nằm trong tập bù của vùng R.
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
8
Sự khác biệt giữa đƣờng bao và cạnh (edge) nằm ở chổ, trong khi đƣờng bao là
đƣờng khép kín (closed path) bao quanh vùng (region) với một ý nghĩa toàn
cục thì viền hay cạnh lại đƣợc xem xét là tập hợp những điểm ảnh mà tại đó
xảy ra sự biến động về giá trị cƣờng độ, mang tính cục bộ.
1.1.4. Các mối liên kết điểm ảnh
Các mối liên kết đƣợc sử dụng để xác định giới hạn (Boundaries) của đối
tƣợng vật thể hoặc xác định vùng trong một ảnh. Một liên kết đƣợc đặc trƣng bởi tính
liền kề giữa các điểm và mức xám của chúng.
Giả sử V là tập hợp các giá trị mức xám. Một ảnh có các giá trị cƣờng độ sáng
từ thang mức xám từ 32 đến 64 đƣợc mô tả nhƣ sau:
V = {32, 33,..., 63, 64}
( 1-4)
Có 3 loại liên kết:
Liên kết 4: Hai điểm ảnh p và q đƣợc gọi là liên kết 4 với các giá trị cƣờng độ
sáng V, nếu q nằm trong một các lân cận p, tức N4(p)
Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc
N8(p)
Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cƣờng độ
sáng V đƣợc nói là liên kết m nếu: q thuộc N4(p) hoặc q thuộc N8(p)
1.1.5. Đo khoảng cách giữa các điểm ảnh
Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p tọa độ (x, y), q tọa độ
(s, t) là hàm khoảng cách (Distance):
1. D(p, q) ≥ 0 (Với D(p, q) = 0, nếu và chỉ nếu p = q)
2. D(p, q) = D(q, p)
3. D(p, z) ≤ D(p, q) + D(q, z); z là một điểm khác bất kỳ.
Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và q(s,
t) đƣợc định nghĩa nhƣ sau:
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
9
De ( p, q ) [( x s ) 2 ( y t ) 2 ]
1
2
( 1-5)
Khoảng cách khối: Khoảng cách D4(p, q) đƣợc gọi là khoảng cách khối đồ thị
(City Block Distance) và đƣợc xác định nhƣ sau:
D4 ( p, q ) | x s | | y t |
( 1-6)
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa các điểm ảnh từ
tâm đến tâm điểm ảnh q khác. Ví dụ: Màn hình CGA 12” (12”*2.54cm = 30,48cm =
3048mm) độ phân giải 320*200; tỷ lệ 4/3(chiều dài/chiều rộng). Theo định nghĩa của
Pitago, ta có đƣờng chéo tỷ lệ là 5 phần (5/4/3: đƣờng chéo/ Chiều dài/ chiều rộng
màn hình); khi đó độ dài thật là 305/244/183 chiều rộng mà hình là 183mm ứng với
màn hình CGA 200 điểm ảnh theo chiều dọc. Nhƣ vậy, khoảng cách điểm ảnh lân cận
của CGA 12” là ≈ 1mm.
Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess – Board Distance)
giữa điểm ảnh p, q đƣợc xác định nhƣ sau:
D8 ( p, q ) max(| x s |, | y t |)
( 1-7)
1.2. Các phép hình thái học cơ bản
Hình thái có nghĩa là cấu trúc hay topology của đối tƣợng, là một cách để mô tả đối
tƣợng ảnh số. Hai phép toán hình thái cơ bản là: phép giãn (Dilation) và phép co
(Erosion).
Các phép toán này đƣợc định nghĩa nhƣ sau: Giả thiết ta có đối tƣợng X và phần tử
cấu trúc (mẫu) B trong không gian Euclide hai chiều. Kí hiệu Bx là dịch chuyển của B tới
vị trí x.
1.2.1. Định nghĩa phép giãn (Dilation)
Phép giãn của X theo mẫu B là hợp của tất cả các Bx với x thuộc X. Ta có:
X B
( 1-8)
Bx
xX
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
10
1.2.2. Định nghĩa phép co (Erosion)
Phép co của X theo B là tập hợp tất cả các điểm x sao cho Bx nằm trong X. Ta có:
X B = {x: Bx X}
0
x
Ví dụ: Ta có tập X nhƣ sau: X = 0
0
0
0
x
0
XB=
0
0
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
( 1-9)
x
0
x
x
x
0
x
x
0
x
x
x
0
x
x
x
0
0
0
0
x
0
x
0
0
và XB = 0
x
0
0
x
B=
0
0
x
0
x
1.2.3. Định nghĩa phép mở (Open)
0
x
0
0
x
x 0
0 B 0=
0 0
0 0
0 0
B=
x
x
x
Phép toán mở của X theo cấu trúc B là tập hợp các điểm của ảnh X sau khi đã co và
giãn nở liên liếp theo B. Ta có:
OPEN(X, B) = (X B) B
( 1-10)
Ví dụ: Với tập X và B trong ví dụ trên ta có
0
0
OPEN(X, B) = (XB) B = 0
0
0
0
0
x
0
x
0
x
x
0
x
x
x
0
0
x
x
0
0
0
0
B=
x
B=
x
1.2.4. Định nghĩa phép đóng (Close)
Phép đóng của X theo cấu trúc B là tập hợp các điểm của ảnh X sau khi đã giãn nở
và co liên tiếp theo B. Ta có:
B=
x
CLOSE(X,B) = (X B) B
( 1-11)
Theo ví dụ trên ta có:
B=
Số hoá bởi Trung tâm Học liệu – ĐHTN
x
http://www.lrc.tnu.edu.vn
B=
x
11
0
x
CLOSE(X,B) = (X B) B = 0
0
0
x
x
x
x
x
x
x
x
x
x
x
x
0
x
x
x
x
0
0
0
1.3. Mờ ảnh
Mờ ảnh có thể đƣợc đƣợc thể hiện nhƣ một tích phân trên ảnh tự nhiên, ký hiệu
là :
M ( x) P I P( x, y ) I ( y )dy
( 1-12)
Đối với ảnh 2 chiều, phép tích phân trên không gian hai chiều xy. P (x, y) đƣợc
gọi là các hàm điểm lan. Đây là khả năng một photon có nguồn gốc tại vị trí y trong
mặt phẳng ảnh lan đến vị trí x trong mặt phẳng tiêu cự.
Có một số mô hình ảnh mờ nhƣ sau:
1.3.1. Mờ trung bình (Average Blur)
Mờ trung bình là một trong số các công cụ để loại bỏ nhiễu và các sạn trong
ảnh. Mờ trung bình đƣợc sử dụng khi nhiễu có trong toàn ảnh.
Mờ trung bình đƣợc phân bổ theo chiều ngang, hoặc theo chiều dọc, hoặc theo
hình tròn với một bán kính R.
Khi đó các điểm ảnh lân cận trong vòng tròn bán kính R đƣợc dùng để thực
hiện phép mờ trung bình: R =
x 2 + y2
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
12
Hình 1-4: Mờ trung bình (Average Blur)
1.3.2. Mờ do chuyển động (Motion Blur)
Khi vật thể và máy quay có sự chuyển động khi chụp hình, mờ do chuyển động
có thể xảy ra. Đó có thể là dạng vệt trƣợt, hoặc dạng tròn, cũng có thể là thay đổi độ
lớn, và kết hợp các dạng trên. Khi làm ảnh bị mờ dạng này, ảnh sẽ tạo ra cảm giác vật
thể đang chuyển động theo một hƣớng nhất định.
Hình 1-5: Mờ do chuyển động (Motion Blur)
1.3.3. Mờ Gaussian
Dạng mờ này tạo ra bởi phép chập ảnh đầu vào với hàm Gausian. Mờ dạng này
thƣờng làm giảm nhiễu, và đồng thời làm mất đi các chi tiết nhỏ.
Dạng mờ Gasian thƣờng đƣợc sử dụng trong các bƣớc tiền xử lý ảnh để làm rõ
các kết cấu ảnh ờ các mức độ phân giải. Dạng mờ này tạo hiệu ứng mờ phụ thuộc vào
khoảng cách từ vành ngoài đến tâm của đồ thị Gausian.
Số hoá bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
- Xem thêm -