ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
-----------------------------
LÊ TRƯỜNG THÔNG
GIẤU TIN THUẬN NGHỊCH TRÊN ẢNH SỐ SỬ DỤNG
PHƯƠNG PHÁP DỰ ĐOÁN VÀ DỊCH CHUYỂN HISTOGRAM
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên - 2015
i
LỜI CAM ĐOAN
Tôi xin cam đoan.
Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng
dẫn trực tiếp của thầy giáo, PGS.TS Phạm Văn Ất.
Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác
giả, tên công trình, thời gian, địa điểm công bố.
Mọi sao chép không hợp lệ, vi phạm qui chế đào tạo, hay gian trá tôi
xin chịu hoàn toàn trách nhiệm.
HỌC VIÊN
Lê Trường Thông
ii
LỜI CẢM ƠN
Lời đầu tiên, em xin được bày tỏ sự kính trọng và lòng biết ơn sâu sắc
đến PGS.TS Phạm Văn Ất, một người thầy đã dạy em trong nhiều năm qua;
đặc biệt, qua thời gian làm luận văn, thầy luôn giảng giải cho em những kiến
thức khoa học theo bản chất của chúng; thầy đã tận tình hướng dẫn, chỉ bảo
để em có thể làm chủ được kiến thức trong nội dung luận văn của mình.
Em cũng xin gửi lời cảm ơn đến các thầy cô giáo giảng dạy cho Khoa
Công nghệ thông tin trường Đại học Công nghệ thông tin và truyền thông –
Đại học Thái Nguyên đã truyền đạt những kiến thức và giúp đỡ em trong suốt
quá trình học của mình.
Em cũng xin gửi lời cảm ơn tới Bộ phận đào tạo Sau đại học cũng như
Phòng đào tạo Trường Đại học Công nghệ thông tin và truyền thông đã tạo
điều kiện thuận lợi cho em trong suốt thời gian của khóa học và trong thời
gian hoàn thành luận văn.
Xin được gửi lời cảm ơn đến lãnh đạo và đồng nghiệp của Phòng Khảo
thí và Đảm bảo chất lượng Trường Đại học Công đoàn – đơn vị nơi tôi đang
công tác, đã tạo điều kiện, giúp đỡ tôi trong thời gian học tập cũng như làm
luận văn.
Không thể quên gửi lời cảm ơn đến một người anh là TS. Đỗ Văn Tuấn,
người đã đóng góp nhiều ý kiến quý báu cũng như chỉ cho tôi nhiều kiến thức,
đặc biệt là trong lúc tôi làm luận văn.
Cuối cùng, xin được gửi lời cảm ơn tới gia đình và bạn bè – những
người đã ủng hộ, động viên, giúp đỡ và tạo mọi điều kiện để tôi có được kết
quả như ngày hôm nay.
Hà Nội, tháng 12 năm 2015
HỌC VIÊN
Lê Trường Thông
iii
MỤC LỤC
Trang bìa phụ
Lời cam đoan
Lời cảm ơn
Mục lục
Danh mục thuật ngữ Anh – Việt
MỞ ĐẦU ..................................................................................................... - 1 CHƯƠNG 1. TỔNG QUAN ........................................................................... - 1 1.1. Giấu tin .................................................................................. - 1 1.1.1. Vài nét về lịch sử giấu tin................................................................................ - 1 1.1.2. Khái niệm giấu tin ........................................................................................... - 2 1.1.3. Phân loại các kỹ thuật giấu tin ........................................................................ - 2 1.1.4. Mô hình kỹ thuật giấu tin ............................................................................... - 3 1.1.5. Ứng dụng của kỹ thuật giấu tin ...................................................................... - 5 -
1.2. Ảnh số.................................................................................... - 6 1.2.1. Khái niệm ảnh Bitmap .................................................................................... - 7 1.2.2. Phân loại ảnh Bitmap...................................................................................... - 7 1.2.3. Định dạng tệp ảnh Bitmap .............................................................................. - 7 1.2.4. Chất lượng ảnh ............................................................................................. - 10 1.2.5. Một số đặc trưng ảnh số .............................................................................. - 11 -
1.3. Môi trường giấu tin ............................................................. - 12 1.3.1. Giấu tin trong ảnh ......................................................................................... - 12 1.3.2. Giấu tin trong audio...................................................................................... - 12 1.3.3. Giấu tin trong video ...................................................................................... - 13 1.3.4. Giấu tin trong văn bản .................................................................................. - 13 -
1.4. Các hướng tiếp cận giấu tin trên ảnh ................................... - 14 1.4.1. Tiếp cận miền không gian ảnh ...................................................................... - 14 1.4.2. Tiếp cận miền tần số ảnh.............................................................................. - 14 -
1.5. Một số lược đồ giấu tin trên ảnh nhị phân .......................... - 15 -
iv
1.5.1. Kỹ thuật giấu tin Wu-Lee .............................................................................. - 15 1.5.2. Kỹ thuật giấu tin CPT..................................................................................... - 20 -
CHƯƠNG 2. PHƯƠNG PHÁP DỊCH CHUYỂN HISTOGRAM VÀ DỰ ĐOÁN ... - 29 2.1. Sơ lược giấu tin thuận nghịch .............................................. - 29 2.1.1. Giấu tin không thuận nghịch và giấu tin thuận nghịch ................................. - 29 2.1.2. Chút lịch sử giấu tin thuận nghịch ................................................................ - 29 2.1.3. Giấu tin và thủy vân ...................................................................................... - 30 2.1.4. Một số hướng tiếp cận giấu tin thuận nghịch .............................................. - 31 -
2.2. Phương pháp histogram ...................................................... - 32 2.2.1. Một số khái niệm .......................................................................................... - 32 2.2.2 Thuật toán giấu tin ........................................................................................ - 33 2.2.3. Lược đồ giấu tin ............................................................................................ - 34 2.2.4 Thuật toán trích tin và khôi phục ảnh gốc ..................................................... - 35 2.2.5. Lược đồ trích tin và khôi phục ảnh gốc ........................................................ - 36 2.2.6. Ví dụ .............................................................................................................. - 37 -
2.3. Phương pháp dự đoán ......................................................... - 39 2.3.1. Dự đoán tuyến tính ...................................................................................... - 39 2.3.2. Thuật toán giấu tin ....................................................................................... - 39 2.3.3. Lược đồ giấu tin ............................................................................................ - 40 2.3.4. Thuật toán trích tin và khôi phục ảnh gốc ................................................... - 41 2.3.5. Lược đồ trích tin và khôi phục ảnh gốc ....................................................... - 42 2.3.6. Ví dụ .............................................................................................................. - 43 -
CHƯƠNG 3. CÀI ĐẶT THỬ NGHIỆM .......................................................... - 46 3.1. Bài toán thử nghiệm ............................................................ - 46 3.1.1. Tệp ảnh sử dụng để thử nghiệm .................................................................. - 47 3.1.2. Bài toán giấu tin ........................................................................................... - 48 3.1.3. Bài toán trích tin và khôi phục ảnh gốc ....................................................... - 48 -
3.2. Chương trình thử nghiệm .................................................... - 49 3.2.1. Môi trường cài đặt ....................................................................................... - 49 3.2.2. Tham quan thư mục chứa tệp mã nguồn .................................................... - 49 3.2.3. Một số đoạn mã nguồn quan trọng............................................................. - 50 -
v
3.2.4.
Hướng dẫn sử dụng chương trình............................................................ - 53 -
3.3. Khả năng giấu tin và chất lượng ảnh .................................... - 54 3.3.1. Khả năng giấu tin ......................................................................................... - 54 3.3.2. Chất lượng ảnh chứa tin ............................................................................... - 54 -
KẾT LUẬN VÀ KIẾN NGHỊ .......................................................................... - 58 I. Tiếng Việt ................................................................................ - 59 II. Tiếng Anh................................................................................ - 59 -
vi
DANH MỤC THUẬT NGỮ ANH – VIỆT
Thuật ngữ Anh
Thuật ngữ Việt (tạm dịch)
Cover image / host/Original image Ảnh phủ / Ảnh gốc
Extract
Trích (tin)
Frequency domain
Miền tần số
Hide / embed
Giấu / nhúng (tin)
Hiding capacity
Khả năng giấu tin
Histogram shifting
Dịch chuyển histogram
Index domain
Miền chỉ số
Medical imange
Ảnh y tế
Neighboring pixcel
Điểm ảnh lân cận
Prediction technique
Kỹ thuật dự đoán
Quality
Chất lượng (ảnh)
Reversible data hiding
Giấu tin thuận nghịch
Screte message / hidden data
Tin mật / giữ liệu giấu
Spatial domain
Miền không gian
Stego-image / marked image
Ảnh gốc
Embedding proceduce
Thủ tục nhúng (tin)
Residual image
Ảnh dự đoán
Residual value
Giá trị dự đoán
Residual histogram
Histogram dự đoán
Extract and recovery proceduce
Thủ tục trích và khôi phục
Experimental result
Kết quả thực nghiệm
PSNR - Peak Signal to Noise Ratio Tỉ số đỉnh tín hiệu trên nhiễu
-1-
MỞ ĐẦU
Một trong những sự kiện trọng đại của những thập niên cuối thế kỷ 20,
đầu thế kỷ 21 là sự ra đời phát triển của mạng Internet. Thông tin đã trở thành
sẵn sàng trực tuyến, mọi người đều có thể kết nối vào Internet để tìm kiếm
thông tin một cách dễ dàng thông qua nhà cung cấp dịch vụ Internet. Người
dùng có thể đọc các thông tin mới nhất, tra cứu các thư viện số, tìm thông tin
lĩnh vực mình quan tâm. Bên cạnh đó các nhà cung cấp sản phẩm cũng sẵn
sàng cung cấp dữ liệu của mình cho người dùng thông qua mạng.
Hiện nay, các thông tin quan trọng thường được lưu trữ và truyền tải
dưới dạng tệp dữ liệu số như: ảnh, âm thanh và video. Tuy nhiên việc phân
phối một cách phổ biến các tài nguyên trên mạng hiện nay với sự trợ giúp của
phần mềm, người dùng có thể dễ dàng tạo ra các bản sao có chất lượng ngang
bằng so với dữ liệu gốc. Bên cạnh đó, vấn nạn sao chép, tái phân phối bất hợp
pháp, làm giả dữ liệu số ngày một gia tăng. Do vậy, vấn đề bảo vệ dữ liệu số
nói chung và ảnh số nói riêng đang nhận được nhiều sự quan tâm của các nhà
nghiên cứu trong và ngoài nước. Một trong những mục tiêu nghiên cứu của an
toàn dữ liệu và bảo mật thông tin là xây dựng quy trình và giải pháp bảo vệ
các tài liệu, ngăn chặn các hoạt động không hợp pháp. Giấu tin thuận nghịch
hiện đang được xem là một trong những giải pháp quan trọng trong việc bảo
vệ thông tin mật và tính toàn vẹn của dữ liệu số.
Dấu tin thuận nghịch là kỹ thuật giấu thông tin mật vào dữ liệu ảnh
trước khi ảnh được phân phối trên môi trường trao đổi không an toàn, việc
giấu thông tin vào ảnh sẽ làm giảm chất lượng ảnh. Các thuật toán đề xuất đều
có mục tiêu không chỉ giấu được nhiều lượng thông tin mà còn giữ cho chất
lượng ảnh ít bị thay đổi nhất. Đây cũng là các tiêu chí để đánh giá một lược
đồ giấu tin tốt hay xấu.
-2-
Nội dung luận văn tập trung vào việc nghiên cứu một số kỹ thuật giấu tin
thuận nghịch và đối tượng được chọn làm môi trường dấu tin là ảnh số.
Cấu trúc của luận văn
Dựa vào mục tiêu đã xác định, nội dung của luận văn sẽ được trình bày
qua 3 chương như sau:
Chương 1: Tổng quan
Chương 2: Phương pháp dịch chuyển histogram và dự đoán
Chương 3: Cài đặt thử nghiệm
Do thời gian và trình độ còn hạn chế nên luận văn khó tránh khỏi
những sai sót, kính mong nhận được sự đóng góp chỉ bảo của các thầy, cô
giáo và các bạn đồng nghiệp.
Qua đây tôi xin cảm ơn thầy giáo, PGS.TS Phạm Văn Ất và các thầy, cô
giáo trong Trường Đại học Công nghệ thông tin và truyền thông – Đại học
Thái Nguyên đã tận tình hướng dẫn tôi trong quá trình học tập cũng như trong
thời gian nghiên cứu hoàn thiện luận văn này.
-1-
CHƯƠNG 1. TỔNG QUAN
1.1. Giấu tin
1.1.1. Vài nét về lịch sử giấu tin
Các kỹ thuật giấu tin đã được đề xuất và sử dụng từ thời xa xưa, và sau
này đã được phát triển ứng dụng cho nhiều lĩnh vực. Từ Steganography bắt
nguồn từ Hi Lạp với ý nghĩa tài liệu được phủ (covered writing). Các câu
chuyện kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ. Có lẽ
những ghi chếp sớm nhất về kỹ thuật giấu thông tin thuộc về sử gia Hi Lạp
Herodotus. Khi bạo chúa Herodotus bị vua Darius bắt ở Susa vào thế kỷ thứ
V trước công nguyên, ông ta đã gửi một bài báo bí mật cho con rể của mình là
Aristagoras ở Milesus. Để thực hiện điều này, Histiaeus đã cạo trọc đầu 1 nô
lệ tin cậy và xăm một thông báo trên da đầu người nô lệ ấy. Khi tóc người nô
lệ đủ dài người nô lệ được gửi tới Milesus.
Một câu chuyện khác về thời Hi Lạp cổ đại cũng do Herodotus ghi lại.
Môi trường để ghi văn bản chính là cá viên thuốc được bọc trong sáp ong.
Demeratus, một người Hi Lạp, cần thông báo cho Sparta rằng Xarxes định
xâm chiếm Hi Lạp. Để tránh bị phát hiện, anh ta đã bóc viên thuốc này, sau
đó bọc lại cá viên thuốc này bằng một lớp sáp mới. Những viên thuốc được để
ngỏ và lọt qua mọi sự kiểm soát một cách dễ dàng.
Mực không màu là phương tiện hữu hiệu cho bảo mật thông tin trong
một thời gian dài. Người Roman cổ đã biết sử dụng những chất sẵn có như
nước quả, nước tiểu và sữa để viết các thông báo bí mật giữa những hàng văn
tự thông thường. Khi bị hơ nóng, những thứ mực không nhìn thấy trở nên sẫm
màu và có thể đọc dễ dàng. Mực không màu cũng được sử dụng rất gần đây,
như trong thời gian chiến trang thứ II. Như vậy ý tưởng về che giấu thông tin
đã có từ hàng nghìn năm về trước nhưng chủ yếu được áp dụng trong quân
đội và các cơ quan tình báo. Mãi cho tới vài thập niên gần đây, do sự phát
-2-
triển rộng rãi của internet, nhu cầu bảo mật thông tin cho cá nhân và các cơ sở
tư nhân và các giao dịch trên mạng máy tính ngày một trở thành bức thiết,
giấu thông tin mới nhận được sự quan tâm của các nhà nghiên cứu với hàng
loạt công trình có giá trị được áp dụng rộng rãi và công khai trong hoạt động
sản xuất, quản trị kinh doanh. Cuộc cách mạng số hóa thông tin và sự phát
triển nhanh chóng của mạng truyền thông là nguyên nhân chính dẫn đến sự
thay đổi này. Gần đây, những phiên bản sao chép hoàn hảo, các kỹ thuật thay
thế, sửa đổi tinh vi, cộng với sự lưu thông phân phối trên diện rộng của các dữ
liệu đa phương tiện đã làm nảy sinh nhiều vấn đề nhức nhối về nạn ăn cắp bản
quyền, phân phối bất chấp hợp pháp, xuyên tạc trái phép càng đòi hỏi phải
đẩy mạnh hơn nữa việc nghiên cứu trong lĩnh vực này.
1.1.2. Khái niệm giấu tin
Giấu tin là một kỹ thuật giấu một lượng thông tin số nào đó vào một đối
tượng dữ liệu số khác.
Kỹ thuật giấu tin nhằm hai mục đích: một là bảo mật cho dữ liệu được
đem giấu, hai là bảo vệ cho chính đối tượng được giấu tin ở trong. Hai mục
đích khác nhau này dẫn đến hai kỹ thuật chủ yếu của giấu tin. Hướng thứ nhất
là giấu tin mật, nhằm tập trung vào các kỹ thuật giấu tin sao cho người khác
khó phát hiện được đối tượng có chứa thông tin mật bên trong. Hướng thứ hai
là thủy vân số, hướng thủy vân số có miền ứng dụng lớn hơn nên được quan
tâm nghiên cứu nhiều hơn và thực tế đã có rất nhiều kỹ thuật đã được đề xuất.
1.1.3. Phân loại các kỹ thuật giấu tin
Có nhiều cách phân loại khác nhau dựa trên những tiêu chí khác nhau. Có
thể chia lĩnh vực giấu tin thành hai hướng chính, đó là thủy vân số và giấu tin
mật.
Giấu tin mật với mục đích bảo toàn và bảo mật thông tin, tập trung vào
các kỹ thuật giấu tin, sao cho người khác khó phát hiện việc có tin được giấu.
-3-
Kỹ thuật giấu tin mật luôn chú trọng đến tính che giấu, với tính che giấu, các
đối thủ khó có thể phát hiện được đối tượng có chứa tin mật bên trong hay
không; hơn nữa, nếu phát hiện có giấu tin thì việc giải mã thông tin mật cũng
khó có thể thực hiện được. Ðồng thời, các kỹ thuật giấu tin mật còn quan tâm
lượng tin có thể được giấu.
Phạm vi ứng dụng của thủy vân đa dạng hơn, tuỳ theo mục đích của hệ
thủy vân mà người ta lại chia thành các hướng nhỏ như: thủy vân dễ vỡ và
thủy vân bền vững. Thủy vân bền vững quan tâm nhiều đến việc nhúng những
mẩu tin đòi hỏi độ bền vững cao của thông tin được giấu trước các biến đổi
thông thường trên dữ liệu môi trường. Thủy vân dễ vỡ yêu cầu thông tin giấu
sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa. Như vậy, kỹ
thuật giấu tin có thể được phân loại như trong Hình 1.1.
Hình` 1.1. Phân loại kỹ thuật giấu tin
1.1.4. Mô hình kỹ thuật giấu tin
Giống như các lược đồ mã hóa thông tin, một kỹ thuật giấu tin gồm thuật
toán nhúng tin và thuật toán trích tin. Theo [5], sơ đồ của thuật toán nhúng tin
tổng quát có mô hình như sau:
-4-
Hình 1.2. Mô hình thuật toán nhúng tin
Trong Hình 1.2, môi trường giấu tin là những dữ liệu dùng để chứa
thông tin mật, dữ liệu môi trường thường là những dữ liệu được dùng phổ
biến trên Internet như: tệp ảnh, tệp âm thanh, tệp video, tệp text…Thông tin
cần giấu là một lượng thông tin mang ý nghĩa và mục đích nào đó tùy thuộc
vào mục đích và yêu cầu của người sử dụng (tin mật). Tin mật được nhúng
vào trong môi trường chứa thông tin nhờ một bộ nhúng thông tin. Trong quá
trình nhúng tin, thuật toán có thể sử dụng hệ thống khóa làm tăng tính an toàn
cho hệ thống. Sau khi nhúng tin mật vào dữ liệu môi trường ta nhận được dữ
liệu môi trường có chứa tin. Dữ liệu này được truyền tải trên các môi trường
truyền thông khác nhau.
Khi nhận được dữ liệu có chứa tin, người nhận thực hiện thuật toán trích
tin tương ứng để trích rút tin mật từ dữ liệu môi trường. Trong một số trường
hợp, người dùng có thể khôi phục lại dữ liệu môi trường từ dữ liệu chứa tin.
Theo , thuật toán trích tin có mô hình thực hiện như:
-5-
Hình 1.3. Mô hình trích tin
Trong hình 1.3 đã chỉ ra các nhiệm vụ của quá trình giải mã thông tin đã
được giấu. Quá trình giải mã này phải được thực hiện thông qua một bộ giải
mã tương ứng với bộ nhúng thông tin và kết hợp với khóa để giải mã tin.
Khóa để giải mã tin này có thể giống hay khác với khóa đã nhúng tin. Kết quả
thu được bao gồm môi trường gốc và thông tin đã được che giấu. Tùy theo
các trường hợp cụ thể, thông tin tách được ra có thể phải cần xử lý, kiểm định
và so sánh với thông tin đem giấu ban đầu. Thông qua dữ liệu được tách ra từ
môi trường chứa thông tin giấu, người ta có thể biết được trong quá trình
truyền tải, phân phát dữ liệu có bị xâm phạm, tấn công hay không.
Đối với các hệ thống giấu thông tin mật này rất quan tâm đến tính an
toàn và bảo mật thông tin của dữ liệu cần giấu. Hệ thống giấu tin mật có độ
bảo mật cao nếu có độ phức tạp của các thuật toán thám mã khó có thể thực
hiện được trên máy tính. Tuy nhiên, cũng có các hệ thống chỉ quan tâm đến số
lượng thông tin có thể được che giấu, hay quan tâm đến sự ảnh hưởng của
thông tin mật đến các môi trường chứa dữ liệu.
1.1.5. Ứng dụng của kỹ thuật giấu tin
Giấu tin mật: Thông tin được giấu trong những trường hợp này cần
được bảo mật trước các đối thủ. Việc giải mã để nhận được thông tin cũng
-6-
không cần dữ liệu môi trường gốc. Đối với các thuật toán giấu tin mật chúng
ta không chú trọng đến việc bảo vệ thông tin mật trước sự tấn công của các
đối thủ mà thay vào đó các thuật toán quan tâm đến tính ẩn và tính an toàn đối
với dữ liệu cần giấu. Do đó, các thuật toán giấu tin có độ bảo mật cao sẽ được
sử dụng trong các ứng dụng giấu tin mật.
Bảo vệ bản quyền tác giả: Đây là ứng dụng cơ bản nhất của kỹ thuật
thủy vân số. Một thông tin nào đó mang ý nghĩa bản quyền được sở hữu bởi
tác giả gọi là thủy vân, thông tin này sẽ được nhúng vào trong các sản phẩm
multimedia, và đó là minh chứng cho bản quyền của tác giả nhằm bảo vệ các
sản phầm chống lại các hành vi lấy cắp hoặc làm nhái. Yêu cầu kỹ thuật đối
với ứng dụng này là thủy vân phải tồn tại bền vững cùng với sản phẩm, khi
muốn bỏ thủy vân này mà không được phép của người chủ sở hữu thì chỉ còn
cách là phá huỷ sản phẩm.
Xác thực thông tin: Một tập các thông tin sẽ được giấu trong dữ liệu
nguồn và thông tin sẽ được sử dụng để nhận biết xem dữ liệu nguồn có bị
thay đổi hay không. Với kiểu ứng dụng này các thủy vân nên được ẩn để tránh
được sự tò mò của đối phương, hơn nữa việc làm giả các thủy vân hợp lệ hay
xuyên tạc thông tin nguồn cũng cần được xem xét. Trong các ứng dụng thực
tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được
các thay đổi. Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin
cao và thủy vân không cần bền vững.
1.2. Ảnh số
Như đã biết, ảnh số được lượng tử hóa từ ảnh liên tục (ảnh tự nhiên). Do
vậy, dữ liệu của ảnh số có sự tương quan cao. Nói cách khác, các điểm ảnh
lân cận (liền kề) thường có giá trị xấp xỉ nhau.
-7-
1.2.1. Khái niệm ảnh Bitmap
Ảnh Bitmap là định dạng ảnh do Microsoft đề xuất, có phần mở rộng là
BMP, loại ảnh này truyền tải, sử dụng rộng rãi trên máy tính, và các thiết bị
điện tử khác.
1.2.2. Phân loại ảnh Bitmap
Trên phương diện toán học, ảnh số được xem như là một ma trận nguyên
dương có m hàng và n cột, mỗi phần tử của ma trận đại diện cho một điểm
ảnh. Dựa theo màu sắc ta có thể chia ảnh số thành 3 dạng cơ bản như: ảnh nhị
phân, ảnh đa cấp xám và ảnh màu (true color).
- Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và
màu còn lại cho đối tượng của ảnh. Nếu hai màu là đen và trắng thì gọi là ảnh
đen trắng. Như vậy, ảnh nhị phân được xem như một ma trận nhị phân.
- Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau
trong khoảng màu đen – màu trắng. Như vậy, ảnh đa cấp xám xem như là ma
trận không âm có giá trị tối đa 255.
- Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn
bởi một số byte (thường 3 byte) đại diện cho 3 thành phần màu R, G và B.
Như vậy, ảnh màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần
màu của các điểm ảnh.
Trong lĩnh vực giấu tin, mỗi dạng ảnh có những thuận lợi, khó khăn và
cách tiếp cận riêng. Tuy nhiên, một lược đồ giấu tin trên ảnh nhị phân ta có
thể dễ dàng áp dụng cho ảnh đa cấp xám hoặc ảnh màu thông qua tính chẵn lẻ
của giá trị điểm ảnh. Nhưng từ lược đồ giấu tin trên ảnh màu hoặc ảnh đa cấp
xám khó có thể áp dụng đối với ảnh nhị phân.
1.2.3. Định dạng tệp ảnh Bitmap
Ảnh Bitmap được lưu trữ dưới dạng nhị phân, một tệp định dạng bitmap
được chia thành các phần cơ bản như: phần tiêu đề file (BITMAP
-8-
HEADER), thông tin về ảnh (BITMAP INFOR), bảng màu (PALLETE
Table) và vùng dữ liệu ảnh (DATA). Và thứ tự các phần của tệp ảnh được
lưu trữ tuần tự trong bộ nhớ như trong hình Hình 1.5
BITMAP HEADER
BITMAP INFOR
PALLETE Table
DATA
Hình 1.5. Minh hoạ cấu trúc tệp ảnh bitmap
Ý nghĩa các phần trong tệp ảnh bitmap
Bitmap Header: mô tả thông tin chung về File định dạng bitmap, độ dài
của phần này được cố định với mọi file ảnh bitmap.
Bảng 1.1. Cấu trúc và nội dung của Bitmap File Header
Byte#
Data
Giá trị
1
Kiểu tệp
‘B’
2
Kiểu tệp
‘M’
3-6
Size of the file
Unsigned long
7 - 10
Reserved
Zero
11 - 14
Byte offset to bitmap data
Số TT (tính từ 0) byte
đầu của BMP data
Bitmap Infor: mô tả thông tin về ảnh được lưu trữ, độ dài của phần này
cũng cố định.
Bảng 1.2. Cấu trúc và nội dung của Bitmap Info
Byte #
Data
Giá trị
1–4
Number of bytes in Bitmap Info
40
5–8
Width of bitmap
In pixels
-9-
9 – 12
Height of bitmap
In pixels
13 – 14
Number of color planes
1
15 – 16
Number of bits per pixels
1, 4, 8 hoặc 24
17 – 20
Type of compression
21 – 24
Size of image
25 – 28
Horizontal resolution
29 – 32
Vertical resolution
33 – 36
Number of colors In color Palette Ảnh 24 bít – 0
In bytes
Ảnh 8 bít - nếu 0 thì 256
mầu
37 – 40
Number of colors importal
Pallete Table: chính là bảng màu của ảnh bitmap, độ dài của phần này
có thể bằng không (không có bảng màu) đối với ảnh đen trắng và ảnh màu có
số lượng màu lớn hơn 256 màu.
Bảng 1.3. Cấu trúc và nội dung của Color Palette
Byte#
Data
Giá trị
Entry - chỉ số mầu
1
Blue color value
0 – 255
0
2
Green color value
0 – 255
0
3
Red color value
0 – 255
0
4
Reserved
0
0
5
Blue color value
0 – 255
1
6
Green color value
0 – 255
1
7
Red color value
0 – 255
1
8
Reserved
0
1
9
…
- 10 -
Data: Thông tin của từng điểm ảnh, độ dài của phần này phụ thuộc kích
thước ảnh. Phần này lưu trữ dữ liệu ảnh theo hướng từ dưới lên trên và từ trái
qua phải.
Với ảnh 8 bit màu giá trị của mỗi điểm ảnh trong vùng Data là chỉ số của
màu trong bảng màu, chỉ số màu của điểm ảnh là một số nguyên có giá trị từ
0 đến 255.
Như đã trình bày ở trên, với ảnh có số lượng màu lớn hơn 256 màu thì
giá trị trong vùng Data chính là giá trị của các thành phần màu cơ bản, số
lượng bit dùng để biểu diễn giá trị cho từng thành phần màu có thể sẽ khác
nhau phụ thuộc vào chất lượng ảnh. Đối với ảnh 24 bit màu, mỗi thành phần
màu được lưu trữ bởi 8 bit và thứ tự lưu trữ là B, G, R.
1.2.4. Chất lượng ảnh
Như đã đề cập ở trên, chất lượng ảnh chứa tin là một trong những yếu tố
quan trọng trong giấu tin mật, đặc biệt là thủy vân số. Chất lượng ảnh chứa tin
có thể được đánh giá bằng hệ số PSNR (Peak Signal-to-Noise Ratio). Lược đồ
có hệ số PSNR càng lớn thì chất lượng ảnh chứa tin càng cao. Hệ số PSNR
của ảnh chứa tin I’ so với ảnh gốc I kích thước m x n được tính theo công
thức:
trong đó, MAX là giá trị cực đại của điểm ảnh và MSE (Mean Square Error)
được xác định theo công thức:
Đối với ảnh màu, giá trị PSNR có thể chấp nhận được nếu thuộc khoảng
từ 30 dB đến 50 dB.
- 11 -
1.2.5. Một số đặc trưng ảnh số
Những đặc trưng của ảnh được trích chọn để sử dụng trong nhiều ứng
dụng như xử lý ảnh, nhận dạng ảnh,… Hầu hết các phương pháp trích chọn
các đặc trưng của ảnh tập trung vào: màu sắc, kết cấu, hình dạng.
a. Đặc trưng về màu sắc
Màu sắc là đặc tính hình ảnh được thể hiện nhiều nhất vì tính đơn giản
của việc trích thông tin màu của ảnh đưa ra phân tích và đã có hiệu quả thông
qua biểu đồ màu. Các biểu đồ màu miêu tả các điểm màu trên những vùng
màu của ảnh.
Không gian màu RGB được sử dụng rộng rãi trong việc miêu tả màu sắc
của ảnh. Nó gồm ba thành phần màu cơ bản là đỏ (Reb), lục (Green), lam
(Blue). Các màu khác được tạo ra bằng cách tổng hợp ba thành phần màu cơ
bản này. Tuy nhiên không gian màu RGB biến đổi không phù hợp với cảm
nhận của mắt con người.
b. Đặc trưng về hình dạng
Hình dạng của đối tượng trong ảnh cũng là một đặc trưng có thể được
xét đến. Đối tượng của ảnh thể hiện nội dung ảnh nhiều nhất. Ảnh được chụp
hoặc tranh được vẽ luôn với mục đích mô tả lại các đối tượng đó. Việc tách
riêng các đối tượng và hình dạng của chúng trong ảnh là rất khó. Khó hơn là
so sánh các đặc trưng đó thế nào.
c. Đặc trưng về kết cấu
Kết cấu bề mặt là phản ánh sự biểu diễn một mẫu về không gian có vài
thuộc tính đồng đều không thể có được từ sự biểu diễn bằng một màu đơn
hoặc một độ sáng trong vùng mà yêu cầu sự tương tác của nhiều màu, độ sáng
khác nhau. Để sử dụng kết cấu trong tìm kiếm ảnh, ta cần có các đặc tính kết
cấu của một đối tượng hoặc một vùng quan tâm đến trong ảnh cung cấp đặc
tính để tìm kiếm ảnh.
- Xem thêm -