ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM CÔNG HÒA
TÌM HIỂU PHƯƠNG PHÁP THỦY VÂN SỐ
THUẬN NGHỊCH VÀ XÂY DỰNG ỨNG DỤNG
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội - 2012
1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM CÔNG HÒA
TÌM HIỂU PHƯƠNG PHÁP THỦY VÂN SỐ
THUẬN NGHỊCH VÀ XÂY DỰNG ỨNG DỤNG
Ngành:
Chuyên ngành:
Mã số:
Công nghệ thông tin
Hệ thống thông tin
60 48 05
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. NGÔ QUỐC TẠO
Hà Nội - 2012
2
MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................... 4
DANH MỤC CHỮ VIẾT TẮT ....................................................................................... 5
DANH MỤC CÁC BẢNG VÀ HÌNH VẼ ...................................................................... 6
MỞ ĐẦU ........................................................................................................................ 8
CHƢƠNG 1: TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN SỐ .......... 10
1.1. Kỹ thuật giấu tin trong phƣơng tiện số ................................................................ 10
1.1.1. Khái niệm giấu tin và lý thuyết cơ sở ........................................................... 10
1.1.2. Phân loại các kỹ thuật giấu tin ...................................................................... 11
1.1.3. Mô hình kỹ thuật giấu tin ............................................................................. 11
1.1.4. Giấu tin trong dữ liệu đa phƣơng tiện ........................................................... 12
1.1.4.1. Giấu tin trong ảnh số ............................................................................. 12
1.1.4.2. Giấu tin trong Audio .............................................................................. 14
1.1.4.3. Giấu tin trong Video .............................................................................. 15
1.1.4.4. Giấu tin trong văn bản ........................................................................... 15
1.2. Kỹ thuật thủy vân số ........................................................................................... 16
1.2.1. Lịch sử phƣơng pháp thủy vân số ................................................................. 16
1.2.2. Mô hình thủy vân số .................................................................................... 17
1.2.3. Các tính chất quan trọng của kỹ thuật thủy vân số ........................................ 18
1.2.4. Hệ thống thủy vân số ................................................................................... 19
1.2.4.1. Quá trình nhúng thủy vân ...................................................................... 19
1.2.4.2. Quá trình trích thủy vân ......................................................................... 20
1.2.5. Các hƣớng ứng dụng của thủy vân ............................................................... 20
1.3. Phân biệt giữa giấu tin và thủy vân ..................................................................... 22
CHƢƠNG 2: THỦY VÂN THUẬN NGHỊCH TRÊN ẢNH SỐ ................................... 23
2.1. Thủy vân số thuận nghịch ................................................................................... 23
2.2. Thủy vân số trên miền không gian ...................................................................... 24
2.2.1. Cơ sở lý thuyết............................................................................................. 24
2.2.2. Một số thuật toán ......................................................................................... 25
2.2.2.1. Thuật toán 1(SW) .................................................................................. 25
2.2.2.2. Thuật toán 2 (Wu-Lee) .......................................................................... 27
2.2.2.3. Thuật toán 3 (PCT) ................................................................................ 30
2.2.2.4. Thuật toán 4 (LSB) ................................................................................ 33
3
2.3. Thủy vân số trên miền tần số .............................................................................. 35
2.3.1. Biến đổi cosin rời rạc (DCT) ........................................................................ 35
2.3.2. Kỹ thuật thủy vân trên miền DCT ................................................................ 37
2.3.2.1. Thuật toán DCT 1 .................................................................................. 38
2.3.2.2. Thuật toán DCT 2 .................................................................................. 39
2.3.2.3. Thuật toán DCT 3.................................................................................. 41
2.4. Thủy vân số trên miền Wavelet .......................................................................... 43
2.4.1. Phép biến đổi DWT ..................................................................................... 43
2.4.2. Các thuật toán thủy vân trên miền DWT ...................................................... 45
2.4.2.1. Thuật toán DWT-1 ................................................................................ 45
2.4.2.2. Thuật toán DWT-2 ................................................................................ 46
CHƢƠNG 3: XÂY DỰNG CHƢƠNG TRÌNH THỬ NGHIỆM ................................... 48
3.1. Phát biểu bài toán ............................................................................................... 48
3.2. Phân tích và thiết kế hệ thống ............................................................................. 48
3.2.1. Mô tả chức năng hệ thống ............................................................................ 48
3.2.2. Ứng dụng thử nghiệm .................................................................................. 52
3.2.3. Đánh giá độ phức tạp và các tấn công trên ảnh ............................................. 55
KẾT LUẬN .................................................................................................................. 57
TÀI LIỆU THAM KHẢO............................................................................................. 58
5
DANH MỤC CHỮ VIẾT TẮT
CHỮ VIẾT TẮT
CP
Ý NGHĨA
Bảo vệ bản quyền tác giả (CopyRight Protection)
CWT
Biến đổi wavelet liên tục (Continuous Wavelet Transform)
DCT
Biến đổi Cosine rời rạc (Discrete Cosine Transform)
iDCT
Biến đổi Cosine rời rạc nghịch (Discrete Cosine
Transform)
DFT
Biến đổi Fourier rời rạc (Discrete Fourier Transform)
DWT
Biến đổi sóng nhỏ rời rạc (Discrete Wavelet Transform)
iDWT
Biến đổi sóng nhỏ rời rạc ngƣợc (Inverse Discrete Wavelet
Transform)
JPEG
Chuẩn nén ảnh của ủy ban JPEG quố tế (Joint
Photographic Experts Group)
LSB
Bít quan trọng nhất (Least Significant Bit)
PCT
Thuật toán thủy vân đặt theo tên 3 tác giả Hsiang-Kuang
Pan, Yu-YuanChen và Yu-chee Tseng
SW
Thuật toán thủy vân đơn giản (Simple Watermarking)
Wu-Lee
Thuật toán thủy vân đặt theo tên 2 tác giả M.Y.Wu và
J.H.Lee
6
DANH MỤC CÁC BẢNG VÀ HÌNH VẼ
1. Danh mục bảng:
Bảng 1.1: Ví dụ bảng các hệ số DCT ......................................................... 35
Bảng 1.2: Minh họa thuật toán DCT3 ........................................................ 41
2. Danh mục hình vẽ:
Hình 1.1: Quá trình chèn (giấu) tin và tách tin ........................................... 11
Hình 1.2: Sơ đồ phân loại kỹ thuật giấu tin của A.P Pentitcolas
1999 theo hai hƣớng nghiên cứu chính là giấu tin mật
và thủy vân số. ............................................................................ 15
Hình 1.3: Ví dụ về thủy vân ẩn và thủy vân hiện........................................ 16
Hình 1.4: Mô hình thủy vân do Sviatoslav Voloshynovskiy và
các cộng sự đề xuất ..................................................................... 16
Hình 1.5: Sơ đồ hệ thống thủy vân số ........................................................ 19
Hình 2.1: Mô hình thủy vân thuận nghịch .................................................. 22
Hình 2.2: Minh họa thuật toán 1(SW): nhúng bit 1 vào khối ảnh B ............ 25
Hình 2.3: Minh họa chọn điểm ảnh giấu tin vào những khối ảnh
một màu ..................................................................................... 26
Hình 2.4: Minh họa thuật toán Wu-Le: nhúng đoạn bit 011 ...................... 27
Hình 2.5. Minh họa thuật toán 3 (TCP) ...................................................... 31
Hình 2.6: Minh họa thuật toán 4 (LSB) ...................................................... 33
Hình 2.7. Phân chia 3 miền tần số thấp giữa, cao của phép biến
đổi DCT ..................................................................................... 35
Hình 2.8. Quy trình nhúng và tách thủy vân theo kỹ thủy vân trên
miền DCT .................................................................................. 36
Hình 2.9. Sự khác nhau giữa sóng (a) và sóng nhỏ (b) ............................... 42
Hình 3.1. Sơ đồ chức năng hệ thống .......................................................... 48
7
Hình 3.2: Giao diện khi mở ảnh gốc .......................................................... 51
Hình 3.3: Giao diện ghi lại ảnh đã thủy vân ............................................... 52
Hình 3.4: Giao diện mở ảnh đã thủy vân .................................................... 53
Hình 3.5: Giao diện ghi ảnh đã trích thủy vân ............................................ 54
8
MỞ ĐẦU
1. Lý do chọn đề tài
Trong kỷ nguyên số, thông tin số đƣợc sử dụng rộng rãi trong một môi trƣờng mở: tài
nguyên đƣợc phân phối cho nhiều ngƣời sử dụng, nhu cầu đƣợc bảo vệ bản quyền và sở
hữu trí tuệ các sản phẩm số đã trở thành một vấn đề quan trọng và đƣợc nhiều cơ sở
nghiên cứu quan tâm. Thuỷ vấn số hay nhúng thuỷ vân trong một phƣơng tiện là một
công nghệ mới đƣợc đánh giá mang lại nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền,
phát hiện xuyên tạc, điều khiển truy cập đối với các dữ liệu đa phƣơng tiện.
Bằng cách sử dụng thủy vân, dữ liệu số sẽ bảo vệ khỏi sự sao chép bất hợp pháp. Tạo
thuỷ vân là một phƣơng pháp nhúng một lƣợng thông tin nào đó vào trong dữ liệu đa
phƣơng tiện cần đƣợc bảo vệ sở hữu mà không để lại ảnh hƣởng nào đến chất lƣợng của
sản phẩm. Thuỷ vân phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất
kì những tấn công có chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm. Thủy
vân luôn gắn kết với dữ liệu số. Bằng trực quan thì khó có thể phát hiện đƣợc thủy vân
trong dữ liệu chứa nhƣng ta có thể tách đƣợc chúng bằng các chƣơng trình có cài đặt thuật
toán thủy vân. Thủy vân tách đƣợc từ dữ liệu số chính là bằng chứng kết luận dữ liệu số
có bị xuyên tạc thông tin hay vi phạm bản quyền không.
Thủy vân thuận nghịch sử dụng một phƣơng pháp biến đổi trực giao nào đó, chẳng
hạn nhƣ Cosine rời rạc, hay Fourier… để chuyển miền không gian ảnh sang miền tần số.
Thuỷ vân sẽ đƣợc nhúng trong miền không gian tần số của ảnh theo kĩ thuật trải phổ trong
truyền thông. Sau khi trích rút thông tin thủy vân thì vật mang tin (sản phẩm số) vẫn đảm
bảo đƣợc chất lƣợng gần nhƣ ban đầu. Đây là kĩ thuật phổ biến với nhiều thuật toán và
đƣợc hứa hẹn là một phƣơng pháp tốt giải quyết vấn đề đảm bảo hai thuộc tính quan trọng
của thuỷ vân sau khi giấu – đó là tính ẩn và tính bền vững.
Dựa vào ý tƣởng trên, tôi chọn đề tài “Tìm hiểu phƣơng pháp thủy vân số thuận
nghịch và xây dựng ứng dụng” làm nội dung nghiên cứu cho luận văn tốt nghiệp của
mình.
2. Mục đích của luận văn
Mục đích của luận văn là nghiên cứu hệ thống lý thuyết liên quan đến giấu tin trong
đó tập trung vào nhánh thứ hai của giấu tin là thủy vân thuận nghịch trên các phƣơng tiện
số. Từ đó, xây dựng chƣơng trình thử nghiệm cài đặt một số thuật toán thủy trên vân
thuận nghịch trên ảnh số nhằm ứng dụng xác thực thông tin và bảo vệ bản quyền cho dữ
liệu ảnh số.
9
3. Đối tƣợng và phạm vi nghiên cứu
Luận văn tập trung nghiên cứu các kỹ thuật thủy vân thuận nghịch trên ảnh số.
Chƣơng trình thử nghiệm mà luận văn xây dựng là hệ thống nhúng và tách thủy vân nhằm
xác thực nội dung thông tin và bảo về bản quyền ảnh số nhƣng vẫn đảm bảo chất lƣợng
của ảnh số nhƣ ban đầu sau khi trích thủy vân.
4. Phƣơng pháp thực hiện
Phƣơng pháp thực hiện đề tài là nghiên cứu các vấn đề liên quan đến thủy vân số, sau
đó tiến hành xây dựng và cài đặt chƣơng trình thử nghiệm.
5. Kết quả đạt đƣợc
Luận văn đã hệ thống lại các kiến thức cơ bản về giấu tin và thủy vân số, nghiên cứu
một số thuật toán thủy vân trên miền không gian và miền tần số. Đồng thời cài đặt thành
công thuật toán thủy vân trên miền DCT nhằm ứng dụng xác định bản quyền tác giả.
6. Bố cục của luận văn
Luận văn đƣợc chia làm 3 chƣơng.
Chương 1. Tổng quan về kỹ thuật giấu tin và thủy vân số.
Nội dung chƣơng 1 đƣa ra các kiến thức cơ bản về kỹ thuật giấu tin và thủy vân, từ
đó chỉ ra thủy vân là một nhánh của giấu tin. So sánh các phƣơng pháp thủy vân trên miền
không gian, miền tần số và thủy vân thuận nghịch. Tuy nhiên, mục đích của thủy vân
khác hoàn toàn so với mục đích của giấu tin mật và mã hóa. Điều này đƣợc thể hiện cụ
thể ở phần phân tích các hƣớng ứng dụng quan trọng của thủy vân trong đời thƣờng. Có
nhiều môi trƣờng đa phƣơng tiện để thực hiện giấu tin và cũng có chừng đó môi trƣờng
để thực hiện thủy vân.
Chương 2. Thủy vân thuận nghịch trên ảnh số
Chƣơng này trình bày một số thuật toán thủy vân trên các miền: miền không gian,
miền tần số dựa vào biến đổi Cosine rời rạc DCT và miền tần số dựa vào biến đổi sóng
nhỏ rời rạc DWT.
Chương 3. Xây dựng chương trình thử nghiệm.
Phần này sẽ phân tích và thiết kế các modul cho hệ thống, cài đặt thuật toán thủy vân
thuận nghịch và chạy thử nghiệm chƣơng trình. Thuật toán đƣợc lựa chọn cài đặt là thuật
toán thủy vân CPT trên miền không gian và thuật toán thủy vân dựa vào DCT trên miền
tần số.
10
CHƢƠNG 1: TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THỦY
VÂN SỐ
1.1. Kỹ thuật giấu tin trong phƣơng tiện số
1.1.1. Khái niệm giấu tin và lý thuyết cơ sở
Steganography có nguồn gốc từ tiếng Hy Lạp và đƣợc sử dụng tới ngày nay, nó có
nghĩa là “tài liệu đƣợc phủ” (covered writing). Các câu chuyện kể về kỹ thuật giấu thông
tin đã có từ rất lâu. Những tài liệu tìm thấy ghi chép về kỹ thuật giấu thông tin sớm nhất
thuộc về sử gia Hy Lạp Herodotus (khoảng năm 440 trƣớc Công nguyên). Khi bạo chúa
Hy Lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ 5 trƣớc Công nguyên, ông
ta đã cố gửi thông báo bí mật cho con rể của mình là Aristagoras ở Miletus. Histiaeus đã
cạo trọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của ngƣời nô lệ đó.
Khi tóc của ngƣời nô lệ mọc đủ dài, anh ta đƣợc gửi tới Miletus.
Trong một câu chuyện khác về thời Hy Lạp cổ đại cũng do Herodotus ghi lại, thì môi
trƣờng để ghi văn bản lại là những viên thuốc. Demeratus, một ngƣời Hy Lạp, cần thông
báo cho Sparta rằng Xerxes định xâm chiếm Hy Lạp. Để tránh bị phát hiện, anh ta đã bọc
lớp sáp khỏi các viên thuốc, khắc thông báo lên bề mặt những viên thuốc này, rồi sau đó
bọc lại các viên thuốc bằng một lớp sáp mới. Những viên thuốc đƣợc để ngỏ và lọt qua
mọi sự kiểm tra một cách dễ dàng.
Ý tƣởng về che giấu thông tin đã có từ hàng nghìn năm trƣớc, nhƣng trƣớc kia kỹ
thuật này chỉ đƣợc dùng chủ yếu trong quân đội và các cơ quan tình báo. Trong vài thập
niên gần đây, giấu tin giành đƣợc rất nhiều sự quan tâm của các nhà nghiên cứu, các viện
công nghệ, và nhiều công trình nghiên cứu có giá trị đã ra đời. Nguyên nhân dẫn tới sự
thay đổi này chính là cuộc cách mạng số hóa thông tin và sự phát triển nhanh chóng của
mạng truyền thông. Những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi
tinh vi, cộng với sự trao đổi dữ liệu đa phƣơng tiện trên mạng đã sinh ra nhiều vấn đề
nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp, xuyên tạc thông tin trái
phép,…
Vậy giấu tin là gì? Giấu thông tin là một kỹ thuật nhúng (giấu) một lƣợng thông tin
số nào đó vào một đối tƣợng dữ liệu số khác. Kỹ thuật giấu thông tin nhằm bảo đảm an
toàn và bảo mật thông tin với hai mục đích. Một là bảo mật cho dữ liệu đƣợc đem giấu,
hai là bảo vệ cho chính đối tƣợng dùng để giấu dữ liệu vào.Yêu cầu cơ bản của kỹ thuật
giấu tin là không làm ảnh hƣởng đến dữ liệu gốc.
11
Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật mật thông tin ở
cả hai khía cạnh. Một là bảo mật cho dữ liệu đƣợc đem giấu, hai là bảo mật cho chính đối
tƣợng đƣợc dùng để giấu tin. Điều này dẫn đến hai khuynh hƣớng chủ yếu của giấu tin:
Khuynh hƣớng thứ nhất là giấu tin mật (steganography). Khuynh hƣớng này tập
trƣng vào các kỹ thuật giấu tin sao cho thông tin giấu đƣợc nhiều và quan trọng là
ngƣời khác khó phát hiện dƣợc một đối tƣợng có bị giấu tin bên trong hay không.
Khuynh hƣớng thứ hai là thủy vân số (watermarking). Khuynh hƣớng thủy vân số
đánh giấu vào đối tƣợng nhằm khẳng định bản quyền quyền sở hữu hay phát hiện
sự xuyên tạc thông tin.
1.1.2. Phân loại các kỹ thuật giấu tin
Hai mục đích khác nhau của kỹ thuật giấu tin dẫn đến hai hƣớng kỹ thuật chủ yếu là
giấu tin mật và thủy vân.
Giấu tin mật là kỹ thuật giấu một lƣợng thông tin lớn vào một dữ liệu chứa nào đó
sao cho ngƣời khác khó phát hiện đƣợc một đối tƣợng có giấu tin bên trong hay không
nhằm bảo vệ lƣợng thông tin đem nhúng. Đồng thời, các kỹ thuật giấu tin mật còn quan
tâm lƣợng tin có thể đƣợc giấu, lƣợng thông tin giấu đƣợc càng nhiều càng tốt. Tuy nhiên,
lƣợng thông tin giấu càng lớn thì tính ẩn của thông tin giấu càng thấp.
Các thành phần trong quá trình giấu tin:
Dữ liệu nguồn (Host Signal): là dữ liệu gốc đƣợc dùng làm nơi giấu dữ liệu. Ví dụ
nếu giấu tin trong bức ảnh thì bức ảnh là dữ liệu nguồn.
Dữ liệu nhúng (Embed Data): là dữ liệu cần giấu, nó đƣợc nhúng vào dữ liệu
nguồn, còn gọi là phƣơng tiện giấu tin.
Khoá và chìa (nếu cần): để mã hóa thông tin trƣớc khi giấu vào ảnh.
Dữ liệu mang thông tin ẩn: là sản phẩm của quá trình giấu tin.
1.1.3. Mô hình kỹ thuật giấu tin
Hệ thống giấu tin nói chung bao gồm 2 phần chính: chèn tin và tách tin
Giai đoạn chèn tin, các thông tin khoá (công khai hoặc bí mật) và tin giấu đƣợc chèn
vào ảnh gốc để đƣợc sản phẩm mang tin giấu. Giai đoạn tách tin, dữ liệu, khoá (bí mật) và hoặc ảnh
gốc (ảnh không chèn tin) sẽ làm dữ liệu cơ sở để tách tin từ sảm phẩm mang tin giấu.
12
Thông điệp M
Ảnh gốc
Chèn tin
Ảnh mang tin
Khóa K
a) Chèn tin
Ảnh gốc
Ảnh mang tin
Tách tin
Thông điệp M
Khóa K
b) Tách tin
Hình 1.1: Quá trình chèn (giấu) tin và tách tin
Trong đó:
Mẩu tin mật: có thể là văn bản hoặc tệp ảnh hay bất kỳ một tệp nhị phân nào, vì quá trình xử
lý chúng ta đều chuyển chúng thành chuỗi các bit.
Ảnh phủ hay ảnh gốc: ảnh đƣợc dùng để làm môi trƣờng nhúng tin mật.
Khoá K: khoá viết mật tham gia vào quá trình giấu tin, tăng tính bảo mật.
Ảnh mang tin: là ảnh sau khi đã nhúng tin mật vào đó.
1.1.4. Giấu tin trong dữ liệu đa phƣơng tiện
Kỹ thuật giấu tin đã đƣợc nghiên cứu và áp dụng trong nhiều môi trƣờng dữ liệu khác
nhau nhƣ trong dữ liệu đa phƣơng tiện (văn bản, hình ảnh, âm thanh, phim), trong sản
phẩm phần mềm và gần đây là những nghiên cứu trên lĩnh vực cơ sở dữ liệu quan hệ.
Trong các dữ liệu đó, dữ liệu đa phƣơng tiện là môi trƣờng chiếm tỷ lệ chủ yếu trong các
kỹ thuật giấu tin.
1.1.4.1. Giấu tin trong ảnh số
Thông tin sẽ đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh ít thay đổi và
không ai biết đƣợc đằng sau đó mang những thông tin có ý nghĩa. Ngày nay, khi ảnh số
đã đƣợc sử dụng phổ biến, giấu thông tin trong ảnh đã đem lại nhiều những ứng dụng
13
quan trọng trên nhiều lĩnh vực trong đời sống xã hội. Ví dụ đối với các nƣớc phát triển,
chữ ký tay đã đƣợc số hóa và lƣu trữ sử dụng nhƣ hồ sơ các nhân của các dịch vụ ngân
hàng và tài chính, nó đƣợc dùng để xác thực trong các thẻ tín dụng của ngƣời tiêu dùng.
Phần mềm WinWord của Microsoft cũng cho phép ngƣời dùng lƣu trữ chữ ký trong ảnh
nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an toàn của thông
tin. Tài liệu sau đó đƣợc truyền trực tiếp qua máy fax hoặc lƣu truyền trên mạng. Theo đó,
việc xác thực chữ ký, xác thực thông tin đã trở thành một vấn đề quan trọng khi việc ăn
cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với
bất kỳ quốc gia nào, tổ chức nào. Hơn nữa có nhiều loại thông tin quan trọng cần đƣợc
bảo mật nhƣ những thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài
chính, các thông tin này đƣợc số hóa và lƣu trữ trong hệ thống máy tính hay trên mạng.
Chúng dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng. Việc xác thực cũng
nhƣ phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng và cấp thiết. Một đặc
điểm của giấu thông tin trong ảnh là thông tin đƣợc giấu trong ảnh một cách vô hình,
tƣơng tự cách truyền thông tin mật cho nhau mà ngƣời khác không thể biết đƣợc bởi sau
khi giấu thông tin chất lƣợng ảnh gần nhƣ không thay đổi đặc biệt đối với ảnh mầu hay
ảnh đa cấp xám.
Các kỹ thuật giấu tin trong ảnh hiện nay đều thuộc vào một trong 3 nhóm:
Giấu tin trong miền quan sát. Đây là kỹ thuật giấu tin vào các bit có trọng số thấp
(Least Significant Bit). Phƣơng pháp này đƣợc áp dụng trên các ảnh bitmap không nén,
các ảnh dùng bảng mầu. Ý tƣởng chính của phƣơng pháp là lấy từng bit của mẫu tin mật
rồi rải nó lên ảnh mang, thay đổi bit có trọng số thấp của ảnh bằng các bit của mẫu tin mật
và mắt ngƣời không cảm nhận đƣợc sự thay đổi đó.
Các phƣơng pháp dựa vào kỹ thuật biến đổi ảnh. Ví dụ biến đổi từ miền không
gian sang miền tần số nhằm đảm bảo tính bền vững của thông tin đƣợc gấu, sử dụng cho
kỹ thuật thủy vân bền vững. Ý tƣởng chính là nhúng thông tin bằng cách điều chế các hệ
số của phép biến đổi Cosin rời rạc theo các bit tin cần giấu và sự làm tròn lỗi khi lƣợng
hóa. Một số phƣơng pháp khác thuộc nhóm này sử dụng ảnh nhƣ mô hình vật lý với các
dải phổ thể hiện mức năng lƣợng. Khi đó giấu tin giống nhƣ việc điều chế một tín hiệu dải
hẹp vào một dải tần rộng (ảnh phủ).
Các phƣơng pháp sử dụng mặt nạ giác quan. Nhóm này dựa trên nguyên lý đánh
lừa giác quan của con ngƣời bằng cách làm mờ bức ảnh. “Mặt nạ” ở đây ám chỉ hiện
tƣợng mắt ngƣời không cảm nhận đƣợc một tín hiệu nếu nó ở bên cạnh một tín hiệu nhất
định nào đó.
14
1.1.4.2. Giấu tin trong Audio
Giấu thông tin trong audio mang những đặc điểm riêng khác với giấu thông tin trong
các đối tƣợng đa phƣơng tiện khác. Một trong những yêu cầu cơ bản của giấu tin là đảm
bảo tính chất ẩn của thông tin đƣợc giấu đồng thời không làm ảnh hƣởng nhiều đến chất
lƣợng của dữ liệu gốc. Để đảm bảo yêu cầu này, kỹ thuật giấu thông tin trong ảnh phụ
thuộc vào hệ thống thị giác của con ngƣời, còn kỹ thuật giấu thông tin trong audio lại phụ
thuộc vào hệ thống thính giác. Và một vấn đề khó khăn ở đây là hệ thống thích giác của
con ngƣời khá nhạy cảm, nghe đƣợc các tín hiệu ở các giải tần rộng và công suất lớn nên
những đoạn thông tin nhiễu dễ dàng bị phát hiện làm cho việc giấu tin gặp khó khăn.
Nhƣng hệ thống thính giác lại kém trong việc phát hiện sự khác biệt của các giải tần và
công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu đƣợc các âm
thanh nhỏ thấp một cách dễ dàng. Các mô hình phân tích tâm lý đã chỉ ra điểm yếu trên
và thông tin này sẽ giúp ích cho việc chọn các audio thích hợp cho việc giấu tin. Vấn đề
khó khăn thứ hai của giấu thông tin trong audio là kênh truyền tin. Kênh truyền hay băng
thông chậm sẽ ảnh hƣởng đến chất lƣợng thông tin sau khi giấu. Các phƣơng pháp giấu
thông tin trong audio đều lợi dụng điểm yếu trong hệ thống thính giác của con ngƣời. Các
thuật toán giấu tin trong audio đƣợc thực hiện trong miền biến đổi tần số, sử dụng kỹ
thuật: mã hóa bit thấp, mã hóa tiếng vang, mã hóa pha,...
Mã hóa bít thấp: Cũng nhƣ các file ảnh, phƣơng pháp chèn vào các bit ít quan trọng
cũng lƣu trữ dữ liệu giấu vào trong các bit ít quan trọng của file audio. Phƣơng pháp mã
hóa LSB là cách đơn giản nhất để nhúng thông tin vào trong dữ liệu audio. Phƣơng pháp
này sẽ thay thế bít ít quan trọng nhất (thƣờng là bít cuối) của mỗi mẫu dữ liệu bằng bit
thông tin giấu.
Mã hóa pha là kỹ thuật thực hiện giấu tin trong audio thông qua việc thay thế pha
của một segment audio ban đầu bằng một pha tham chiếu (referency phase) thể hiện dữ
liệu. Pha của các segment tiếp theo sẽ đƣợc điều chỉnh sao cho duy trì mối quan hệ giữa
các đoạn.
Kỹ thuật giấu dựa vào tiếng vang thực hiện giấu tin bằng cách thêm vào tiếng vang
trong tín hiệu gốc. Dữ liệu nhúng đƣợc giấu bằng cách thay đổi 3 tham số của tiếng vang:
biên độ ban đầu, tỉ lệ phân rã và độ trễ. Khi thời gian giữa tín hiệu gốc và tiếng vang giảm
xuống, hai tín hiệu có thể trộn lẫn và ngƣời nghe khó có thể phân biệt giữa hai tín hiệu. Số
lƣợng tin giấu có liên quan đến thời gian trễ của tiếng vang và biên độ của nó.
15
1.1.4.3. Giấu tin trong Video
Cũng giống nhƣ giấu tin trong ảnh hay trong audio, giấu tin trong video cũng đƣợc
quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng dụng nhƣ kiểm soát sao chép thông
tin, nhận thực thông tin và bảo vệ bản quyền tác giả. Nhiều kỹ thuật giấu tin trong ảnh
đƣợc áp dụng cho giấu tin trong video nhƣng đảm bảo các ràng buộc:
Do dữ liệu video là rất lớn nên thời gian để giấu tin cũng rất lớn. Vì vậy, việc
giấu tin phải đƣợc thực hiện trong thời gian thực để truyền các tín hiệu video
đi.
Do giới hạn của băng thông nên việc giấu tin không đƣợc làm thay đổi kích
thƣớc của dữ liệu.
Các dữ liệu video thƣờng đƣợc lƣu ở dạng nén, thông thƣờng dựa vào quá
trình xử lý sự thay đổi ảnh từ khung hình này đến khung hình khác. Vì vậy,
khi giấu tin cần đảm bảo rằng thông tin không quá dễ phát hiện ra bằng mắt
thƣờng.
1.1.4.4. Giấu tin trong văn bản
Trong trao đổi thông tin qua hệ thống máy tính, văn bản chiếm một tỷ lệ rất lớn so
với các loại phƣơng tiện chứa khác. Tuy vậy, giấu tin trong văn bản lại chƣa đƣợc quan
tâm nghiên cứu nhiều. Các nghiên cứu về giấu tin trong văn bản đƣợc chia theo hai
hƣớng:
Thứ nhất, văn bản đƣợc sử dụng để giấu tin là những văn bản đƣợc chụp lại và lƣu
trên máy nhƣ một bức ảnh nhị phân. Theo hƣớng này, các kỹ thuật giấu tin đƣợc thực
hiện nhƣ kỹ thuật giấu tin trong ảnh.
Thứ hai, phƣơng tiện chứa sử dụng cho quá trình giấu tin đƣợc lƣu dƣới dạng văn
bản. Theo hƣớng này, giấu tin đƣợc thực hiện bằng cách điều chỉnh khoảng cách giữa các
dòng hoặc thay đổi kích thƣớc một số ký tự tại một số vị trí trên văn bản mà không làm
ảnh hƣởng nhiều đến nội dung văn bản gốc.
16
1.2. Kỹ thuật thủy vân số
1.2.1. Lịch sử phƣơng pháp thủy vân số
Phƣơng pháp thủy vân đầu tiền đƣợc thực hiện là thủy vân trên giấy. Đó là một thông
tin nhỏ đƣợc nhúng chìm trong giấy để thể hiện bản gốc hoặc bản chính thức. Theo
Hartung và Kutter, thủy vân trên giấy đã bắt đầu đƣợc sử dụng vào năm 1292 ở Fabriano,
Italy – nơi đƣợc coi là nơi sinh của thủy vân. Sau đó, thủy vân đã nhanh chóng lan rộng
trên toàn Italy và rồi trên các nƣớc châu Âu và Mỹ. Ban đầu, thủy vân giấy đƣợc dùng với
mục đích xác định nhãn hàng và nhà máy sản xuất. Sau này đƣợc sử dụng để xác định
định dạng, chất lƣợng và độ dài, ngày tháng của sản phẩm.
Đến thế kỷ thứ 18, nó bắt đầu đƣợc dùng cho tiền tệ và cho đến nay thủy vân vẫn là
một công cụ đƣợc dùng rộng rãi với mục đích bảo mật cho tiền tệ, chống làm tiền giả.
Thuật ngữ “thủy vân” (watermarking) đƣợc đƣa ra vào cuối thế 18, nó bắt nguồn từ một
loại mực vô hình khi viết lên giấy và chỉ hiển thị khi nhúng giấy đó vào nƣớc. Năm 1988,
Komatsu và Tominaga đã đƣa ra thuật ngữ “thủy vân số” (Digital watermarking).
Vậy thủy vân số là quá trình sử dụng các thông tin (ảnh, chuỗi bít, chuỗi số) nhúng
một cách tinh vi vào dữ liệu số (ảnh số, audio, video hay text) nhằm xác định thông tin
bản quyền của tác phẩm số. Mục đích của thủy vân số là bảo vệ bản quyền cho phƣơng
tiện dữ liệu số mang thông tin thủy vân. Tùy theo mục đích của hệ thủy vân mà ngƣời ta
lại chia thành các hƣớng nhỏ nhƣ thủy vân dễ vỡ và thủy vân bền vững.
Giấu tin
(Information
hiding)
Giấu tin mật
(steganography)
Thủy vân số
(watermaking)
Thủy vân dễ vỡ
(Fragile watermarking)
Thủy vân bền vững
(robust copyright marking)
Thủy vân ẩn
(Imperseptipl Mermarking)
Thủy vân hiện
(Visible watermarking)
Hình 1.2: Sơ đồ phân loại kỹ thuật giấu tin của A.P Pentitcolas 1999 theo hai hướng
nghiên cứu chính là giấu tin mật và thủy vân số
17
Thủy vân bền vững quan tâm nhiều đến việc nhúng những mẩu tin đòi hỏi độ bền
vững cao của thông tin đƣợc giấu trƣớc các biến đổi thông thƣờng trên dữ liệu chứa.
Hƣớng này đƣợc sử dụng để bảo vệ bản quyền tác giả.
Thủy vân dễ vỡ yêu cầu thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào
trên dữ liệu chứa. Hƣớng này đƣợc sử dụng để phát hiện xuyên tạc thông tin.
Ở mỗi loại thủy vân bền vững hoặc thủy vân dễ vỡ lại chia thành hai loại dựa theo
đặc tính đó là thủy vân ẩn và thủy vân hiện. Thủy vân hiện cho phép nhìn thấy thông tin
đem nhúng vào dữ liệu chứa. Loại này đƣợc sử dụng cho mục đích công bố công khai về
quyền sở hữu. Ngƣợc lại, thủy vân ẩn không cho phép nhìn thấy nội dung thông tin nhúng
và nó đƣợc sử dụng với mục đích gài bí mật các thông tin xác nhận quyền sở hữu.
Hình 1.3: Ví dụ về thủy vân ẩn và thủy vân hiện
1.2.2. Mô hình thủy vân số
Hình 1.4: Mô hình thủy vân do Sviatoslav Voloshynovskiy và các cộng sự đề xuất
18
Mô Mô hình thủy vân Sviatoslav Voloshynovskiy đƣợc chia làm 3 phần chính:
Nhúng thủy vân
Các tấn công trên thủy vân
Trích thủy vân
Thủy vân có thể đƣợc mã hóa để tăng cƣờng tính bền vững. Thông thƣờng, tài liệu đã
nhúng thủy vân sẽ trải qua một số bƣớc tấn công trƣớc khi đƣợc trích thủy vân. Sau quá
trình trích đƣợc thực hiện, dựa vào kết quả trích rút để có quyết định tài liệu có đƣợc
nhúng thủy vân hay không, và nếu có thì thực hiện giải mã trên dữ liệu trích để nhận đuợc
giá trị thủy vân.
1.2.3. Các tính chất quan trọng của kỹ thuật thủy vân số
Tính bền vững: Chất lƣợng của thuật toán phụ thuộc vào tính bền vững của thủy vân.
Đặc biệt đối với thủy vân bền vững, yêu cầu quan trọng là thủy vân không bị thay đổi sau
một số phép xử lý trên đối tƣợng đƣợc nhúng. Đối với ảnh số, các phép xử lý này có thể
là phép nén thông tin, lọc, tính tiến, quay, làm sắc ảnh, xén ảnh,…
Tính vô hình: Đối với thủy vân ẩn thì mọi thuật toán đều cố gắng nhúng thủy vân sao
cho chúng không bị phát hiện bởi ngƣời sử dụng. Thông thƣờng đối với một thuât toán
nếu tính bền vững cao thì tính vô hình kém và ngƣợc lại, do đó cần có sự cân nhắc giữa
tính bền vững và tính vô hình để đảm bảo thủy vân đạt đƣợc cả tính bền vững cũng nhƣ
tính vô hình.
Tính bảo mật: Bảo mật đối với khóa, thủy vân sao cho nếu một ai đó không có quyền
thì không thể dò đƣợc thủy vân.
Tính phức tạp của kỹ thuật thuỷ vân thể hiện ở hai tính chất mâu thuẫn (tính bền
vững và tính ẩn) lẫn nhau này. Nếu nhƣ để đảm bảo tính ẩn thì thuỷ vân phải đƣợc giấu
trong những vị trí ít có ý nghĩa tri giác nhất, ít bị chú ý nhất, nhƣng để đảm bảo đƣợc tính
bền vững thì thuỷ vân phải chịu đƣợc những phép xử lí ảnh phổ biến nhƣ dịch chuyển
ảnh, co giãn ảnh, quay ảnh hoặc nén ảnh. Đơn cử nhƣ phép nén JPEG lại loại bỏ ảnh
những thông tin ít có tính tri giác nhất để làm giảm kích thƣớc của ảnh mà vẫn đảm bảo
đƣợc chất lƣợng ảnh. Căn cứ trên các giải pháp đã đƣợc công bố, ta có thể phân loại các
kĩ thuật hiện nay thành hai nhóm chính:
Nhóm các kĩ thuật biến đổi miền không gian ảnh (spatial image
transfroms): nhóm kĩ thuật này tập trung vào việc thay đổi trực tiếp lên không
gian các điểm ảnh và sử dụng các mô hình tri giác và phƣơng pháp hình
học. Tuy nhiên, các kĩ thuật này chỉ đảm bảo đƣợc thuộc tính ẩn mà không có
19
tính bền vững. Kĩ thuật này thƣờng đƣợc sử dụng trong các ứng dụng nhận
thực thông tin, phát hiện xuyên tạc.
Nhóm các kĩ thuật biến đổi miền tần số ảnh (frequency image transforms):
Nhóm kĩ thuật này sử dụng một phƣơng pháp biến đổi trực giao nào đó, chẳng
hạn nhƣ Cosine rời rạc, hay Fourier… để chuyển miền không gian ảnh sang
miền tần số. Thuỷ vân sẽ đƣợc nhúng trong miền không gian tần số của ảnh
theo kĩ thuật trải phổ trong truyền thông. Đây là kĩ thuật phổ biến nhất với
nhiều thuật toán và đƣợc hứa hẹn là một phƣơng pháp tốt giải quyết vấn đề
đảm bảo hai thuộc tính quan trọng của thuỷ vân sau khi giấu.
Ngoài hai nhóm trên, gần đây đã xuất hiện những ký thuật dựa trên đặc thù của ảnh.
1.2.4. Hệ thống thủy vân số
Hệ thống thủy vân số là quá trình sử dụng một thủy vân nhúng vào trong một dữ liệu
số để đƣợc một dữ liệu số có chứa thủy vân hay gọi là dữ liệu có bản quyền. Dữ liệu có
bản quyền này sẽ đƣợc phân phối trên kênh truyền tin. Trong quá trình phân phối, dữ liệu
bản quyền có thể bị tấn công trái phép hoặc yếu tố gây nhiễu. Nếu dữ liệu số bản quyền bị
nghi ngờ sao chép trái phép hoặc chỉnh sửa thông tin thì có thể xác minh nhờ quá trình
tách thủy vân đã nhúng. Nhƣ vậy, hệ thống thủy vân số nói chung bao gồm 2 quá trình là
quá trình nhúng thủy vân và quá trình tách thủy vân.
Thủy vân mang thông tin bảo mật hoặc bản quyền về dữ liệu chứa.
Khóa thủy vân đƣợc dùng cho cả phiên nhúng và phát hiện thủy vân. Khóa thủy vân
là duy nhất với mỗi thủy vân. Khóa đó là khóa bí mật, chỉ tác giả mới biết. Điều đó nói
lên rằng chỉ tác giả mới phát hiện ra đƣợc thủy vân. Tùy từng bộ nhúng thủy vân mà có
các yêu cầu với khóa thủy vân.
1.2.4.1. Quá trình nhúng thủy vân
Giai đoạn này gồm thông tin khóa thủy vân, thủy vân, dữ liệu chứa và bộ nhúng thủy
vân.
Dữ liệu chứa bao gồm các đối tƣợng nhƣ văn bản, audio, video, ảnh… dạng số, đƣợc
dùng làm môi trƣờng để giấu tin.
Bộ nhúng thủy vân là chƣơng trình đƣợc cài đặt những thuật toán thủy vân và đƣợc
thực hiện với một khóa bí mật.
Thủy vân sẽ đƣợc nhúng vào trong dữ liệu chứa nhờ một bộ nhúng thủy vân. Kết quả
quá trình này là đƣợc dữ liệu chứa đã nhúng thủy vân gọi là dữ liệu có bản quyền và đƣợc
20
phân phối trên các môi trƣờng khác nhau. Trên đƣờng phân phối có nhiễu và sự tấn công
từ bên ngoài. Do đó yêu cầu các kỹ thuật thủy vân số phải bền vững với cả nhiễu và sự
tấn công trên.
1.2.4.2. Quá trình trích thủy vân
Quá trình tách thủy vân đƣợc thực hiện thông qua một bộ tách thủy vân tƣơng ứng
với bộ nhúng thủy vân cùng với khóa của quá trình nhúng. Kết quả thu đƣợc là một thủy
vân. Thủy vân thu đƣợc có thể giống với thủy vân ban đầu hoặc sai khác do nhiễu và sự
tấn công trên đƣờng truyền.
Khóa thủy vân
Dữ liệu số
Bộ nhúng thủy vân
Dữ liệu bản quyền
Thủy vân
Tấn công
Thủy vân
Bộ tách thủy vân
Kênh truyền
tin
Nhiễu
Dữ liệu bản quyền
Khóa thủy vân
Hình 1.5: Sơ đồ hệ thống thủy vân số
1.2.5. Các hƣớng ứng dụng của thủy vân
Bảo vệ bản quyền tác giả CP (copyright protection): Đây là ứng dụng cơ bản nhất
của kỹ thuật thủy vân. Trong thực tế, nhiều tác phẩm đã có tác quyền nhƣng vẫn bị sử
dụng sai mục đích. Các thông báo tác quyền này thƣờng đƣợc đặt ở một vị trí nào đó trên
tác phẩm đƣợc phân phối. Chẳng hạn, ta thƣờng thấy trên các tài liệu văn bản là
“copyright ngày ... ngƣời sở hữu ...” hay trên các tác phẩm âm thanh thì đƣợc đặt trên
băng đĩa vật lý hoặc trên bao bì,... Vấn đề bảo vệ bản quyền này không đƣợc đảm bảo vì
không quá khó để loại bỏ nó ra khỏi một tài liệu khi cần sao chép. Ví dụ, một giáo viên
sao chép một số trang từ quyển sách mà quên sao chép thông báo tác quyền ở trang tiêu
- Xem thêm -