Đăng ký Đăng nhập
Trang chủ Tái tạo video dựa vào kỹ thuật nội suy bù chuyển động...

Tài liệu Tái tạo video dựa vào kỹ thuật nội suy bù chuyển động

.PDF
64
79859
137

Mô tả:

ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG -------oOo-------- Phạm Tuấn Anh TÁI TẠO VIDEO DỰA VÀO KỸ THUẬT NỘI SUY BÙ CHUYỂN ĐỘNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Thái Nguyên, tháng 06 năm 2014 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ LỜI CẢM ƠN Để hoàn tất một luận văn thạc sĩ yêu cầu sự tập trung, sự cố gắng và độc lập nghiên cứu. Bản thân tôi sau những năm tháng học tập vất vả và nghiên cứu cũng đã cố gắng để hoàn thành được luận văn này. Tôi luôn ghi nhận những sự đóng góp giúp đỡ nhiệt tình của những người bên cạnh mình, sự ủng hộ, sự hỗ trợ của gia đình bạn bè giúp tôi có thêm động lực để hoàn thành luận tốt nghiệp, nhân đây tôi muốn gửi lời cảm ơn nhất tới họ. Lời cảm ơn trân trọng đầu tiên tôi muốn dành tới TS Nguyễn Thị Hồng Minh, đã hướng dẫn tôi trong suốt quá trình làm luận văn, nhờ sự định hướng của cô giúp tôi tự tin nghiên cứu những vấn đề mới và giải quyết bài toán một cách khoa học. Tôi xin trân trọng cảm ơn Ban giám hiệu trường Đại học công nghệ thông tin, Đại học Thái nguyên, khoa CNTT đã tạo các điều kiện cho chúng tôi được học tập và làm khóa luận một cách thuận lợi. Lời cảm ơn sâu sắc muốn được gửi tới các thầy cô giáo đã dạy dỗ và mở ra cho chúng tôi thấy chân trời tri thức mới, hướng dẫn chúng tôi cách khám phá và làm chủ công nghệ mới. Tôi muốn gửi lời cảm ơn chân thành đến tập thể lớp CHK11D-KHMT đã cùng tôi đi qua những tháng ngày miệt mài học tập, cùng chia sẻ những niềm vui nỗi buồn, động viên tôi đi qua những khó khăn, để tôi vững bước vượt qua những vất vả, quyết tâm hoàn thành luận văn này. Tuy nhiên do thời gian có hạn, mặc dù đã nỗ lực cố gắng hết mình nhưng chắc rằng luận văn khó tránh khỏi những thiếu sót. Rất mong được sự chỉ bảo, góp ý tận tình của Quý thầy cô và các bạn. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Môc lôc Lêi c¶m ¬n................................................................................................................ 1 PhÇn më ®Çu ............................................................................................................ 6 Ch-¬ng 1: Kh¸i qu¸t vÒ video vµ bµi to¸n t¸i t¹o video...................................... 8 1.1. Kh¸i qu¸t vÒ video.......................................................................................... 8 1.1.1. Mét sè kh¸i niÖm c¬ b¶n ......................................................................... 8 1.1.1.1. C¸c d¹ng video .................................................................................. 9 1.1.1.2. Mét sè ®Þnh chuÈn video ................................................................. 10 1.1.2. Video vµ c¸c thao t¸c video .................................................................. 26 1.1.2.1 C¸c hiÖu øng biªn tËp video ........................................................... 276 1.1.2.2. Mét sè thuéc tÝnh ®Æc tr-ng cña video .......................................... 287 1.1.2.2.1. Mµu(Color) ............................................................................... 287 1.1.2.2.2. KÕt cÊu (Texture) ..................................................................... 298 1.1.2.2.3. H×nh d¸ng (Shape).................................................................... 298 1.1.2.2.4. ChuyÓn ®éng (Motion) ............................................................. 309 1.2. Bµi to¸n t¸i t¹o video .................................................................................... 30 Ch-¬ng 2: Mét sè vÊn ®Ò trong t¸i t¹o video ..................................................... 33 2.1. TrÝch rót video .............................................................................................. 33 2.1.1. Kü thuËt trõ ¶nh x¸c ®Þnh trong video ................................................... 33 2.1.2. Trõ ¶nh dùa vµo ®iÓm ¶nh ...................................................................... 34 2.1.3. Trõ ¶nh ph©n khèi .................................................................................. 36 2.1.4. Trõ ¶nh dùa vµo biÓu ®å ......................................................................... 38 2.2. Mét sè kü thuËt t¸i t¹o video ........................................................................ 44 2.2.1. Kü thuËt néi suy kh«ng gian ............................................................. 50 2.2.3. Kü thuËt néi suy bï chuyÓn ®éng ..................................................... 52 Ch-¬ng 3: Ch-¬ng tr×nh thö nghiÖm.................................................. 57 3.1. §Æt vÊn ®Ò .................................................................................................... 57 3.2. Ph©n tÝch, lùa chän c«ng cô ......................................................................... 57 3.3. Mét sè giao diÖn cña ch-¬ng tr×nh............................................................... 58 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ PhÇn kÕt luËn ......................................................................................................... 60 Danh môc tµi liÖu tham kh¶o ............................................................................. 621 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Danh môc h×nh vÏ Hình 1.1 : Cấu trúc phân cấp video ...................................................................... 8 Hình 1.2 : Minh họa chuyển đổi giữa các lia ....................................................... 9 Hình 1.3 :Sơ đồ giải nén MPEG-1(ISO/IEC 11172) .......................................... 18 Hình 1.4 : Sơ đồ nén dữ liệu âm thanh ............................................................... 18 Hình 1.5 : Mô hình hệ thống giải mã MPEG-2 .................................................. 20 Hình 1.6 : Mô hình nén và giải nén theo từng lớp của MPEG-4........................ 23 Hình 1.7 : Một số wipe cơ bản ........................................................................... 27 Hình 1.8 : Các ảnh rất khác nhau nhưng có cùng biểu đồ màu ......................... 28 Hình 1.9 : Biểu đồ thể hiện 4 loại ảnh cơ bản ................................................... 28 Hình 1.10 : Các thao tác camera ........................................................................ 29 Hình 1.11 : Mô hình chung của phép cộng ảnh .................................................. 30 Hình 1.12 : Ánh xạ các đặc trưng ....................................................................... 31 Hình 2.1 : Quá trình phân đoạn video ................................................................ 34 Hình 2.2 : Các cửa sổ cơ sở trong thuật toán so sánh thực ............................... 37 Hình 2.3 : Chênh lệch biêt đồ, * cắt cảnh,---- chồng mờ ................................... 38 Hình 2.4 : So sánh biểu đồ màu giữa hai ảnh..................................................... 39 Hình 2.5 : So sánh các cặp a, Chênh lệch biểu đồ liên tiếp b, Chênh lệch biêt đồ tích lũy .......................................................................................................... 42 Hình 2.6 : Phát hiện chuyển cảnh dần dần bằng kỹ thuật so sánh cặp .............. 43 Hình 2.7 : Biểu diễn giá trị fc(x,y)bằng nội suy song tuyến ................................ 49 Hình 2.8 : Ảnh tịn tiến di chuyển dx, dy .............................................................. 51 Hình 2.9 : Nội suy sinh khung trung gian f(n1, n2, t) .......................................... 53 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Hình 2.10 : Mô tả nội suy theo thời gian ........................................................... 54 Hình 2.11 : tái tạo cảnh theo ba bước (1) hình ảnh gốc I0 và I1 được kéo giãn để tạo ra những hình ảnh song song I^0 và I^1. (2)I^S được tạo ra bằng cách phối hợp hai hình ảnh kéo giãn( trung gian).(3) I^S được co lại để tạo thành IS ................................................................................................................... 55 Hình 3.1 : Giao diện module trích rút video ....................................................... 58 Hình 3.2 : Giao diện module tái tạo video .......................................................... 59 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ PhÇn Më ®Çu Video ra đời vào những năm đầu của thế kỷ XX và phát triển khá mạnh mẽ, nhưng phải đến cuối thập kỷ XX video số mới phát triển. Với sự ra đời và phát triển mạnh của máy tính và hệ thống viễn thông, dữ liệu video đã được số hoá và đưa vào xử lý trên hệ thống máy tính. Việc xử lý dữ liệu video được số hoá trên máy tính tỏ ra khá hiệu quả. Kết quả là dữ liệu video số đã được đưa vào rất nhiều ứng dụng trong thực tế như truyền hình, đào tạo điện tử dựa vào máy tính, hỗ trợ đào tạo trên mạng, hệ thống mô phỏng, video theo yêu cầu. Video là phương tiện thông tin đại chúng có độ phân giải cao và nội dung thông tin rất phong phú. Tuy nhiên vì nhiều nguyên nhân như: chất lượng thiết bị thu nhận video, do chuyển động của đối tượng… làm thiếu khuyết các khung hình trong video, ảnh hưởng đến nội dung, chất lượng của video. Do đó cần tái tạo các khung hình bị thiếu khuyết trong video. Hiện nay có rất nhiều công trình nghiên cứu để tái tạo các khung hình bị thiếu khuyết trong video và đã đạt được những kết quả nhất định. Tuy nhiên việc sử dụng kỹ thuật nội suy bù chuyển động để tái tạo khung hình bị thiếu khuyết trong video vẫn chưa có nhiều sự đầu tư, nghiên cứu chuyên sâu. Xuất phát trong hoàn cảnh đó luận văn lựa chọn đề tài: Tái tạo video dựa vào kỹ thuật nội suy bù chuyển động. §Ó ®¹t ®-îc môc tiªu ®Ò ra, luËn v¨n tËp trung nghiªn cøu mét sè vÊn ®Ò c¬ b¶n sau ®©y: "Nghiªn cøu tæng quan vÒ video". PhÇn nµy tr×nh bµy mét sè kh¸i niÖm vµ c¸c vÊn ®Ò c¬ b¶n trong xö lý vµ t¸i t¹o video. "Nghiªn cøu mét sè kü thuËt trÝch rót vµ t¸i t¹o video". PhÇn nµy tr×nh bµy c¸c nghiªn cøu vÒ kü thuËt trõ ¶nh vµ läc ¶nh, c¸c -u vµ nh-îc ®iÓm cña tõng kü thuËt trong viÖc x¸c ®Þnh c¶nh cña video vµ trÝch rót khung h×nh ®Æc tr-ng trong mçi c¶nh cña video ®Ó l-u tr÷. PhÇn nµy còng tr×nh bµy c¸c nghiªn cøu vÒ c¸c kü thuËt t¹o lËp khung h×nh trung gian trong viÖc t¸i t¹o ®o¹n video tõ c¸c khung h×nh ®¹i diÖn dùa vµo kü thuËt néi suy bï chuyÓn ®éng. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ "Nghiªn cøu vµ øng dông kü thuËt t¸i t¹o video". §-a ra mét sè øng dông kü thuËt t¸i t¹o video. Cµi ®Æt vµ thö nghiÖm vµ ®¸nh gi¸ kü thuËt t¸i t¹o video dùa vµo kü thuËt néi suy bï chuyÓn ®éng ®Ó kh«i phôc l¹i c¸c khung h×nh bÞ thiÕu khuyÕt tõ nh÷ng khung h×nh ®· trÝch rót. Trªn c¬ së c¸c môc tiªu ®Æt ra, cÊu tróc cña luËn v¨n bao gåm 3 ch-¬ng: Ch-¬ng 1: Kh¸i qu¸t vÒ video vµ bµi to¸n t¸i t¹o video Ch-¬ng 2: Mét sè vÊn ®Ò trong t¸i t¹o video. Ch-¬ng 3: Ch-¬ng tr×nh thö nghiÖm Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Ch-¬ng 1 kh¸I qu¸t vÒ video vµ bµi to¸n t¸I t¹o video 1.1. Kh¸i qu¸t vÒ video 1.1.1. Mét sè kh¸i niÖm c¬ b¶n Video lµ tËp hîp c¸c khung h×nh (frames), mçi khung h×nh lµ mét ¶nh. Shot (hay lia) lµ ®¬n vÞ c¬ së cña video. Mét lia lµ mét ®¬n vÞ vËt lý cña dßng video, gåm c¸c chuçi c¸c khung h×nh liªn tiÕp, kh«ng thÓ chia nhá h¬n, øng víi mét thao t¸c camera ®¬n. Scene (c¶nh) lµ c¸c ®¬n vÞ logic cña dßng video, mét c¶nh gåm c¸c lia liªn quan vÒ kh«ng gian vµ liÒn kÒ vÒ thêi gian, cïng m« t¶ mét néi dung ng÷ nghÜa hoÆc mét t×nh tiÕt. Khi phim ®-îc chiÕu, c¸c khung h×nh lÇn l-ît ®-îc hiÓn thÞ ë tèc ®é nhÊt ®Þnh. Tèc ®é th-êng thÊy ë c¸c ®Þnh d¹ng video kh¸c nhau lµ 25 hoÆc 30 h×nh/s. Nh- vËy, mét giê video sÏ cã sè l-îng khung h×nh t-¬ng øng lµ 90000 hoÆc lµ 1080000. CÊu tróc ph©n cÊp cña video ®-îc thÓ hiÖn trªn h×nh d-íi ®©y. H×nh 1.1: CÊu tróc ph©n cÊp video Ph©n ®o¹n video lµ qu¸ tr×nh ph©n tÝch vµ chia néi dung h×nh ¶nh video thµnh c¸c ®¬n vÞ c¬ së gäi lµ c¸c lia (shot). ViÖc lÊy mÉu chÝnh lµ chän gÇn ®óng mét khung video ®¹i diÖn cho mçi lia (hoÆc nhiÒu h¬n tuú theo møc ®é phøc t¹p cña néi dung h×nh ¶nh cña lia) vµ ®-îc gäi lµ c¸c khung kho¸. Khung kho¸ lµ khung h×nh ®¹i diÖn m« t¶ néi dung chÝnh cña shot. Qu¸ tr×nh ph©n ®o¹n d÷ liÖu video tiÕn hµnh, ph¸t hiÖn sù chuyÓn ®æi tõ lia nµy sang lia kh¸c hay chÝnh lµ sù ph¸t hiÖn ranh giíi gi÷a c¸c lia (®ã chÝnh lµ ®o sù kh¸c nhau gi÷a c¸c khung h×nh liÒn kÒ). Trong h×nh d-íi ®©y minh häa vÒ sù chuyÓn ®æi gi÷a c¸c lia: Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ H×nh 1.2: Minh ho¹ vÒ sù chuyÓn ®æi gi÷a c¸c lia 1.1.1.1.Các dạng video 1.1.1.1.1.Video tương tự NTSC Video: Đây là dạng Video tương tự với 525 dòng trên một khung hình, 30 khung hình trong một giây, quét cách dòng, chia làm hai trường (mỗi trường 262.5 dòng), có 20 dòng dự trữ cho thông tin điều khiển tại thời điểm bắt đầu mỗi trường. PAL Video: Dạng Video này có 625 dòng trên một khung hình, 25 khung hình trong một giây, quét cách dòng. Khung gồm hai trường chẵn lẽ, mỗi trường bao gồm 312.5 dòng. 1.1.1.1.2.Video số Một số tiêu chuẩn của Video số lấy theo tiêu chuẩn CCI. CCIR CCIR 601525/60 601625/50 NTSC PAL/SECAM 720x480 CIF QCIF 360x576 352x288 176x144 360x480 360x576 176x144 88x72 Lấy mẫu màu 4:2:2 4:2:2 4:2:0 4:2:0 Số trường /s 60 50 30,15,10,7.5 30,15,10,7.5 Cách quét Cách dòng Cách dòng Liên tục Liên tục Độ phân giải độ chói Độ phân giải màu sắc Bảng 1. 1: Các tiêu chuẩn của Video số Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 1.1.1.2.Một số định chuẩn video Sự chuẩn hóa của video tương tự trong những năm đầu của thập niên 1950 (NTSC) và những năm cuối của 1960 (SECAM và PAL) làm cho ảnh chuyển động xuất hiện hầu như khắp nơi, với các thiết bị vô tuyến được dùng rộng rãi cho mục đích giải trí, các hệ thống ứng dụng công nghệ như phát hiện chuyển động tiếp tục được phát triển. Vào năm 1990, các tổ chức về chuẩn hóa như tổ chức ISO-IEC (International Organization for Standard – International Electrotechnical Commission) đã đưa ra chuẩn MJPEG cho video kĩ thuật số, tổ chức chuẩn ITU-T đã đưa ra chuẩn H.261 và một số các chuẩn liên quan khác. Đi kèm với nó là các thiết bị tin học giá rẻ đã tạo nên sự phát triển bùng nổ cho các ứng dụng đa phương tiện. Trong quá trình soạn thảo, xử lý và kết xuất video cần hiểu rõ về các định chuẩn video. Ví dụ: để tạo ra một video sử dụng trên Intermet chúng ta cần phải thiết lập các tham số nén đảm bảo tệp video theo đúng định dạng và mục đích sử dụng. Ngoài các yếu tố kỹ thuật, việc xác định định dạng của video còn phụ thuộc vào các yếu tố kinh nghiệm của người xử lý. MPEG, AVI cho Windows, MOV cho QuickTime là các định dạng được sử dụng rộng rãi. Trong phần này chúng ta làm rõ các định chuẩn với mục đích sử dụng, các kỹ thuật nén, kích cỡ, thời gian xử lý nén và giải nén. 1.1.1.2.1.Định dạng AVI Đây là định dạng phổ biến được thiết kế để dùng trong môi trường Windows. Định dạng này rất linh hoạt, có thể sử dụng rất nhiều thuật toán nén video được phát triển từ trước đến nay để tạo ra các sản phẩm video theo mục đích sử dụng. a) Mã nén âm thanh cho chuẩn AVI + Intel Indeo 5.10 (Intel indeo 5.03): được sử dụng cho các định dạng Video phân tán trên mạng Internet, cho các máy tính có bộ xử lý MMX hoặc bộ xử lý từ Pentium II trở lên. Mã nén có đặc trưng: có lựa chọn nén nhanh, điều khiển các khung hình chính mềm dẻo, điều chỉnh độ sắc, Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ các hiệu ứng hiển thị lại, và cuối cùng tạo ra các tệp video có dữ liệu giảm đáng kể. Kiểu nén này cho phép người xử lý video có thể điều chỉnh để tạo ra các video dùng cho các băng thông khác nhau. Ví dụ: có thể điều chỉnh để tạo ra video dùng cho modem 56Kb, 28,8Kb hay đường cáp mạng... Mã nén này được thiết kế để làm việc cùng với mã nén âm thanh Intel Audio. + Intel Indeo Video Raw R1.1: được sử dụng tốt nhất cho việc thu các tín hiệu video làm dữ liệu video nguồn sử dụng cho soạn thảo video, với thiết bị thu Intel Video. Mã nén này cung cấp các hình ảnh chất lượng cao. Các tệp video dùng lựa chọn Intel Indeo Video Raw R1.1, có kích cỡ nhỏ hơn các tệp video chưa được nén. Ở định dạng này màu sắc của hình ảnh video đã được chuyển từ không gian mầu RGB thành không gian mầu YUV. + Intel Indeo Video Interactive: là kiểu nén tương tự như định dạng 5.10 nhưng có một số hỗ trợ mở rộng như đặc tính trong suốt, nhiều đối tượng chuyển động và các hiệu ứng hiển thị lại trong video. + Microsoft RLE: dùng để nén các khuôn hình mà nội dung là các vùng mầu đồng nhất có kích cỡ lớn và số lượng mầu không nhiều, màu phẳng (các ảnh không có chiều sâu). Ví dụ: khi xử lý các video phim hoạt hình, sử dụng kiểu nén này tỏ ra khá hữu hiệu. Kiểu nén này có mã nén độ dài 8 bit dùng thuật toán nén RLE và chất lượng video cao. + Microsoft Video 1: sử dụng kỹ thuật nén mất thông tin theo phương pháp nén không gian màu. Mã nén này có nhiều tham số có thể thay đổi như: số mầu trên khuôn hình của video (8 bit hay 24 bit mầu), chất lượng video, số khung hình chính... Chuẩn nén này có thể tạo ra các tệp video sử dụng cho các chương trình đào tạo từ xa hay các tệp video sử dụng cho mạng tốc độ thấp. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ + Indeo (R) Video R3:2: sử dụng để nén video 24 bit dùng cho đĩa CD. Tỷ lệ nén tốt, chất lượng hình ảnh cao và tốc độ hiển thị nhanh hơn so với kiểu nén Microsoft Video 1. Cho kết quả tốt nhất nếu sử dụng mã nén Indeo Video trên dữ liệu video nguồn mà trước đó dữ liệu này không bị nén với tỷ lệ cao bằng các kỹ thuật nén mất thông tin. Các tệp video được nén bằng kỹ thuật nén Indeo (R) video R3:2 có chất lượng tương đương với các tệp video sử dụng kỹ thuật nén Cinepak. + Cinepak Code By Radius: sử dụng để nén video 24 bit dùng cho CD-ROM hoặc cho mục đích tải về từ Web. Đây là kiểu nén đạt được tỷ lệ nén cao hơn và tốc độ giải nén nhanh hơn so với mã nén Microsoft Video 1. Chúng ta có thể đặt tham số chất lượng hình ảnh. Các tệp video sau khi xử lý có thể hiển thị lại trên đường truyền có tốc độ 30 Kb/giây. Kỹ thuật mã bằng Cinepak tạo ra sản phẩm video có tốc độ giải nén rất nhanh nhưng khi nén mất rất nhiều thời gian. Kỹ thuật nén này phù hợp cho việc chuyển một đoạn video thành kết quả cuối cho người sử dụng. b) Mã nén âm thanh cho Windows + Intel Audio Software codec: sử dụng cho nhạc và lời nói trên Internet. Tỷ lệ nén tối đa là 8:1. Mã nén này được thiết kế để làm việc với chương trình Intel Video Software. + TrueSpeech: sử dụng cho nói chuyện trên mạng Internet với tốc độ thấp. + Microsoft GSM 6.10: sử dụng cho điện thoại trên Internet ở châu Âu. + MS-ADPCM: sử dụng để tạo các tệp âm thanh có chất lượng cao ghi trên đĩa CD-ROM. Kiểu nén này được sử dụng rộng rãi. + Microsoft IMA ADPCM: sử dụng tạo các tệp âm thanh cho các sản phẩm đa phương tiện. Mã nén này được dựa trên mã nén ADPCM được phát triển bởi IMA. + Lucent Technologies SX8300P: sử dụng cho giao tiếp trên Internet với tốc độ thấp. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ + Elemedia TM AX2400P: sử dụng tạo ra các tệp âm nhạc có chất lượng cao trên Internet. + Voxware Audio Codecs: sử dụng cho các tệp âm thanh dạng tiếng nói trên Internet tốc độ thấp. 1.1.1.2.2.Định dạng MOV Các phần mềm soạn thảo video thường cung cấp các mã nén theo chuẩn QuickTime sử dụng trên môi trường hệ điều hành Windows và Mac Error! Reference source not found.. Định dạng QuickTime được xây dựng từ nhiều thuật toán nén ảnh và âm thanh trong môi trường Mac. QuickTime cũng là định dạng được rất nhiều phần mềm ứng dụng hỗ trợ. Không những thế, nó còn được cài đặt trong nhiều chíp xử lý của hệ thống máy Mac. a) Mã nén video cho chuẩn QuickTime + Cinepak: được sử dụng để nén video 24 bit. Các tệp sử dụng mã nén này để dùng cho CD-ROM và Web video. Mã nén có tỷ lệ nén cao và tốc độ giải nén nhanh. Cinepak dùng thuật toán nén không đối xứng các tệp video có kích cỡ nhỏ nhưng thời gian nén rất lâu. Cho kết quả tốt nhất nếu dùng Cinepak để tạo tệp video. + Sorenson Video: được sử dụng để nén video 24 bit. Các tệp sử dụng mã nén này để dùng cho CD-ROM và Web video. Nó cũng giống như mã nén Cinepak nhưng là mã nén mới thiết kế để nén với chất lượng cao. Mã nén này cho hình ảnh tốt hơn, kích cỡ tệp video nhỏ hơn so với mã Cinepak vì vậy nó phù hợp cho việc tạo các tệp video cuối cùng chứ không phù hợp cho soạn thảo. + Planar RGB: sử dụng hiệu quả cho các khuôn hình có vùng màu đặc như các tệp hình động (hoạt hoạ). Nó sử dụng thuật toán nén RLE kết hợp với kỹ thuật tạo mã hình động. + Motion JPEGA and Motion JPEG: được dùng cho mục đích chuyển mã video giữa các thiết bị. Ví dụ: chuyển các tệp video trong hệ thống máy Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ tính, các đoạn video trên băng ra các thiết bị khác của mày tính như đĩa CD... thông qua thiết bị thu video. Mã nén Motion JPEGA and Motion JPEG được hỗ trợ nhiều trong các chíp có trên các thiết bị thu video do đó tốc độ xử lý rất nhanh. + Photo - JPEG: dùng để nén một chuỗi các ảnh tĩnh có màu sắc biến đổi dần (các đường biên không rõ nét). Đây là kiểu nén mất thông tin nhưng có thể đặt được tham số nén để ảnh có chất lượng rất cao. Mã nén PhotoJPEG là kiểu nén đối xứng - thời gian nén gần bằng thời gian giải nén, nhưng thời gian nén là khá nhiều so với thời gian thực của video. Các ảnh đã được nén theo kiểu này thì không nên dùng làm nguồn để soạn thảo vì nó đã bị mất thông tin. Tuy nhiên với tỷ lệ nén không cao nhưng cho chất lượng ảnh tốt nên có thể dùng để lưu trữ hoặc để di chuyển giữa các hệ thống máy tính. Rất nhiều phần mềm cho phép nén dữ liệu video đã được cứng hoá sử dụng định dạng JPEG. + H.261, H.263: sử dụng tạo các video cho hội thảo, có tỷ lệ nén cao. Không nên sử dụng chuẩn này cho soạn thảo video thông thường. + Component video: được sử dụng để thu các video chất lượng cao để tạo và lưu trữ video nguồn hay tạo các đoạn video trung gian cho xử lý. Mã nén này có tỷ lệ nén rất thấp do đó các tệp video chiếm rất nhiều không gian đĩa. + Graphics: được sử dụng cho việc nén và tạo video với chất lượng cao, có độ sâu màu 8 bit. Mục tiêu của mã nén là để nén các ảnh động (một chuỗi các ảnh) nhưng đôi khi cũng có thể sử dụng cho nén video. Mã nén này không đạt được tỷ lệ nén cao. Nó chỉ thích hợp cho các tệp video lưu trữ và được xem lại trên đĩa cứng, không phù hợp với các tệp video trên CD-ROM. + Video: được sử dụng cho việc thu và nén các tín hiệu video có nguồn ở dạng tín hiệu tương tự. Mã nén này tạo ra các tệp video có chất lượng cao và Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ sử dụng tốt cho lưu trữ trên ổ đĩa cứng hoặc trên đĩa CD-ROM. Nó hỗ trợ cả hai loại nén theo không gian và thời gian cho video 16 bit mầu. + Animation: được sử dụng cho việc nén các khuôn hình có vùng màu có kích cỡ lớn, như các khuôn hình cho phim hoạt hình. Mã nén này có các tham số cho phép thay đổi tỷ lệ nén. Với tỷ lệ nén là 100%, video không bị nén. Nếu tỷ lệ dưới 100% tệp video bị nén ở dạng mất thông tin. Mã nén hình động dựa trên lý thuyết nén của hãng Apple và thuật toán nén RLE. + DV–PAL và DV–NTSC: dùng để tạo các tệp video với định dạng PAL, NTSC phục vụ in ra băng theo các hệ trên hoặc ngược lại lấy từ băng vào máy tính thông qua card thu video số. Chuẩn nén này rất hữu dụng cho việc chuyển dữ liệu video từ hệ thống máy tính này sang hệ thống máy tính khác hoặc từ thiết bị này sang thiết bị khác. Đối với các thiết bị phần cứng hỗ trợ soạn thảo Video thường có các mã nén riêng được viết bởi nhà sản xuất thiết bị phần cứng. b) Mã nén âm thanh cho chuẩn QuickTime Đối với hệ thống Mac người ta thường sử dụng các mã nén âm thanh sau: + mLaw 2:1: sử dụng cho việc chuyển các tệp âm thanh với các ứng dụng trên các máy trạm. Tại đó mLaw là định dạng âm thanh chuẩn, mLaw được sử dụng cho điện thoại số ở Bắc Mỹ và Nhật Bản. + 16-bit Big Endian và 16-bit Little Endian: sử dụng cho các phần cứng và phần mềm chuyên dụng để nén âm thanh. Âm thanh đã được nén bằng mã nén này thường không tốt cho soạn thảo. + 24–bit Integer và 32–bit Integer: sử dụng cho âm thanh 24 bit hoặc 32 bit. Mã nén này được sử dụng tốt cho các phần cứng và phần mềm chuyên dụng. Nó là sản phẩm cuối do đó các tệp video chứa mã nén này không nên dùng để soạn thảo. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ + IMA 4:1: sử dụng cho các tệp âm thanh tại các trạm. IMA 4:1 được phát triển bởi IMA sử dụng mã ADPCM. + 32–bit Floating và 64–bit Floating: sử dụng trong các thiết bị phần cứng và phần mềm chuyên dụng nhưng thường không sử dụng cho Video. + ALaw 2:1: giống mLaw nhưng được sử dụng cho điện thoại số ở châu Âu. + QDesign Music Codec: sử dụng để nén các tệp âm thanh chất lượng cao dùng trên Internet. Chất lượng của nó tương đương các tệp âm thanh trên CD-ROM có định dạng 16 bit, 44.1 kHz. Các tệp âm thanh được nén theo mã này có thể nghe trực tiếp bằng đường Internet có tốc độ 28.8 Kb/giây. + Qualcomm PureVoice: được thiết kế để tạo các tệp âm thanh tốt nhất ở tần số 8 kHz. Cơ sở của mã nén này dựa trên thuật toán nén chuẩn của Telephone CDMA. + MACE 3:1 and MACE 6:1: để tạo các tệp âm thanh thông thường cho hệ điều hành Mac. Nó dựa trên thuật toán nén âm thanh MACE. Mã nén MACE 3:1 có tỷ lệ nén thấp hơn mã nén MACE 6:1 nhưng có chất lượng cao hơn. 1.1.1.2.3.Các định chuẩn MPEG Chuẩn nén video MPEG được phát triển bởi MPEG, hiện đang được sử dụng rộng rãi trong các sản phẩm video. MPEG đứng đầu trong việc ứng dụng trong truyền hình số, mã và giải mã HDTV, CD, DVD, video hội nghị, video cho Internet và các ứng dụng khác. MPEG được sử dụng rộng rãi như vậy chính là nhờ khả năng nén hiệu quả, làm giảm đáng kể kích cỡ tệp video. Thông qua xử lý nén bằng MPEG, các video có thể truyền hiệu quả trên mạng. Cơ sở của chuẩn nén MPEG là sử dụng thuật toán biến đổi cosin rời rạc DCT với việc phân chia khuôn hình ảnh thành các khối và đánh giá chuyển động. Các đặc điểm chi tiết về kỹ thuật của chuẩn MPEG được tổ Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ chức ISO và IEC công nhận. Có ba định dạng Video theo chuẩn MPEG là MPEG 1, MPEG 2, MPEG 4 chính thức trở thành định dạng chuẩn quốc tế. a) Chuẩn Video MPEG-1 MPEG 1 đã được hoàn thiện vào năm 1991, với nhiều ưu điểm như: tối ưu hoá khi làm việc với độ phân giải 352x240 điểm ảnh, 30 hình/giây cho hệ NTSC và độ phân giải 352x288 điểm ảnh, 25 hình/giây. Chuẩn này cố định độ phân giải nên thường gây ra một số lỗi nếu độ phân giải đặt không đúng. Tuy nhiên, trường hợp đặc biệt MPEG 1 có chế độ làm việc với độ phân giải rất cao 4095x4095, phát 60 hình/giây. MPEG 1 thông thường làm việc tối ưu với tốc độ 1,5 Mb/giây cho các ứng dụng. MPEG 1 sử dụng cho các ứng dụng có chế độ quét hình tuần tự. Nó không trực tiếp làm việc với các ứng dụng video sử dụng chế độ quét xen dòng như ứng dụng truyền hình. MPEG 1 có chất lượng tương đương với chất lượng truyền hình. Video MPEG-1 sử dụng làm định dạng chuẩn cho các sản phẩm video CD. MP3 là chuẩn nén âm thanh được sử dụng trong MPEG-1. Mã nén cho cho các tín hiệu âm thanh theo chuẩn 3 lớp: Lớp 1 MP1 (MPEG 1 Audio Layer 1) Lớp 2 MP2 (MPEG 1 Audio Layer 2) Lớp 3 MP3 (MPEG 1 Audio Layer 3) MPEG 1 được thiết kế theo chuẩn ISO/IEC 11172, phân định địa chỉ của các kênh dữ liệu âm thanh và hình ảnh, kết hợp với thời gian. Đây là chức năng quan trọng vì từ dạng dữ liệu này sẽ được chuyển đổi thành các kênh dữ liệu phù hợp. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ¢m thanh Bé gi¶i m· ©m thanh ¢m thanh ®· gi¶i m· Luång L-u tr÷ Media sè Bé gi¶i m· ®Æc tr-ng media Bé gi¶i m· hÖ thèng Bé ®iÒu khiÓn ®ång hå Bé gi¶i m· video Video Video ®· gi¶i m· Hình 1.3 Sơ đồ giải nén MPEG–1 (ISO/IEC 11172) Theo sơ đồ này chúng ta thấy rằng, thông qua các địa chỉ được lưu trữ trong chuẩn MPEG1, khi giải nén sẽ xác định chính xác các kênh âm thanh và video. Thuật toán nén cho chuẩn MPEG1 có khả năng nén cao. Đầu tiên chuyển video từ không gian mầu RGB về không gian mầu YUV, sử dụng thuật toán nén không gian mầu để giảm dữ liệu video. Sau đó dùng thuật nén theo thời gian chuyển động bằng cách phân chia video thành các dãy, lựa chọn các khung hình. Phân chia khuôn hình thành các macro block và block. Dùng giải thuật DCT nén không gian ảnh. Nén không gian dữ liệu một lần nữa bằng giải thuật nén không mất thông tin. TÝn hiÖu ©m thanh B¶n ®å Bé l-îng tö vµ m· ho¸ §ãng gãi khung Dßng bit ®· m· ho¸ M« h×nh t©m lý ©m häc D÷ liÖu lÖ thuéc Hình 1.4 Sơ đồ nén dữ liệu âm thanh Đầu vào là các tín hiệu âm thanh, dựa theo bản đồ, lọc và lấy ra các mẫu đặc trưng. Mô hình tâm lý - âm học là quá trình tập hợp dữ liệu và điều khiển việc Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ lượng tử hoá và mã hoá để tạo ra khối các khuôn hình. Khối các khuôn hình là các gói chuẩn (cơ sở) được mã hoá. Ứng dụng của MPEG 1: Phân phối video: Một ứng dụng rộng khắp của MPEG 1 hiện nay đó là việc phân phối video thường là phim. Các video theo chuẩn MPEG 1 có chất lượng tốt, kích cỡ nhỏ. Phim được chuyển thành dạng MPEG 1, ghi trên đĩa CD-ROM và đang được các hãng phân phối trên toàn thế giới. Video công cộng: các trạm video công cộng hướng dẫn người sử dụng các thông tin cần thiết của một hệ thống nào đó. Nó thường được đặt tại các nhà ga, ngân hàng, siêu thị... Các video này được đặt trên đĩa cứng hoặc CD-ROM với định chuẩn MPEG 1. MPEG 1 đảm bảo chất lượng, kích cỡ nhỏ do đó có thể dễ dàng sử dụng trong các ứng dụng này. Dịch vụ video thông qua đường truyền điện thoại: Hệ thống này đang được thử nghiệm ở nhiều nước tiên tiến như Nhật Bản, Mỹ. Thông qua đường truyền điện thoại, máy điện thoại để bàn có màn hình hoặc hệ thống điện thoại di động, người sử dụng có thể đặt các chương trình video xem trực tiếp trên máy điện thoại hay có thể đàm thoại và thấy được hình ảnh của nhau. Dịch vụ này bị giới hạn về băng thông do đó người ta sử dụng định chuẩn video MPEG 1. Thư viện video: Các thư viện dữ liệu video hiện nay đang được thay thế dần các băng video bằng dữ liệu video số theo chuẩn MPEG 1. Ưu điểm của các đĩa CD theo chuẩn MPEG 1 là dễ hiển thị, dễ truy cập, không gian lưu trữ nhỏ, chất lượng hình ảnh tốt. Hiện nay rất nhiều thư viện của các trường đại học, viện nghiên cứu, trung tâm... đang chuyển dần sang sử dụng dữ liệu video số. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
- Xem thêm -

Tài liệu liên quan