Xử lý và truyền thông đa phương tiện 24/02/22

Tóm tắt ngắn:
- Bài giảng giới thiệu về xử lý và truyền thông đa phương tiện, tập trung vào các phương pháp mã hóa dữ liệu nhằm giảm dung lượng lưu trữ.
- Các điểm chính bao gồm so sánh giữa mã hóa đơn giản (dựa trên xác suất xuất hiện của ký tự) và mã hóa LZW (tận dụng các cụm từ lặp lại). Ví dụ cụ thể về mã hóa đơn giản và mã hóa LZW được trình bày chi tiết. Công thức tính độ dư thừa thông tin cũng được đề cập.
- Ứng dụng của các phương pháp mã hóa này là giảm dung lượng lưu trữ dữ liệu, đặc biệt hữu ích khi xử lý văn bản lớn với nhiều ký tự lặp lại. Việc tiết kiệm dung lượng được minh họa bằng các ví dụ số liệu.
- Quá trình mã hóa và giải mã LZW được giải thích, bao gồm việc xây dựng từ điển và cách mã hóa/giải mã dựa trên các cụm từ.
Tóm tắt chi tiết:
Bài giảng được chia thành các phần chính như sau:
Phần 1: Mã hóa đơn giản dựa trên xác suất: Phần này trình bày một ví dụ mã hóa đơn giản dựa trên xác suất xuất hiện của các ký tự trong nguồn tin. Giảng viên tính toán độ dài trung bình của mã và độ dư thừa thông tin, nhấn mạnh rằng với văn bản lớn, độ dư thừa này sẽ rất đáng kể. Công thức tính độ dư thừa được đề cập. Ví dụ minh họa cho thấy sự không hiệu quả của phương pháp này khi xử lý văn bản lớn.
Phần 2: Giới thiệu mã hóa LZW: Phần này giới thiệu mã hóa LZW như một phương pháp hiệu quả hơn so với mã hóa đơn giản. Ý tưởng chính là tận dụng các cụm từ lặp lại trong văn bản để giảm dung lượng. Giảng viên giải thích sự khác biệt giữa mã hóa LZW và mã hóa đơn giản, nhấn mạnh việc mã hóa LZW không chỉ mã hóa mà còn học hỏi và cập nhật từ điển trong quá trình mã hóa. "Ý tưởng của mã LZW là sử dụng để vừa mã hóa đồng thời lại vừa học trong quá trình mã hóa."
Phần 3: Minh họa mã hóa LZW: Phần này trình bày một ví dụ chi tiết về quá trình mã hóa LZW. Giảng viên sử dụng một chuỗi ký tự đơn giản để minh họa cách xây dựng từ điển, cách mã hóa các ký tự và cụm từ, và cách tính toán số bit cần thiết. Quá trình này được thể hiện bằng bảng input-output và từ điển. Giảng viên nhấn mạnh việc sử dụng số bit khác nhau (8 bit hoặc 9 bit) tùy thuộc vào kích thước của mã. "Chúng ta cứ cho từ điển nó học dần, học dần đến khi nào khi mà có những xuất hiện những cái chuỗi mới thì nó lưu lại."
Phần 4: So sánh và kết luận: Phần này so sánh số bit cần thiết cho mã hóa đơn giản và mã hóa LZW trong ví dụ đã cho. Kết quả cho thấy mã hóa LZW tiết kiệm được một lượng bit đáng kể. Giảng viên kết luận về hiệu quả của mã hóa LZW trong việc giảm dung lượng lưu trữ, đặc biệt khi xử lý văn bản lớn. Giảng viên cũng nhắc đến phần giải mã (mà không đi sâu vào chi tiết). "Như vậy là chúng ta tiết kiệm được là 29 bit so với cả mã ASCII."
Trong suốt bài giảng, giảng viên tương tác với sinh viên, giải đáp thắc mắc và hướng dẫn sinh viên thực hành. Các ví dụ số liệu được sử dụng để minh họa các khái niệm và kết quả.