Jensen Huang Special Address from NVIDIA AI Summit Japan

Tóm tắt ngắn:
- Bài phát biểu chính tập trung vào cuộc cách mạng trí tuệ nhân tạo (AI) và vai trò của NVIDIA trong việc thúc đẩy nó, đặc biệt tại Nhật Bản.
- Jensen Huang nhấn mạnh hai khía cạnh chính của AI: AI số (digital AI agents) và AI vật lý (physical AI, robotics), cùng với các công nghệ hỗ trợ như CUDA, NeMo, Omniverse, và hệ thống Blackwell. Ông cũng đề cập đến luật mở rộng (scaling law) cho cả huấn luyện và suy luận AI. Các ví dụ cụ thể bao gồm các thư viện CUDA, mô hình ngôn ngữ lớn (LLM), robot hình người, và ứng dụng AI trong sản xuất.
- Ứng dụng của AI được thảo luận bao gồm tự động hóa quy trình, tối ưu hóa chuỗi cung ứng, phát hiện lỗi bảo mật phần mềm, khám phá thuốc, và robot hình người trong sản xuất. Tác động bao gồm tăng năng suất, giảm chi phí, và tạo ra các ngành công nghiệp mới.
- Phương pháp được mô tả chi tiết bao gồm chu kỳ sống của AI agent (NeMo), quy trình huấn luyện và mô phỏng robot (Omniverse và Isaac Lab), và kiến trúc hệ thống Blackwell.
Tóm tắt chi tiết:
Bài phát biểu của Jensen Huang tại Hội nghị Thượng đỉnh AI NVIDIA Nhật Bản được chia thành các phần chính sau:
Phần 1: Giới thiệu và lịch sử hợp tác NVIDIA - Nhật Bản: Huang bắt đầu bằng việc nhấn mạnh vai trò của mô phỏng trong công nghệ NVIDIA và chào mừng hệ sinh thái AI sôi động của Nhật Bản, nhắc lại những thành tựu ban đầu của NVIDIA tại Nhật Bản, bao gồm hợp tác với SEGA, siêu máy tính Tsubame, và Nintendo Switch. Ông khẳng định Nhật Bản đóng vai trò tiên phong trong nhiều lĩnh vực liên quan đến NVIDIA.
Phần 2: Tính toán tăng tốc (Accelerated Computing): Huang giải thích khái niệm tính toán tăng tốc, sự kết hợp giữa CPU và GPU để xử lý các tác vụ tính toán nặng. Ông nhấn mạnh sự khác biệt cơ bản giữa mô hình tính toán này với việc chỉ sử dụng CPU, đã tồn tại từ năm 1964. Ông giới thiệu một loạt các thư viện CUDA được phát triển bởi NVIDIA để tăng tốc các ứng dụng trong nhiều lĩnh vực khác nhau, từ lithography đến giải trình tự gene. Đặc biệt, ông nhấn mạnh vai trò quan trọng của cuDNN trong việc thúc đẩy sự phát triển của học sâu (deep learning).
Phần 3: Phần mềm 2.0 và Mô hình Ngôn ngữ Lớn (LLM): Huang phân biệt giữa phần mềm 1.0 (viết code) và phần mềm 2.0 (học máy), cho thấy sự chuyển đổi từ lập trình truyền thống sang học máy dựa trên mạng nơ-ron chạy trên GPU. Ông giải thích cách LLM hiểu và tạo ra thông tin thông minh bằng cách học từ dữ liệu quan sát khổng lồ. Ông trình bày các ứng dụng đa dạng của LLM, bao gồm dịch thuật, tạo nội dung, và kết hợp nhiều loại dữ liệu (multimodal).
Phần 4: Luật mở rộng (Scaling Law) và Suy luận AI: Huang giới thiệu luật mở rộng cho cả huấn luyện và suy luận AI, nhấn mạnh nhu cầu về sức mạnh tính toán ngày càng tăng để đạt được hiệu suất cao hơn. Ông thảo luận về sự khác biệt giữa suy luận một bước (one-shot) và suy luận đa bước (multi-plan, reflection, chain of thought), và cách NVIDIA đang cải thiện hiệu suất suy luận.
Phần 5: Hệ thống Blackwell và Nền tảng Phần mềm: Huang giới thiệu hệ thống Blackwell, một siêu máy tính AI mạnh mẽ với hai chip GPU lớn nhất thế giới, kết nối với nhau bằng công nghệ NVLink tốc độ cao. Ông nhấn mạnh tầm quan trọng của phần mềm NVIDIA, bao gồm CUDA, NCCL, Megatron, TensorRT, Triton, trong việc vận hành và lập trình hệ thống này.
Phần 6: AI số (Digital AI Agents): Huang giới thiệu khái niệm AI số, được ví như những nhân viên kỹ thuật số có khả năng hiểu, lập kế hoạch và hành động. Ông trình bày chu kỳ sống của AI agent, bao gồm các giai đoạn huấn luyện, đánh giá, và quản lý rủi ro, và giới thiệu nền tảng NeMo và các mô hình AI được đóng gói sẵn (NIMs) của NVIDIA. Ông cũng đề cập đến các ví dụ về ứng dụng AI agent trong nhiều lĩnh vực. Câu nói đáng chú ý: "AI sẽ không lấy đi công việc của bạn. AI được sử dụng bởi người khác mới lấy đi công việc của bạn."
Phần 7: AI vật lý (Physical AI) và Robot hình người: Huang chuyển sang thảo luận về AI vật lý, tập trung vào lĩnh vực robot học. Ông nhấn mạnh sự cần thiết của sự linh hoạt và khả năng thích ứng của AI trong robot học, và giới thiệu nền tảng Omniverse và bộ xử lý Jetson Thor cho robot hình người. Ông trình bày khung Isaac Lab và các quy trình Groot-Mimic, Groot-Gen, và Groot-Control để huấn luyện robot hình người.
Phần 8: Hợp tác với SoftBank và Lưới AI Nhật Bản: Huang công bố hợp tác với SoftBank để xây dựng cơ sở hạ tầng AI lớn nhất Nhật Bản, với công suất 25 exaflops. Ông giải thích cách tích hợp công nghệ NVIDIA Aerial vào mạng 5G của SoftBank để tạo ra mạng AI-RAN, cho phép phân phối AI đến 55 triệu khách hàng. Ông cũng đề cập đến việc xây dựng một cửa hàng AI để cung cấp các mô hình AI cho người dùng. Ông nhấn mạnh tầm quan trọng của việc xây dựng cơ sở hạ tầng AI như một phần của cơ sở hạ tầng quốc gia, tương tự như vai trò của đường sá và nhà máy trong cuộc cách mạng công nghiệp.
Phần 9: Kết luận và Tầm nhìn: Huang kết thúc bài phát biểu bằng việc nhấn mạnh tầm quan trọng của việc mỗi quốc gia, mỗi công ty phải tự sản xuất trí tuệ nhân tạo của riêng mình, ví von nó như một cuộc cách mạng công nghiệp mới. Ông bày tỏ sự tin tưởng vào tiềm năng của Nhật Bản trong việc dẫn đầu cuộc cách mạng AI, nhấn mạnh sự hợp tác lâu dài giữa NVIDIA và Nhật Bản. Ông kết thúc bằng một video ngắn tóm tắt lịch sử hợp tác giữa hai bên.