5492
Alibaba phát triển công nghệ giúp giảm 82% nhu cầu dùng chip Nvidia cho mô hình AI
315
Ứng dụng và giải pháp
https://doi.org/10.51199
https://api-public.tapchianninhmang.vn
https://cdn.tapchianninhmang.vn

Alibaba phát triển công nghệ giúp giảm 82% nhu cầu dùng chip Nvidia cho mô hình AI

Alibaba vừa công bố hệ thống Aegaeon - giải pháp tối ưu mới giúp cắt giảm tới 82% số lượng chip Nvidia GPU cần thiết cho việc xử lý và vận hành các mô hình trí tuệ nhân tạo quy mô lớn.

Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU.
Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU.

Theo công bố, Aegaeon đã được thử nghiệm nội bộ trên chợ mô hình của Alibaba Cloud trong hơn ba tháng. Kết quả cho thấy hệ thống có thể giảm số lượng GPU Nvidia H20 phục vụ hàng chục mô hình AI khổng lồ, lên đến 72 tỷ tham số, từ 1.192 chip xuống chỉ còn 213 chip.

Công trình nghiên cứu này được nhóm khoa học của Đại học Bắc Kinh và Alibaba Cloud trình bày tại Hội nghị chuyên đề quốc tế lần thứ 31 về Nguyên tắc Hệ điều hành (SOSP) tổ chức tại Hàn Quốc. Báo cáo chỉ ra chi phí khổng lồ phát sinh khi vận hành đồng thời nhiều mô hình ngôn ngữ lớn (LLM), trong đó 17,7% GPU chỉ được sử dụng để đáp ứng 1,35% tổng số yêu cầu trên chợ mô hình của Alibaba Cloud.

Trên thế giới, các nhà nghiên cứu đang tìm cách tăng hiệu suất xử lý bằng chiến lược “gộp GPU” - cho phép một GPU phục vụ nhiều mô hình AI cùng lúc. Tuy nhiên, giải pháp Aegaeon của Alibaba vượt xa các phương pháp trước đó khi triển khai cơ chế “tự động mở rộng và thu hẹp” (auto-scaling) ở cấp độ token - đơn vị dữ liệu cơ bản trong quá trình huấn luyện và suy luận của AI.

Nhờ đó, một GPU duy nhất có thể phục vụ tối đa bảy mô hình khác nhau, thay vì chỉ hai hoặc ba mô hình như trong các hệ thống cạnh tranh khác, đồng thời giảm tới 97% độ trễ (latency) khi chuyển đổi giữa các mô hình AI.

Trong bối cảnh tập đoàn chip Mỹ Nvidia đang chịu ảnh hưởng nặng nề từ chính sách kiểm soát xuất khẩu công nghệ của chính quyền Tổng thống Biden, dòng chip H20 - được thiết kế riêng cho thị trường Trung Quốc - đã trở thành giải pháp thay thế chủ lực cho các mô hình AI tại quốc gia này. Tuy nhiên, con chip này gần đây bị các cơ quan quản lý Trung Quốc điều tra do nghi ngờ tồn tại rủi ro bảo mật “cửa hậu” (backdoor).

Song song đó, các doanh nghiệp công nghệ Trung Quốc như Huawei Technologies và Cambricon Technologies đang đẩy mạnh nghiên cứu, phát triển GPU nội địa nhằm củng cố chiến lược tự chủ công nghệ quốc gia.

Đầu tháng này, Giám đốc điều hành Nvidia Jensen Huang cũng thừa nhận thị phần chip cao cấp của hãng tại Trung Quốc đã giảm xuống mức “0”, đánh dấu bước chuyển mạnh trong bức tranh cạnh tranh công nghệ bán dẫn toàn cầu.

Bình luận

Tin bài khác

Giá xăng tăng phi mã, tài xế dịch vụ mạnh dạn “bỏ xăng sang điện”, chọn VinFast Feliz II

Giá xăng tăng phi mã, tài xế dịch vụ mạnh dạn “bỏ xăng sang điện”, chọn VinFast Feliz II

Giá xăng tăng vọt và dự báo sẽ còn “leo thang” trong thời gian dài khiến nhiều khách hàng Việt đẩy nhanh kế hoạch chốt xe máy điện. Những mẫu xe “hot” với khả năng đổi pin linh hoạt như VinFast Feliz II bởi thế đang trở thành tâm điểm với người dùng, đặc biệt là với loạt ưu đãi dày túi trong đợt mở cọc sớm tới 15/3.

Ngân hàng số và bài toán an toàn dữ liệu: Khi tăng trưởng chạm ngưỡng rủi ro

Ngân hàng số và bài toán an toàn dữ liệu: Khi tăng trưởng chạm ngưỡng rủi ro

Theo các chuyên gia, đi cùng với tốc độ tăng trưởng ấn tượng của ngân hàng số là những rủi ro ngày càng phức tạp về an toàn dữ liệu. Khi dữ liệu trở thành “tài sản lõi”, cuộc chiến bảo vệ thông tin tài chính cũng bước vào giai đoạn khốc liệt hơn bao giờ hết.

Bài 2: Chuyên gia Việt nói gì về “cơn sốt” OpenClaw?

Bài 2: Chuyên gia Việt nói gì về “cơn sốt” OpenClaw?

Từ góc nhìn của các chuyên gia Việt Nam, đằng sau sức hút của OpenClaw không chỉ là sự tò mò công nghệ, mà còn là dấu hiệu cho thấy AI đang rời vai trò chatbot để tiến sâu hơn vào đời sống, công việc và thói quen sử dụng công nghệ của con người.

iHanoi tích hợp bản đồ số 1.451 điểm bầu cử, hỗ trợ tra cứu nhanh

iHanoi tích hợp bản đồ số 1.451 điểm bầu cử, hỗ trợ tra cứu nhanh

Ứng dụng Công dân Thủ đô số iHanoi vừa bổ sung tiện ích bản đồ số 1.451 điểm bầu cử trên địa bàn Hà Nội, giúp người dân dễ dàng tra cứu khu vực bỏ phiếu, địa chỉ điểm bầu cử và chỉ đường tới nơi gần nhất trước ngày bầu cử 15/3.

Memories AI: Khi robot bắt đầu có “ký ức” như con người

Memories AI: Khi robot bắt đầu có “ký ức” như con người

Memories AI thu hút chú ý tại GTC 2026 khi giới thiệu “tầng bộ nhớ thị giác”, hướng tiếp cận mới giúp robot và thiết bị đeo ghi lại, truy xuất trải nghiệm bằng hình ảnh theo thời gian thực

Wells Fargo trao tặng Giải thưởng “Ngân hàng được công nhận đặc biệt về thanh toán quốc tế 2024-2025” cho SeABank

Wells Fargo trao tặng Giải thưởng “Ngân hàng được công nhận đặc biệt về thanh toán quốc tế 2024-2025” cho SeABank

Ngày 23/3/2026, Ngân hàng TMCP Đông Nam Á (SeABank, HOSE: SSB) được Wells Fargo - ngân hàng hàng đầu của Mỹ, trao tặng giải thưởng “Ngân hàng được công nhận đặc biệt về thanh toán quốc tế 2024-2025” (Special Recognition Award 2024-2025) ghi nhận chất lượng giao dịch thanh toán quốc tế nổi bật của SeABank không chỉ ở Việt Nam mà trên cả phạm vi quốc tế với tỷ lệ điện thanh toán chuẩn (STP) đạt 99,89% và tỷ lệ tra soát thấp chỉ 0,5%.