Nvidia: GPU GeForce RTX sẽ tối ưu các tác vụ AI Windows 11, tốc độ hàng trăm TOPS chứ không phải 40

Nvidia: GPU GeForce RTX sẽ tối ưu các tác vụ AI Windows 11, tốc độ hàng trăm TOPS chứ không phải 40
Ngày đăng: 23/05/2024 09:20 AM

    Cũng may là Nvidia đã nhanh chóng có những công bố chính thức ngay sau sự kiện của Microsoft, nghĩa là anh em đang sử dụng máy tính trang bị GPU GeForce RTX của Nvidia cũng sẽ được tận dụng những nhân CUDA hay thậm chí cả những nhân tensor xử lý deep learning mà Nvidia phát triển, để vận hành những tính năng AI của Windows 11 cũng như những phần mềm, ứng dụng có tính năng AI xử lý on device.

    Điều này có nghĩa là, ngay khi Windows 11 24H2 ra mắt, với chuẩn Copilot+ PC, anh em sẽ không phải đợi Intel và AMD ra mắt những con chip xử lý máy tính cá nhân đủ sức mạnh 40 TOPS trở lên nữa. Lý do cũng đơn giản. Chẳng hạn như RTX 4080, Nvidia cho biết sức mạnh xử lý AI của card đồ họa này lên tới ngưỡng tối đa 836 TOPS. RTX 4090 thì có sức mạnh lên tới 1321 AI TOPS thông qua nhân Tensor thế hệ 4.

    Anh em có thể đọc thêm những tính năng AI đã và sẽ hiện diện trên Windows 11, cũng như những tính năng thuộc chuẩn Copilot+ PC:

     

    Còn theo thông tin mới nhất của Nvidia, sắp tới sẽ có phiên bản driver R555 Game Ready Driver. Với bản cập nhật phần mềm vận hành GPU GeForce RTX này, vận hành những mô hình ngôn ngữ để chạy những tính năng AI thông qua ONNX Runtime (ORT) và DirectML sẽ tăng tốc gấp 3 lần. ORT và DirectML chính là những công cụ vận hành những tính năng và mô hình AI ngay trên phần cứng PC Windows.

    R555 Game Ready Driver, Studio Driver và RTX Enterprise Driver vừa được ra mắt, với phiên bản 555.85 cho anh em cập nhật.

    Còn với các nhà phát triển ứng dụng, nền tảng WebNN cho phép các lập trình viên viết các tính năng và ứng dụng AI, chạy mô hình AI trên nền web cũng sẽ có thể tăng tốc xử lý bằng card RTX thông qua DirectML. PyTorch cũng sẽ hỗ trợ backend vận hành runtime DirectML, tức là với GPU RTX, những dàn máy tính Windows sẽ có thể huấn luyện những mô hình AI phức tạp.

    Hiện tại, Nvidia và Microsoft đang hợp tác để tối ưu tốc độ xử lý machine learning trên những GPU RTX, từ laptop đến máy bàn.

    Tính ra, Nvidia chính là đơn vị đầu tiên khởi đầu xu hướng AI tiêu dùng trên máy tính cá nhân, với tính năng đến giờ vẫn có ích và được đánh giá cao, là DLSS, ra mắt từ 6 năm trước cùng sự ra mắt của thế hệ card đồ họa RTX 20 series, kiến trúc GPU Turing.

     

    Và thậm chí hồi đầu tháng này, sau khi có thông tin từ Microsoft đưa ra con số 45 TOPS là con số phù hợp cho một hệ thống AI PC, Nvidia còn lên tiếng bác bỏ ý tưởng này. Theo họ, con số từ 10 đến 45 TOPS trên những chip xử lý của Intel, AMD, Apple và Qualcomm cũng chỉ đủ chạy những “tính năng AI cơ bản”. Những ví dụ mà Nvidia đưa ra, bao gồm chỉnh ảnh, tạo sinh hình ảnh, nâng độ phân giải hình ảnh và hỗ trợ lập trình nâng cao thông qua AI, tất cả chúng đều chỉ làm được ở mức độ căn bản, gọi là có sản phẩm đầu ra, chứ chưa chắc đủ chất lượng phục vụ người dùng hàng ngày.

    Đương nhiên là tại sự kiện hồi đầu tháng 5, Nvidia đem RTX 4090 với 1321 AI TOPS ra so sánh với những con chip xử lý giá chỉ bằng một phần lẻ. Nhưng để công bằng thì Tensor thế hệ 3 trên RTX 3060 cũng tạo ra được sức mạnh 102 TOPS rồi.

     

    Còn hiện tại, trong bài blog mới của Nvidia, họ so sánh hiệu năng và tốc độ xử lý những mô hình AI với tham số từ 7 đến 8 tỷ, đủ gọn để vận hành on device, xử lý thông qua chip trong máy tính cá nhân. HIệu năng được cải thiện với driver R555 mới ra mắt, đi kèm với đó là những tối ưu để vận hành AI tạo sinh thông qua runtime ORT, chạy những mô hình phổ biến như Llama hay Phi-3-mini:

    llm-inference-perf.png

    Vậy là, với GPU RTX, Nvidia cho biết người dùng ở mọi nhu cầu sẽ có thể tiếp cận và vận hành những tính năng AI:
     

    • Với anh em gamer, là DLSS tăng độ phân giải hình, thậm chí còn có thể tạo ra những khung hình mới để tăng tốc độ hình ảnh, chơi game mượt hơn. Gói ứng dụng Nvidia ACE thì cho phép tạo ra những nhân vật ảo với lời thoại, giọng nói và cử động tạo ra bằng AI.
    • Với người sáng tạo nội dung, những tính năng AI trong Adobe Premiere, Blackmagic Design DaVinci Resolver hay Blender cho phép hoàn thành tự động những tác vụ lặp đi lặp lại, tốc độ làm việc nhanh hơn, từ denoise mô hình 3D cho tới tạo hình, tạo cả những đoạn video ngắn.
    • Với các modder làm game, họ có RTX Remix, dựa trên nền tảng RTX Omniverse, với những công cụ AI để lột xác những game PC cũ, khoác lên bộ cánh mới hiện đại và đẹp mắt hơn.
    • Với livestreamer, Nvidia Broadcast có tính năng cắt nền video bằng AI, khử nhiễu hình ảnh, và RTX Video cho phép nâng độ phân giải hình ảnh, tự động điều chỉnh dải màu HDR của video.
    • Với các nhà phát triển ứng dụng, những công cụ dành cho các dev như AI Workbench, cuDNN, TensorRT, Maxine và RTX Video cho phép họ tối ưu nhanh những tính năng machine learning để nhanh chóng thương mại hóa mô hình và giải pháp.
    Facebook Gọi điện Gửi tin nhắn Zalo Zalo Liên hệ