Microsoft cuối cùng cũng nhảy vào tự sản xuất chip

Ngày đăng: 17/11/2023 08:26 AM

Chip Azure Maia 100 và Cobalt 100 là hai chip bán dẫn đầu tiên được Microsoft thiết kế cho cơ sở hạ tầng đám mây của mình.

Tin đồn đã đúng. Microsoft chính thức nhảy vào làm chip AI tùy chỉnh của riêng mình, có thể được sử dụng để đào tạo các mô hình ngôn ngữ lớn và có khả năng tránh được sự phụ thuộc tốn kém vào Nvidia. Microsoft đã phát triển CPU dựa trên kiến trúc ARM phục vụ cho hạ tầng đám mây. Cả hai chip tùy chỉnh của Microsoft đều được thiết kế để cung cấp cho các trung tâm dữ liệu Azure và giúp công ty cũng như khách hàng doanh nghiệp sẵn sàng cho một tương lai tràn ngập AI.

Theo The Verge, hai chip Azure Maia AI của Microsoft và CPU Azure Cobalt chạy bằng kiến trúc ARM sẽ ra mắt vào năm 2024. Hiện nay, nhu cầu mua GPU H100 của Nvidia dùng đào tạo và vận hành các công cụ hình ảnh tổng hợp và mô hình ngôn ngữ lớn đang tăng lên rất cao. Nhu cầu về những GPU này cao đến mức một số thậm chí đã bán được với giá hơn 40.000 USD (940 triệu đồng) trên eBay.

Rani Borkar, người đứng đầu hệ thống phần cứng và cơ sở hạ tầng Azure tại Microsoft, giải thích trong một cuộc phỏng vấn với The Verge: “Microsoft thực sự có lịch sử lâu dài trong việc phát triển chip. Microsoft đã hợp tác sản xuất chip cho Xbox hơn 20 năm trước và thậm chí còn đồng thiết kế chip cho các thiết bị Surface của mình.

Rani Borkar nói: “Những nỗ lực làm chip hiện nay được xây dựng dựa trên kinh nghiệm đó. Vào năm 2017, chúng tôi đã bắt đầu kiến trúc hệ thống phần cứng đám mây và bắt đầu hành trình đưa chúng tôi đi đúng hướng để xây dựng các chip tùy chỉnh mới của mình.”

Chip AI Azure Maia mới và CPU Azure Cobalt đều được xây dựng nội bộ tại Microsoft, kết hợp với việc đại tu sâu toàn bộ hệ thống máy chủ đám mây để tối ưu hóa hiệu suất, sức mạnh và chi phí. Rani Borkar cho biết: “Chúng tôi đang xem xét lại cơ sở hạ tầng đám mây cho kỷ nguyên AI và tối ưu hóa mọi lớp của cơ sở hạ tầng đó theo đúng nghĩa đen”.

CPU Azure Cobalt là một con chip 128 lõi được xây dựng trên thiết kế CSS của ARM Neoverse và được tùy chỉnh riêng cho Microsoft. Nó được thiết kế để cung cấp sức mạnh tính toán cho các dịch vụ đám mây nói chung trên Azure. Rani Borkar giải thích: “Chúng tôi đã suy nghĩ rất nhiều để không chỉ làm cho nó có hiệu suất cao mà còn đảm bảo rằng chúng tôi quan tâm đến việc quản lý năng lượng. Chúng tôi đã thực hiện một số lựa chọn thiết kế có chủ ý, bao gồm khả năng kiểm soát hiệu suất và mức tiêu thụ điện năng trên mỗi lõi và trên từng máy ảo.”