Over 10 years we help companies reach their financial and branding goals. Engitech is a values-driven technology agency dedicated.

Gallery

Contacts

411 University St, Seattle, USA

engitech@oceanthemes.net

+1 -800-456-478-23

Development Technology

CUDA đã có đối thủ mạnh mẽ, hỗ trợ đầy đủ Windows, Pytorch, cài bằng 1 pip duy nhất


Ở những phiên bản trước, ROCm khá kín tiếng và quá trình setup, cấu hình cũng sẽ đôi chút phức tạp, chủ yếu qua các CLI trong Linux. Đồng thời cộng đồng nhà phát triển và người dùng khi xưa vẫn chưa nhiều. Tuy nhiên, khoảng 2 năm trở lại đây, những vấn đề đó ngày càng được cải thiện tích cực và cho tới phiên bản 7 hiện tại, mọi thứ đã thay đổi hoàn toàn và ở nhiều khía cạnh, thậm chí còn thân thiện hơn các nền tảng khác.

Lần đầu tiên, ROCm 7 mở rộng hỗ trợ đầy đủ cho cả Windows và GPU Radeon trên các máy tính cá nhân dùng Ryzen, không chỉ giới hạn ở Linux hay các máy chủ chuyên dụng như trước đây. Điều này giúp người dùng phổ thông dễ dàng tiếp cận AI ngay trên laptop hoặc desktop cá nhân


AMD-ROCM7-2-2.jpg


Cụ thể với phiên bản ROCm 7, người dùng chỉ cần chạy một lệnh pip install rocm là đã có thể bắt đầu phát triển AI trên GPU AMD. Điều này cực kỳ tiện lợi, đặc biệt cho những ai mới tiếp cận hoặc muốn tiết kiệm thời gian thiết lập môi trường, không cần phải trải qua nhiều bước thiết lập, đồng thời cũng không bị lệ thuộc vào hệ điều hành + phiên bản driver. Mặt khác, bởi tính chất open source nên người dùng tự do kiểm tra, tùy chỉnh và đóng góp vào hệ sinh thái phần mềm. Mình nghĩ chính hướng đi này đã giúp ROCm rất nhanh có được cộng đồng người dùng và nhà phát triển lớn như hiện nay.


8759769-AMD-AI-2.webp


Với ROCm 7, AMD cho biết nó hỗ trợ sâu rộng cho các thư viện AI phổ biến như PyTorch, Triton, Hugging Face, vLLM và AGI-lang. Tích hợp CI/CD hàng ngày giúp đảm bảo tính tương thích, cập nhật và hiệu suất tối ưu. Nó hỗ trợ đầy đủ các định dạng dữ liệu tiên tiến như FP8, tối ưu hóa kernel (tại sự kiện AMD Advancing AI mình dự vừa rồi còn có cả cuộc thi viết kernel ngay tại chỗ phá kỷ lục luôn), đồng thời cải thiện cơ chế giao tiếp nhằm tăng tốc các tác vụ AI phức tạp.


Screenshot 2025-06-19 160742.png


ROCm 7 hiện tại đã được tối ưu cho các kỹ thuật huấn luyện hiện đại như sharding, data parallelism, FSDP và pipeline parallelism, giúp xử lý các mô hình lớn hiệu quả hơn từ 3 đến 3.8 lần so với phiên bản trước đây. Tại sự kiện, nhiều đơn vị nổi tiếng như xAI Grok hay Usloth thần thánh cũng đã xuất hiện và chia sẻ cách họ dùng ROCm 7 để tối ưu hóa quá trình huấn luyện. Cái này có nhiều cái hay lắm, mình hẹn các bạn chia sẻ sau sâu hơn về chuyện train AI ha.





Source link

Author

MQ

Leave a comment

Your email address will not be published. Required fields are marked *