شرکت AMD شروع به پشتیبانی رسمی از مدل هوش مصنوعی Gemma 4 گوگل در طیف کاملی از پردازندههای گرافیکی (GPU) و مرکزی (CPU) خود کرده است تا کاربران امکان استفاده از این مدل هوش مصنوعی فشرده را داشته باشند.
گوگل روز گذشته خانواده مدلهای هوش مصنوعی Gemma 4 را معرفی کرد که در اندازههای مختلفی از 2 میلیارد تا 31 میلیارد پارامتر (2B تا 31B) در دسترس هستند. اکنون AMD نیز پشتیبانی از این مدلها را در تمامی پردازندههای گرافیکی Radeon و خانواده پردازندههای مرکزی Ryzen AI خود آغاز کرده است.
AMD در بیانیه خود توضیح داده که این پشتیبانی شامل پردازندههای گرافیکی AMD Instinct برای دیتاسنترهای ابری و سازمانی، پردازندههای گرافیکی AMD Radeon برای ایستگاههای کاری (Workstations) هوش مصنوعی و پردازندههای AMD Ryzen AI برای کامپیوترهای شخصی مبتنیبر هوش مصنوعی (AI PCs) میشود.
نحوه اجرای Gemma 4 روی پردازندههای AMD
مدلهای Gemma 4 را میتوان بهراحتی از طریق پروژه منبعباز llama.cpp و LM Studio روی سختافزارهای AMD اجرا کرد. با دانلود اپلیکیشن محبوب LM Studio و ترکیب آن با جدیدترین درایورهای گرافیکی AMD، میتوانید بهسرعت این مدلها را روی سختافزارهای پشتیبانیشده مانند پردازندههای Ryzen AI و Ryzen AI Max و همچنین کارتهای گرافیک Radeon و Radeon PRO راهاندازی کنید.

برنامه Lemonade Server هم امکان استقرار مدلهای Gemma 4 را روی سختافزار AMD از طریق یک سرور محلی منبعباز (برای مدلهای زبانی بزرگ) با APIهای سازگار با OpenAI فراهم میکند.
راههای متفاوت دیگری هم برای اجرای مدلهای Gemma 4 روی پردازندههای AMD وجود دارد که یکی از آنها vLLM است. این ابزارها بهصورت یک ایمیج Docker یا یک پکیج قابل نصب پایتون و با استفاده از دستورالعملهای سایت https://vllm.ai/ قابل نصب هستند.
docker pull vllm/vllm-openai-rocm:gemma4
برای تمامی پردازندههای گرافیکی AMD، میتوان vLLM را با بکاند TRITON_ATTN فراخوانی کرد:
vllm serve vllm/vllm-openai-rocm:gemma4 --attention-backend TRITON_ATTN
همچنین میتوان مدلهای Gemma 4 را با استفاده از ابزار SGLang روی پردازندههای گرافیکی AMD MI300X/MI325X/MI35X مستقر کرد. SGLang از خانواده کامل مدلهای Gemma 4، شامل مدلهای متراکم (E2B, E4B, 31B) و نسخه MoE (با مشخصات 26B-A4B) پشتیبانی میکند.
نظرات کاربران