مدل هوش مصنوعی BitNet b1.58 2B4T مایکروسافت برخلاف مدلهای رایج، به پردازندههای گرافیکی نیازی ندارد و روی پردازندههای مرکزی اجرا میشود.
به گزارش تکناک، محققان مایکروسافت از توسعه مدل هوش مصنوعی کارآمدی خبر دادهاند که میتواند روی پردازندههای مرکزی (CPU) اجرا شود. این مدل که BitNet b1.58 2B4T نام دارد، بزرگترین مدل هوش مصنوعی یک بیتی یا «بیتنت» است که تاکنون ساخته شده و بهطور عمومی تحت مجوز MIT در دسترس قرار گرفته است. این مدل میتواند روی پردازندههای مرکزی مختلف، ازجمله پردازنده M2 شرکت اپل، اجرا شود.
تککرانچ مینویسد که بیتنتها مدلهای فشردهای هستند که بهویژه برای اجرا روی سختافزارهای سبک طراحی شدهاند. در مدلهای استاندارد، وزنها که مقادیر تعریفکننده ساختار داخلی مدل هستند، معمولاً کمّیسازی (Quantize) میشوند تا بتوانند بهخوبی روی طیف وسیعی از ماشینها اجرا شوند. کمّیسازی وزنها موجب کاهش تعداد بیتها میشود که کوچکترین واحدهایی هستند که کامپیوتر میتوانند آنها را پردازش کنند و این کار به مدلها امکان میدهد تا روی چیپهای با حافظه کمتر سریعتر اجرا شوند.
در مدل BitNet، وزنها به سه مقدار ۱- و ۰ و ۱ کمّیسازی میشوند که باعث میشود این مدلها ازنظر مصرف حافظه و کارایی پردازش بهمراتب کارآمدتر از بسیاری از مدلهای هوش مصنوعی امروزی باشند. به گفته محققان مایکروسافت، هوش مصنوعی BitNet b1.58 2B4T نخستین مدل بیتنت با دومیلیارد پارامتر است که پارامترها اساساً هممعنی با وزنها هستند. این مدل براساس مجموعه دادهای شامل ۴ تریلیون توکن آموزش دیده است که معادل حدود ۳۳ میلیون کتاب میشود.
طبق آزمایشهای انجامشده، مدل BitNet b1.58 2B4T توانسته است از مدلهای مشابه با دومیلیارد پارامتر ازجمله Llama 3.2 1B متا و Gemma 3 1B گوگل و Qwen 2.5 1.5B علیبابا پیشی بگیرد. این مدل در بنچمارکهایی همچون GSM8K که مسائل ریاضی سطح ابتدایی را بررسی میکند و PIQA که مهارتهای استدلال فیزیکی را آزمایش میکند، عملکرد بهتری از خود نشان است.
علاوهبر این، یکی از ویژگیهای برجسته مدل BitNet b1.58 2B4T سرعت بسیار زیاد آن است. این مدل در برخی مواقع میتواند با دو برابر سرعت بیشتر از مدلهای مشابه دستورها را اجرا کند؛ درحالیکه مصرف حافظه آن کاهش چشمگیری یافته است.
در کنار این ویژگیها، نکتهای مهم نیز وجود دارد. برای دستیابی به این عملکرد قدرتمند، باید از فریمورک سفارشی مایکروسافت به نام bitnet.cpp استفاده شود. درحالحاضر، این فریمورک فقط با برخی از سختافزارها سازگار است و پردازندههای گرافیکی (GPU) که در زیرساخت هوش مصنوعی بهطور گستردهای استفاده میشوند، در فهرست سختافزارهای پشتیبانیشده قرار ندارند.
این یعنی درحالیکه بیتنتها قابلیتهای فراوانی دارند و بهویژه برای دستگاههای با منابع محدود مناسب به نظر میرسند، مسئله سازگاری با سختافزارها هنوز یکی از مشکلات اصلی این فناوری است که در آینده احتمالاً همچنان ادامه خواهد یافت.