D1-kifpool

شیائومی مدل هوش مصنوعی متن‌باز برای رقابت با OpenAI معرفی کرد

جمعه 12 اردیبهشت 1404 - 06:24
مطالعه 2 دقیقه
لوگو شیائومی / Xiaomi از نمای دور
شیائومی از مدل هوش مصنوعی متن‌باز جدیدی با ادعای عملکرد بهتر از برخی مدل‌های OpenAI پرده برداشت.
تبلیغات
D4-mcid4

شیائومی بی‌سروصدا با معرفی MiMo-7B، اولین مدل هوش مصنوعی متن‌باز در دسترس عموم خود، وارد فضای مدل‌های زبانی بزرگ (LLM) شد.

MiMo-7B محصول تیم تازه تأسیس شیائومی به‌نام Big Model Core Team است و به‌طور خاص بر وظایف نیازمند استدلال سنگین تمرکز دارد و طبق ادعای شیائومی در استدلال ریاضی و تولید کد، از رقبایی چون OpenAI و علی‌بابا عملکرد بهتری دارد.

MiMo-7B یک مدل هفت میلیارد پارامتری است. با وجود اندازه‌ی به‌مراتب کوچک‌تر نسبت‌به اکثر مدل‌های زبانی بزرگ رده‌بالا، شیائومی ادعا می‌کند عملکردش با مدل‌های حجیم‌تر، از جمله o1-mini متعلق به OpenAI و Qwen-32B-Preview از علی‌بابا، برابری می‌کند؛ هر سه مدل توانایی استدلال دارند.

شیائومی می‌گوید دیتاست متراکمی از ۲۰۰ میلیارد توکن استدلالی گردآوری کرده و در مجموع ۲۵ تریلیون توکن را طی سه مرحله به مدل آموزش داده است.

شیائومی به‌جای روش استاندارد پیش‌بینی توکن بعدی، از هدف پیش‌بینی چندتوکنی استفاده کرده و مدعی است این کار زمان استنتاج را بدون کاهش کیفیت خروجی، کوتاه می‌کند.

فرایند پس‌آموزش شامل ترکیبی از تکنیک‌های یادگیری تقویتی (RL) و بهبودهای زیرساختی می‌شود. شیائومی از الگوریتم سفارشی RL به‌نام Test Difficulty Driven Reward برای وظایف پیچیده استفاده کرد و روش Easy Data Re-Sampling برای پایدارسازی آموزش پیاده‌سازی شد.

شیائومی سیستم Seamless Rollout را برای کاهش زمان بیکاری GPU طی آموزش و اعتبارسنجی طراحی کرد که طبق ادعای شیائومی، بهبود ۲٫۲۹ برابری سرعت آموزش و جهش تقریباً ۲ برابری عملکرد اعتبارسنجی را به‌همراه داشته است.

چهار نسخه‌ی عمومی از MiMo-7B دردسترس قرار گرفته است: Base (مدل خام پیش‌آموزش‌دیده)، SFT (تنظیم دقیق با داده‌های نظارت‌شده)، RL-Zero (یادگیری تقویتی از پایه) و RL (مدل بهبودیافته مبتنی‌بر نسخه‌ی SFT با بالاترین دقت ادعاشده).

شیائومی برای ادعاهای خود، چند بنچمارک منتشر کرده؛ نسخه‌ی MiMo-7B-RL در ریاضی امتیاز ۹۵٫۸ در MATH-500 و در AIME 2024 بیش از ۶۸ امتیاز کسب کرد. در کدنویسی، امتیازش در LiveCodeBench v5 برابر ۵۷٫۸ و در نسخه‌ی ۶ کمتر از ۵۰ است.

مدل MiMo-7B هم‌اکنون با مجوز متن‌باز در Hugging Face دردسترس قرار گرفته است.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
گروه بزرگی از مردم در صفی منتظر هستند تا پارد یک ساختمان شوند
وفاداران پنهان به نظم؛ چرا برخی افراد در هر صورت همواره تابع قانون هستند؟

پژوهشی با شرکت ۱۴هزار نفر نشان داد که ۲۵ درصد افراد حتی بدون فشار بیرونی، قوانین را بی‌قیدوشرط رعایت می‌کنند، حتی وقتی شکستن آن سود بیشتری دارد.

11
حدود 22 ساعت قبل
پنل پشت و جلو گوشی پوکو F7
گوشی خوش‌قیمت جدید پوکو با طراحی بسیار جذاب رؤیت شد

رندرهای به ظاهر رسمی از پوکو F7 طراحی گوشی جدید شیائومی را به‌طور کامل به‌نمایش می‌گذارند.

134
1 روز قبل
آموزش فعال‌ سازی قابلیت SOS گوشی
آموزش فعال‌ سازی قابلیت SOS گوشی؛ نجات‌یافتن از شرايط بحرانی

قابلیت SOS در گوشی‌های هوشمند، به شما امکان می‌دهد در لحظات بحرانی به‌سرعت کمک بخواهید. در این مقاله با نحوه فعال‌سازی این قابلیت آشنا می‌شوید.

51
حدود 4 ساعت قبل
آموزش روت گوشی شیائومی
کامل‌ترین آموزش روت کردن گوشی‌ های شیائومی به همراه نکات مهم

با روت کردن گوشی شیائومی، دنیایی از امکانات و ویژگی‌های جدید به‌روی شما باز خواهد شد که بازگشت به زمان پیش از روت را سخت می‌کند؛ با زومیت همراه ...

49
حدود 5 ساعت قبل
نمای سه‌چهارم جلو خودرو تویوتا لندکروزر
پرقدرت‌ترین تویوتا لندکروزر تاریخ رونمایی شد؛ غول‌پیکر و مدرن با قیمت چشمگیر

تویوتا نسخه‌ی به‌روزشده‌ی شاسی‌بلند محبوب لندکروزر را با سیستم هیبریدی پیشرفته‌تر معرفی کرد.

64
1 روز قبل
مارک کوبان کارآفرین آمریکایی
میلیاردر معروف: اگر می‌خواهید موفق شوید، تعادل کار و زندگی را کنار بگذارید

میلیاردر معروف و باسابقه می‌گوید برای بهترین بودن نمی‌توان بین کار و زندگی تعادل داشت.

47
2 روز قبل
هوش مصنوعی جمنای گوگل
چگونه از قابلیت های هوش مصنوعی جمینای گوگل در گوشی استفاده کنیم؟

آیا جمنای می‌تواند جای دستیار گوگل را بگیرد؟ با امکانات جدید و هوش برتر، شاید جمینای همان دستیار هوشمندی باشد که همیشه منتظرش بودید.

37
1 روز قبل
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات