شیائومی از پیشرفتهترین مدل زبانی خود رونمایی کرد؛ رقیبی سریع و ارزان برای Claude و DeepSeek

شیائومی از پیشرفتهترین مدل زبانی متنباز خود با نام MiMo-V2-Flash رونمایی کرد. این مدل که بخشی از سرمایهگذاری جدی این شرکت در حوزه هوش مصنوعی محسوب میشود، بر سرعت پردازش، معماری بهینه و توانمندی بالا در استدلال و تولید کد تمرکز دارد. این ویژگیها MiMo-V2-Flash را به رقیب جدی برای مدلهایی مانند DeepSeek V3.2 و Claude 4.5 Sonnet تبدیل میکند.
MiMo-V2-Flash یک مدل با معماری Mixture-of-Experts (MoE به معنای ترکیب متخصصان) است که از 309 میلیارد پارامتر کلی و 15 میلیارد پارامتر فعال پشتیبانی میکند. این مدل بهطور خاص برای سناریوهای مبتنی بر ایجنت هوش مصنوعی و تعاملات چندمرحلهای طراحی شده که سرعت استنتاج نقش کلیدی در آنها دارد.
بهگفته شیائومی، این طراحی باعث حفظ بهرهوری بالا در وظایف با موضوعات طولانی شده و درعینحال هزینه عملیاتی را کاهش میدهد. ادعای شرکت این است که MiMo-V2-Flash در بسیاری از سناریوها سریعتر از DeepSeek و Claude خروجی تولید میکند.
عملکرد مدل شیائومی در بنچمارکها
نتایج بنچمارکها نشان میدهد MiMo-V2-Flash در سطح بالایی از مدلهای متنباز قرار دارد. این مدل در آزمونهای استدلالی مانند AIME 2025 و GPQA-Diamond جزو دو مدل برتر متنباز بوده است.

در بنچمارکهای مهندسی نرمافزار مثل SWE-Bench Verified و SWE-Bench Multilingual هم عملکرد MiMo-V2-Flash از سایر مدلهای متنباز بهتر بوده و به سطح مدلهایی مانند GPT-5 و Claude 4.5 Sonnet نزدیک شده است.
قیمت API این مدل برابر با 0.1 دلار به ازای هر یک میلیون توکن ورودی و 0.3 دلار به ازای هر یک میلیون توکن خروجی تعیین شده و درحالحاضر برای مدت محدود بهصورت رایگان در دسترس است. طبق اعلام شیائومی، سرعت تولید پاسخ این مدل به 150 توکن در ثانیه میرسد، درحالی که تنها 2.5 درصد از هزینه استنتاج Claude را دارد.
نوآوریهای فنی شیائومی MiMo-V2-Flash
یکی از نوآوریهای کلیدی MiMo-V2-Flash استفاده از فناوری Multi-Token Prediction (MTP) است که امکان تولید همزمان چند توکن و بررسی آنها پیش از نمایش خروجی نهایی را فراهم میکند. همچنین شیائومی روش جدیدی بهنام Multi-Teacher Online Policy Distillation (MOPD) را معرفی کرده که با استفاده از چند مدل دستیار و پاداشدهی در سطح توکن، نیاز به منابع آموزشی سنگین را بهشدت کاهش میدهد.
شیائومی برای استفاده از مدل خود پلتفرمی با نام MiMo Studio را راهاندازی کرده که امکان گفتگو مستقیم با مدل، جستجوی وب، اجرای ایجنتها و تولید کد را فراهم میکند. این مدل همچنین توانایی تولید صفحات HTML کاربردی را دارد و با ابزارهایی مانند Claude Code و Cursor سازگار است.





