مدل متنباز Kimi K2 Thinking؛ رقیب جدید GPT-5 و Claude 4.5 که در بنچمارکها پیروز شد
استارتاپ چینی Moonshot AI از مدل جدید خود با نام Kimi K2 Thinking رونمایی کرده است؛ مدلی که در بنچمارکهای برجسته استدلال، کدنویسی و ریاضی توانسته است حتی مدلهای پیشرفته و اختصاصی مانند GPT-5 و Claude 4.5 را شکست دهد. این مدل متنباز نهتنها رقبای چینی بلکه مدلهای آمریکایی و تجاری را در برخی از آزمونهای کلیدی پشت سر گذاشته است.
رقابت Kimi K2 Thinking با مدلهای اختصاصی
طبق نتایج منتشر شده توسط Moonshot AI، Kimi K2 Thinking در بنچمارک BrowseComp (جستجوی ایجنتی وب) امتیاز ۶۰.۲ درصد را کسب کرده است که بهطور قابل توجهی از مدل Deepseek-V3.2 (رقیب چینی) و مدلهای GPT-5 (۵۴.۹ درصد) و Claude Sonnet 4.5 (۲۴.۱ درصد) بالاتر است. این مدل همچنین در آزمونهای استدلال HLE با ۴۴.۹ درصد و کدنویسی SWE-Bench Verified با ۷۱.۳ درصد عملکرد بسیار قویتری نسبت به رقبای خود نشان داده است.
در آزمونهای ریاضی سطح بالا مانند AIME 2025 و HMMT 2025 نیز، Kimi K2 Thinking با GPT-5 برابری کرده یا از آن عبور کرده است. این دستاورد، اولینبار است که یک مدل متنباز توانسته به سطح مدلهای اختصاصی پولی برسد یا از آنها پیشی بگیرد.
معماری و قابلیتهای فنی Kimi K2 Thinking
مدل Kimi K2 Thinking برپایه معماری ترکیب متخصصان (MoE) و با ۱ تریلیون پارامتر ساخته شده است. اما به لطف معماری MoE، در هر لحظه تنها ۳۲ میلیارد پارامتر فعال است که باعث بهینهسازی بیشتر آن میشود. این مدل همچنین دارای پنجره زمینه بزرگ ۲۵۶ هزار توکن است که آن را برای انجام وظایف پیچیده استدلالی بسیار مناسب میکند.
در کنار این ویژگیها، مدل Kimi K2 Thinking از فرایند آموزشی Quantization بهره میبرد که بهطور چشمگیری نیاز به حافظه را کاهش داده و سرعت تولید متن را در مقایسه با نسخههای غیر فشرده، دو برابر میکند.
قیمت و دسترسی
مدل Kimi K2 Thinking هماکنون از طریق وبسایت kimi.com و API در دسترس است. هزینه استفاده از API آن به میزان ۰.۶۰ دلار برای هر ۱ میلیون توکن ورودی است که بسیار ارزانتر از GPT-5 (۱.۲۵ دلار) بوده و این مزیت، آن را به گزینهای بسیار رقابتی تبدیل میکند.
مجوز و محدودیتها
Moonshot AI این مدل را تحت مجوز MIT اصلاحشده منتشر کرده است. این مجوز بهطور کامل اجازه استفاده تجاری را میدهد، اما اگر محصول یا نرمافزار مشتقشده از آن بیش از ۱۰۰ میلیون کاربر فعال ماهانه داشته باشد یا بیش از ۲۰ میلیون دلار درآمد ماهانه داشته باشد، لازم است که نام Kimi K2 بهطور واضح در رابط کاربری محصول نمایش داده شود.
نتیجهگیری
Kimi K2 Thinking یک مدل متنباز با تواناییهای استثنایی است که در بسیاری از بنچمارکها حتی مدلهای اختصاصی پولی را پشت سر گذاشته است. با معماری پیشرفته و هزینههای استفاده مقرون بهصرفه، این مدل به یک گزینه بسیار جذاب برای توسعهدهندگان و کسبوکارها تبدیل شده است.











