غول چینی هوش مصنوعی Kimi K2 Thinking از GPT-5 پیشی گرفت!

۱۷ آبان ۱۴۰۴ ·

فرزانه

مدل متن‌باز Kimi K2 Thinking؛ رقیب جدید GPT-5 و Claude 4.5 که در بنچمارک‌ها پیروز شد

استارتاپ چینی Moonshot AI از مدل جدید خود با نام Kimi K2 Thinking رونمایی کرده است؛ مدلی که در بنچمارک‌های برجسته استدلال، کدنویسی و ریاضی توانسته است حتی مدل‌های پیشرفته و اختصاصی مانند GPT-5 و Claude 4.5 را شکست دهد. این مدل متن‌باز نه‌تنها رقبای چینی بلکه مدل‌های آمریکایی و تجاری را در برخی از آزمون‌های کلیدی پشت سر گذاشته است.

رقابت Kimi K2 Thinking با مدل‌های اختصاصی

طبق نتایج منتشر شده توسط Moonshot AI، Kimi K2 Thinking در بنچمارک BrowseComp (جستجوی ایجنتی وب) امتیاز ۶۰.۲ درصد را کسب کرده است که به‌طور قابل توجهی از مدل Deepseek-V3.2 (رقیب چینی) و مدل‌های GPT-5 (۵۴.۹ درصد) و Claude Sonnet 4.5 (۲۴.۱ درصد) بالاتر است. این مدل همچنین در آزمون‌های استدلال HLE با ۴۴.۹ درصد و کدنویسی SWE-Bench Verified با ۷۱.۳ درصد عملکرد بسیار قوی‌تری نسبت به رقبای خود نشان داده است.

در آزمون‌های ریاضی سطح بالا مانند AIME 2025 و HMMT 2025 نیز، Kimi K2 Thinking با GPT-5 برابری کرده یا از آن عبور کرده است. این دستاورد، اولین‌بار است که یک مدل متن‌باز توانسته به سطح مدل‌های اختصاصی پولی برسد یا از آنها پیشی بگیرد.

معماری و قابلیت‌های فنی Kimi K2 Thinking

مدل Kimi K2 Thinking برپایه معماری ترکیب متخصصان (MoE) و با ۱ تریلیون پارامتر ساخته شده است. اما به لطف معماری MoE، در هر لحظه تنها ۳۲ میلیارد پارامتر فعال است که باعث بهینه‌سازی بیشتر آن می‌شود. این مدل همچنین دارای پنجره زمینه بزرگ ۲۵۶ هزار توکن است که آن را برای انجام وظایف پیچیده استدلالی بسیار مناسب می‌کند.

در کنار این ویژگی‌ها، مدل Kimi K2 Thinking از فرایند آموزشی Quantization بهره می‌برد که به‌طور چشمگیری نیاز به حافظه را کاهش داده و سرعت تولید متن را در مقایسه با نسخه‌های غیر فشرده، دو برابر می‌کند.

قیمت و دسترسی

مدل Kimi K2 Thinking هم‌اکنون از طریق وب‌سایت kimi.com و API در دسترس است. هزینه استفاده از API آن به میزان ۰.۶۰ دلار برای هر ۱ میلیون توکن ورودی است که بسیار ارزان‌تر از GPT-5 (۱.۲۵ دلار) بوده و این مزیت، آن را به گزینه‌ای بسیار رقابتی تبدیل می‌کند.

مجوز و محدودیت‌ها

Moonshot AI این مدل را تحت مجوز MIT اصلاح‌شده منتشر کرده است. این مجوز به‌طور کامل اجازه استفاده تجاری را می‌دهد، اما اگر محصول یا نرم‌افزار مشتق‌شده از آن بیش از ۱۰۰ میلیون کاربر فعال ماهانه داشته باشد یا بیش از ۲۰ میلیون دلار درآمد ماهانه داشته باشد، لازم است که نام Kimi K2 به‌طور واضح در رابط کاربری محصول نمایش داده شود.

نتیجه‌گیری

Kimi K2 Thinking یک مدل متن‌باز با توانایی‌های استثنایی است که در بسیاری از بنچمارک‌ها حتی مدل‌های اختصاصی پولی را پشت سر گذاشته است. با معماری پیشرفته و هزینه‌های استفاده مقرون به‌صرفه، این مدل به یک گزینه بسیار جذاب برای توسعه‌دهندگان و کسب‌وکارها تبدیل شده است.