استارتاپ چینی دیپسیک ۲ مدل زبانی جدید و متنباز را در دسترس عموم قرار داد که طبق ادعای سازندگان، عملکردی همتراز یا فراتر از سامانههای پیشرفته اوپنایآی و گوگل دارند و این اقدام توانایی چین در عبور از محدودیتهای سختافزاری را نشان میدهد.
شرکت دیپسیک نسخه DeepSeek-V۳.۲ را به عنوان دستیار استدلال روزمره و نسخه DeepSeek-V۳.۲-Speciale را برای پردازشهای سنگین و تخصصی معرفی کرد. نسخه ویژه این هوش مصنوعی موفق شده است در ۴ رقابت نخبگان جهانی، از جمله المپیاد جهانی ریاضی ۲۰۲۵ و المپیاد جهانی کامپیوتر، عملکردی در سطح مدال طلا از خود نشان دهد و توجه جامعه علمی را به خود جلب کند.
معماری جدید این مدلها بر پایه فناوری نوآورانهای با عنوان «توجه پراکنده» بنا شده است. این فناوری با استفاده از مکانیزم نمایهسازی سریع، تنها بخشهای مرتبط متن را برای هر پرسش پردازش میکند و برخلاف مدلهای سنتی که با افزایش طول متن دچار کندی و افزایش تصاعدی هزینه میشوند، بار محاسباتی را به شکل قابل توجهی کاهش میدهد.
گزارش فنی منتشر شده توسط دیپسیک نشان میدهد که هزینه استنتاج یا همان پردازش نهایی در این معماری جدید، حدود ۵۰ درصد نسبت به مدلهای قبلی کاهش یافته است. پردازش ۱۲۸ هزار توکن که معادل یک کتاب ۳۰۰ صفحهای است، اکنون با هزینهای معادل ۷۰ سنت برای هر میلیون توکن انجام میشود، در حالی که این رقم در نسخه پیشین حدود ۲.۴۰ دلار بود. کاهش ۷۰ درصدی هزینه، کارایی مدل را برای تحلیل اسناد طولانی و کدهای پیچیده افزایش داده است.
نتایج بنچمارکهای تخصصی حاکی از رقابت نزدیک و گاه برتری محصول جدید چینیها نسبت به رقبای خود در آمریکا است. مدل Speciale در مسابقات ریاضی معتبر AIME ۲۰۲۵ موفق به کسب نمره ۹۶ درصد شد که بالاتر از نمره ۹۴.۶ درصدی جیپیتی-۵ و ۹۵ درصدی جمینای-۳ پرو است. مدل مذکور در تورنمنت ریاضی هاروارد-امآیتی نیز با کسب امتیاز ۹۹.۲ درصد، از رقیب گوگل خود پیشی گرفت.

مدل جدید دیپسیک توانست در المپیاد جهانی کامپیوتر با کسب ۴۹۲ امتیاز از ۶۰۰، رتبه دهم کلی و مدال طلا را کسب کند و در فینال مسابقات ICPC با حل ۱۰ مسئله از ۱۲ مسئله، جایگاه دوم را به دست آورد. طبق گزارش شرکت سازنده، تمامی این آزمونها بدون دسترسی به اینترنت و ابزارهای کمکی و با رعایت دقیق محدودیتهای زمانی مسابقات انجام شده است.
قابلیت متمایز دیگر در نسخه ۳.۲، توانایی تفکر حین استفاده از ابزار است. مدلهای پیشین هوش مصنوعی معمولاً هنگام فراخوانی ابزارهای بیرونی مانند جستجوگر وب یا اجرای کد، رشته افکار و استدلال خود را از دست میدادند، اما معماری جدید دیپسیک این امکان را فراهم کرده تا مدل ضمن استفاده از ابزارها، روند حل مسئله چندمرحلهای را حفظ کند. دادههای ترکیبی شامل ۱۸۰۰ محیط وظیفه مختلف از جمله برنامهریزی سفر با بودجه محدود و رفع باگهای نرمافزاری برای آموزش این قابلیت استفاده شده است.
انتشار عمومی این مدلهای ۶۸۵ میلیارد پارامتری تحت مجوز باز MIT، چالش جدیدی برای مدلهای تجاری شرکتهایی مانند اوپنایآی ایجاد کرده است. رقبای آمریکایی مدلهای پیشرفته خود را به صورت انحصاری و با هزینه اشتراک عرضه میکنند، اما دیپسیک دسترسی کامل به کدهای مدل خود را برای پژوهشگران و توسعهدهندگان آزاد گذاشته است که این امر مهاجرت کاربران از سرویسهای پولی به این مدل رایگان را تسهیل میکند.
توسعه این فناوری در شرایطی رخ داده که محدودیتهای صادراتی آمریکا دسترسی چین به تراشههای پیشرفته انویدیا را مسدود کرده است. دیپسیک پیشتر اعلام کرده بود که سیستمهایش با تراشههای ساخت داخل چین نظیر محصولات هواوی سازگاری دارند و این پیشرفت نشاندهنده تداوم توسعه نرمافزاری هوش مصنوعی چین با وجود تحریمهای سختافزاری است.
رقابت هوش مصنوعی میان چین و آمریکا اکنون با عرضه مدلهایی که کارایی بالا را با هزینه پایین و دسترسی آزاد ترکیب کردهاند، وارد مرحله حساستری شده است. تحلیلگران بازار فناوری معتقدند اگر شرکتهای آمریکایی نتوانند در برابر رقیبی که تکنولوژی مشابه را به رایگان عرضه میکند استراتژی جدیدی اتخاذ کنند، جایگاه آنها در این صنعت با تغییراتی روبهرو خواهد شد.
source