دیپ‌سیک نسخه جدید هوش مصنوعی خود را با قابلیت‌هایی فراتر از رقبا عرضه کرد

استارتاپ چینی دیپ‌سیک ۲ مدل زبانی جدید و متن‌باز را در دسترس عموم قرار داد که طبق ادعای سازندگان، عملکردی هم‌تراز یا فراتر از سامانه‌های پیشرفته اوپن‌ای‌آی و گوگل دارند و این اقدام توانایی چین در عبور از محدودیت‌های سخت‌افزاری را نشان می‌دهد.

شرکت دیپ‌سیک نسخه DeepSeek-V۳.۲ را به عنوان دستیار استدلال روزمره و نسخه DeepSeek-V۳.۲-Speciale را برای پردازش‌های سنگین و تخصصی معرفی کرد. نسخه ویژه این هوش مصنوعی موفق شده است در ۴ رقابت نخبگان جهانی، از جمله المپیاد جهانی ریاضی ۲۰۲۵ و المپیاد جهانی کامپیوتر، عملکردی در سطح مدال طلا از خود نشان دهد و توجه جامعه علمی را به خود جلب کند.

معماری جدید این مدل‌ها بر پایه فناوری نوآورانه‌ای با عنوان «توجه پراکنده» بنا شده است. این فناوری با استفاده از مکانیزم نمایه‌سازی سریع، تنها بخش‌های مرتبط متن را برای هر پرسش پردازش می‌کند و برخلاف مدل‌های سنتی که با افزایش طول متن دچار کندی و افزایش تصاعدی هزینه می‌شوند، بار محاسباتی را به شکل قابل توجهی کاهش می‌دهد.

گزارش فنی منتشر شده توسط دیپ‌سیک نشان می‌دهد که هزینه استنتاج یا همان پردازش نهایی در این معماری جدید، حدود ۵۰ درصد نسبت به مدل‌های قبلی کاهش یافته است. پردازش ۱۲۸ هزار توکن که معادل یک کتاب ۳۰۰ صفحه‌ای است، اکنون با هزینه‌ای معادل ۷۰ سنت برای هر میلیون توکن انجام می‌شود، در حالی که این رقم در نسخه پیشین حدود ۲.۴۰ دلار بود. کاهش ۷۰ درصدی هزینه، کارایی مدل را برای تحلیل اسناد طولانی و کد‌های پیچیده افزایش داده است.

نتایج بنچمارک‌های تخصصی حاکی از رقابت نزدیک و گاه برتری محصول جدید چینی‌ها نسبت به رقبای خود در آمریکا است. مدل Speciale در مسابقات ریاضی معتبر AIME ۲۰۲۵ موفق به کسب نمره ۹۶ درصد شد که بالاتر از نمره ۹۴.۶ درصدی جی‌پی‌تی-۵ و ۹۵ درصدی جمینای-۳ پرو است. مدل مذکور در تورنمنت ریاضی هاروارد-ام‌آی‌تی نیز با کسب امتیاز ۹۹.۲ درصد، از رقیب گوگل خود پیشی گرفت.

دیپ‌سیک نسخه جدید هوش مصنوعی خود را با قابلیت‌هایی فراتر از رقبا عرضه کرد

مدل جدید دیپ‌سیک توانست در المپیاد جهانی کامپیوتر با کسب ۴۹۲ امتیاز از ۶۰۰، رتبه دهم کلی و مدال طلا را کسب کند و در فینال مسابقات ICPC با حل ۱۰ مسئله از ۱۲ مسئله، جایگاه دوم را به دست آورد. طبق گزارش شرکت سازنده، تمامی این آزمون‌ها بدون دسترسی به اینترنت و ابزار‌های کمکی و با رعایت دقیق محدودیت‌های زمانی مسابقات انجام شده است.

قابلیت متمایز دیگر در نسخه ۳.۲، توانایی تفکر حین استفاده از ابزار است. مدل‌های پیشین هوش مصنوعی معمولاً هنگام فراخوانی ابزار‌های بیرونی مانند جستجوگر وب یا اجرای کد، رشته افکار و استدلال خود را از دست می‌دادند، اما معماری جدید دیپ‌سیک این امکان را فراهم کرده تا مدل ضمن استفاده از ابزارها، روند حل مسئله چندمرحله‌ای را حفظ کند. داده‌های ترکیبی شامل ۱۸۰۰ محیط وظیفه مختلف از جمله برنامه‌ریزی سفر با بودجه محدود و رفع باگ‌های نرم‌افزاری برای آموزش این قابلیت استفاده شده است.

انتشار عمومی این مدل‌های ۶۸۵ میلیارد پارامتری تحت مجوز باز MIT، چالش جدیدی برای مدل‌های تجاری شرکت‌هایی مانند اوپن‌ای‌آی ایجاد کرده است. رقبای آمریکایی مدل‌های پیشرفته خود را به صورت انحصاری و با هزینه اشتراک عرضه می‌کنند، اما دیپ‌سیک دسترسی کامل به کد‌های مدل خود را برای پژوهشگران و توسعه‌دهندگان آزاد گذاشته است که این امر مهاجرت کاربران از سرویس‌های پولی به این مدل رایگان را تسهیل می‌کند.

توسعه این فناوری در شرایطی رخ داده که محدودیت‌های صادراتی آمریکا دسترسی چین به تراشه‌های پیشرفته انویدیا را مسدود کرده است. دیپ‌سیک پیش‌تر اعلام کرده بود که سیستم‌هایش با تراشه‌های ساخت داخل چین نظیر محصولات هواوی سازگاری دارند و این پیشرفت نشان‌دهنده تداوم توسعه نرم‌افزاری هوش مصنوعی چین با وجود تحریم‌های سخت‌افزاری است.

رقابت هوش مصنوعی میان چین و آمریکا اکنون با عرضه مدل‌هایی که کارایی بالا را با هزینه پایین و دسترسی آزاد ترکیب کرده‌اند، وارد مرحله حساس‌تری شده است. تحلیلگران بازار فناوری معتقدند اگر شرکت‌های آمریکایی نتوانند در برابر رقیبی که تکنولوژی مشابه را به رایگان عرضه می‌کند استراتژی جدیدی اتخاذ کنند، جایگاه آنها در این صنعت با تغییراتی رو‌به‌رو خواهد شد.

source

توسط argbod.ir

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *