بازگشت غول ارزانقیمت چین؛ هوش مصنوعی دیپسیک با V۴ به جنگ GPT-۵.۴ و Gemini رفت

استارتاپ چینی دیپسیک (DeepSeek) حدود یک سال پس از معرفی مدل جنجالی R1، از نسل جدید هوش مصنوعی خود با نامهای V4-Pro و V4-Flash رونمایی کرد. این مدلهای متنباز که برای رقابت مستقیم با غولهای آمریکایی مانند OpenAI (مدل GPT-5.4) و گوگل (مدل Gemini 3.1 Pro) طراحی شدهاند، تواناییهای استثنایی در ریاضیات، کدنویسی و استدلال منطقی از خود نشان دادهاند.
تقریباً یک سال پس از آنکه استارتاپ چینی دیپسیک (DeepSeek) با مدل R1 خود، جرقهای در جهان هوش مصنوعی زد و ادعای «توسعه با کمتر از ۶ میلیون دلار» را مطرح کرد، این بار با دو مدل جدید و قدرتمندتر به نامهای «DeepSeek-V4-Pro» و «DeepSeek-V4-Flash» بازگشته است. مدلهایی که به ادعای سازندگان، در حوزههای تخصصی ریاضیات و کدنویسی از تمام مدلهای متنباز موجود بهتر عمل میکنند و تنها فاصلهای حدود ۳ تا ۶ ماه با پیشرفتهترین مدلهای بسته جهان نظیر GPT-5.4 اوپنایآی و Gemini 3.1 Pro گوگل دارند.
این رونمایی که ساعاتی پیش (جمعه ۴ اردیبهشت ۱۴۰۵) به نقل از بیانیه رسمی دیپسیک منتشر شده، بار دیگر مدل «توسعه کمهزینه اما قدرتمند» را به صدر اخبار فناوری بازگردانده است. دیپسیک که دفتر مرکزی آن در هانگژو (Hangzhou) چین قرار دارد، با انتشار V4-Pro و V4-Flash در قالب مدلهای متنباز (Open Source) به صورت رایگان در دسترس عموم و توسعهدهندگان قرار گرفته است. این اقدام، یک چالش مستقیم برای اوپنایآی (که به شدت از مدلهای بسته و تجاری خود دفاع میکند) و گوگل (با مدل Gemini 3.1 Pro که دسترسی API آن پولی است) محسوب میشود.
دو نسخه، دو هدف: یکی قدرتمند، یکی فراگیر
DeepSeek-V4-Pro: هوش در سطح غولها
پرچمدار جدید دیپسیک، یعنی نسخه «V4-Pro»، یک مدل زبانی بزرگ (LLM) با تمرکز ویژه بر وظایف سخت و تخصصی است. بر اساس بیانیه این شرکت، عملکرد V4-Pro در سه شاخص کلیدی عبارت است از:
۱. ریاضیات و منطق: در بنچمارکهای پیچیده ریاضی مانند GSM8K و MATH، این مدل از تمام مدلهای متنباز رقیب (مانند Llama 3، Mistral Large و Qwen 2.5) بهتر عمل کرده و حتی به رقیب بسته Gemini 3.1 Pro نیز بسیار نزدیک شده است.
۲. کدنویسی (Coding): در تستهای معتبر کدنویسی مانند HumanEval و MBPP، V4-Pro موفق به کسب نمراتی شده که دیپسیک آن را «در سطح پیشرفتهترین مدلهای تجاری» توصیف میکند. به این معنا که برای تولید کد پایتون، جاوااسکریپت، سیشارپ و حتی کدهای سیستمی، میتواند جایگزینی جدی برای GPT-4o یا Gemini Pro باشد.
۳. دانش عمومی و استدلال: در این بخش، V4-Pro فاصله کمی (۵ تا ۷ درصد) با Gemini 3.1 Pro دارد و تنها در این شاخص (و نه شاخصهای تخصصی) است که مدل بسته گوگل همچنان پیشتاز باقی میماند.
دیپسیک در بیانیه خود میگوید: «از نظر سطح فناوری، مدل V4-Pro حدود ۳ تا ۶ ماه از پیشرفتهترین مدلهای فعلی جهان (GPT-5.4 و Gemini 3.1 Pro) عقبتر است. اما این فاصله به سرعت در حال کاهش است.» این ادعا در حالی مطرح میشود که کمتر از یک سال پیش، مدل R1 این شرکت حدود ۱۲ تا ۱۸ ماه از رقبای آمریکایی عقب بود. پیشرفت دیپسیک نشاندهنده شتاب بالای توسعه در این شرکت چینی است.
DeepSeek-V4-Flash: اسلحه انبوه برای کاربردهای روزمره
در کنار نسخه قدرتمند Pro، دیپسیک از نسخه «V4-Flash» نیز رونمایی کرده است. این مدل، نسخه بهینهشده، سریعتر و بسیار سبکتر V4 است که توانایی استدلال مشابه نسخه Pro را دارد (با دقتی حدود ۱۵-۲۰ درصد کمتر)، اما با سرعت پاسخگویی حدود ۴ برابر بیشتر و هزینه محاسباتی بسیار پایینتر (تا ۱۰ برابر ارزانتر در هر توکن).
هدف V4-Flash، کاربردهایی مانند:
-
چتباتهای مقیاس بزرگ برای پشتیبانی مشتریان.
-
جستجوی هوشمند در وبسایتها و اپلیکیشنها.
-
تحلیل همزمان حجم عظیم داده (Real-time Data Analysis).
-
پردازش و خلاصهسازی اسناد طولانی با هزینه ناچیز.
این مدل میتواند رقیب مستقیمی برای GPT-3.5-turbo و Gemini 1.5-Flash باشد اما با قدرت استدلال بسیار بالاتر و هزینهای حتی پایینتر. به عبارت دیگر، دیپسیک با دو تیر، دو هدف را نشانه رفته است: تصاحب قله کیفیت با V4-Pro و تصاحب دشت انبوه کاربران با V4-Flash.
میراث R1؛ افسانه «۶ میلیون دلاری» و جنجال همیشگی
یک سال پیش چه گذشت؟
برای درک اهمیت رونمایی V4، باید نگاهی به مدل قبلی دیپسیک یعنی DeepSeek-R1 انداخت. R1 در سال ۲۰۲۵ (اوایل ۱۴۰۴) با ادعایی بمبوار معرفی شد: توسعه مدلی با قابلیتهای رقابتی با GPT-4، با هزینهای کمتر از ۶ میلیون دلار. این عدد در مقایسه با بودجههای چند میلیارد دلاری اوپنایآی و گوگل برای مدلهای مشابه، شوک عظیمی به صنعت وارد کرد.
R1 که مدعی بود با استفاده از معماری نوآورانه Mixture of Experts (MoE) و روشهای بهینهسازی بینظیر توسعه یافته، خیلی زود به یکی از محبوبترین مدلهای متنباز در میان توسعهدهندگان (به ویژه در گیتهاب) تبدیل شد. اما این ادعا با واکنشهای تردیدآمیز بسیاری از تحلیلگران غربی نیز همراه بود.
منتقدان (از جمله برخی تحلیلگران موسسه SemiAnalysis) استدلال میکردند که:
-
عدد ۶ میلیون دلار احتمالاً فقط هزینه نهایی یک بار آموزش (Final Training Run) را شامل میشود، نه هزینههای تحقیق و توسعه، آزمایشهای شکستخورده، جمعآوری دادهها و زیرساختهای سختافزاری.
-
دیپسیک احتمالاً به صورت نه چندان شفاف از سختافزارهای (احتمالاً دور زده تحریمها) با تعداد زیاد استفاده کرده که ارزش کلی آنها از ۶ میلیون دلار بسیار فراتر است.
-
این حرکت بیشتر یک بازاریابی هوشمندانه برای جذب سرمایه و توجه به استارتاپ چینی بود تا یک معجزه اقتصادی واقعی.
با وجود این جنجالها، R1 موفق شد نام دیپسیک را در سطح جهانی بر سر زبانها بیندازد و حالا نسل V4 با قوت بیشتری به این مسیر ادامه میدهد.
دیپسیک V4 در مقابل رقبا: جدول مقایسه
برای درک بهتر جایگاه مدل جدید دیپسیک، جدول زیر مقایسهای بین V4-Pro و مهمترین رقبای آمریکایی آن (با استفاده از ادعاهای خود دیپسیک و دادههای بنچمارک عمومی) ارائه میدهد:
| مدل | شرکت | متنباز؟ | قیمت تقریبی به ازای ۱M توکن (ورودی) | عملکرد در کدنویسی (نسبی) | عملکرد در ریاضیات (نسبی) | دانش عمومی |
|---|---|---|---|---|---|---|
| DeepSeek-V4-Pro | دیپسیک (چین) | ✅ بله | ~۰.۴۰ دلار | بسیار خوب (در سطح GPT-4o) | عالی (نزدیک به Gemini) | خوب (کمتر از Gemini) |
| GPT-5.4 | OpenAI (آمریکا) | ❌ خیر | ~۵.۰۰ دلار | عالی | عالی | عالی |
| Gemini 3.1 Pro | گوگل (آمریکا) | ❌ خیر | ~۳.۵۰ دلار | عالی | عالی | عالی |
| Claude 4.0 | انتروپیک (آمریکا) | ❌ خیر | ~۴.۰۰ دلار | عالی (ویژه کدنویسی) | خوب | عالی |
| Llama 4.5 (بزرگ) | متا (آمریکا) | ✅ بله | ~۰.۹۰ دلار | خوب | متوسط | خوب |
| DeepSeek-V4-Flash | دیپسیک (چین) | ✅ بله | ~۰.۰۷ دلار | متوسط (برای کارهای ساده) | متوسط (برای کارهای ساده) | متوسط |
نکات جدول:
-
قیمتها تخمینی و بر اساس نرخهای عمومی API در آوریل ۲۰۲۶ است.
-
همانطور که مشخص است، V4-Pro از نظر قیمت (حدود یک دهم GPT-5.4) و متنباز بودن، یک مزیت رقابتی عظیم دارد، حتی اگر در عملکرد نهایی چند درصدی از رقبای بسته عقب باشد.
-
V4-Flash با قیمت ۰.۰۷ دلار (حدود ۷ سنت به ازای هر میلیون توکن)، به یکی از ارزانترین مدلهای باکیفیت بازار تبدیل شده است.
چرا متنباز بودن مهم است؟ پادشاهی از آن توسعهدهندگان
دیپسیک بر خلاف استراتژی بسته اوپنایآی و گوگل، اصرار دارد که مدلهای خود را به صورت کامل متنباز (Open Source) منتشر کند.:
-
هر توسعهدهنده، شرکت یا دانشگاهی میتواند کد اصلی مدل را دانلود کرده، آن را بر روی سرورهای خود اجرا کند، تغییر دهد و برای استفاده خاص خود تنظیم (Fine-tune) نماید.
-
وابستگی به API یک شرکت خاص از بین میرود. کاربران میتوانند مدل را به صورت محلی (Offline) و بدون نیاز به اتصال اینترنت اجرا کنند (برای کاربردهای حساس امنیتی یا نظامی).
-
محققان میتوانند معماری درونی مدل را بررسی کرده و نوآوریهای آن را شفاف ارزیابی کنند.
این مدل متنباز بودن (که توسط متا با Llama و توسط گروههای متنباز دیگر دنبال میشود) یک مزیت استراتژیک درازمدت ایجاد میکند. در حالی که شرکتهای غربی نگران افشای اسرار تجاری خود هستند، دیپسیک با انتشار رایگان مدلهایش، عملاً نفوذ خود را در میان جامعه جهانی توسعهدهندگان (که موتور نوآوری دنیای امروزند) افزایش میدهد.
نگرانی امنیت ملی در غرب؛ مقابله با “نفوذ چین از طریق متنباز”
با توجه به تنشهای سیاسی میان آمریکا و چین، انتشار یک مدل قدرتمند و متنباز از یک شرکت چینی، نگرانیهای امنیت ملی در واشنگتن را نیز برانگیخته است. سناتورهای آمریکایی پیشتر به دیپسیک (و شرکت علیبابا) به عنوان “ابزارهای نفوذ چین در زیرساختهای دیجیتال غرب” اشاره کرده بودند.
بحث اصلی این است: اگر یک سازمان دولتی یا یک شرکت حساس آمریکایی از مدل متنباز چینی V4-Pro روی سرورهای خود استفاده کند، آیا نمیتواند حفرههای امنیتی عمدی (Backdoor) در کد آن تعبیه شده باشد که اطلاعات را به پکن منتقل کند؟ دیپسیک ادعا میکند کد مدل کاملاً شفاف است و چنین چیزی وجود ندارد، اما مجلس نمایندگان آمریکا اوایل سال جاری لایحهای برای ممنوعیت استفاده نهادهای دولتی از مدلهای متنباز چینی (از جمله دیپسیک) ارائه داده است. این نبرد «تکنولوژی در مقابل ژئوپلیتیک» ادامه خواهد داشت.
استقبال اولیه و دسترسی
مدلهای V4-Pro و V4-Flash از امروز از طریق:
-
وبسایت رسمی DeepSeek (به صورت چت آنلاین رایگان برای آزمایش عمومی).
-
پلتفرم Hugging Face (برای دانلود وزنهای مدل و کد).
-
API اختصاصی DeepSeek Cloud (با قیمتهای بسیار رقابتی)
در دسترس عموم قرار گرفتهاند. استارتاپها و توسعهدهندگان مستقل در سراسر جهان (از جمله در ایران، از طریق فیلترشکنها) میتوانند به راحتی از آن استفاده کنند.
بر اساس اولین واکنشها در توییتر (X) و گیتهاب، استقبال از V4 بسیار خوب بوده و برخی کاربران مدعی شدهاند که در وظایف کدنویسی مقدماتی، عملکرد آن از GPT-4o فعلی نیز بهتر است (هرچند که این ادعاها نیاز به تأیید مستقل در بنچمارکهای بزرگتر دارند.)
جمعبندی: تهدید جدی یا سراب چینی؟
دیپسیک با معرفی مدل V4-Pro و V4-Flash، گام بلندی در جهت تحقق چشمانداز “دموکراتیزه کردن هوش مصنوعی پیشرفته” برداشته است. ترکیب قدرت بالا (نزدیک به Gemini و GPT)، هزینه پایین (یک دهم رقبا) و متنباز بودن، یک مزیت رقابتی تقریباً بینظیر برای این شرکت چینی ایجاد میکند. به ویژه برای کشورها و شرکتهایی که نمیخواهند به زیرساخت ابری آمریکا وابسته شوند (از جمله چین، روسیه، ایران و بسیاری از کشورهای در حال توسعه)، شریکی جذاب و حیاتی به نظر میرسد.
با این حال، هنوز سوالات بیپاسخی وجود دارد:
-
آیا ادعای عملکرد در بنچمارکهای مستقل و شخص ثالث (مثل LMSYS Chatbot Arena) تأیید میشود؟
-
آیا دیپسیک میتواند زیرساخت ابری مقیاسپذیر و پایداری برای پاسخگویی به حجم بالای درخواستهای API ارائه دهد (چیزی که حتی شرکتهای بزرگ با آن مشکل دارند)؟
-
آیا واکنش سیاسی غرب (ممنوعیتها) مانع از نفوذ گسترده این مدلها به بازارهای غربی خواهد شد؟
تا زمانی که پاسخ این سوالات مشخص نشود، قضاوت نهایی درباره موفقیت یا عدم موفقیت “غول چینی” زود است. اما یک چیز قطعی است: نگاه ترس و احترام رقبای آمریکایی به سمت هانگژو (دفتر مرکزی دیپسیک) سنگینتر از قبل شده است. رقابت هوش مصنوعی وارد فاز تازهای شده است.




