بازگشت غول ارزان‌قیمت چین؛ هوش مصنوعی دیپسیک با V۴ به جنگ GPT-۵.۴ و Gemini رفت

زمان تقریبی مطالعه ۷ دقیقه

تقریباً یک سال پس از آنکه استارتاپ چینی دیپ‌سیک (DeepSeek) با مدل R1 خود، جرقه‌ای در جهان هوش مصنوعی زد و ادعای «توسعه با کمتر از ۶ میلیون دلار» را مطرح کرد، این بار با دو مدل جدید و قدرتمندتر به نام‌های «DeepSeek-V4-Pro» و «DeepSeek-V4-Flash» بازگشته است. مدل‌هایی که به ادعای سازندگان، در حوزه‌های تخصصی ریاضیات و کدنویسی از تمام مدل‌های متن‌باز موجود بهتر عمل می‌کنند و تنها فاصله‌ای حدود ۳ تا ۶ ماه با پیشرفته‌ترین مدل‌های بسته جهان نظیر GPT-5.4 اوپن‌ایآی و Gemini 3.1 Pro گوگل دارند.

این رونمایی که ساعاتی پیش (جمعه ۴ اردیبهشت ۱۴۰۵) به نقل از بیانیه رسمی دیپ‌سیک منتشر شده، بار دیگر مدل «توسعه کم‌هزینه اما قدرتمند» را به صدر اخبار فناوری بازگردانده است. دیپ‌سیک که دفتر مرکزی آن در هانگژو (Hangzhou) چین قرار دارد، با انتشار V4-Pro و V4-Flash در قالب مدل‌های متن‌باز (Open Source) به صورت رایگان در دسترس عموم و توسعه‌دهندگان قرار گرفته است. این اقدام، یک چالش مستقیم برای اوپن‌ایآی (که به شدت از مدل‌های بسته و تجاری خود دفاع می‌کند) و گوگل (با مدل Gemini 3.1 Pro که دسترسی API آن پولی است) محسوب می‌شود.

دو نسخه، دو هدف: یکی قدرتمند، یکی فراگیر

DeepSeek-V4-Pro: هوش در سطح غول‌ها

پرچمدار جدید دیپ‌سیک، یعنی نسخه «V4-Pro»، یک مدل زبانی بزرگ (LLM) با تمرکز ویژه بر وظایف سخت و تخصصی است. بر اساس بیانیه این شرکت، عملکرد V4-Pro در سه شاخص کلیدی عبارت است از:

۱. ریاضیات و منطق: در بنچمارک‌های پیچیده ریاضی مانند GSM8K و MATH، این مدل از تمام مدل‌های متن‌باز رقیب (مانند Llama 3، Mistral Large و Qwen 2.5) بهتر عمل کرده و حتی به رقیب بسته Gemini 3.1 Pro نیز بسیار نزدیک شده است.

۲. کدنویسی (Coding): در تست‌های معتبر کدنویسی مانند HumanEval و MBPP، V4-Pro موفق به کسب نمراتی شده که دیپ‌سیک آن را «در سطح پیشرفته‌ترین مدل‌های تجاری» توصیف می‌کند. به این معنا که برای تولید کد پایتون، جاوااسکریپت، سیشارپ و حتی کدهای سیستمی، می‌تواند جایگزینی جدی برای GPT-4o یا Gemini Pro باشد.

۳. دانش عمومی و استدلال: در این بخش، V4-Pro فاصله کمی (۵ تا ۷ درصد) با Gemini 3.1 Pro دارد و تنها در این شاخص (و نه شاخص‌های تخصصی) است که مدل بسته گوگل همچنان پیشتاز باقی می‌ماند.

دیپ‌سیک در بیانیه خود می‌گوید: «از نظر سطح فناوری، مدل V4-Pro حدود ۳ تا ۶ ماه از پیشرفته‌ترین مدل‌های فعلی جهان (GPT-5.4 و Gemini 3.1 Pro) عقب‌تر است. اما این فاصله به سرعت در حال کاهش است.» این ادعا در حالی مطرح می‌شود که کمتر از یک سال پیش، مدل R1 این شرکت حدود ۱۲ تا ۱۸ ماه از رقبای آمریکایی عقب بود. پیشرفت دیپ‌سیک نشان‌دهنده شتاب بالای توسعه در این شرکت چینی است.

DeepSeek-V4-Flash: اسلحه انبوه برای کاربردهای روزمره

در کنار نسخه قدرتمند Pro، دیپ‌سیک از نسخه «V4-Flash» نیز رونمایی کرده است. این مدل، نسخه بهینه‌شده، سریع‌تر و بسیار سبک‌تر V4 است که توانایی استدلال مشابه نسخه Pro را دارد (با دقتی حدود ۱۵-۲۰ درصد کمتر)، اما با سرعت پاسخ‌گویی حدود ۴ برابر بیشتر و هزینه محاسباتی بسیار پایین‌تر (تا ۱۰ برابر ارزان‌تر در هر توکن).

هدف V4-Flash، کاربردهایی مانند:

چت‌بات‌های مقیاس بزرگ برای پشتیبانی مشتریان.
جستجوی هوشمند در وب‌سایت‌ها و اپلیکیشن‌ها.
تحلیل همزمان حجم عظیم داده (Real-time Data Analysis).
پردازش و خلاصه‌سازی اسناد طولانی با هزینه ناچیز.

این مدل می‌تواند رقیب مستقیمی برای GPT-3.5-turbo و Gemini 1.5-Flash باشد اما با قدرت استدلال بسیار بالاتر و هزینه‌ای حتی پایین‌تر. به عبارت دیگر، دیپ‌سیک با دو تیر، دو هدف را نشانه رفته است: تصاحب قله کیفیت با V4-Pro و تصاحب دشت انبوه کاربران با V4-Flash.

میراث R1؛ افسانه «۶ میلیون دلاری» و جنجال همیشگی

یک سال پیش چه گذشت؟

برای درک اهمیت رونمایی V4، باید نگاهی به مدل قبلی دیپ‌سیک یعنی DeepSeek-R1 انداخت. R1 در سال ۲۰۲۵ (اوایل ۱۴۰۴) با ادعایی بمب‌وار معرفی شد: توسعه مدلی با قابلیت‌های رقابتی با GPT-4، با هزینهای کمتر از ۶ میلیون دلار. این عدد در مقایسه با بودجه‌های چند میلیارد دلاری اوپن‌ایآی و گوگل برای مدل‌های مشابه، شوک عظیمی به صنعت وارد کرد.

R1 که مدعی بود با استفاده از معماری نوآورانه Mixture of Experts (MoE) و روش‌های بهینه‌سازی بی‌نظیر توسعه یافته، خیلی زود به یکی از محبوب‌ترین مدل‌های متن‌باز در میان توسعه‌دهندگان (به ویژه در گیت‌هاب) تبدیل شد. اما این ادعا با واکنش‌های تردیدآمیز بسیاری از تحلیلگران غربی نیز همراه بود.

منتقدان (از جمله برخی تحلیلگران موسسه SemiAnalysis) استدلال می‌کردند که:

عدد ۶ میلیون دلار احتمالاً فقط هزینه نهایی یک بار آموزش (Final Training Run) را شامل می‌شود، نه هزینه‌های تحقیق و توسعه، آزمایش‌های شکست‌خورده، جمع‌آوری داده‌ها و زیرساخت‌های سخت‌افزاری.
دیپ‌سیک احتمالاً به صورت نه چندان شفاف از سخت‌افزارهای (احتمالاً دور زده تحریم‌ها) با تعداد زیاد استفاده کرده که ارزش کلی آنها از ۶ میلیون دلار بسیار فراتر است.
این حرکت بیشتر یک بازاریابی هوشمندانه برای جذب سرمایه و توجه به استارتاپ چینی بود تا یک معجزه اقتصادی واقعی.

با وجود این جنجال‌ها، R1 موفق شد نام دیپ‌سیک را در سطح جهانی بر سر زبان‌ها بیندازد و حالا نسل V4 با قوت بیشتری به این مسیر ادامه می‌دهد.

دیپ‌سیک V4 در مقابل رقبا: جدول مقایسه

برای درک بهتر جایگاه مدل جدید دیپ‌سیک، جدول زیر مقایسه‌ای بین V4-Pro و مهم‌ترین رقبای آمریکایی آن (با استفاده از ادعاهای خود دیپ‌سیک و داده‌های بنچمارک عمومی) ارائه می‌دهد:

مدل	شرکت	متن‌باز؟	قیمت تقریبی به ازای ۱M توکن (ورودی)	عملکرد در کدنویسی (نسبی)	عملکرد در ریاضیات (نسبی)	دانش عمومی
DeepSeek-V4-Pro	دیپ‌سیک (چین)	✅ بله	~۰.۴۰ دلار	بسیار خوب (در سطح GPT-4o)	عالی (نزدیک به Gemini)	خوب (کمتر از Gemini)
GPT-5.4	OpenAI (آمریکا)	❌ خیر	~۵.۰۰ دلار	عالی	عالی	عالی
Gemini 3.1 Pro	گوگل (آمریکا)	❌ خیر	~۳.۵۰ دلار	عالی	عالی	عالی
Claude 4.0	انتروپیک (آمریکا)	❌ خیر	~۴.۰۰ دلار	عالی (ویژه کدنویسی)	خوب	عالی
Llama 4.5 (بزرگ)	متا (آمریکا)	✅ بله	~۰.۹۰ دلار	خوب	متوسط	خوب
DeepSeek-V4-Flash	دیپ‌سیک (چین)	✅ بله	~۰.۰۷ دلار	متوسط (برای کارهای ساده)	متوسط (برای کارهای ساده)	متوسط

نکات جدول:

قیمت‌ها تخمینی و بر اساس نرخ‌های عمومی API در آوریل ۲۰۲۶ است.
همانطور که مشخص است، V4-Pro از نظر قیمت (حدود یک دهم GPT-5.4) و متن‌باز بودن، یک مزیت رقابتی عظیم دارد، حتی اگر در عملکرد نهایی چند درصدی از رقبای بسته عقب باشد.
V4-Flash با قیمت ۰.۰۷ دلار (حدود ۷ سنت به ازای هر میلیون توکن)، به یکی از ارزان‌ترین مدل‌های باکیفیت بازار تبدیل شده است.

چرا متن‌باز بودن مهم است؟ پادشاهی از آن توسعه‌دهندگان

دیپ‌سیک بر خلاف استراتژی بسته اوپن‌ای‌آی و گوگل، اصرار دارد که مدل‌های خود را به صورت کامل متن‌باز (Open Source) منتشر کند.:

هر توسعه‌دهنده، شرکت یا دانشگاهی می‌تواند کد اصلی مدل را دانلود کرده، آن را بر روی سرورهای خود اجرا کند، تغییر دهد و برای استفاده خاص خود تنظیم (Fine-tune) نماید.
وابستگی به API یک شرکت خاص از بین می‌رود. کاربران می‌توانند مدل را به صورت محلی (Offline) و بدون نیاز به اتصال اینترنت اجرا کنند (برای کاربردهای حساس امنیتی یا نظامی).
محققان می‌توانند معماری درونی مدل را بررسی کرده و نوآوری‌های آن را شفاف ارزیابی کنند.

این مدل متن‌باز بودن (که توسط متا با Llama و توسط گروه‌های متن‌باز دیگر دنبال می‌شود) یک مزیت استراتژیک درازمدت ایجاد می‌کند. در حالی که شرکت‌های غربی نگران افشای اسرار تجاری خود هستند، دیپ‌سیک با انتشار رایگان مدل‌هایش، عملاً نفوذ خود را در میان جامعه جهانی توسعه‌دهندگان (که موتور نوآوری دنیای امروزند) افزایش می‌دهد.

نگرانی امنیت ملی در غرب؛ مقابله با “نفوذ چین از طریق متن‌باز”

با توجه به تنش‌های سیاسی میان آمریکا و چین، انتشار یک مدل قدرتمند و متن‌باز از یک شرکت چینی، نگرانی‌های امنیت ملی در واشنگتن را نیز برانگیخته است. سناتورهای آمریکایی پیشتر به دیپ‌سیک (و شرکت علی‌بابا) به عنوان “ابزارهای نفوذ چین در زیرساخت‌های دیجیتال غرب” اشاره کرده بودند.

بحث اصلی این است: اگر یک سازمان دولتی یا یک شرکت حساس آمریکایی از مدل متن‌باز چینی V4-Pro روی سرورهای خود استفاده کند، آیا نمی‌تواند حفره‌های امنیتی عمدی (Backdoor) در کد آن تعبیه شده باشد که اطلاعات را به پکن منتقل کند؟ دیپ‌سیک ادعا می‌کند کد مدل کاملاً شفاف است و چنین چیزی وجود ندارد، اما مجلس نمایندگان آمریکا اوایل سال جاری لایحه‌ای برای ممنوعیت استفاده نهادهای دولتی از مدل‌های متن‌باز چینی (از جمله دیپ‌سیک) ارائه داده است. این نبرد «تکنولوژی در مقابل ژئوپلیتیک» ادامه خواهد داشت.

استقبال اولیه و دسترسی

مدل‌های V4-Pro و V4-Flash از امروز از طریق:

وب‌سایت رسمی DeepSeek (به صورت چت آنلاین رایگان برای آزمایش عمومی).
پلتفرم Hugging Face (برای دانلود وزن‌های مدل و کد).
API اختصاصی DeepSeek Cloud (با قیمت‌های بسیار رقابتی)

در دسترس عموم قرار گرفته‌اند. استارتاپ‌ها و توسعه‌دهندگان مستقل در سراسر جهان (از جمله در ایران، از طریق فیلترشکن‌ها) می‌توانند به راحتی از آن استفاده کنند.

بر اساس اولین واکنش‌ها در توییتر (X) و گیت‌هاب، استقبال از V4 بسیار خوب بوده و برخی کاربران مدعی شده‌اند که در وظایف کدنویسی مقدماتی، عملکرد آن از GPT-4o فعلی نیز بهتر است (هرچند که این ادعاها نیاز به تأیید مستقل در بنچمارک‌های بزرگ‌تر دارند.)

جمع‌بندی: تهدید جدی یا سراب چینی؟

دیپ‌سیک با معرفی مدل V4-Pro و V4-Flash، گام بلندی در جهت تحقق چشمانداز “دموکراتیزه کردن هوش مصنوعی پیشرفته” برداشته است. ترکیب قدرت بالا (نزدیک به Gemini و GPT)، هزینه پایین (یک دهم رقبا) و متن‌باز بودن، یک مزیت رقابتی تقریباً بی‌نظیر برای این شرکت چینی ایجاد می‌کند. به ویژه برای کشورها و شرکت‌هایی که نمی‌خواهند به زیرساخت ابری آمریکا وابسته شوند (از جمله چین، روسیه، ایران و بسیاری از کشورهای در حال توسعه)، شریکی جذاب و حیاتی به نظر می‌رسد.

با این حال، هنوز سوالات بی‌پاسخی وجود دارد:

آیا ادعای عملکرد در بنچمارک‌های مستقل و شخص ثالث (مثل LMSYS Chatbot Arena) تأیید می‌شود؟
آیا دیپ‌سیک می‌تواند زیرساخت ابری مقیاس‌پذیر و پایداری برای پاسخگویی به حجم بالای درخواست‌های API ارائه دهد (چیزی که حتی شرکت‌های بزرگ با آن مشکل دارند)؟
آیا واکنش سیاسی غرب (ممنوعیت‌ها) مانع از نفوذ گسترده این مدل‌ها به بازارهای غربی خواهد شد؟

تا زمانی که پاسخ این سوالات مشخص نشود، قضاوت نهایی درباره موفقیت یا عدم موفقیت “غول چینی” زود است. اما یک چیز قطعی است: نگاه ترس و احترام رقبای آمریکایی به سمت هانگژو (دفتر مرکزی دیپ‌سیک) سنگین‌تر از قبل شده است. رقابت هوش مصنوعی وارد فاز تازه‌ای شده است.

برچسب ها