گوگل حمله تازه به ChatGPT را آغاز کرد؛ Gemini Omni و نسل جدید هوش مصنوعی چه چیزی را تغییر می‌دهند؟ | ۱۳ خرداد ۱۴۰۵

زمان تقریبی مطالعه ۷ دقیقه

گوگل در I/O ۲۰۲۶ نشان داد که دیگر فقط می‌خواهد در هوش مصنوعی حضور داشته باشد؛ این شرکت می‌خواهد قواعد بازی را عوض کند. معرفی Gemini Omni، مدل تازه‌ای که از ورودی‌های چندگانه مثل تصویر، صدا، ویدئو و متن استفاده می‌کند و از ویدئو شروع به تولید خروجی می‌کند، در کنار Gemini ۳.۵ Flash و تغییرات تازه در جست‌وجوی هوشمند، پیام روشنی دارد: رقابت با ChatGPT وارد فاز جدی‌تری شده است.

گوگل دقیقاً چه چیزی را معرفی کرد؟

در تازه‌ترین موج اعلامیه‌های Google I/O ۲۰۲۶، دو نام بیش از همه توجه‌ها را جلب کردند: Gemini Omni و Gemini ۳.۵ Flash. گوگل درباره Omni می‌گوید این مدل می‌تواند از هر نوع ورودی، چیزهای جدید تولید کند و فعلاً تمرکز آن از ویدئو آغاز شده است. این یعنی کاربر می‌تواند ترکیبی از تصویر، صدا، ویدئو و متن را وارد کند و خروجی‌ای بگیرد که بر پایه درک واقعی مدل از محتوا ساخته شده باشد. گوگل حتی تأکید کرده که ویرایش ویدئو با زبان محاوره‌ای هم ممکن شده است.

در کنار آن، Gemini ۳.۵ Flash هم به‌عنوان یکی از مهم‌ترین مدل‌های تازه گوگل معرفی شد؛ مدلی که گوگل آن را برای اجرای کارهای عامل‌محور، برنامه‌نویسی و وظایف پیچیده طولانی‌مدت طراحی کرده و می‌گوید عملکردی در سطح مدل‌های پرچم‌دار ارائه می‌دهد. گوگل برای این مدل از عباراتی استفاده کرده که نشان می‌دهد هدف فقط سرعت نیست؛ بلکه ترکیب سرعت با توان حل مسئله است.

چرا این خبر برای رقابت با ChatGPT مهم است؟

رقابت اصلی دیگر فقط بر سر «چت‌بات بهتر» نیست. گوگل با این موج تازه می‌خواهد از یک ابزار پاسخ‌گو به یک اکوسیستم هوش مصنوعی همه‌کاره برسد؛ اکوسیستمی که بتواند تولید محتوا، جست‌وجو، ویرایش، اجرای وظایف و حتی هماهنگی میان سرویس‌های مختلف را پوشش دهد. از همین زاویه است که معرفی AI Search تازه هم اهمیت پیدا می‌کند؛ گوگل گفته این نسخه جدید، بزرگ‌ترین ارتقای جست‌وجوی آن در بیش از ۲۵ سال گذشته است و جست‌وجوی چندرسانه‌ای را به شکل جدی وارد تجربه کاربر می‌کند.

این موضوع برای ChatGPT هم معنی مشخصی دارد: رقابت از سطح مکالمه به سطح «انجام کار» منتقل شده است. OpenAI در همین بازه همچنان روی توسعه تجربه ChatGPT برای استفاده روزمره، وب‌گردی و نسخه‌های مختلف محصول خود کار می‌کند، اما گوگل با تکیه بر جست‌وجو، اندروید، یوتیوب و سرویس‌های گسترده خود، مزیت متفاوتی دارد؛ مزیتی که به آن اجازه می‌دهد هوش مصنوعی را نه فقط به‌عنوان یک محصول، بلکه به‌عنوان لایه‌ای در کل اکوسیستم وارد کند.

Gemini Omni چه تفاوتی با مدل‌های قبلی دارد؟

نکته مهم درباره Gemini Omni این است که گوگل آن را فقط یک مدل زبانی نمی‌داند؛ Omni برای کار با ورودی‌های چندگانه طراحی شده و توانایی ایجاد خروجی از ترکیب داده‌های مختلف را دارد. گوگل گفته این مدل می‌تواند ویدئو تولید کند و بعد در آینده به تصویر و متن هم گسترش پیدا کند. این یعنی حرکت از «فهمیدن متن» به سمت «ساختن محتوا از هر چیزی» در حال شتاب گرفتن است.

از طرف دیگر، این مدل فقط در آزمایشگاه باقی نمانده است. گوگل اعلام کرده Gemini Omni Flash به مشترکان Google AI Plus، Pro و Ultra در سراسر جهان از طریق Gemini app و Google Flow ارائه می‌شود و حتی برای کاربران YouTube Shorts و YouTube Create App هم بدون هزینه در دسترس قرار می‌گیرد. این توزیع گسترده نشان می‌دهد گوگل قصد دارد Omni را به‌سرعت وارد استفاده روزمره کند، نه اینکه فقط یک رونمایی نمایشی باشد.

Gemini ۳.۵ Flash برای چه کسانی ساخته شده است؟

Gemini ۳.۵ Flash بیشتر به‌درد کسانی می‌خورد که با کارهای پیچیده، طولانی و چندمرحله‌ای سروکار دارند؛ از توسعه‌دهندگان گرفته تا تیم‌های محصول و کاربرانی که می‌خواهند ابزار هوش مصنوعی فقط پاسخ ندهد، بلکه کار هم انجام دهد. گوگل در توضیح این مدل، روی توانایی آن در تسک‌های agentic و coding تأکید کرده و حتی آن را در برخی بنچمارک‌های تخصصی بالاتر از نسخه‌های قبلی خود معرفی کرده است.

همین تغییر برای بازار مهم است، چون نشان می‌دهد گوگل فقط دنبال رقابت در گفت‌وگو نیست. اگر ChatGPT برای بسیاری از کاربران نقطه شروع آشنایی با هوش مصنوعی بوده، حالا Gemini ۳.۵ Flash می‌خواهد به گزینه‌ای جدی برای کسانی تبدیل شود که از هوش مصنوعی انتظار دارند کارهای واقعی و چندمرحله‌ای را مدیریت کند. این همان جایی است که رقابت از «محبوب بودن» به «کاربردی بودن» تغییر مسیر می‌دهد.

جست‌وجوی گوگل چه تغییری می‌کند؟

بزرگ‌ترین پیام I/O ۲۰۲۶ شاید همین باشد: گوگل می‌خواهد جست‌وجو را از یک نوار جست‌وجوی ساده به یک سیستم هوشمند چندرسانه‌ای تبدیل کند. در اعلام رسمی این شرکت آمده که کاربران می‌توانند با متن، تصویر، فایل، ویدئو یا حتی تب‌های مرورگر، جست‌وجوی خود را آغاز کنند. این تغییر، فاصله بین «پرسیدن سؤال» و «گرفتن نتیجه» را کمتر می‌کند و جست‌وجو را به یک دستیار عملیاتی نزدیک‌تر می‌سازد.

از نگاه سئو و رسانه هم این موضوع مهم است. هر جا جست‌وجوی گوگل تغییر کند، رفتار کاربر هم تغییر می‌کند. یعنی نوع تیتر، ساختار محتوا، تصویر شاخص، سرعت به‌روزرسانی و حتی عمق پاسخ‌گویی در محتوا اهمیت بیشتری پیدا می‌کند. در چنین فضایی، خبرهایی که فقط «اطلاعات» می‌دهند، کمتر شانس دیده شدن دارند؛ اما خبرهایی که «تغییر رفتار کاربر» را توضیح می‌دهند، برای دیسکاور و خبرخوان‌ها ارزش بیشتری پیدا می‌کنند. این برداشت، بر پایه جهت‌گیری رسمی گوگل در I/O ۲۰۲۶ است که Search را به سمت agentic و multimodal برده است.

این اتفاق چه فشاری روی ChatGPT می‌گذارد؟

فشار اصلی روی ChatGPT از اینجا می‌آید که گوگل حالا چند مزیت هم‌زمان را کنار هم قرار داده است: جست‌وجوی عظیم، اندروید، یوتیوب، سرویس‌های ابری و پایگاه کاربران بسیار بزرگ. از سوی دیگر، OpenAI هم با ChatGPT همچنان در مرکز توجه است و محصولش را برای استفاده روزمره، جست‌وجوی وب و تعامل طبیعی توسعه می‌دهد. به همین دلیل، رقابت آینده احتمالاً دیگر فقط بین «مدل بهتر» و «مدل ضعیف‌تر» تعریف نمی‌شود؛ بلکه بین «اکوسیستم کامل‌تر» و «تجربه چت بهتر» شکل می‌گیرد.

در عمل، کاربر عادی بیش از هر چیز به این نگاه می‌کند که کدام ابزار سریع‌تر، دقیق‌تر و مفیدتر مشکل او را حل می‌کند. اگر Gemini Omni بتواند تولید و ویرایش ویدئو، جست‌وجوی چندرسانه‌ای و اجرای وظایف را یک‌جا جمع کند، سهم بیشتری از ذهن کاربر خواهد گرفت. اگر ChatGPT هم بتواند تجربه‌ای روان‌تر و قابل‌اعتمادتر در همین حوزه‌ها ارائه دهد، رقابت برای مدت طولانی ادامه پیدا می‌کند. همین‌جا است که بازار وارد یک دوره پرخبر می‌شود؛ دوره‌ای که هر هفته می‌تواند با یک اعلامیه تازه جابه‌جا شود.

پیامدهای احتمالی برای کاربران و بازار

اولین پیامد، بالا رفتن انتظار کاربران از هوش مصنوعی است. دیگر کسی فقط یک پاسخ کوتاه نمی‌خواهد؛ کاربر انتظار دارد ابزار هوشمند، چند ورودی مختلف را بفهمد، خروجی بسازد و حتی در مسیر کار همراهش بماند. معرفی Gemini Omni و Gemini ۳.۵ Flash دقیقاً همین انتظارات را تقویت می‌کند.

پیامد دوم، شدت گرفتن رقابت میان پلتفرم‌ها است. وقتی گوگل مدل جدید را به‌صورت گسترده در Gemini app، AI Mode در Search، Android Studio، Google AI Studio و سرویس‌های سازمانی عرضه می‌کند، فشار روی سایر بازیگران بازار بیشتر می‌شود. این وضعیت معمولاً دو نتیجه دارد: یا سرعت نوآوری بالا می‌رود، یا شرکت‌ها مجبور می‌شوند برای ماندن در رقابت، محصول را سریع‌تر از قبل به‌روزرسانی کنند. خود گوگل هم در اعلامیه‌های I/O ۲۰۲۶ نشان داده که قصد دارد این فشار را با انتشار پی‌درپی قابلیت‌های تازه حفظ کند.

پیش‌بینی کوتاه‌مدت

در کوتاه‌مدت، احتمالاً موجی از خبرها، ویدئوهای مقایسه‌ای و آموزش‌های کاربردی درباره Gemini Omni، Gemini ۳.۵ Flash و AI Search تولید می‌شود. چون گوگل در چند صفحه رسمی، هم قابلیت‌های مدل‌ها را توضیح داده و هم نمونه‌های نمایشی منتشر کرده، رسانه‌ها و تولیدکنندگان محتوا خوراک کافی برای ادامه‌دار کردن خبر دارند. این یعنی این سوژه فقط یک خبر یک‌روزه نیست و ظرفیت ادامه‌دار شدن دارد.

در همین بازه، انتظار می‌رود بحث مقایسه مستقیم میان Gemini و ChatGPT هم داغ‌تر شود. کاربرانی که دنبال انتخاب ابزار مناسب هستند، معمولاً در چنین دوره‌هایی به سراغ مقالات «مقایسه‌ای»، «آموزشی» و «کاربردی» می‌روند. پس از نظر رسانه‌ای، این خبر هم برای تیترهای هیجانی مناسب است و هم برای خبرهای تحلیلی و آموزشی.

پیش‌بینی میان‌مدت

در میان‌مدت، اگر گوگل بتواند Omni و ۳.۵ Flash را با سرعت مناسب به تجربه روزمره کاربران وارد کند، احتمالاً بخش بیشتری از توجه بازار به سمت اکوسیستم Gemini می‌رود. آن‌وقت تمرکز فقط روی یک مدل نخواهد بود، بلکه روی مجموعه‌ای از سرویس‌ها است که با هم کار می‌کنند: جست‌وجو، ویدئو، اپلیکیشن Gemini، ابزارهای توسعه و حتی ابزارهای تولید محتوا. این همان جایی است که گوگل می‌تواند از قدرت توزیع خود بیشترین استفاده را ببرد.

از نظر رسانه‌ای هم این مسیر خبرساز می‌ماند، چون هر ارتقای کوچک در Search یا Gemini می‌تواند به‌تنهایی تیتر شود. گوگل عملاً یک چرخه خبرسازی پیوسته ساخته است: معرفی مدل، انتشار دمو، عرضه عمومی، سپس گسترش در سرویس‌های دیگر. چنین چرخه‌ای برای سایت‌های خبری فناوری بسیار ارزشمند است، چون به آن‌ها اجازه می‌دهد از یک خبر، چندین خبر فرعی و چندین آپدیت بسازند.

سوالات متداول کاربران

Gemini Omni چیست؟

Gemini Omni مدل تازه گوگل است که می‌تواند از ورودی‌های مختلف مثل تصویر، صدا، ویدئو و متن استفاده کند و فعلاً روی تولید و ویرایش ویدئو تمرکز دارد. گوگل می‌گوید این مدل می‌تواند از هر ورودی، محتوای تازه بسازد.

Gemini ۳.۵ Flash چه فرقی با مدل‌های قبلی دارد؟

گوگل Gemini ۳.۵ Flash را برای سرعت بالا، اجرای وظایف پیچیده، کارهای عامل‌محور و برنامه‌نویسی معرفی کرده است. تمرکز آن فقط روی پاسخ‌گویی نیست، بلکه روی انجام کارهای طولانی‌مدت و چندمرحله‌ای است.

آیا این خبر یعنی گوگل مستقیم با ChatGPT رقابت می‌کند؟

بله، از نگاه بازار همین‌طور برداشت می‌شود. گوگل با Gemini Omni، Gemini ۳.۵ Flash و AI Search تازه، تلاش دارد تجربه‌ای بسازد که هم در جست‌وجو و هم در تولید محتوا با ChatGPT رقابت کند.

آیا این قابلیت‌ها همین حالا برای همه فعال شده‌اند؟

گوگل اعلام کرده Gemini Omni Flash برای مشترکان Google AI Plus، Pro و Ultra در سراسر جهان عرضه می‌شود و در برخی محصولات مثل YouTube Shorts و Google Flow هم در دسترس قرار گرفته است. درباره بخش‌هایی از Gemini ۳.۵ Flash هم گوگل از عرضه عمومی و گسترش تدریجی صحبت کرده است.

چرا این خبر برای کاربران عادی مهم است؟

چون مسیر استفاده از هوش مصنوعی را تغییر می‌دهد. کاربر فقط با یک چت‌بات روبه‌رو نیست؛ حالا با ابزاری روبه‌رو است که می‌تواند جست‌وجو کند، ویدئو بسازد، و از ورودی‌های مختلف برای حل مسئله استفاده کند. این یعنی کاربردهای روزمره هوش مصنوعی وسیع‌تر می‌شود.

جمع‌بندی نهایی

گوگل با معرفی Gemini Omni و Gemini ۳.۵ Flash در I/O ۲۰۲۶ نشان داد که برنامه‌اش برای هوش مصنوعی، یک برنامه کوتاه‌مدت یا نمایشی نیست؛ این شرکت به‌صورت هم‌زمان دارد مدل‌های جدید، جست‌وجوی هوشمندتر، تجربه چندرسانه‌ای و ابزارهای توسعه را کنار هم می‌چیند تا اکوسیستم Gemini را به مرحله‌ای بالاتر برساند. Omni با تمرکز بر ورودی‌های چندگانه و تولید ویدئو، و ۳.۵ Flash با تمرکز بر سرعت و کارهای عامل‌محور، نشان می‌دهند گوگل دیگر فقط دنبال پاسخ دادن به سؤال‌های کاربر نیست، بلکه می‌خواهد کارهای او را هم انجام دهد.

برای بازار فناوری، این خبر فقط یک رونمایی جدید نیست؛ یک سیگنال جدی از شروع موج تازه رقابت با ChatGPT است. برای رسانه‌ها هم یک سوژه داغ و چندلایه است که هم قابلیت خبر فوری دارد، هم ظرفیت تحلیل، هم پتانسیل آموزش و هم شانس بالای دیده شدن در Google Discover. اگر گوگل همین مسیر را ادامه بدهد، باید انتظار داشت در هفته‌ها و ماه‌های آینده هر بار یک بخش از این اکوسیستم تازه، دوباره تیتر اول خبرهای فناوری شود.

برچسب ها