در ۲۶ اوت ۲۰۲۵، گوگل از ارتقا چشمگیر ابزار ویرایش تصویر هوش مصنوعی Gemini خود رونمایی کرد؛ رویدادی که با واکنشهای گستردهٔ کاربران، توسعهدهندگان و رسانهها روبهرو شد. این بهروزرسانی، با نام رمز «Nano Banana» شناخته میشود و رسماً تحت عنوان مدل نسل جدید Gemini 2.5 Flash Image معرفی شده است. اهمیت این تحول در این است که Gemini اکنون نه فقط به تولید تصویر میپردازد، بلکه ویرایشهایی ظریف و دقیق نیز ارائه میکند—که پیشتر ابزارهای رقیب در آن ضعف داشتند.
چیستی «Nano Banana» یا Gemini 2.5 Flash Image
گوگل با نام رمز «Nano Banana» مدلی را توسعه داد که اکنون در Gemini با عنوان رسمی Gemini 2.5 Flash Image عرضه میشود. این مدلِ پیشرفته، قابلیت ویرایش تصویر را بسیار ارتقاء میبخشد.
ویژگیهای کلیدی ویرایشگر جدید Gemini
۱. حفظ شباهت چهره و عناصر ثابت
یکی از نقاط ضعف ابزارهای پیشین، تغییر شخصیتها یا حیوانات در اصلاحات تصویر بود—یعنی آنها «نزدیک بودند اما دقیق نبودند». حالا Gemini این مشکل را رفع کرده و در هر ویرایش، چهره یا ویژگیهای سوژه بهخوبی حفظ میشود.
۲. ویرایش چند مرحلهای و ترکیب تصاویر
کاربران قادرند تغییرات را مرحله به مرحله اعمال کنند—برای مثال تغییر لباس، سپس پسزمینه، و در نهایت افزودن جزئیات دیگر. همچنین میتوان چند تصویر را با هم ترکیب کرد، مثلاً تصویری از خود و حیوان خانگی در یک صحنه جدید.
۳. ویرایش دقیق (Prompt-Based)
Gemini 2.5 قابلیت انجام ویرایشهای هدفمند (مانند تغییر رنگ، حذف لکه، افزودن یا تغییر جزئی خاص) با تنها یک فرمانی طبیعی را دارد.
۴. افکتهای ترکیبی و الگویی
میتوانید سبک، بافت یا الگوی موجود در یک تصویر را به جسم یا لباس دیگری منتقل کنید—مثلاً طرحی از گلبرگ را روی بوتهای بارانی اعمال کنید.
۵. بهرهگیری از دانایی جهانشمول
این مدل از ظرفیتهای هوش فراگیر (world knowledge) برخوردار است و میتواند بر مبنای فهم واقعی جهان، به ایجاد یا ویرایش صحنههای پیچیده کمک کند—مثلاً شناخت صحیح گیاهان یا عناصر مرتبط با محیط.
فراهمسازی ابزار برای سطوح متفاوت کاربران
- برای همه کاربران Gemini (رایگان و پولی): این امکانات از همان امروز در اپ Gemini قابل استفاده است.
- برای توسعهدهندگان و کسبوکارها: مدل Gemini 2.5 Flash Image از طریق قابلیتهایی مانند Gemini API، Google AI Studio و Vertex AI در دسترس است. این مدل همچنین هزینهای حدود ۰.۰۳۹ دلار به ازای هر تصویر دارد.
واکنشهای صنعت و رسانهها
- Business Insider: این ابزار را تهدیدی جدی برای برنامههایی مانند فتوشاپ دانسته و ترمیم دقیق چهره و لباس را ویژگی پیشگام آن دانسته است.
- جامعه توسعهدهندگان: مدل در آزمون LM Arena، که کیفیت مدلهای هوش مصنوعی را رتبهبندی میکند، موفق به کسب رتبه اول در بخش ویرایش تصویر شده است.
- Adobe: این ابزار جدید در Adobe Firefly و Adobe Express ادغام شده و به کاربران امکان ساخت و تنظیم تصاویر را میدهد؛ در نسخه رایگان امکان ۲۰ تصویر رایگان، و برای اعضای پولی عملکرد نامحدود فراهم است.
- بازخورد حرفهایها: شرکتهای طراحی و آژانسها، مانند WPP (مارکتینگ)، Leonardo.AI، Freepik و طراحیهای تعاملی (Poe)، کیفیت بالای این ابزار را در حفظ انسجام تصویری و جابجایی دقیق سوژه ستودهاند.
پیامدها و اهمیت
این تحول در Gemini نشاندهنده نزدیک شدن ابزارهای هوش مصنوعی به قابلیتهای معمول ابزارهای حرفهای همچون فتوشاپ است—ولی با دردسترسپذیری و تعامل طبیعیتر. از کاربردهای شخصی مانند تبدیل عکسهای خانوادگی به نسخههای خلاقانه، تا تولید محتوا برای بازاریابی و طراحی، همه میتوانند از این توانمندی بهرهمند شوند.
همچنین، وجود واترمارک مرئی و «SynthID» پنهان در تصاویر تولیدشده، ابزاری برای نمایش منشأ مصنوعی تصویر و کاهش خطر سوءاستفاده در زمینه جعلهای بصری است.
جمعبندی
ابزار جدید ویرایش تصویر در Gemini، با نام Gemini 2.5 Flash Image (یا Nano Banana)، جهشی بزرگ در دقت، خلاقیت و کنترل فرآیند ایجاد و ویرایش تصاویر فراهم آورده است. ویژگیهای برجستهای مانند حفظ شخصیت، ویرایش مرحلهای، فرمانهای زبانی، ترکیب تصاویر و تطابق با منطق جهانی، آن را تبدیل به یکی از پیشگامترین ابزارهای موجود در عرصه تولید و اصلاح تصاویر دیجیتال کرده است.
این ابزار اکنون در دسترس همه کاربران Gemini و توسعهدهندگان از طریق API و پلتفرمهای AI Studio و Vertex AI قرار دارد و اثرات آن بهسرعت در جامعه خلاق و صنعت دیده میشود.