رونمایی از «Nano Banana»، ابزار ویرایش تصویر هوش مصنوعی Gemini

هوش‌نیوز » اخبار » رونمایی از «Nano Banana»، ابزار ویرایش تصویر هوش مصنوعی Gemini

اخبار, هوش مصنوعی در دنیا

3 ماه پیش
بدون دیدگاه
زمان تقریبی مطالعه: 1 دقیقه

گوگل از مدل جدید Gemini 2.5 Flash Image با نام رمز «Nano Banana» رونمایی کرد. این ابزار ویرایش تصویر که از ۲۶ اوت ۲۰۲۵ در دسترس قرار گرفته، امکان حفظ دقیق چهره‌ها، ویرایش مرحله‌ای، ترکیب چند تصویر و اعمال تغییرات بر اساس فرمان‌های زبانی را فراهم می‌کند. قابلیت‌های تازه، جمینای را به رقیبی جدی برای ابزارهای حرفه‌ای مانند فتوشاپ تبدیل کرده و اکنون هم در اپلیکیشن Gemini و هم از طریق API و پلتفرم Vertex AI در دسترس کاربران و توسعه‌دهندگان قرار دارد.

در ۲۶ اوت ۲۰۲۵، گوگل از ارتقا چشمگیر ابزار ویرایش تصویر هوش مصنوعی Gemini خود رونمایی کرد؛ رویدادی که با واکنش‌های گستردهٔ کاربران، توسعه‌دهندگان و رسانه‌ها روبه‌رو شد. این به‌روزرسانی، با نام رمز «Nano Banana» شناخته می‌شود و رسماً تحت عنوان مدل نسل جدید Gemini 2.5 Flash Image معرفی شده است. اهمیت این تحول در این است که Gemini اکنون نه فقط به تولید تصویر می‌پردازد، بلکه ویرایش‌هایی ظریف و دقیق نیز ارائه می‌کند—که پیش‌تر ابزارهای رقیب در آن ضعف داشتند.

آنچه خواهید خواند:

چیستی «Nano Banana» یا Gemini 2.5 Flash Image

گوگل با نام رمز «Nano Banana» مدلی را توسعه داد که اکنون در Gemini با عنوان رسمی Gemini 2.5 Flash Image عرضه می‌شود. این مدلِ پیشرفته، قابلیت ویرایش تصویر را بسیار ارتقاء می‌بخشد.

ویژگی‌های کلیدی ویرایشگر جدید Gemini

۱. حفظ شباهت چهره و عناصر ثابت

یکی از نقاط ضعف ابزارهای پیشین، تغییر شخصیت‌ها یا حیوانات در اصلاحات تصویر بود—یعنی آن‌ها «نزدیک بودند اما دقیق نبودند». حالا Gemini این مشکل را رفع کرده و در هر ویرایش، چهره‌ یا ویژگی‌های سوژه به‌خوبی حفظ می‌شود.

۲. ویرایش چند مرحله‌ای و ترکیب تصاویر

کاربران قادرند تغییرات را مرحله به مرحله اعمال کنند—برای مثال تغییر لباس، سپس پس‌زمینه، و در نهایت افزودن جزئیات دیگر. همچنین می‌توان چند تصویر را با هم ترکیب کرد، مثلاً تصویری از خود و حیوان خانگی در یک صحنه جدید.

۳. ویرایش دقیق (Prompt-Based)

Gemini 2.5 قابلیت انجام ویرایش‌های هدفمند (مانند تغییر رنگ، حذف لکه، افزودن یا تغییر جزئی خاص) با تنها یک فرمانی طبیعی را دارد.

۴. افکت‌های ترکیبی و الگویی

می‌توانید سبک، بافت یا الگوی موجود در یک تصویر را به جسم یا لباس دیگری منتقل کنید—مثلاً طرحی از گلبرگ را روی بوت‌های بارانی اعمال کنید.

۵. بهره‌گیری از دانایی جهان‌شمول

این مدل از ظرفیت‌های هوش فراگیر (world knowledge) برخوردار است و می‌تواند بر مبنای فهم واقعی جهان، به ایجاد یا ویرایش صحنه‌های پیچیده کمک کند—مثلاً شناخت صحیح گیاهان یا عناصر مرتبط با محیط.

فراهم‌سازی ابزار برای سطوح متفاوت کاربران

برای همه کاربران Gemini (رایگان و پولی): این امکانات از همان امروز در اپ Gemini قابل استفاده است.
برای توسعه‌دهندگان و کسب‌وکارها: مدل Gemini 2.5 Flash Image از طریق قابلیت‌هایی مانند Gemini API، Google AI Studio و Vertex AI در دسترس است. این مدل همچنین هزینه‌ای حدود ۰.۰۳۹ دلار به ازای هر تصویر دارد.

واکنش‌های صنعت و رسانه‌ها

Business Insider: این ابزار را تهدیدی جدی برای برنامه‌هایی مانند فتوشاپ دانسته و ترمیم دقیق چهره و لباس را ویژگی پیشگام آن دانسته است.
جامعه توسعه‌دهندگان: مدل در آزمون LM Arena، که کیفیت مدل‌های هوش مصنوعی را رتبه‌بندی می‌کند، موفق به کسب رتبه اول در بخش ویرایش تصویر شده است.
Adobe: این ابزار جدید در Adobe Firefly و Adobe Express ادغام شده و به کاربران امکان ساخت و تنظیم تصاویر را می‌دهد؛ در نسخه رایگان امکان ۲۰ تصویر رایگان، و برای اعضای پولی عملکرد نامحدود فراهم است.
بازخورد حرفه‌ای‌ها: شرکت‌های طراحی و آژانس‌ها، مانند WPP (مارکتینگ)، Leonardo.AI، Freepik و طراحی‌های تعاملی (Poe)، کیفیت بالای این ابزار را در حفظ انسجام تصویری و جابجایی دقیق سوژه ستوده‌اند.

پیامدها و اهمیت

این تحول در Gemini نشان‌دهنده نزدیک شدن ابزارهای هوش مصنوعی به قابلیت‌های معمول ابزارهای حرفه‌ای همچون فتوشاپ است—ولی با دردسترس‌پذیری و تعامل طبیعی‌تر. از کاربردهای شخصی مانند تبدیل عکس‌های خانوادگی به نسخه‌های خلاقانه، تا تولید محتوا برای بازاریابی و طراحی، همه می‌توانند از این توانمندی بهره‌مند شوند.

همچنین، وجود واترمارک مرئی و «SynthID» پنهان در تصاویر تولیدشده، ابزاری برای نمایش منشأ مصنوعی تصویر و کاهش خطر سوءاستفاده در زمینه جعل‌های بصری است.

جمع‌بندی

ابزار جدید ویرایش تصویر در Gemini، با نام Gemini 2.5 Flash Image (یا Nano Banana)، جهشی بزرگ در دقت، خلاقیت و کنترل فرآیند ایجاد و ویرایش تصاویر فراهم آورده است. ویژگی‌های برجسته‌ای مانند حفظ شخصیت، ویرایش مرحله‌ای، فرمان‌های زبانی، ترکیب تصاویر و تطابق با منطق جهانی، آن را تبدیل به یکی از پیشگام‌ترین ابزارهای موجود در عرصه تولید و اصلاح تصاویر دیجیتال کرده است.

این ابزار اکنون در دسترس همه کاربران Gemini و توسعه‌دهندگان از طریق API و پلتفرم‌های AI Studio و Vertex AI قرار دارد و اثرات آن به‌سرعت در جامعه خلاق و صنعت دیده می‌شود.

تحریریه هوش نیوز

«ما در تیم تحریریه هوش‌نیوز عاشق دنیای فناوری و هوش مصنوعی هستیم. تلاش می‌کنیم تازه‌ترین خبرها و تحلیل‌ها رو به زبانی ساده و قابل اعتماد براتون بیاریم، تا همیشه یک قدم جلوتر از تغییرات بزرگ دنیای تکنولوژی باشید.

اشتراک گذاری: