قابلیت‌های نسخه جدید «جمنای»؛ همزمان هم می‌بیند و هم می‌خواند!

قابلیت‌های نسخه جدید «جمنای»؛ همزمان هم می‌بیند و هم می‌خواند!
۰

در روز‌های اخیر گوگل از مدل جدیدی با نام «جمنای ۳ فلش» رونمایی کرده است. این مدل به‌سرعت به یکی از مهم‌ترین تحولات فضای هوش مصنوعی مصرفی و جست‌وجوی آنلاین تبدیل شده است. این مدل نه به‌عنوان یک ابزار آزمایشگاهی یا صرفاً حرفه‌ای، بلکه به‌عنوان موتور پیش‌فرض تجربه هوش مصنوعی گوگل معرفی شده. تصمیمی که نشان می‌دهد گوگل جمنای ۳ فلش را برای استفاده روزمره میلیون‌ها کاربر طراحی کرده است. 

هدف اصلی این مدل، ایجاد تعادلی میان سرعت بسیار بالا، هزینه کمتر و حفظ سطح قابل‌قبولی از دقت و استدلال است. ترکیبی که برای جست‌وجوی هوشمند، پاسخ‌دهی فوری و تعاملات مداوم با کاربر اهمیت حیاتی دارد.

پردازش همزمان عکس، متن، صدا و ویدئو

جمنای ۳ فلش عضوی از نسل سوم خانواده مدل‌های جمنای است؛ نسلی که گوگل آن را ادامه مسیر مدل‌های چندوجهی (Multimodal) خود می‌داند. منظور از چندوجهی این است که مدل می‌تواند به‌طور هم‌زمان با انواع مختلف داده مانند متن، تصویر، صدا و حتی ویدئو کار کند. به زبان ساده، جمنای ۳ فلش می‌تواند یک سؤال متنی را همراه با یک تصویر یا فایل صوتی تحلیل کند. و بر اساس مجموع این اطلاعات پاسخ بدهد، بدون آن‌که کاربر مجبور باشد همه‌چیز را فقط در قالب متن توضیح دهد. این قابلیت پیش‌تر هم در مدل‌های جمنای وجود داشت، اما در نسخه فلش با تمرکز بر سرعت و پاسخ‌گویی آنی بهینه‌سازی شده است.

پاسخگویی بدون مکث به سوالات

مهم‌ترین ویژگی جمنای ۳ فلش، سرعت آن است. گوگل به‌صراحت اعلام کرده که این مدل برای پاسخ‌دهی تقریباً هم‌سطح با جست‌وجوی سنتی طراحی شده. یعنی زمانی که کاربر سؤال خود را می‌پرسد، پاسخ باید تقریباً بدون مکث و تأخیر ظاهر شود. در مقایسه با مدل‌های سنگین‌تر مانند جمنای پرو، فلش سبک‌تر است و منابع محاسباتی کمتری مصرف می‌کند. اگر بخواهیم این تفاوت را ساده توضیح دهیم. جمنای پرو شبیه یک متخصصی است که برای حل مسائل پیچیده زمان بیشتری می‌گذارد. اما جمنای فلش شبیه دستیاری سریع است که باید فوراً جواب بدهد، حتی اگر مسئله کمی ساده‌تر باشد.

گوگل برای رسیدن به این سرعت بالا، بخشی از تمرکز خود را بر بهینه‌سازی مصرف توکن‌ها (Token) گذاشته است. توکن‌ها در واقع واحد‌های پردازش متن برای مدل‌های زبانی هستند؛ هرچه تعداد توکن‌های مصرفی کمتر باشد، پاسخ سریع‌تر و هزینه محاسباتی پایین‌تر خواهد بود. گزارش‌های رسمی و رسانه‌های تخصصی فناوری نشان می‌دهند که جمنای ۳ فلش نسبت به برخی مدل‌های قبلی گوگل، توکن کمتری مصرف می‌کند، بدون آن‌که کیفیت پاسخ به‌طور محسوسی افت کند. این موضوع برای گوگل اهمیت استراتژیک دارد. چون مدلی که قرار است به‌صورت گسترده و روزانه توسط میلیون‌ها کاربر استفاده شود، باید هم سریع باشد و هم مقرون‌به‌صرفه.

مطالب بیشتر

...

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *