گوگل در آینده جمنای و Veo را ادغام می‌کند

جمعه ۲۲ فروردین ۱۴۰۴ - ۰۸:۰۴
مطالعه 1 دقیقه
طرح گرافیکی هوش مصنوعی گوگل جمنای / Google Gemini روی موبایل
مدیرعامل گوگل دیپ‌مایند از ادغام مدل‌های جمنای و Veo در آینده خبر داد.
تبلیغات

دمیس هاسابیس، مدیرعامل گوگل دیپ‌مایند، در قسمتی از پادکست Possible به میزبانی یکی از بنیان‌گذاران لینکدین، اعلام کرد که گوگل قصد دارد مدل‌های هوش مصنوعی جمنای را با مدل‌های ساخت ویدیو Veo ادغام کند تا درک مدل‌های قبلی از دنیای فیزیکی بهبود یابد.

مدیرعامل دیپ‌مایند توضیح می‌دهد که جمنای از ابتدا با هدف چندوجهی‌بودن طراحی شد و این تصمیم به‌دلیل چشم‌انداز گوگل برای ایجاد یک دستیار دیجیتال جهانی اتخاذ شده است؛ دستیار دیجیتالی‌ای که بتواند در دنیای واقعی به کاربران کمک کند.

صنعت هوش مصنوعی به‌طور تدریجی به سمت مدل‌های «همه‌کاره» پیش می‌رود؛ مدل‌هایی که قادر به درک و ترکیب اشکال مختلف محتوا هستند. مدل‌های جمنای گوگل قادر به تولید صدا، تصویر و متن هستند، از سوی دیگر مدل GPT-4o از OpenAI نیز می‌تواند تصویر ایجاد کند.

ایجاد چنین مدل‌هایی نیازمند داده‌های آموزشی فراوان است؛ از جمله تصویر، ویدیو صدا و متن. هاسابیس اشاره کرده که داده‌های ویدیویی Veo عمدتاً از یوتیوب استخراج می‌شوند.

هاسابیس می‌گوید که با مشاهده‌ی تعداد زیادی ویدیو در یوتیوب، Veo 2 می‌تواند مفاهیمی چون قوانین فیزیکی جهان را شناسایی کند.

گوگل پیش‌تر گفته بود که مدل‌هایش ممکن است با «برخی» محتواهای یوتیوب، مطابق توافق‌نامه‌ای با خالقان محتوا، آموزش ببینند. گفته می‌شود گوگل سال گذشته شرایط خدمات خود را گسترش داد تا امکان دسترسی بیشتر به داده‌های یوتیوب برای آموزش مدل‌های هوش مصنوعی‌اش فراهم شود.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
داغ‌ترین مطالب روز

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات