Google представила нову модель штучного інтелекту Gemini Omni Flash. Це перша розробка у сімействі Omni, яка має дати користувачам можливість створювати контент практично з будь-яких вхідних даних. На старті основний акцент зроблено саме на генерації відео.
Нова модель здатна працювати з різними форматами: текстом, зображеннями, відео та аудіо. Завдяки цьому користувачі зможуть поєднувати кілька типів матеріалів і створювати на їхній основі якісні відеоролики. У Google наголошують, що Gemini Omni Flash використовує знання Gemini, тому може не лише генерувати картинку, а й враховувати контекст, логіку сцени та зміст майбутнього відео.
Окрема можливість нової моделі – редагування відео за допомогою звичайних текстових команд. Користувачу не потрібно буде працювати зі складними інструментами монтажу, алише достатньо описати, що саме потрібно змінити. Наприклад, можна буде змінити стиль ролика, місце подій, зовнішність персонажа, окремі деталі сцени або реакцію об’єктів у кадрі.
За словами Google, кожна нова команда враховуватиме попередні інструкції. Це означає, що персонажі мають залишатися послідовними, сцена – зберігати логіку, а фізика рухів та взаємодії об’єктів має виглядати природніше.
У компанії також підкреслюють, що Gemini Omni Flash не просто створює реалістичні кадри. Модель намагається «розуміти», що має відбуватися далі у сцені, поєднуючи знання про фізику, історію, науку та культурний контекст. Завдяки цьому Google хоче наблизити генерацію відео не лише до фотореалізму, а й до повноцінного візуального сторітелінгу.
Gemini Omni Flash зможе перетворювати на відео різні матеріали, які завантажує користувач. Водночас на першому етапі для аудіо будуть певні обмеження: підтримуватиметься лише голос. У майбутньому Google планує додати й інші типи аудіовиходу. Для тексту, зображень та відео таких обмежень не заявлено.
Нова модель уже доступна передплатникам Google AI Plus, Pro та Ultra по всьому світу через застосунок Gemini та сервіс Google Flow. Крім того, цього тижня Gemini Omni Flash починають безкоштовно запускати для користувачів YouTube Shorts і YouTube Create App. У найближчі тижні доступ до моделі також мають отримати розробники та корпоративні клієнти через API.