MOBILZONE

Як Google покращує портретний режим в Pixel 3?

Google розповіла, як вона покращує портретний режим у своїх смартфонах, продовжуючи використовувати всього одну камеру. Раніше компанія покладалася на технологію фокусування Dual Pixel, де кожен піксель матриці камери розділений на два субпікселя, що дозволяє «бачити» картинку під двома кутами. Часом цей метод працював некоректно, через що фон міг розмиватися частково. Тому, в Pixel 3 і Pixel 3 XL пошуковий гігант вирішив застосовувати машинне навчання.

На зображенні нижче наочно показано, що при використанні однієї лише інформації з субпікселів задній фон за людиною розмивається нерівномірно, а деякі області і зовсім залишаються у фокусі. При активації машинного навчання проблема виправлена.

Для поліпшення портретного режиму в Pixel 3 компанія Google створила нейронну мережу, написану в TensorFlow, яка аналізує отриману з матриці інформацію і вчиться прогнозувати глибину зображення. Так як системі потрібно «згодувати» велику кількість даних, щоб навчити її, інженери Google придумали конструкцію під назвою Frankenphone, що об’єднує п’ять смартфонів Pixel 3 в один. Використання зв’язку по Wi-Fi дозволяє одночасно робити знімок об’єкта з усіх п’яти пристроїв з максимально допустимою затримкою 2 мілісекунди. Нейронна мережа аналізує отримані кадри, визначаючи фон, який потрібно розмити.

Для інженерів Google було важливо, щоб нейронна мережа навчилася працювати з динамічними сценами, як представлено на прикладі нижче. Крім того, установка Frankenphone створювалася таким чином, щоб вона була мобільною і її можна було носити з собою на вулицю, роблячи фотографії, які знімають в повсякденному житті звичайні користувачі смартфонів.

«Оцінка глибини з використанням машинного навчання повинна виконуватися швидко на Pixel 3, щоб людям не доводилося занадто довго чекати знімків, зроблених у портретному режимі. Однак, для якісної оцінки глибини, яка використовує тонке дефокусування та ефект паралакса, ми повинні передавати нейронної мережі PDAF-зображення в повному розширенні. Для забезпечення швидкої обробки ми застосовуємо TensorFlow Lite – кросплатформинне рішення для запуску моделей машинного навчання на мобільних і підключених до інтернету пристроїв – і потужний графічний процесор Pixel 3, щоб обчислити глибину швидко, незважаючи на наші аномально великі вхідні дані. Потім ми об’єднуємо отриману оцінку глибини з масками із нашої персоналізованої нейронної мережі для досягнення бажаного результату в портретному режимі», – йдеться в повідомленні Google.

Facebook Comments Box
Yulia Dimitrova

Recent Posts

«Форсажем на Волині»: лековий автомобіль підрізав бус ТЦК та звільнила мобілізованого: відео з’явилось у мережі

У мережі поширюється відео інциденту на Волині, під час якого група автомобілів зупинила мікроавтобус територіального…

15 хвилин ago

Абоненти масово переходять з Київстар та Vodafone до lifecell: у чому причина

У лютому 2026 року українці активно змінювали мобільних операторів, користуючись послугою перенесення номера (MNP). Найбільшим…

2 години ago

Як законно покинути ТЦК: адвокат розповів, що робити при затриманні

Чоловіки, які потрапляють до територіальних центрів комплектування (ТЦК), часто цікавляться, чи можуть вони залишити приміщення…

3 години ago

Через скільки часу пропадає статус розшук в «Резерв+»: що потрібно знати

Статус розшуку від територіальних центрів комплектування (ТЦК), який може відображатися в застосунку «Резерв+», має чітко…

5 години ago

Українці масово змінюють мобільних операторів: хто отримав десятки тисяч нових абонентів

У лютому 2026 року мобільний оператор lifecell став головним бенефіціаром послуги перенесення номерів (MNP) в…

5 години ago

Штрафи від ТЦК: що буде, якщо не платити і як сума може зрости з 17 до 37 тисяч гривень

Після змін до мобілізаційного законодавства в Україні значно посилили відповідальність за порушення правил військового обліку.…

9 години ago