Хашем Ал-Гаили, јеменски молекуларен биолог, популаризатор на науката и директор, е најпознат по истоимената Фејсбук страница, која ја лансираше во 2008 година. Објавува инфографици и кратки видеа за научни вести и истражувања. До октомври 2022 година, страницата имаше повеќе од 32 милиони следбеници, а близу милион луѓе го следат на Инстаграм.
Со неверојатниот успех на алатките што користат вештачка интелигенција за обработка на фотографии , текст или снимки, се појави голем интерес за „оживување“ на историски личности. Имено, врз основа на бисти, скулптури и слики, Хашем со помош на вештачка интелигенција покажа како навистина изгледале некои познати историски личности. Иако вештачката интелигенција не е секогаш точна, конечниот резултат е најблиску до тоа како тие навистина изгледале.
Во видеото се појавуваат Нефертити, Сократ, Никола Тесла, Исак Њутн, Галилео Галилеј, Наполеон, Бетовен, Вилијам Шекспир …
Како вештачката интелигенција прави видео од фотографија или биста на историска личност?
Процесот вклучува неколку клучни технологии во областите на компјутерски вид, длабоко учење и синтеза на движење и глас. Подолу се наведени главните фази:
1. Анализа на лице од фотографија или биста
Вештачката интелигенција користи алгоритми за препознавање лица за да идентификува клучни точки на лицето – како што се очите, веѓите, усните, брадата и контурите на лицето. Дури и кога станува збор за биста (скулптура), системот ги препознава основните облици и ориентацијата на лицето.
Неговата цел е да се разбере анатомијата и изразите на лицето за да може да се „мапира“ анимацијата.
2. Анимација на лицето со користење на модели на движење
Потоа се користи генеративен модел (најчесто варијанта на Генеративни Адверсаријални Мрежи – GAN или AI за пренос на движење), кој врз основа на постоечка фотографија или биста симулира движења на лицето – како што се говор, трепкање, навалување на главата итн.
Вештачката интелигенција користи примерок – да речеме, видео од вистинско лице кое зборува – и го „пренесува“ тоа движење на неподвижна слика. Ова се нарекува пренос на снимање на движење.
3. Конечна обработка: осветлување, позадина, текстури
Конечно, вештачката интелигенција ги додава завршните допири:
осветлување и сенки во согласност со сцената, можна боја на кожа во позадина, текстура на облека итн.
Кои технологии се користат?
Deep Nostalgia (MyHeritage) – популарна услуга за анимирање на стари фотографии
D-ID, Synthesia, Reface – платформи за генерирање лица што зборуваат од слики
First Order Motion Model – алгоритам со отворен код за анимација на фотографии
StyleGAN / GANimation – генеративни мрежи за создавање реалистични изрази