Dziennikarz stworzył cyfrowego klona w Gemini. Funkcja awatarów Google generuje realistyczne filmy AI, ale budzi obawy o bezpieczeństwo deepfake.

Źródło zdjęcia: WIRED
Dziennikarz Wired przetestował nową funkcję awatarów w aplikacji Gemini od Google, która pozwala tworzyć realistyczne filmy AI z własną podobizną. Wyniki okazały się jednocześnie imponujące i niepokojące, pokazując możliwości i zagrożenia związane z technologią deepfake dostępną dla zwykłych użytkowników.
Funkcja awatarów, dostępna tylko dla płatnych subskrybentów Google AI Pro (20 dolarów miesięcznie), wykorzystuje nowy model Omni do tworzenia filmów z cyfrowym klonem użytkownika. To rozwiązanie przypomina nieistniejącą już aplikację Sora od OpenAI.
Konfiguracja awatara w aplikacji Gemini okazała się zaskakująco prosta. Autor usiadł w dobrze oświetlonym pomieszczeniu, skierował kamerę telefonu na twarz i przeczytał ciąg dwucyfrowych liczb. Następnie powoli spojrzał w prawo i obrócił głową w lewo. Po pięciu minutach „Reece 2.0” był gotowy do występów w filmach AI.
Ważnym szczegółem jest ubiór podczas nagrywania — to, co użytkownik ma na sobie podczas tworzenia awatara, prawdopodobnie pojawi się w generowanych filmach.
Pierwszy wygenerowany film pokazywał autora śpiewającego „Sto lat” prehistorycznemu dinozaurowi w parku Dolores w San Francisco. Najbardziej uderzające było fotorealistyczne tło — zamiast umieszczać awatar na przypadkowym wzgórzu, AI odtworzyło rzeczywistą lokalizację z palmami i wieżowcem Salesforce w tle.
Nicole Brichtova, która kieruje zespołem produktowym pracującym nad Omni w Google DeepMind, podkreśla, że firma stara się zapobiegać szkodom: „Próbujemy zapobiegać krzywdzie i robimy to w sposób, który nie blokuje niewinnych rzeczy.”
Jednak generowane treści zawierały dziwaczne elementy — w klipie z dinozaurem magicznie pojawiła się babeczka z różową świeczką, a podczas surfingu pod Golden Gate Bridge autor był ubrany w dżinsy zamiast kombinezonu.
Autor opisuje swoje odczucia jako mieszankę podziwu i niepokoju. Choć filmy zawierały błędy i niezgrabne momenty, cyfrowy klon wydawał się „bardziej prawdziwy” niż nagrania z weekendowych wypadów czy wiadomości głosowe. To nie była „lepsza wersja” siebie, ale coś jeszcze bardziej niepokojącego — „bezszwowy Reece”, zawsze gotowy być wszędzie i robić wszystko.

Analiza Google I/O ujawnia przesunięcie priorytetów firmy od narzędzi jak AlphaFold w kierunku systemów agentowych zdolnych do samodzielnych badań.

Nowy Gemini 3.5 Flash osiąga 280 tokenów na sekundę, ale koszty wzrosły trzykrotnie. W zadaniach agentowych przewyższa nawet droższy model Pro.

YouTube dodaje funkcję AI remix w Shorts. Gemini Omni przekształca filmy w anime, pixel art i pozwala umieszczać siebie w cudzych nagraniach.