9 czerwca 20262 min czytania

Google udostępnia Gemini 3.5 Live Translate z tłumaczeniem głosowym w czasie rzeczywistym

Nowy model Google tłumaczy mowę w czasie rzeczywistym dla ponad 70 języków, zachowując ton i tempo głosu. Dostępny już w Google Meet i Translate.

Źródło zdjęcia: The Decoder

Google wprowadza Gemini 3.5 Live Translate, nowy model sztucznej inteligencji do tłumaczenia mowy w czasie rzeczywistym dla ponad 70 języków. System automatycznie wykrywa język i, jak twierdzi Google, zachowuje ton, tempo i wysokość głosu mówiącego. Model jest już dostępny dla deweloperów i użytkowników.

Technologia tłumaczy wypowiedzi w sposób ciągły, nie czekając na zakończenie całego zdania. Wszystkie wygenerowane nagrania audio są oznaczone niewidocznym znakiem wodnym SynthID.

Kluczowe wnioski

Gemini 3.5 Live Translate obsługuje ponad 70 języków z automatycznym wykrywaniem języka i zachowaniem charakterystyki głosu.
Model dostępny jest już dla deweloperów przez Gemini Live API i Google AI Studio oraz dla wszystkich użytkowników w aplikacji Google Translate.
W Google Meet wsparcie językowe wzrosło z pięciu do ponad 70 języków, oferując ponad 2000 kombinacji językowych.
Usługa transportowa Grab testuje model do komunikacji między kierowcami a pasażerami.
Wszystkie wygenerowane nagrania są oznaczone niewidocznym znakiem wodnym SynthID.

Dostępność na różnych platformach

Gemini 3.5 Live Translate jest obecnie dostępny w kilku wersjach. Deweloperzy mogą korzystać z modelu przez Gemini Live API oraz Google AI Studio. Firmy otrzymują dostęp do wersji preview w Google Meet, podczas gdy wszyscy użytkownicy mogą już testować funkcję w aplikacji Google Translate na systemach Android i iOS.

Szczególnie znaczącą zmianą jest rozszerzenie możliwości Google Meet. Platforma do wideokonferencji zwiększyła wsparcie językowe z zaledwie pięciu języków do ponad 70, co daje użytkownikom dostęp do ponad 2000 różnych kombinacji językowych.

Zastosowania komercyjne i technologia

Usługa transportowa Grab już testuje nowy model do usprawnienia komunikacji między kierowcami a pasażerami. To pokazuje praktyczne zastosowanie technologii w branży usług transportowych, gdzie bariery językowe mogą stanowić znaczący problem operacyjny.

Google zastosowało także rozwiązania bezpieczeństwa w postaci SynthID — niewidocznego znaku wodnego, który oznacza wszystkie wygenerowane nagrania audio. To zabezpieczenie ma pomóc w identyfikacji treści wygenerowanych przez AI.

Wprowadzenie Gemini 3.5 Live Translate stanowi kolejny krok Google w rozwoju technologii tłumaczenia w czasie rzeczywistym, oferując użytkownikom bardziej naturalne i płynne doświadczenie komunikacji międzykulturowej.

#tłumaczenie głosowe #Google Meet #Gemini 3.5 #sztuczna inteligencja #Google

Udostępnij

Źródła

The Decoder

Poprzedni

Momfluencers Are Pitching AI as a Better ‘Coparent’ Than Men

Następny

Anthropic udostępnia Claude Fable 5 z ograniczeniami bezpieczeństwa i Mythos 5 dla partnerów

Podobne Publikacje

Biznes i Rynek

Anthropic podpisało umowę z AMD na 5 miliardów dolarów na procesory dla Claude

Anthropic zawarło z AMD umowę wartą do 5 miliardów dolarów na dostawę 2 gigawatów GPU do trenowania modeli Claude. Pierwsza faza w 2027 roku.

3 min22 lipca

Etyka i Bezpieczeństwo

USA planują selektywne zakazy chińskich modeli AI zamiast całkowitego embargo

Administracja Trumpa rozważa ograniczenia konkretnych chińskich modeli AI ze względów bezpieczeństwa, podczas gdy firmy lobbują za różnymi rozwiązaniami.

4 min26 lipca

Biznes i Rynek

NVIDIA uruchomiła superkomputer AI w Naval Postgraduate School

Superkomputer DGX GB300 z NVIDIA obsłuży 1500 studentów wojskowych, umożliwiając trenowanie modeli AI i symulacje w cyberbezpieczeństwie oraz prognozowaniu.

4 min23 lipca

9 czerwca 20262 min czytania

Google udostępnia Gemini 3.5 Live Translate z tłumaczeniem głosowym w czasie rzeczywistym

Nowy model Google tłumaczy mowę w czasie rzeczywistym dla ponad 70 języków, zachowując ton i tempo głosu. Dostępny już w Google Meet i Translate.

Źródło zdjęcia: The Decoder

Technologia tłumaczy wypowiedzi w sposób ciągły, nie czekając na zakończenie całego zdania. Wszystkie wygenerowane nagrania audio są oznaczone niewidocznym znakiem wodnym SynthID.

Kluczowe wnioski

Gemini 3.5 Live Translate obsługuje ponad 70 języków z automatycznym wykrywaniem języka i zachowaniem charakterystyki głosu.
Model dostępny jest już dla deweloperów przez Gemini Live API i Google AI Studio oraz dla wszystkich użytkowników w aplikacji Google Translate.
W Google Meet wsparcie językowe wzrosło z pięciu do ponad 70 języków, oferując ponad 2000 kombinacji językowych.
Usługa transportowa Grab testuje model do komunikacji między kierowcami a pasażerami.
Wszystkie wygenerowane nagrania są oznaczone niewidocznym znakiem wodnym SynthID.

Dostępność na różnych platformach

Zastosowania komercyjne i technologia

#tłumaczenie głosowe #Google Meet #Gemini 3.5 #sztuczna inteligencja #Google

Udostępnij

Źródła

The Decoder

Poprzedni

Momfluencers Are Pitching AI as a Better ‘Coparent’ Than Men

Następny

Anthropic udostępnia Claude Fable 5 z ograniczeniami bezpieczeństwa i Mythos 5 dla partnerów

Podobne Publikacje

Biznes i Rynek

Anthropic podpisało umowę z AMD na 5 miliardów dolarów na procesory dla Claude

Anthropic zawarło z AMD umowę wartą do 5 miliardów dolarów na dostawę 2 gigawatów GPU do trenowania modeli Claude. Pierwsza faza w 2027 roku.

3 min22 lipca

Etyka i Bezpieczeństwo

USA planują selektywne zakazy chińskich modeli AI zamiast całkowitego embargo

Administracja Trumpa rozważa ograniczenia konkretnych chińskich modeli AI ze względów bezpieczeństwa, podczas gdy firmy lobbują za różnymi rozwiązaniami.

4 min26 lipca

Biznes i Rynek

NVIDIA uruchomiła superkomputer AI w Naval Postgraduate School

Superkomputer DGX GB300 z NVIDIA obsłuży 1500 studentów wojskowych, umożliwiając trenowanie modeli AI i symulacje w cyberbezpieczeństwie oraz prognozowaniu.

4 min23 lipca