Startup Miry Murati pracuje nad modelem interakcji, który może jednocześnie słuchać i mówić jak w naturalnej rozmowie, z czasem odpowiedzi 0,40 sekundy.

Źródło zdjęcia: TechCrunch
Thinking Machines Lab, startup założony przez byłą CTO OpenAI Mirę Murati, ogłosił przełomową technologię zwaną „modelami interakcji”. Firma pracuje nad sztuczną inteligencją, która może słuchać i mówić jednocześnie, naśladując naturalną rozmowę telefoniczną zamiast wymiany wiadomości tekstowych. Szczegóły projektu opisuje TechCrunch.

Badanie rosyjskich naukowców pokazuje, że proste nakładanie siatki na wykresy redukuje błąd modeli AI z 25,5% do 19,5% — lepiej niż zaawansowane metody.

Daron Acemoglu wskazuje kluczowe trendy w AI: agenty, zatrudnianie ekonomistów przez firmy AI i rozwój aplikacji. Jego prognozy wciąż się sprawdzają.
Dotychczas wszystkie modele AI działały według tego samego schematu: użytkownik mówi, AI słucha, następnie AI odpowiada, a użytkownik słucha. Thinking Machines Lab próbuje całkowicie zmienić ten paradygmat, budując model który może przetworzyć input użytkownika i wygenerować odpowiedź w tym samym czasie.
Techniczne określenie tej funkcjonalności to „full duplex” — pojęcie znane z telekomunikacji, oznaczające możliwość jednoczesnego przesyłania danych w obu kierunkach. W praktyce oznacza to, że AI może przerwać użytkownikowi, podobnie jak to dzieje się w naturalnej rozmowie między ludźmi.
Firma twierdzi, że jej model TML-Interaction-Small osiąga czas odpowiedzi na poziomie 0,40 sekundy. To znacząco szybciej niż porównywalne modele od OpenAI czy Google, a jednocześnie odpowiada naturalnej prędkości ludzkiej konwersacji.
Jednak na razie to tylko zapowiedź. Thinking Machines Lab nie udostępnia jeszcze swojego rozwiązania publicznie. Ograniczony podgląd badawczy ma być dostępny w nadchodzących miesiącach, natomiast szersze wydanie zaplanowano na później w tym roku.
Choć benchmarki wyglądają imponująco, a sama idea — że interaktywność powinna być wbudowana w model, a nie doklejana jako dodatek — brzmi interesująco, rzeczywiste doświadczenie użytkowania pozostaje nieznane. Dopiero gdy ludzie będą mogli faktycznie przetestować technologię, okaże się, czy spełni ona swoje techniczne obietnice.