Startup Miry Murati pracuje nad modelem interakcji, który może jednocześnie słuchać i mówić jak w naturalnej rozmowie, z czasem odpowiedzi 0,40 sekundy.

Źródło zdjęcia: TechCrunch
Thinking Machines Lab, startup założony przez byłą CTO OpenAI Mirę Murati, ogłosił przełomową technologię zwaną „modelami interakcji”. Firma pracuje nad sztuczną inteligencją, która może słuchać i mówić jednocześnie, naśladując naturalną rozmowę telefoniczną zamiast wymiany wiadomości tekstowych. Szczegóły projektu opisuje TechCrunch.
Dotychczas wszystkie modele AI działały według tego samego schematu: użytkownik mówi, AI słucha, następnie AI odpowiada, a użytkownik słucha. Thinking Machines Lab próbuje całkowicie zmienić ten paradygmat, budując model który może przetworzyć input użytkownika i wygenerować odpowiedź w tym samym czasie.
Techniczne określenie tej funkcjonalności to „full duplex” — pojęcie znane z telekomunikacji, oznaczające możliwość jednoczesnego przesyłania danych w obu kierunkach. W praktyce oznacza to, że AI może przerwać użytkownikowi, podobnie jak to dzieje się w naturalnej rozmowie między ludźmi.
Firma twierdzi, że jej model TML-Interaction-Small osiąga czas odpowiedzi na poziomie 0,40 sekundy. To znacząco szybciej niż porównywalne modele od OpenAI czy Google, a jednocześnie odpowiada naturalnej prędkości ludzkiej konwersacji.
Jednak na razie to tylko zapowiedź. Thinking Machines Lab nie udostępnia jeszcze swojego rozwiązania publicznie. Ograniczony podgląd badawczy ma być dostępny w nadchodzących miesiącach, natomiast szersze wydanie zaplanowano na później w tym roku.
Choć benchmarki wyglądają imponująco, a sama idea — że interaktywność powinna być wbudowana w model, a nie doklejana jako dodatek — brzmi interesująco, rzeczywiste doświadczenie użytkowania pozostaje nieznane. Dopiero gdy ludzie będą mogli faktycznie przetestować technologię, okaże się, czy spełni ona swoje techniczne obietnice.

Test programistyczny pokazał zbliżoną skuteczność GLM-5.2 i Opus 4.7, ale dramatyczna różnica w cenie może wywrócić rynek AI do góry nogami.

Badanie największej organizacji pisarzy USA pokazuje dramatyczne różnice między detektorami AI — od 100% skuteczności do całkowitej porażki.

Startup General Intuition zebrał 320 mln dolarów na model AI, który uczy się działania w rzeczywistym świecie poprzez analizę danych z gier wideo.