AI Overview Google'a twierdzi, że w słowie Google są dwa P, a nazwisko prezydenta USA to t-r-p-u-m. Problem wynika z architektury transformerów.

Źródło zdjęcia: TechCrunch
Sztuczna inteligencja Google'a ma problem z podstawową umiejętnością — nie potrafi poprawnie literować. Nowe AI Overviews w wyszukiwarce twierdzą, że w słowie „Google” są dwa „P”, a nazwisko prezydenta USA zapisują jako „t-r-p-u-m”. To kolejny przykład problemów z funkcjami AI, które Google wprowadza do swojej flagowej wyszukiwarki, jak informuje TechCrunch.
Problem nie ogranicza się tylko do błędów ortograficznych. AI Overview Google'a twierdzi również, że w słowie „poop” jest dokładnie jedna litera „r”, a w słowie „journalism” są dwa „d”, zapisując je jako „j-o-u-r-n-a-d-i-s-m”. To kolejna wpadka po tym, jak funkcja wcześniej cytowała satyryczne posty z The Onion i Reddit, doradzając ludziom jedzenie kamieni i dodawanie kleju do pizzy.
Jak wyjaśnia Matthew Guzdial, badacz AI i profesor nadzwyczajny na Uniwersytecie Alberty, duże modele językowe nie „czytają” tekstu tak jak ludzie. Gdy wprowadzamy prompt, jest on tłumaczony na kodowanie numeryczne.
„Gdy AI widzi słowo 'the', ma jedno kodowanie tego, co oznacza 'the', ale nie wie o literach 'T', 'H', 'E'” — tłumaczy Guzdial.
Modele LLM oparte na architekturze transformerów dzielą tekst na tokeny, które mogą być całymi słowami, sylabami lub literami, w zależności od modelu. Zamiast czytać jak człowiek, AI przekształca tekst w reprezentacje numeryczne, które są następnie kontekstualizowane, aby pomóc AI wypracować logiczną odpowiedź.
Sheridan Feucht, doktorantka badająca interpretowalność dużych modeli językowych na Northeastern University, jest sceptyczna co do możliwości rozwiązania tego problemu. Jak tłumaczy, trudno jest określić, czym dokładnie powinno być „słowo” dla modelu językowego.
„Nawet gdybyśmy poprosili ekspertów o uzgodnienie idealnego słownika tokenów, modele prawdopodobnie nadal uznałyby za przydatne dalsze 'dzielenie' rzeczy” — mówi Feucht.
Google już naprawił jeden z problemów z zeszłego tygodnia, gdy wyszukiwanie słowa „disregard” wyświetlało pozorną definicję słownikową, która brzmiała: „Zrozumiano. Daj mi znać, gdy będziesz mieć nowy prompt lub pytanie!”. Jednak błędy ortograficzne pozostają trudne do wyeliminowania ze względu na fundamentalne ograniczenia architektury tokenowej.
Choć to nie jest pilny problem dla badaczy — użyteczność LLM nie polega na ich zdolności do literowania — te oczywiste błędy przypominają nam, że AI nie jest doskonałe. Nie możemy ślepo ufać wynikom AI bez sprawdzenia ich dokładności.
Narzędzie wykorzystuje model Qwen3–8B do automatycznego generowania zapytań LinkedIn i oceny dopasowania ofert według pięciu kryteriów dla absolwentów.

Nvidia przedstawiła laptopy RTX Spark z 128 GB pamięci i procesorami N1. Czy to pierwsze prawdziwe komputery AI konkurujące z MacBook Pro?

AI startup Suno pozyskał 400 mln dolarów przy wycenie 5,4 mld, stając się liderem AI muzyki. Ma 2 mln subskrybentów, ale walczy w sądzie z Universal i Sony.