Nowy Gemini 3.5 Flash osiąga 280 tokenów na sekundę, ale koszty wzrosły trzykrotnie. W zadaniach agentowych przewyższa nawet droższy model Pro.

Źródło zdjęcia: The Decoder
Google wprowadził nowy model Gemini 3.5 Flash, który według analizy Artificial Analysis kosztuje 5,5 raza więcej niż jego poprzednik. Pomimo znacznego wzrostu cen, model oferuje ponad 280 tokenów wyjściowych na sekundę, co czyni go najszybszym w swojej klasie inteligencji.
Gemini 3.5 Flash kontynuuje trend w branży AI, gdzie najnowsze modele od Google, Anthropic i OpenAI stają się znacznie droższe w eksploatacji. W przypadku zadań agentowych rzeczywiste koszty przewyższają nawet droższy model Pro ze względu na wysokie zużycie tokenów.
Gemini 3.5 Flash reprezentuje radykalną zmianę w strategii cenowej Google. Podczas gdy poprzednie modele Flash były pozycjonowane jako tańsza alternatywa dla modeli Pro, najnowsza wersja łamie ten schemat. Cena za token wzrosła trzykrotnie, a dodatkowo model zużywa znacznie więcej tokenów podczas pracy.
Szczególnie problematyczne jest zużycie tokenów w zadaniach agentowych. Gemini 3.5 Flash potrzebuje średnio 49 interakcji na zadanie, podczas gdy konkurencyjny GPT-5.4 wymaga tylko 40, a własny model Pro Google'a — zaledwie 23. To prowadzi do sytuacji, gdzie pomimo niższych cen za token, całkowite koszty przewyższają droższe modele.
Google podąża za trendem ustanowionym przez konkurentów. Anthropic podniósł ukryte koszty Opus 4.7 o 30–40% w stosunku do poprzednika poprzez wyższe zużycie tokenów, podczas gdy OpenAI zwiększył ceny GPT-5.5 o 50–90% w porównaniu do wersji 5.4, podnosząc bazowe ceny przy jednoczesnym obniżeniu zużycia tokenów.
Największe ulepszenia Gemini 3.5 Flash dotyczą zadań agentowych, które historycznie były słabością modeli Gemini. W teście GDPval-AA, który ocenia rzeczywiste zadania agentowe z dostępem do internetu i terminala, model osiągnął wynik 1656 punktów Elo. To ogromny skok w porównaniu z 1204 punktami Gemini 3 Flash i 1314 punktami Gemini 3.1 Pro.
Paradoksalnie, programowanie — jeden z najważniejszych przypadków użycia dla szybkich i wydajnych modeli AI — pozostaje słabym punktem. Z wynikiem 45 punktów w Artificial Analysis Coding Index, Gemini 3.5 Flash wypada gorzej niż własny model Pro Google'a (55 punktów) i znacznie słabiej od liderów jak GPT-5.5 (59) czy Claude Opus 4.7 (53).
W ogólnym indeksie inteligencji model osiąga 55 punktów, wyprzedzając Grok 4.3 (53) i Claude Sonnet 4.6 (52). Współczynnik halucynacji spadł znacząco z 92% do 61%, ale nadal pozostaje wysoki w porównaniu do najlepszych modeli, które osiągają zaledwie 25%.
Nowy Gemini 3.5 Flash pokazuje, jak branża AI zmierza w stronę droższych, ale bardziej wyspecjalizowanych modeli, gdzie kluczowa staje się efektywność wykorzystania tokenów, a nie tylko ich cena.

Analiza Google I/O ujawnia przesunięcie priorytetów firmy od narzędzi jak AlphaFold w kierunku systemów agentowych zdolnych do samodzielnych badań.

Trzej czołowi badacze AI prezentują radykalnie różne wizje: od krytyki LLM-ów jako nieinteligentnych po przewidywania AGI w ciągu pięciu lat.

Zwycięzcy Commonwealth Short Story Prize 2026 stoją w obliczu oskarżeń o wykorzystanie sztucznej inteligencji. Narzędzia wykrywania AI wskazują 100% prawdopodobieństwo.