20 maja 20264 min czytania

Gemini 3.5 Flash kosztuje 5,5 raza więcej niż poprzednik — Google podąża za trendem droższych modeli AI

Nowy Gemini 3.5 Flash osiąga 280 tokenów na sekundę, ale koszty wzrosły trzykrotnie. W zadaniach agentowych przewyższa nawet droższy model Pro.

Źródło zdjęcia: The Decoder

Google wprowadził nowy model Gemini 3.5 Flash, który według analizy Artificial Analysis kosztuje 5,5 raza więcej niż jego poprzednik. Pomimo znacznego wzrostu cen, model oferuje ponad 280 tokenów wyjściowych na sekundę, co czyni go najszybszym w swojej klasie inteligencji.

Gemini 3.5 Flash kontynuuje trend w branży AI, gdzie najnowsze modele od Google, Anthropic i OpenAI stają się znacznie droższe w eksploatacji. W przypadku zadań agentowych rzeczywiste koszty przewyższają nawet droższy model Pro ze względu na wysokie zużycie tokenów.

Kluczowe wnioski

Ceny tokenów wzrosły trzykrotnie — z 0,50 USD do 1,50 USD za milion tokenów wejściowych i z 3,00 USD do 9,00 USD za tokeny wyjściowe.
W testach benchmarkowych całkowite koszty eksploatacji są o 75% wyższe niż w przypadku Gemini 3.1 Pro z powodu wysokiego zużycia tokenów.
Model wykazuje największe postępy w zadaniach agentowych, osiągając wynik Elo 1656 w GDPval-AA, ale potrzebuje średnio 49 interakcji na zadanie — więcej niż jakikolwiek inny testowany model.
Programowanie pozostaje słabym punktem — model uzyskuje tylko 45 punktów w Artificial Analysis Coding Index, znacznie poniżej konkurentów jak GPT-5.5 (59) czy Claude Opus 4.7 (53).
Współczynnik halucynacji spadł z 92% do 61%, ale wciąż pozostaje wysoki w porównaniu do liderów, którzy osiągają 25%.

Drastyczny wzrost kosztów eksploatacji

Gemini 3.5 Flash reprezentuje radykalną zmianę w strategii cenowej Google. Podczas gdy poprzednie modele Flash były pozycjonowane jako tańsza alternatywa dla modeli Pro, najnowsza wersja łamie ten schemat. Cena za token wzrosła trzykrotnie, a dodatkowo model zużywa znacznie więcej tokenów podczas pracy.

Szczególnie problematyczne jest zużycie tokenów w zadaniach agentowych. Gemini 3.5 Flash potrzebuje średnio 49 interakcji na zadanie, podczas gdy konkurencyjny GPT-5.4 wymaga tylko 40, a własny model Pro Google'a — zaledwie 23. To prowadzi do sytuacji, gdzie pomimo niższych cen za token, całkowite koszty przewyższają droższe modele.

Google podąża za trendem ustanowionym przez konkurentów. Anthropic podniósł ukryte koszty Opus 4.7 o 30–40% w stosunku do poprzednika poprzez wyższe zużycie tokenów, podczas gdy OpenAI zwiększył ceny GPT-5.5 o 50–90% w porównaniu do wersji 5.4, podnosząc bazowe ceny przy jednoczesnym obniżeniu zużycia tokenów.

Mocne strony w zadaniach agentowych, słabości w kodowaniu

Największe ulepszenia Gemini 3.5 Flash dotyczą zadań agentowych, które historycznie były słabością modeli Gemini. W teście GDPval-AA, który ocenia rzeczywiste zadania agentowe z dostępem do internetu i terminala, model osiągnął wynik 1656 punktów Elo. To ogromny skok w porównaniu z 1204 punktami Gemini 3 Flash i 1314 punktami Gemini 3.1 Pro.

Paradoksalnie, programowanie — jeden z najważniejszych przypadków użycia dla szybkich i wydajnych modeli AI — pozostaje słabym punktem. Z wynikiem 45 punktów w Artificial Analysis Coding Index, Gemini 3.5 Flash wypada gorzej niż własny model Pro Google'a (55 punktów) i znacznie słabiej od liderów jak GPT-5.5 (59) czy Claude Opus 4.7 (53).

W ogólnym indeksie inteligencji model osiąga 55 punktów, wyprzedzając Grok 4.3 (53) i Claude Sonnet 4.6 (52). Współczynnik halucynacji spadł znacząco z 92% do 61%, ale nadal pozostaje wysoki w porównaniu do najlepszych modeli, które osiągają zaledwie 25%.

Nowy Gemini 3.5 Flash pokazuje, jak branża AI zmierza w stronę droższych, ale bardziej wyspecjalizowanych modeli, gdzie kluczowa staje się efektywność wykorzystania tokenów, a nie tylko ich cena.

#tokeny #ceny modeli AI #Gemini 3.5 Flash #zadania agentowe #Google

Udostępnij

Źródła

The Decoder

Poprzedni

Cloudflare testuje Mythos Preview od Anthropic — model wykrywa łańcuchy exploitów pomijane przez wcześniejsze AI

Następny

Grok nie radzi sobie na rynku — rządowe dane ujawniają problemy chatbota Muska

Podobne Publikacje

Badania i Nauka

Auto-FL-Research: Agenty AI automatyzują poszukiwanie algorytmów uczenia federacyjnego

Badacze opracowali system agentów AI, który automatycznie projektuje i testuje algorytmy uczenia federacyjnego, przyspieszając rozwój tej kluczowej technologii.

4 min3 lipca

Modele AI

Współzałożyciel OpenAI wizjonuje przyszłość bez interfejsów, gdzie nikt nie uczy się oprogramowania

Greg Brockman z OpenAI przedstawia wizję niewidzialnego AI, które eliminuje potrzebę nauki oprogramowania. Wtyczki ChatGPT z 2023 roku okazały się niepowodzeniem.

3 min4 lipca

Narzędzia i Aplikacje

SpaceX ma prototyp urządzenia AI przypominającego smartfona

SpaceX zaprezentowało inwestorom prototyp urządzenia AI smuklejszego od iPhone'a, konkurując z projektem OpenAI i Jony Ive.

3 min2 lipca

Kluczowe wnioski

Ceny tokenów wzrosły trzykrotnie — z 0,50 USD do 1,50 USD za milion tokenów wejściowych i z 3,00 USD do 9,00 USD za tokeny wyjściowe.

W testach benchmarkowych całkowite koszty eksploatacji są o 75% wyższe niż w przypadku Gemini 3.1 Pro z powodu wysokiego zużycia tokenów.

Model wykazuje największe postępy w zadaniach agentowych, osiągając wynik Elo 1656 w GDPval-AA, ale potrzebuje średnio 49 interakcji na zadanie — więcej niż jakikolwiek inny testowany model.

Programowanie pozostaje słabym punktem — model uzyskuje tylko 45 punktów w Artificial Analysis Coding Index, znacznie poniżej konkurentów jak GPT-5.5 (59) czy Claude Opus 4.7 (53).

Współczynnik halucynacji spadł z 92% do 61%, ale wciąż pozostaje wysoki w porównaniu do liderów, którzy osiągają 25%.

Drastyczny wzrost kosztów eksploatacji

Mocne strony w zadaniach agentowych, słabości w kodowaniu