Nowy model AI do kodowania od Cursor osiąga wydajność najlepszych modeli za mniej niż dolara za zadanie, podczas gdy konkurencja kosztuje do 11 USD.

Źródło zdjęcia: The Decoder
Cursor zaprezentował Composer 2.5, nową wersję swojego modelu AI do kodowania, która w testach wydajności dorównuje najnowszym modelom Anthropic i OpenAI, oferując przy tym znacznie niższe koszty. Szczegóły aktualizacji przedstawiono w dokumentacji na The Decoder.
Nowy model został zbudowany na bazie otwartego checkpointa Kimi K2.5 od Moonshot i przeszedł szkolenie na 25-krotnie większej liczbie syntetycznych zadań niż jego poprzednik Composer 2. Firma przeznacczyła 85 procent budżetu obliczeniowego na dodatkowe szkolenie i uczenie ze wzmocnieniem.
Composer 2.5 osiąga porównywalną wydajność z najnowszymi modelami konkurencji przy znacznie niższych kosztach. Podczas gdy zadanie w Composer 2.5 kosztuje mniej niż dolara, konkurencyjna oferta może sięgać nawet jedenastu dolarów za zadanie. Ta różnica cenowa może mieć istotne znaczenie dla deweloperów i firm intensywnie korzystających z narzędzi AI do kodowania.
Szybsza wersja modelu, chociaż droższa od podstawowej, nadal pozostaje konkurencyjna cenowo w porównaniu z ofertą Anthropic i OpenAI, oferując przy tym identyczną wydajność.
Cursor nie poprzestaje na obecnym sukcesie i już pracuje nad znacznie większym następcą modelu. Nowy projekt realizowany jest we współpracy z SpaceX i xAI, wykorzystując dziesięciokrotnie większą moc obliczeniową klastra Colossus-2 z milionem jednostek równoważnych H100.
Warto przypomnieć, że SpaceX wcześniej ogłosiło plany przejęcia Cursor za 60 miliardów dolarów, co wskazuje na strategiczne znaczenie tej technologii dla przyszłych projektów firmy Elona Muska.
Composer 2.5 pokazuje, że efektywne wykorzystanie zasobów obliczeniowych i przemyślana strategia szkolenia mogą prowadzić do modeli równie wydajnych jak te od liderów rynku, ale oferowanych w znacznie bardziej przystępnych cenach.

Chiński startup szykuje rundę 70 mld juanów przy wycenie 45 mld dolarów. Założyciel stawia na badania nad AGI i open-source zamiast szybkich zysków.

Nowy Gemini 3.5 Flash osiąga 280 tokenów na sekundę, ale koszty wzrosły trzykrotnie. W zadaniach agentowych przewyższa nawet droższy model Pro.

Nowe podsumowania AI w Google Search generują pusty blok zamiast definicji słowa 'disregard', podczas gdy Bing dostarcza użyteczne wyniki.