Nowy model MAI-Image-2.5 zajmuje trzecie miejsce na Arena's text-to-image leaderboard, wprowadzając usprawnienia w renderowaniu tekstu i wizualizacjach.

Źródło zdjęcia: The Decoder
Microsoft wypuścił aktualizację swojego modelu MAI-Image-2.5, który zajmuje trzecie miejsce na liście Arena's text-to-image leaderboard i dorównuje poziomem Google'owi Nano Banana 2. Szczegółowy przegląd nowej wersji znajduje się w raporcie The Decoder.
Według zespołu MAI, nowy model dorównuje Google Nano Banana 2, choć nadal ustępuje OpenAI Image-2. Microsoft określa MAI-Image-2.5 jako najmocniejszy model graficzny w swojej ofercie, wprowadzając znaczące ulepszenia w kilku kluczowych obszarach.
Microsoft podkreśla znaczące postępy MAI-Image-2.5 w porównaniu do MAI-Image-2. Nowa wersja excels w trzech głównych obszarach: renderowaniu tekstu, tworzeniu stylizowanych ilustracji oraz generowaniu wizualizacji komercyjnych.
Według danych z rankingu Arena, MAI-Image-2.5 wyraźnie przewyższa swoich poprzedników we wszystkich ośmiu kategoriach. Szczególnie widoczne usprawnienia dotyczą renderowania tekstu, portretów oraz motywów komercyjnych. Model lepiej interpretuje polecenia użytkowników, co przekłada się na bardziej precyzyjne rezultaty.
Microsoft kieruje MAI-Image-2.5 przede wszystkim do profesjonalnych zastosowań. Firma wskazuje na fotografie produktowe i projektowanie marki jako kluczowe obszary wykorzystania nowego modelu. Usprawnienia w zakresie spójności oświetlenia, głębi i relacji przestrzennych mają szczególne znaczenie dla tego typu aplikacji komercyjnych.
Model jest już dostępny na platformie Arena. Microsoft zapowiada, że w ciągu najbliższych dwóch tygodni MAI-Image-2.5 trafi również do MAI Playground i Foundry, rozszerzając dostępność dla szerszego grona użytkowników.
MAI-Image-2.5 stanowi kolejny krok w rywalizacji między największymi graczami na rynku generatywnej AI, choć OpenAI Image-2 nadal utrzymuje pozycję lidera w tej kategorii.

OpenAI uruchomiło Lockdown Mode dla ChatGPT — nową funkcję zabezpieczającą wrażliwe dane przed atakami prompt injection w firmach i organizacjach.
Projekt wykorzystuje model Qwen2.5–3B do symulacji handlu między leśnymi stworzeniami, demonstrując możliwości małych modeli w systemach wieloagentowych.

Liderzy największych firm AI apelują do Kongresu USA o przepisy regulujące sprzedaż syntetycznego DNA, ostrzegając przed zagrożeniem bioterroryzmu.