1 artykuł z tym tagiem
Nowy model ZAYA1–8B z 700M aktywnych parametrów osiąga 91,9% na AIME'25, konkurując z większymi modelami jak GPT-5-High dzięki architekturze MoE++.