• 1M токенов контекстное окно

• до 2.9× меньше вычислений на длинном контексте

• до 20% быстрее генерация ответов

• открытые веса MIT: можно запускать у себя и встраивать в продукты

• цена API как у GLM-5.1