NVIDIA запускает GPU-ускоренные конечные точки для модели Kimi K2.5 от Moonshot AI
Jessie A Ellis 23:11, 4 февраля 2026
NVIDIA теперь предлагает бесплатный GPU-ускоренный доступ к API для Kimi K2.5, мультимодальной ИИ-модели с 1T параметрами, 384 экспертами и длиной контекста 262K для разработчиков.
NVIDIA развернула GPU-ускоренные конечные точки для Kimi K2.5 от Moonshot AI, предоставив разработчикам бесплатный доступ к API одной из самых продвинутых мультимодальных моделей с открытым исходным кодом, доступных в настоящее время. Интеграция, объявленная 4 февраля 2026 года, позиционирует модель с 1 триллионом параметров для быстрого корпоративного внедрения через платформу build.nvidia.com от NVIDIA.
Kimi K2.5 обладает серьезными техническими характеристиками, важными для производственных развертываний. Модель использует архитектуру Mixture-of-Experts с 384 экспертами, активируя всего 32,86 миллиарда параметров на токен — коэффициент активации 3,2%, который поддерживает управляемые затраты на вывод, несмотря на огромное количество параметров. Длина контекста достигает 262 000 токенов, обрабатывая существенный анализ документов и расширенные диалоги.
Визуальные возможности заслуживают внимания. Moonshot создала пользовательскую MoonViT3d Vision Tower, которая обрабатывает изображения и видеокадры в эмбеддинги, поддерживаемые словарем из 164 000 токенов, содержащим специфичные для визуализации токены. Это не надстроенная мультимодальность — она встроена в архитектуру.
Что получают разработчики
Бесплатный доступ к прототипированию через программу для разработчиков NVIDIA означает, что команды могут тестировать производственные рабочие нагрузки перед развертыванием инфраструктуры. API следует паттернам, совместимым с OpenAI, включая поддержку вызова инструментов для агентных рабочих процессов. Микросервисы NVIDIA NIM для контейнеризованного производственного вывода находятся в разработке, хотя конкретных сроков не предоставлено.
Для самостоятельно размещенных развертываний интеграция vLLM готова прямо сейчас. NVIDIA также подтвердила поддержку тонкой настройки через фреймворк NeMo с открытым исходным кодом, используя NeMo AutoModel для настройки модели непосредственно из контрольных точек Hugging Face без этапов конвертации.
Рыночный контекст
Moonshot AI выпустила Kimi K2.5 27 января 2026 года, обучив её на приблизительно 15 триллионах смешанных визуальных и текстовых токенов, построенных на основе более ранней версии K2. Модель вызвала прямые сравнения с Gemini 3 Pro от Google, показав конкурентные результаты, включая 78,5% в тестах визуального понимания MMMU-Pro и 76,8% в SWE-Bench Verified для задач кодирования.
Одна отличительная особенность: механизм "Agent Swarm", который координирует до 100 параллельных субагентов, сокращая время выполнения в 4,5 раза по сравнению с одноагентными подходами. Для предприятий, создающих сложные автономные системы, это значимый функциональный разрыв.
Поддержка архитектуры Blackwell от NVIDIA предполагает, что компания рассматривает Kimi K2.5 как серьезного конкурента в корпоративных развертываниях ИИ. Разработчики могут получить доступ к модели немедленно через build.nvidia.com или через платформу Kimi API непосредственно от Moonshot.
Источник изображения: Shutterstock- nvidia
- kimi k2.5
- moonshot ai
- мультимодальный ИИ
- gpu вычисления


