На вопрос ИТ-директора, что есть вместо NVIDIA H100, в 2026 году приходит десяток разных ответов - от «всё импортозаместили» до «ничего нет». Реальность посередине: универсального ответа на «чем заменить H100» в России нет, но несколько рабочих направлений всё-таки есть.
С 2022 года официальные поставки NVIDIA ограничены, и компании ищут российские альтернативы NVIDIA по четырём направлениям: отечественные чипы, параллельный импорт NVIDIA, китайские ускорители (Huawei Ascend, Cambricon), западные не-NVIDIA (AMD Instinct, Intel Gaudi). У каждого пути свои зрелые сценарии.
Контекст: почему ищут альтернативы NVIDIA
Под ограничения попали дата-центровые ускорители - A100, H100, H200, L40S, B200, в меньшей степени RTX. Напрямую у вендора их купить нельзя, гарантии и поддержки от NVIDIA для российских юрлиц нет. Параллельный импорт закрывает эту дыру: всё перечисленное в России есть, цены выше мировых на 20–40%, гарантию даёт российский интегратор.
Но «возможно купить» не равно «можно использовать в любом сценарии». Для КИИ, ГИС и компаний с требованиями по импортозамещению иностранные GPU обычно не подходят: нужны изделия из реестра российского ПО и с сертификацией ФСТЭК. Для обычной коммерческой компании выбор шире, и решение зависит от того, что важнее - быстрый старт на знакомом стеке, минимальная стоимость или долгосрочная независимость от вендора. Под каждую цель подходят разные ускорители.
Что есть в России: реальная картина
Российские чипы, что есть прямо сейчас
Эльбрус и Байкал - это CPU, не GPU. В роли ускорителя для нейросетей они не подходят: матричные вычисления ложатся на специализированный кремний.
Из российских NPU реально работает NeuroMatrix от НТЦ «Модуль» в видеоаналитике и edge-AI, под фиксированный набор моделей. Под обучение крупных языковых моделей не годится: не та категория производительности. В своей нише он сертифицирован и применяется под жёсткие регуляторные требования.
ИВА Технологии и другие разработки серверных GPU класса H100 заявлены, но на момент публикации массово доступных моделей нет. Прототипы есть, серийная поставка - пока нет. Итог: российских GPU дата-центрового класса, готовых заменить H100, на рынке сегодня нет. Edge-NPU для узких задач - есть.
Российские серверы и платформы без своего ускорителя
Aquarius, Yadro, Rikor, Kraftway, Delta Computers - серверные платформы из реестра Минцифры, проходят сертификацию ФСТЭК. GPU в них ставится та же NVIDIA через параллельный импорт. «Российский сервер с NVIDIA H100» - это про шасси, БП, корпус и интеграцию, а не про чип-ускоритель.
Для коммерческих компаний это понятный путь: платформа из реестра плюс GPU как комплектующее. Для жёсткого КИИ нужно смотреть, что разрешает регулятор: иногда требуется отечественный ускоритель, и выбор сужается до edge-NPU.
Параллельный импорт NVIDIA как основной канал
Параллельный импорт NVIDIA - самый предсказуемый способ получить дата-центровое ИИ-железо в России сегодня. Через интеграторов завозится почти вся актуальная линейка: A100, H100 в исполнениях SXM и PCIe, H200, L40S, RTX 4090 и 5090, готовые HGX-платформы. B200 поступает с задержкой относительно мирового релиза.
Гарантия идёт от интегратора (обычно 1–3 года), драйверы и софт с сайта NVIDIA. Цены выше мировых на 20–40% за счёт логистики и маржи посредников, цифры меняются неделя к неделе.
Перед покупкой стоит пройтись по четырём пунктам:
- Сверить серийники ускорителя с реестром NVIDIA. Это отсекает контрафакт и серые партии.
- Прогнать ускоритель на стенде под нагрузкой. Несколько часов экономят месяцы ремонта в проде.
- У RTX отдельно проверить отсутствие следов майнинга. На б/у моделях это критично.
- Учесть NVIDIA EULA: использовать консьюмерские RTX в коммерческих ИИ-сервисах формально запрещено - это закрывает RTX-вариант для серьёзного продакшена.
Китайские альтернативы: Huawei, Cambricon и другие
Huawei Ascend, Cambricon и нюансы совместимости
Huawei Ascend 910B и 910C - реальная альтернатива A100 и H100 по чистым вычислениям. На ряде нагрузок сопоставим с H100. В Россию идут через китайских дистрибьюторов и параллельный импорт, поставки регулярные.
Главное «но» - софтверный стек. Ascend работает под CANN, а не CUDA, и это меняет всю экосистему. Готовый код PyTorch и TensorFlow с CUDA-зависимостями запускается частично, нужна адаптация через MindSpore или прослойки совместимости. Готовых модельных репозиториев под Ascend на порядок меньше. Cambricon MLU370 - отдельный путь со стеком NEUWARE, в России нишево, в единичных пилотах.
На условиях анонимности коллеги делятся: пилоты с Ascend в финтехе разворачиваются под китайские локальные LLM (Qwen, DeepSeek, Yi) и под классическую CV-аналитику - детекция объектов, распознавание лиц на проходных, OCR документов. Под массовый набор моделей с Hugging Face переход требует значительных доработок: часть моделей либо не запускается без портирования, либо теряет точность.
Когда китайский ускоритель оправдан:
- Задача стабильная, набор моделей ограничен;
- Есть инженерный ресурс на адаптацию софта;
- Локальное размещение важнее свежей CUDA-экосистемы.
Когда не оправдан:
- R&D с быстрой сменой моделей;
- Обучение из открытых репозиториев без бюджета на портирование;
- Продакшен с зависимостью от vLLM или TensorRT-LLM.
AMD Instinct MI300 и Intel Gaudi
AMD Instinct MI300X - прямой конкурент NVIDIA H100 в дата-центровом ИИ. На ряде LLM-инференс-задач он показывает сопоставимую или лучшую производительность за счёт большого объёма HBM3-памяти: 192 ГБ против 80 ГБ у H100. В Россию идёт через параллельный импорт, объёмы меньше NVIDIA, но завозится.
Главное отличие от китайских ускорителей - софтверный стек: AMD ROCm как аналог CUDA, миграция идёт проще, чем на Ascend. PyTorch и TensorFlow поддерживают ROCm нативно, vLLM и llama.cpp работают стабильно. Для инференса открытых LLM на MI300X уже есть готовые сборки. Слабое место - TensorRT-LLM, который остаётся только под CUDA. Для обучения с нуля переход сложнее: нужно перепроверять CUDA-зависимости в пайплайнах.
Intel Gaudi 2 и Gaudi 3 - третий игрок со своим стеком SynapseAI и поддержкой PyTorch через плагин Habana. По бенчмаркам Gaudi 2 сопоставим с A100 на инференсе крупных моделей, Gaudi 3 заявлен на уровне H100 в части задач. В России почти не представлены: единичные поставки через параллельный импорт, без собственного канала поддержки и инженеров с опытом эксплуатации. На горизонте 2026 года - нишевый выбор для команд, которые сознательно строят инфраструктуру без NVIDIA и AMD.
AMD - самый близкий к NVIDIA путь по принципу работы и при этом независимый от одного вендора. Подходит компаниям, которые хотят диверсифицировать риск и готовы вложить недели или месяцы в адаптацию стека.
Как выбирать в этих условиях
Решение определяется двумя факторами: регуляторными требованиями и готовностью адаптировать софт. Если задача попадает под КИИ, ГИС или госконтракт с требованиями по российскому ПО, выбор узкий: отечественные NPU под видеоаналитику и edge-CV. Полноценные ИИ-нагрузки либо ждут развития рынка, либо строятся через российские платформы с зарубежными ускорителями, если регулятор разрешает.
Для обычной коммерческой задачи - обучение собственных моделей, инференс открытых LLM, классические CV-сценарии - параллельный импорт NVIDIA остаётся самым предсказуемым путём: библиотеки работают, инженеров с CUDA-экспертизой много. Когда сценарий зафиксирован, удобнее смотреть готовые AI-серверы под конкретную задачу: типовые платформы под обучение, инференс и видеоаналитику уже учитывают баланс между ускорителем, CPU, памятью и сетью.
Если задача - снизить вендорную зависимость, в шорт-лист попадают AMD Instinct с ROCm и Huawei Ascend под локальные сценарии. Гибрид часто оказывается оптимальным: NVIDIA для R&D и быстрых пилотов, AMD или Ascend в проде на отработанных моделях. Единственное, что работает точно - пилот на своих данных и моделях до закупки.
Чего точно не делать
Не меньшую цену имеют решения, которых стоит избегать. Четыре антипаттерна:
- Покупать «российскую альтернативу» по презентации, без публичных характеристик и подтверждённого пилота. Тестовый стенд от вендора - обязательное условие.
- Брать единственный экземпляр редкого ускорителя в продакшен. При выходе из строя замены ждут месяцами. Минимум - резервный узел или контракт на горячую замену.
- Считать, что Ascend или AMD ровно заменят NVIDIA в существующем коде. Адаптация требуется почти всегда и занимает недели или месяцы.
- Игнорировать NVIDIA EULA при покупке RTX через параллельный импорт. Для коммерческого ИИ-сервиса это юридический риск.
Заключение
Российских GPU класса NVIDIA H100 в свободной продаже сегодня нет, и эта точка отсчёта не изменится в ближайший год.
Практический порядок действий: зафиксировать сценарий и регуляторные требования, сузить шорт-лист до двух-трёх ускорителей, провести пилот, посчитать TCO на 3–5 лет с учётом адаптации софта. Если речь идёт не о точечной замене одного ускорителя, а о пересборке AI-инфраструктуры под регуляторные требования, экономнее закрыть это как импортозамещение серверной инфраструктуры - единый проект с подрядчиком, общий TCO и одна точка ответственности.