В начале этого года весь мир обсуждал DeepSeek. Это только первая ласточка и верхушка айсберга результатов работы системы поддержки open source в Китае. Уже очень скоро их системный подход начнет приносить интересные результаты.
О преимуществах и особенностях китайского подхода к развитию open source на Scientific Open source Meetup 2025, организованном при участии ИТМО, GitVerse и OpenScaler, рассказывал Олег Сиротюк, лидер сообщества OpenScaler. Та же тема активно обсуждалась во время круглого стола. В этой статье пересказываем основные идеи обсуждения.

Феномен DeepSeek
Кажется, сегодня все знают, что такое DeepSeek. Эта большая языковая модель буквально взорвала мир. Ее выпустила небольшая китайская компания, которая была создана в 2020 году. Причем, это не крупный холдинг, не государственная инициатива, а полноценный стартап, в который инвестировал человек, верящий в искусственный интеллект. Компания состоит из людей, которые родились, учились и работали только в Китае. Там нет ни одного специалиста, который получал бы образование на Западе.
Компания выпускала свои модели на протяжении трех лет, но в конце прошлого ― начале этого года они стали известны на весь мир. Сначала в декабре 2024 появился DeepSeek v3 ― LLM, которая по своим характеристикам не уступает основным западным аналогам. А в начале этого года вышел DeepSeek R1 ― рассуждающая модель, которая обрушила акции NVidia, поскольку китайцы заявили, что для обучения и использования модели требуется на порядок меньше ресурсов. Они смогли разработать такие оптимизационные механизмы, которые позволили обучать модели и использовать их на куда меньшем объеме железа (в 10 раз меньше NVidia).
Но самое важное: DeepSeek не планирует закрывать свой код. Наоборот, они выкладывают все исходные коды и веса в открытый доступ ― это полноценный open source.
Естественно, феномен DeepSeek тут же начали анализировать западные коллеги. Ян Лекун, вице-президент компании Meta (признана в России экстремистской организацией и запрещена) и лауреат премии Тьюринга, высказался, что дело не в победе китайской нейросети над американской. По его мнению, суть в том, что открытые модели победили закрытые. Через некоторое время это мнение подтвердил Сэм Альтман, генеральный директор компании OpenAI. Дело в том, что до GPT3 OpenAI также выпускал открытые модели, но начиная с третьей версии продукт был закрыт. Специалист признался, что, судя по успеху DeepSeek, компания оказалась не с той стороны истории.
Иными словами, именно открытый исходный код ― основной драйвер революции в экосистеме искусственного интеллекта. И DeepSeek тому хорошее подтверждение.
Open source имеет ряд неоспоримых преимуществ:
Границы стираются. Любой человек, размещая свой проект, может рассчитывать, что к нему подключатся люди со всего мира. Мы не ограничены в развитии одной компанией.
Технологии для всех. Возможность загрузить код, улучшить его, запустить и получить результат вдохновляет людей.
Скорость прогресса. Open source помогает консолидировать серьезный интеллектуальный потенциал в одном проекте. Благодаря этому мы получаем результаты быстро ― намного быстрее, чем в случае одной команды, даже если это OpenAI с его невероятными бюджетами.
Получается, DeepSeek ― не чудо, а закономерный результат выстроенной в Китае системы поддержки open source проектов в области искусственного интеллекта.
Как организована такая поддержка
В 2020 году в ответ на западные санкции против Huawei крупные китайские компании при поддержке государства создали фонд OpenAtom. Правительство страны задумалось о том, насколько глубоко китайская ИТ-индустрия зависит от американских технологий. И на тот момент зависимость была довольно высокой, что побудило начать процесс импортозамещения, в том числе железа и open source. Фонд OpenAtom стал одной из инициатив в рамках этого импортозамещения. Помимо государства в нем участвуют донатами крупные компании.
Перед фондом поставили две основные задачи:
Поддержать развитие ключевых для Китая проектов ― ОС, БД, моделей ИИ и так далее ― тех, которые нельзя сделать в одиночку, где нужно сосредоточение усилий, чтобы реализовать все быстро и относительно дешево.
Выстроить систему подготовки специалистов буквально с уровня школы и студенчества.
По обоим направлениям за прошедшие годы OpenAtom продвинулся достаточно далеко.
Фонд курирует обучение школьников и студентов ― им рассказывают, что такое open source, как организована работа внутри и какие выгоды для себя можно получить с его помощью. Параллельно он помогает командам молодых специалистов развивать open source проекты ― дает для этого все необходимые ресурсы, предоставляет множество сервисов, закрывающих те вопросы, которыми разработчики обычно не хотят заниматься: обеспечивает юридическую поддержку, организует мероприятия, выстраивает сообщество и тому подобное. При этом он, естественно, контролирует целевое расходование средств.
Проекты в области искусственного интеллекта не могут развиваться без вычислительных мощностей. Чтобы сделать их доступнее, китайцы запустили сеть так называемых центров коллективного использования. Это очень крупные вычислительные центры ― порядка петафлопс и даже экзафлопс ― где мощности дотируются государством, то есть предоставляются желающим практически бесплатно. На этих мощностях молодые компании могут тестировать свои проекты и гипотезы.
Импортозамещается в Китае не только open source, но и железо, точнее железо NVidia ― это история уже за рамками фонда OpenAtom. Одна из ключевых компаний, которая обеспечивает это импортозамещение, ― Huawei, выпускающая чипы Ascent, линейку продуктов Atlas. И на сегодняшний день уже каждые три чипа из четырех в Китае выпущены этой компанией.
Понятно, что для китайских игроков их собственная аппаратная платформа в приоритете. Это касается не только моделей ИИ, но и в целом open source проектов, например openEuler ― ключевого дистрибутива Linux в Китае с сообществом более 20 тыс. участников и 1800 коммерческих организаций.
Основные ИИ-игроки в Китае
При таких начальных данных стоит ожидать результаты ― очень внимательно следить за тем, что происходит в области искусственного интеллекта в Китае, в ближайшее время там будет много всего интересного.
DeepSeek ― только первая ласточка:
https://github.com/deepseek-ai ― исходные коды проекта;
https://chat.deepseek.com/ ― чат с нейросетью.
Qwen ― целая линейка моделей, разработанная корпорацией Alibaba. Это одни из мощнейших моделей ИИ в Китае, которые выкладываются на GitHub. Они первые поддержали миллион токенов (то есть слов, которые может сформулировать нейросеть).
https://github.com/QwenLM ― исходные коды проекта;
https://chat.qwen.ai/ ― это веб-интерфейс, где можно попробовать поработать с нейросетью.
Кстати, Qwen уже очень популярна в России. Т-Банк выпустил свою модель на ее основе.
MoonshotAI ― очень интересный стартап, напоминающий DeepSeek. Его основной продукт ― Kimi. Из перечисленных проектов этот пока единственный, кто умеет переваривать веб-ссылки. Модель можно попросить, например сделать обзор на статью.
ByteDance ― это компания, которая сделала TikTok. И хотя их выгнали из США, в Китае это основная соцсеть под названием DaoBao. Помимо своей социальной сети, ByteDance активно развивает самые разнообразные нейромодели. Это как LLM, так и генерация видео, картинок и работа со звуком. Интересны они тем, что у них огромный «молодежный» датасет, собранный с TikTok, и внушительная клиентская база.
В прошлом году по показателю MAO (monthly active users, количество активных пользователей в месяц) DaoBao была на первом месте в Китае с более 15 млн. пользователей.
Можно также отдельно выделить экосистему Modelers, созданную компанией Huawei (построенную на ее вычислительных мощностях). Так или иначе все китайские компании поддерживают эту экосистему в приоритетном порядке, поскольку речь идет о железе собственного производства.
У Modelers есть хороший англоязычный интерфейс, много quick start документации, бесплатная регистрация, песочницы.
Вместо итогов
Мир open source сейчас позволяет попробовать разные сетки. Экспериментируйте и развивайте свои идеи.
Исследуйте чужие open source проекты. И не надо смущаться того, что это действительно большие языковые модели. DeepSeek ― это 670 млрд токенов, но не надо думать, что никогда не найдется достаточно вычислительных мощностей для работы с подобными сетями. Обратите внимание на три термина:
дистилляция;
сериализация;
merge kit.
Это тренды в мире искусственного интеллекта. Многие компании сейчас работают над тем, чтобы запускать нейросети на достаточно скромном оборудовании, добиваясь при этом хороших результатов.
Еще одна рекомендация ― Ollama ― это простой инструмент, который позволяет развернуть нейросеть на вашем локальном компьютере, обращаясь к ней как к веб-серверу.
Дополнительные материалы
Про опенсорс в ИТМО
Канал и чат про научный опенсорс в Telegram: @scientific_opensource