Как стать автором
Обновить
87.74
ИТМО
IT's MOre than a University

Как организована поддержка open-source ИИ-проектов в Китае

Время на прочтение6 мин
Количество просмотров868

В начале этого года весь мир обсуждал DeepSeek. Это только первая ласточка и верхушка айсберга результатов работы системы поддержки open source в Китае. Уже очень скоро их системный подход начнет приносить интересные результаты. 

О преимуществах и особенностях китайского подхода к развитию open source на Scientific Open source Meetup 2025, организованном при участии ИТМО, GitVerse и OpenScaler, рассказывал Олег Сиротюк, лидер сообщества OpenScaler. Та же тема активно обсуждалась во время круглого стола. В этой статье пересказываем основные идеи обсуждения.

Scientific Open source Meetup 2025 в Петербурге
Scientific Open source Meetup 2025 в Петербурге

Феномен DeepSeek

Кажется, сегодня все знают, что такое DeepSeek. Эта большая языковая модель буквально взорвала мир. Ее выпустила небольшая китайская компания, которая была создана в 2020 году. Причем, это не крупный холдинг, не государственная инициатива, а полноценный стартап, в который инвестировал человек, верящий в искусственный интеллект. Компания состоит из людей, которые родились, учились и работали только в Китае. Там нет ни одного специалиста, который получал бы образование на Западе.

Компания выпускала свои модели на протяжении трех лет, но в конце прошлого ― начале этого года они стали известны на весь мир. Сначала в декабре 2024 появился DeepSeek v3 ― LLM, которая по своим характеристикам не уступает основным западным аналогам. А в начале этого года вышел DeepSeek R1 ― рассуждающая модель, которая обрушила акции NVidia, поскольку китайцы заявили, что для обучения и использования модели требуется на порядок меньше ресурсов. Они смогли разработать такие оптимизационные механизмы, которые позволили обучать модели и использовать их на куда меньшем объеме железа (в 10 раз меньше NVidia).

Но самое важное: DeepSeek не планирует закрывать свой код. Наоборот, они выкладывают все исходные коды и веса в открытый доступ ― это полноценный open source.

Естественно, феномен DeepSeek тут же начали анализировать западные коллеги. Ян Лекун, вице-президент компании Meta (признана в России экстремистской организацией и запрещена) и лауреат премии Тьюринга, высказался, что дело не в победе китайской нейросети над американской. По его мнению, суть в том, что открытые модели победили закрытые. Через некоторое время это мнение подтвердил Сэм Альтман, генеральный директор компании OpenAI. Дело в том, что до GPT3 OpenAI также выпускал открытые модели, но начиная с третьей версии продукт был закрыт. Специалист признался, что, судя по успеху DeepSeek, компания оказалась не с той стороны истории. 

Иными словами, именно открытый исходный код ― основной драйвер революции в экосистеме искусственного интеллекта. И DeepSeek тому хорошее подтверждение.

Open source имеет ряд неоспоримых преимуществ:

  • Границы стираются. Любой человек, размещая свой проект, может рассчитывать, что к нему подключатся люди со всего мира. Мы не ограничены в развитии одной компанией.

  • Технологии для всех. Возможность загрузить код, улучшить его, запустить и получить результат вдохновляет людей.

  • Скорость прогресса. Open source помогает консолидировать серьезный интеллектуальный потенциал в одном проекте. Благодаря этому мы получаем результаты быстро ― намного быстрее, чем в случае одной команды, даже если это OpenAI с его невероятными бюджетами.

Получается, DeepSeek ― не чудо, а закономерный результат выстроенной в Китае системы поддержки open source проектов в области искусственного интеллекта.

Как организована такая поддержка

В 2020 году в ответ на западные санкции против Huawei крупные китайские компании при поддержке государства создали фонд OpenAtom. Правительство страны задумалось о том, насколько глубоко китайская ИТ-индустрия зависит от американских технологий. И на тот момент зависимость была довольно высокой, что побудило начать процесс импортозамещения, в том числе железа и open source. Фонд OpenAtom стал одной из инициатив в рамках этого импортозамещения. Помимо государства в нем участвуют донатами крупные компании.

Перед фондом поставили две основные задачи:

  • Поддержать развитие ключевых для Китая проектов ― ОС, БД, моделей ИИ и так далее ― тех, которые нельзя сделать в одиночку, где нужно сосредоточение усилий, чтобы реализовать все быстро и относительно дешево.

  • Выстроить систему подготовки специалистов буквально с уровня школы и студенчества. 

По обоим направлениям за прошедшие годы OpenAtom продвинулся достаточно далеко.

Фонд курирует обучение школьников и студентов ― им рассказывают, что такое open source, как организована работа внутри и какие выгоды для себя можно получить с его помощью. Параллельно он помогает командам молодых специалистов развивать open source проекты ― дает для этого все необходимые ресурсы, предоставляет множество сервисов, закрывающих те вопросы, которыми разработчики обычно не хотят заниматься: обеспечивает юридическую поддержку, организует мероприятия, выстраивает сообщество и тому подобное. При этом он, естественно, контролирует целевое расходование средств.

Проекты в области искусственного интеллекта не могут развиваться без вычислительных мощностей. Чтобы сделать их доступнее, китайцы запустили сеть так называемых центров коллективного использования. Это очень крупные вычислительные центры ― порядка петафлопс и даже экзафлопс ― где мощности дотируются государством, то есть предоставляются желающим практически бесплатно. На этих мощностях молодые компании могут тестировать свои проекты и гипотезы.

Импортозамещается в Китае не только open source, но и железо, точнее железо NVidia ― это история уже за рамками фонда OpenAtom. Одна из ключевых компаний, которая обеспечивает это импортозамещение, ― Huawei, выпускающая чипы Ascent, линейку продуктов Atlas. И на сегодняшний день уже каждые три чипа из четырех в Китае выпущены этой компанией.

Понятно, что для китайских игроков их собственная аппаратная платформа в приоритете. Это касается не только моделей ИИ, но и в целом open source проектов, например openEuler ― ключевого дистрибутива Linux в Китае с сообществом более 20 тыс. участников и 1800 коммерческих организаций.

Основные ИИ-игроки в Китае

При таких начальных данных стоит ожидать результаты ― очень внимательно следить за тем, что происходит в области искусственного интеллекта в Китае, в ближайшее время там будет много всего интересного.

DeepSeek ― только первая ласточка:

Qwen ― целая линейка моделей, разработанная корпорацией Alibaba. Это одни из мощнейших моделей ИИ в Китае, которые выкладываются на GitHub. Они первые поддержали миллион токенов (то есть слов, которые может сформулировать нейросеть).

Кстати, Qwen уже очень популярна в России. Т-Банк выпустил свою модель на ее основе.

MoonshotAI ― очень интересный стартап, напоминающий DeepSeek. Его основной продукт ― Kimi. Из перечисленных проектов этот пока единственный, кто умеет переваривать веб-ссылки. Модель можно попросить, например сделать обзор на статью.

ByteDance ― это компания, которая сделала TikTok. И хотя их выгнали из США, в Китае это основная соцсеть под названием DaoBao. Помимо своей социальной сети, ByteDance активно развивает самые разнообразные нейромодели. Это как LLM, так и генерация видео, картинок и работа со звуком. Интересны они тем, что у них огромный «молодежный» датасет, собранный с TikTok, и внушительная клиентская база.

В прошлом году по показателю MAO (monthly active users, количество активных пользователей в месяц) DaoBao была на первом месте в Китае с более 15 млн. пользователей.

Можно также отдельно выделить экосистему Modelers, созданную компанией Huawei (построенную на ее вычислительных мощностях). Так или иначе все китайские компании поддерживают эту экосистему в приоритетном порядке, поскольку речь идет о железе собственного производства.

У Modelers есть хороший англоязычный интерфейс, много quick start документации, бесплатная регистрация, песочницы.

Вместо итогов

Мир open source сейчас позволяет попробовать разные сетки. Экспериментируйте и развивайте свои идеи.

Исследуйте чужие open source проекты. И не надо смущаться того, что это действительно большие языковые модели. DeepSeek ― это 670 млрд токенов, но не надо думать, что никогда не найдется достаточно вычислительных мощностей для работы с подобными сетями. Обратите внимание на три термина:

  • дистилляция;

  • сериализация;

  • merge kit.

Это тренды в мире искусственного интеллекта. Многие компании сейчас работают над тем, чтобы запускать нейросети на достаточно скромном оборудовании, добиваясь при этом хороших результатов.

Еще одна рекомендация ― Ollama ― это простой инструмент, который позволяет развернуть нейросеть на вашем локальном компьютере, обращаясь к ней как к веб-серверу.

Дополнительные материалы

Про опенсорс в ИТМО

Канал и чат про научный опенсорс в Telegram: @scientific_opensource

Теги:
Хабы:
+10
Комментарии2

Публикации

Информация

Сайт
itmo.ru
Дата регистрации
Дата основания
Численность
Неизвестно
Местоположение
Россия
Представитель
itmo

Истории