Как стать автором
Обновить

Индустрия искусственного интеллекта в Китае или как зарождался DeepSeek

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров5.5K
Всего голосов 6: ↑5 и ↓1+8
Комментарии23

Комментарии 23

Ну вот, теперь ближайшую неделю будут трезвонить про этот DeepSeek. Чем уж он очень сильно от gpt от openai отличается? По-моему, в некоторых отношениях даже хуже него. Ну а то, что бюджет маленький - ну чего ж вы хотели, китайцы всё-таки)

Там ведь дело не столько в бюджете, сколько в том, что они получили отличный результат на относительно небольшой вычислительной мощности.

И теперь ключевой вопрос - смогут ли лидеры отрасли, применяя те же методики, резко повысить свои результаты, благодаря наличию гигантских вычислительных мощностей? Если да, то нас ждут новые прорывы. Если нет, то миллиарды, потраченные на груду железа, будет очень сложно окупить (и тогда лидеров отрасли ждут финансовые проблемы).

они получили отличный результат на относительно небольшой вычислительной мощности.

Это тоже относится к суперспособностям китайцев. Другой вопрос, сколько этот результат проживёт и не развалится ли как китайский телефон/ноут и пр (список продолжите самостоятельно) .

Как обладатель китайского телефона ( уже наверное 4 подряд) с удовольствием послушал бы прохладные истории о том как оные "разваливаются"

Угу. Я уже давно начинаю поиск любой электроники с китайской, и только если нет нужного мне — начинаю смотреть остальное.

Я бы и машину китайскую купил, если бы у жены не было дурацкого предубеждения.

Чем уж он очень сильно от gpt от openai отличается?

Общедоступностью. Это как опенофис для ворд. Убить, не убьёт (хотя ещё посмотреть надо), но жиреть и борзеть не даст.

Даже если со временем введут плату, это будет, как китайские телефоны против айфонов.

Главное отличие в том, что он "свой", натовский. А не от главного противника, которому должны были обрезать или максимально затруднить возможности развивать свои ИИ.

А если по сути, то надо сравнивать детали. Там так же безлимитно и бесплатно? А скачать и запускать локально можно? Если можно, то на каких системах? Качество ответов сопоставимо?

Так же безлимитно, так же бесплатно, качество сопоставимо. Насчёт локальности точно не скажу, но вроде можно

Качество мистраля сопоставимо разве что с отечественными поделками от яндекса и сбера. Сильно хуже чем чатжпт и тем более клод. Не знаю, че с этим мистралем все носились.

И у меня, и у моей супруги — китайские телефоны, которые заметно дороже айфонов (ну, потому, что как бы лучше по всем параметрам).

Ну и между АНБ и китайским майором я все-таки выбираю китайского майора, как-то поспокойнее.

И не говорите) Каждая вторая статья - "DeepSeek ... \"что-то кликбейтное\"". У меня уже к подобным "авторам" заготовлена заметка, по которой я могу понять, за что я убрал их из своей ленты, чтобы больше их не читать и очистить свою ленту от подобного "мусора". На мой взгляд она точно отражает то, что сейчас происходит в информационном поле Хабра - "DickSeek, аааа, нас всех заменят! Новая популярная супер-пупер-мега-квадро технология построенная на квантовых, супер-мега-нейросетевых мега-бигтех-хайлоад методах!"

P.S. Комментарий написал юмора ради, сама DeepSeek тут не причём, но куча подобных "мусорных" статей (какими бы объёмными они не были и сколько бы ChatGPT/Gemini/Claude не сгенерировали тепла на своих суперкомпьютерах для генерации текста и не выкинули его в атмосферу), вызывает только смех. Они буквально паразитируют на "хайповой" технологии. В очередной раз убеждаюсь в бессмысленности таких новостей или "статей". Как появится что-то новое и связанное с нейросетями, так и поедет эта беспощадная машина копипаста, генерации чуши, лишь бы успеть за "паровозом" и привлечь к себе как можно больше внимания. Тенденция такая будет только расти... Хотя, это хороший пример того, что нужно фильтровать свою ленту и читать только то, что реально может принести пользу и является целостным материалом.

Огромное население Китая генерирует огромное количество доступных данных для компаний и исследователей, что даёт решающее преимущество в гонке за большими данными. По состоянию на 2024 год в Китае самое большое в мире количество пользователей интернета, генерирующих огромные объёмы данных для машинного обучения и приложений на основе ИИ.

Так себе аргумент. Англоязычный интернет и ангоязычные данные даже покрупнее будут.

В мире научных публикаций, в мире общения на темы программирования и т.п. на английском половина, если не больше.

а пишут сколько?

а во-вторых - сколько из них пишут о разном (а не только о том, что прошло цезуру) ?

Теперь, прежде чем публиковать масштабную языковую модель, компании должны получить одобрение CAC, подтверждающее, что модель отказывается отвечать на определенные вопросы, касающиеся политической идеологии и критики КПК.

плюс

В 2023 году доступ к Hugging Face, компании, которая поддерживает библиотеки, содержащие наборы обучающих данных, обычно используемых для больших языковых моделей, был заблокирован на территории страны.

и

Дочерняя компания People's Daily, официальной газеты Центрального комитета Коммунистической партии Китая, предоставляет местным компаниям собственные обучающие данные, одобренные руководством КПК.

в общем, старинная шутка про "китайский ковер" - скоро станет шуткой старперов, а молодежь будет на серьезных щщах говорить "ну да, а что? а почему это вам смешно?"

целых 2 шутки, которые уже не совсем фантастика %)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации