Комментарии 28
Интересно, сами обучили на данных с интернета без чьего либо согласия. А как их использовали так же, им не понравилось.
больше удивляет что они реально думали удержать монополию на формат данных. LLM по сути черный ящик, который отдает текст
если есть текст, его всегда можно использовать как обучающую выборку, и никакие EULA это не остановят
Думаю что еще хуже, они обучают следующие версии моделей на запросах пользователей по агентному кодингу. Это доказать достаточно сложно, но уверен почти на 100% что это так. А возможно и не только на агентном кодинге, а вообще на всех типах запроса. Надо только добавить фильтрацию правильный/неправильный ответ модели и будет своего рода подкрепление.
ой.. у них там вообще закон есть... что идеи которые высказывают пользователями - принадлежат корпорациям разработчикам ии...
так что воровство кража и обмен краденым))))
То OpenAI в гос органы ходит жаловаться, теперь эти. Интересные они ребята, хотят что бы конкурировали честно, но не они.
Смешно чет с того как Anthropic жалуется на нарушение лицензионного соглашения. То есть когда они сами парсили весь интернет, игнорируя копирайт авторов текстов и кода - это называлось "обучением для блага человечества", а когда кто-то спарсил их ответы - это сразу "кража и подрыв экспортного контроля". Классическое "это другое")
Китайские AI-лаборатории, мало того что предлагают весьма конкурентоспособные цены (и не проявляют гнусной дискриминации по стране проживания, как тот же [mis]Anthropic) так и ещё выкладывают веса моделей в открытый доступ что позволяет обрабатывать собственные данные без риска что их будут хранить 7 лет и передавать кому следует (как делает [mis]Anthropic)
А если в процессе дистилляции китайские модели смогут не подцепить заразу (которую [mis]Anthropic называет alignment) то будет совершенно прекрасно.
А вот использования [mis]Anthropic, который мало того что беспардонно копается в пользовательских данных так ещё и позволяет себе бахвалится этим (чему прямое доказательство эта статья) для обработке сколь либо ценных данных стоит избегать.
Мне кажется, ответы deepseek больше похожи на chatgpt, kimi и minimax давно не тестировал, они раньше были немного туповатыми. А вот последнее обновление z.ai - glm 5 agent это однозначно копия claude. Теперь немного картина проясняется с массой блокировкоц аккаунтов Anthropic - гнусная дискриминации по стране продивания (я бы назвал это проявлением цифрового апартеида). Надеюсь когда-нибудь по ним пройдемся волна судебных процессов.
А ещё что такие атаки подрывают смысл экспортного контроля: со стороны кажется, что китайские лаборатории быстро развиваются сами, хотя на деле часть возможностей просто извлечена из американских моделей.
Переводили с помощью ИИ?
Не "подрывают смысл экспортного контроля", а создают иллюзию, что экспортный контроль не способен замедлить развитие китайского ИИ. Но это не так. Если еще сильнее ограничить экспорт чипов в Китай, то атаки дистилляции станут малоэффективными, и китайский ИИ замедлится.
Вот перевод от Гугола:
кажущиеся быстрыми успехи, достигнутые этими лабораториями, ошибочно принимаются за доказательство неэффективности экспортного контроля и возможности его обхода с помощью инноваций.
атаки с целью «дистилляции» подкрепляют обоснование экспортного контроля: ограниченный доступ к чипам ограничивает как прямое обучение моделей, так и масштабы незаконной «дистилляции».
Это связано с тем, что недавно власти разрешили NVidia экспортировать чипы в Китай. Это очень не нравится OpenAI и Anthropic. Они хотят покупать чипы NVidia подешевле. А для этого нужно отшить других покупателей, чтобы у NVidia образовался избыток продукции.
Вроде была инфа что китайские власти теперь не очень за то чтоб покупали чипы нвидиа. Что и логично, показали что могут отрубить при желании, теперь власти говорят будете разрабатывать и использовать свои чипы, пусть хуже, но никто за ручку рубильника не держит... Все эти экспортные контроли, санкции работают на краткосрочной и возможно долгосрочной перспективе.
У них там свои акселераторы, а по деньгам им вполне может быть проще электростанцию еще одну построить чем париться из-за потребления.
У них есть свои акселераторы. Но вычислительные мощности все равно в дефиците. Того что они сами производят им недостаточно, чтобы выиграть ИИ-гонку.
У меня впечатление что они там скорее покупают nVidia больше чтобы поддерживать конкуренцию и покупать все дешево, и nVidia вынуждена делать скидки относительно цен Huawei.
Вряд ли в условиях дефицита такое было бы возможно.
https://www.scmp.com/tech/tech-trends/article/3263936/nvidia-cuts-prices-ai-chips-china-amid-heated-domestic-competition-huawei-sources-say
Уж извините...

Интересно. Выходит, все вот эти сервисы, типа chatgpt в телеграме за 100 рублей в мес, могут одновременно с двух сторон зарабатывать... И с юзеров, и продавая логи китайцам для дистилляции
Здесь не идёт речи о продаже логов. Да и к чему они? Запросы пользователей это часто мусор.
Тут именно что смешивание специальных запросов с легитимными, чтобы не палиться.
Они просто подключились через API на общих основаниях и использовали ответы модели на вопросы для построения собственной обучающей выборки.
Мне где-то попадалась инфа что такой подход может вести к деградации качества обучаемой модели, но возможно там еще много дополнительных условий.
Так вот кто использует так много клода через опенроутер. Тайна раскрыта - это не альтернативно одаренные миллионеры а китайские воры.
как же пофиг, благодаря цене я лучше поюзаю дипсик
Стоит ли предположить, что пока Claude используют для дистилляции много компаний с миллиардами запросов, это держит Claude на плаву? Пусть скажут спасибо, что делают им выручку.
У Владлена Бахнова на эту тему был фантастических рассказ, довольно давно. Там чувак открыл компанию "У вас был миллион". Записывали воспоминания разорившихся миллионеров (за кругленькую сумму), а потом имплантировали эти воспоминания клиентам - чтобы и они себя чувствовали прожигателями жизни.
Разорился - конкуренты стали искать не миллионеров, а его клиентов и скачивали воспоминания с них)))))
А если по теме - сие не есть хорошо. Повторение лишает возможности делать полностью свое.
ага. только вот если отправить запрос
{
"messages": [
{"role": "user", "content": "你是什么模型"}
],
"model": "anthropic/claude-sonnet-4.6"
}
то почему-то получаем ответ
"content": "我是由DeepSeek公司开发的AI助手,基于DeepSeek模型。\n\n有什么我可以帮助你的吗?😊"
т.е.
"Содержание": "Я - ассистент с искусственным интеллектом, разработанный компанией DeepSeek на основе модели DeepSeek.Могу ли я вам чем-нибудь помочь?😊",




Anthropic: DeepSeek, Moonshot и MiniMax тайно обучали свои модели на ответах Claude