denis-19 28 янв в 10:18

TOS DeepSeek: IP-адрес, user-agent, шаблоны нажатий клавиш, информация об устройстве, удаление аккаунта оставляет данные

2 мин

8.7K

Информационная безопасность*Облачные сервисы*Искусственный интеллектМашинное обучение*Управление продуктом*

Комментарии 22

rijbek 28 янв в 10:35

ИИ собирает все данные что может

https://www.youtube.com/watch?v=ik8I9YtPqhY

weirded 28 янв в 11:02

В случае с локальной ollama это ведь неактуально?

AlexeevEugene 28 янв в 14:34

но тогда актуально станет найти лишние 700 Гб GPU RAM

microArt 28 янв в 15:00

Читаю разные телеграм-каналы, так там речь идет о таких запредельных сборах (на всякое военное оборудование, понимаете, о чем я?), что просто диву даешься, и ведь собирают...
А если бы люди умели кооперироваться (аккуратно, без мошенников), то, наверное, можно было бы миллион рублей и на серверок для ИИ собрать. Какой-нибудь, поселкового масштаба, например, который бы знал все привычки жителей одного поселка и помогал бы им разными подсказками. Как думаете, реально это? Вот и сюжет для очередной "Кибердеревни".

А может быть, опять кто-то на "малинке" запустит. Ведь уже запускали же другие модели...

freeExec 28 янв в 15:15

Только надо 30 миллионов, и потом у людей проблемы в коммуникации даже в собственном доме при меньших деньгах.

FantazZzer1 29 янв в 09:10

Да да, тут вопросы по уборке подъезда решаются годами, думаю пока создастся собственный ИИ мир пересоберется заново. Только если у нас в подъезде не живёт Сэм Альтман (думаю он не живёт)

dartraiden 28 янв в 16:40

Какой-нибудь, поселкового масштаба

И мы вновь возвращаемся к той же проблеме приватности, только теперь она станет ещё острее. Одно дело, когда мои запросы читает далёкий китаец или американец, которого я не стыжусь, никогда не увижу и ему до меня дела нет, другое - когда мой сосед, который этот сервер администрирует, и с которым мне ещё потом за руку здороваться и в глаза глядеть (а ещё он, чего доброго, и донос напишет, увидев, как один из жителей спрашивает у ИИ что-то крамольное).

microArt 28 янв в 19:18

Спасибо за ответ. Да, Вы правы же, конечно.

Я тут размышляла немного на эту тему. Допустим, я делаю устройство вроде "умной колонки" и хочу туда подселить какую-нибудь языковую модель. (На самом деле, мне это в жизни не сделать, у меня таких навыков нет). Так вот, я не хочу видеть в таком устройстве какую-нибудь нашу БЯМ, например, Алису или другую от Яндекса, ГигаЧат или другую подобную из наших. По той причине, что вот так ляпнешь что-нибудь сгоряча, а на следующий день у тебя уже товарищ майор рядышком стоит - горько потом пожалеешь о сказанном.
А вот с заморскими БЯМ (Чатом или ДипСик или любой другой) уже не так страшно мастерить такое устройство. Там, конечно, тоже остро стоит вопрос утечки личных данных, но хотя бы товарища майора не опасаешься.

А самый лучший вариант - это, конечно, же языковая модель, запущенная на личном оборудовании (локально). Только вот мощности тут нужны нехилые.

Kamosol 29 янв в 07:34

Сидим с мужиками говорим об песках в бане. Поболтали сажусь За компьютер, открываю интернет и мне реклама про печки в баню лезет. Мужики у кого шпион в телефоне. При условии я на компьютере в Гугле не авторизован и нет никаких подключенных к компьютеру микрофонов.

И такая фишка постоянна.

microArt 29 янв в 09:53

Может, и не нужны такие запредельные мощности. Для дома можно, наверное, обойтись чем-то попроще (расчеты космических кораблей производить не будем, так, просто о жизни поговорить, в интернете что-либо поискать да информацию обобщить).

Сегодня такое видео нашлось:
OpenAI's nightmare: Deepseek R1 on a Raspberry Pi
https://www.youtube.com/watch?v=o1sN1lB76EA
Это дает надежду, что супероборудование все же не нужно.

К мини-ПК можно подключить внешнюю видеокарту. Выглядит такая конструкция впечатляюще: маленький мини-ПК, а рядом такая же по размеру, если не больше, видеокарта.

Может, наши умельцы сделают подобное видео. Интересует, как нейронка будет отвечать на русском языке.

m_aleksei 29 янв в 19:16

На макбуке с М1 Про пашет отлично (пробовал). Ясно что такие 4-12гБ модельки не такие идеально крутые как более большие модели. Но все же...

Noah1 29 янв в 19:49

Немного подушню, но вот как раз расчеты космических кораблей - дело очень простое, требует минимум мощности и всего пару килобайт, именно столько и было у NASA в 80хх.

Нейросети потребляют на порядки больше вычислительной мощности.

gsaw 28 янв в 11:04

Я думаю логи писать, это тоже сбор данных. там все перечисленное и пишется в лог. Так что тут все стандартно. Опять же, если логи не удаляются после удаления пользователя, тоже нормально. Это наверное уже требование каких ни будь регулирующих органов.

Мне вот интересно, что за "keystrokes patterns und rhythms", какой то механизм, что бы получить fingerprint пользователя? Это наверное для рекламщиков собирают.

В общем выглядит все стандартно и в тексте просто указано, все, что собирается с пользователя. Наверное EU требование. У chatgpt и других все тоже самое написано, ну может другими словами.

microArt 28 янв в 14:52

"Мне вот интересно, что за "keystrokes patterns und rhythms", какой то механизм, что бы получить fingerprint пользователя? Это наверное для рекламщиков собирают."

Как вариант: для идентификации пользователя. У каждого из нас, наверное. выработался свои индивидуальный стиль использования клавиатуры.

В общем-то, понятно, что все эти ИИ - это не про разумные машины, которые вот-вот выйдут из подчинения людям (как в "Терминаторе", например). Это про то, что в некоей виртуальной точке (в мегакорпорациях) создается просто гигантский поток данных о людях (о каждом человеке), и тот, кто сумеет оседлать этот поток в своих (мегакорпоративных) интересах, станет "царем горы" и "повелителем вселенной".

Вот подождите, еще немного (пару-тройку лет) - и личные (локальные) модели запретят использовать. Под предлогом заботы о пользователях, конечно же...

Ravius 29 янв в 12:08

DS просто слишком честно написали. Что если вы зарегистрируйте 100 ботов и удалите каждый аккаунт - они будут знать, что 100 ботов на самом деле уже было.

Самое интересное это чаты и код - удаляются ли они.

ashuu 29 янв в 05:09

Ох блин, типа ds собирает, ну хоть какую то волну поднять, амеры обосрамшись, особенно в смысле цены вопроса 5,6 млн против их сотен лярдов , не могут понять как надавить, сообщество запугать хоть чем то надо, обвал более 1 трл на их рынке, это такая пощечина, сейчас будут предприняты такие вливания. Мелкомягкие собирают гуля собирает, а кто не собирает? Опсосы и те обязаны сейчас без вопросов передавать, теперь бесплатно по любому запросу без суда сведения о ваших передвижениях, чего рассуждать про дипсик? От него точно вреда нет, а вот польза офигенная.

В свете работы ии мне все больше становится интересно, что теперь будет с спецами по сео и тп , ранжироние , таргетирование уходят в небытие?

BlackMokona 29 янв в 18:38

Почитайте на что ушли 5,6 лямов. Удивитесь

Hoy_cMoKuHr 29 янв в 06:58

Да неужели?

А какое ПО этим не занимается?

UnknownUser 29 янв в 14:10

Нее, остальное ПО оно кого надо ПО а не каких то там китайцев. Так что пользуйтесь продукцией MS и других корпораций добра.

Hoy_cMoKuHr 30 янв в 05:27

Вот каждый раз смешно, китайцы собирают данные, а когда звонит неизвестный номер и представляется крупнейшим в стране провайдером и просит назвать адрес, для проверки возможности подключения, то все выкладывается, как на духу. В конце концов у каждого есть аккаунт в онлайн магазине или на госуслугах да и много ещё где. Эти то данные против пользователя использовать могут с ощутимым вредом и гораздо легче их добыть.

marat2509 29 янв в 22:36

Бонусом ко всему этому ещё идёт, что их база данных не была надёжно защищена

Fedoresko1 31 янв в 06:41

Все системы защиты от ddos собирают подобную информацию. Deepseek тут упоминается для хайпа?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий