Комментарии 22
ИИ собирает все данные что может
В случае с локальной ollama это ведь неактуально?
но тогда актуально станет найти лишние 700 Гб GPU RAM
Читаю разные телеграм-каналы, так там речь идет о таких запредельных сборах (на всякое военное оборудование, понимаете, о чем я?), что просто диву даешься, и ведь собирают...
А если бы люди умели кооперироваться (аккуратно, без мошенников), то, наверное, можно было бы миллион рублей и на серверок для ИИ собрать. Какой-нибудь, поселкового масштаба, например, который бы знал все привычки жителей одного поселка и помогал бы им разными подсказками. Как думаете, реально это? Вот и сюжет для очередной "Кибердеревни".
А может быть, опять кто-то на "малинке" запустит. Ведь уже запускали же другие модели...
Только надо 30 миллионов, и потом у людей проблемы в коммуникации даже в собственном доме при меньших деньгах.
Какой-нибудь, поселкового масштаба
И мы вновь возвращаемся к той же проблеме приватности, только теперь она станет ещё острее. Одно дело, когда мои запросы читает далёкий китаец или американец, которого я не стыжусь, никогда не увижу и ему до меня дела нет, другое - когда мой сосед, который этот сервер администрирует, и с которым мне ещё потом за руку здороваться и в глаза глядеть (а ещё он, чего доброго, и донос напишет, увидев, как один из жителей спрашивает у ИИ что-то крамольное).
Спасибо за ответ. Да, Вы правы же, конечно.
Я тут размышляла немного на эту тему. Допустим, я делаю устройство вроде "умной колонки" и хочу туда подселить какую-нибудь языковую модель. (На самом деле, мне это в жизни не сделать, у меня таких навыков нет). Так вот, я не хочу видеть в таком устройстве какую-нибудь нашу БЯМ, например, Алису или другую от Яндекса, ГигаЧат или другую подобную из наших. По той причине, что вот так ляпнешь что-нибудь сгоряча, а на следующий день у тебя уже товарищ майор рядышком стоит - горько потом пожалеешь о сказанном.
А вот с заморскими БЯМ (Чатом или ДипСик или любой другой) уже не так страшно мастерить такое устройство. Там, конечно, тоже остро стоит вопрос утечки личных данных, но хотя бы товарища майора не опасаешься.
А самый лучший вариант - это, конечно, же языковая модель, запущенная на личном оборудовании (локально). Только вот мощности тут нужны нехилые.
Может, и не нужны такие запредельные мощности. Для дома можно, наверное, обойтись чем-то попроще (расчеты космических кораблей производить не будем, так, просто о жизни поговорить, в интернете что-либо поискать да информацию обобщить).
Сегодня такое видео нашлось:
OpenAI's nightmare: Deepseek R1 on a Raspberry Pi
https://www.youtube.com/watch?v=o1sN1lB76EA
Это дает надежду, что супероборудование все же не нужно.
К мини-ПК можно подключить внешнюю видеокарту. Выглядит такая конструкция впечатляюще: маленький мини-ПК, а рядом такая же по размеру, если не больше, видеокарта.
Может, наши умельцы сделают подобное видео. Интересует, как нейронка будет отвечать на русском языке.
На макбуке с М1 Про пашет отлично (пробовал). Ясно что такие 4-12гБ модельки не такие идеально крутые как более большие модели. Но все же...
Немного подушню, но вот как раз расчеты космических кораблей - дело очень простое, требует минимум мощности и всего пару килобайт, именно столько и было у NASA в 80хх.
Нейросети потребляют на порядки больше вычислительной мощности.
Я думаю логи писать, это тоже сбор данных. там все перечисленное и пишется в лог. Так что тут все стандартно. Опять же, если логи не удаляются после удаления пользователя, тоже нормально. Это наверное уже требование каких ни будь регулирующих органов.
Мне вот интересно, что за "keystrokes patterns und rhythms", какой то механизм, что бы получить fingerprint пользователя? Это наверное для рекламщиков собирают.
В общем выглядит все стандартно и в тексте просто указано, все, что собирается с пользователя. Наверное EU требование. У chatgpt и других все тоже самое написано, ну может другими словами.
"Мне вот интересно, что за "keystrokes patterns und rhythms", какой то механизм, что бы получить fingerprint пользователя? Это наверное для рекламщиков собирают."
Как вариант: для идентификации пользователя. У каждого из нас, наверное. выработался свои индивидуальный стиль использования клавиатуры.
В общем-то, понятно, что все эти ИИ - это не про разумные машины, которые вот-вот выйдут из подчинения людям (как в "Терминаторе", например). Это про то, что в некоей виртуальной точке (в мегакорпорациях) создается просто гигантский поток данных о людях (о каждом человеке), и тот, кто сумеет оседлать этот поток в своих (мегакорпоративных) интересах, станет "царем горы" и "повелителем вселенной".
Вот подождите, еще немного (пару-тройку лет) - и личные (локальные) модели запретят использовать. Под предлогом заботы о пользователях, конечно же...
DS просто слишком честно написали. Что если вы зарегистрируйте 100 ботов и удалите каждый аккаунт - они будут знать, что 100 ботов на самом деле уже было.
Самое интересное это чаты и код - удаляются ли они.
Ох блин, типа ds собирает, ну хоть какую то волну поднять, амеры обосрамшись, особенно в смысле цены вопроса 5,6 млн против их сотен лярдов , не могут понять как надавить, сообщество запугать хоть чем то надо, обвал более 1 трл на их рынке, это такая пощечина, сейчас будут предприняты такие вливания. Мелкомягкие собирают гуля собирает, а кто не собирает? Опсосы и те обязаны сейчас без вопросов передавать, теперь бесплатно по любому запросу без суда сведения о ваших передвижениях, чего рассуждать про дипсик? От него точно вреда нет, а вот польза офигенная.
В свете работы ии мне все больше становится интересно, что теперь будет с спецами по сео и тп , ранжироние , таргетирование уходят в небытие?
Да неужели?
А какое ПО этим не занимается?
Нее, остальное ПО оно кого надо ПО а не каких то там китайцев. Так что пользуйтесь продукцией MS и других корпораций добра.
Вот каждый раз смешно, китайцы собирают данные, а когда звонит неизвестный номер и представляется крупнейшим в стране провайдером и просит назвать адрес, для проверки возможности подключения, то все выкладывается, как на духу. В конце концов у каждого есть аккаунт в онлайн магазине или на госуслугах да и много ещё где. Эти то данные против пользователя использовать могут с ощутимым вредом и гораздо легче их добыть.
Бонусом ко всему этому ещё идёт, что их база данных не была надёжно защищена
Все системы защиты от ddos собирают подобную информацию. Deepseek тут упоминается для хайпа?
TOS DeepSeek: IP-адрес, user-agent, шаблоны нажатий клавиш, информация об устройстве, удаление аккаунта оставляет данные