Это новый дивный мир, когда тебе в лицо говорят, "я тебя защищаю от грабителей и мошенников" и при этом залезают в карман и грабят, естественно ни от каких мошенников не защищаю.
Он уже давно такой, всякие защиты от террористов то же в ту же степь, хотя конечно же на словах начинания просто отличные.
приложение для инференса (llama.cpp/vllm/..) делает это самостоятельно, если запуск нейросети делать самому (в этом случае у тебя будет цикл где ты получаешь по одному токену, в нем и контролируй), то зависит от библиотеки.
Еще, если библиотека или сервер не умеют tool calling, можно попробовать structured output, описать условие завершения генерации, и уже самому все перезапускать, но tool calling кажется все уже поддерживают
исполнение модели прерывается (приложение ищет завершенный json определенной структуры), на клиенте код выполняет функцию, то что она вернула, добавляется в текущее контекстное окно и генерация продолжается
в своем приложении можно при вызове api (и в промпте) указать какие методы как вызывать, в зависимости от того какой inference используется, например vllm, llama.cpp (lm studio/ollama/..)
я про это и говорю, если вас не устраивает что пользователь не смотрит рекламу (лучше сервис не получает прибыль) а контент потребляет, то об этом и надо обсуждать.
Только тогда и пользователя этого бизнеса пожалуйста не забудьте, который этот контент туда занес.
p.s. на хабре контент кстати допускается к копированию по CC BY 3.0 лицензии.
С позиции perplexity каким боком саморизация вредна? какому бизнесу?
Саморизация это упрощенное представление (не важно, верное или нет), худшее к чему это может привести, это плохой результат поиска (не найдется искомое) и неверное понимание информации (тем более бизнесу на это наплевать), люди и без ИИ прекрасно делали и то и другое.
обычно в стране законотворчество делают с оглядкой на заинтересованных лиц, как минимум опсосы это олигополия с явно не нулевым лобби, как минимум они должны были участвовать в производстве этого бреда (вангую там просто бардак и левая рука не знает что делает правая).
Вангую ОпСоСы доиграются, и население полностью (процесс в принципе уже идет) уйдут в интернет, есть наверное еще какой то заметный процент населения, для которых интернет звонки это что то за гранью (особенно когда UI какого-нибудь telegram ставит в тупик средней подкованности пользователя), но это будет меняться быстрее, если цены на звонок станут расти.
Абсолютно бесполезная деятельность, вредная всем, потому что трата ресурсов на ненужные действия. Спам и мошенничество никогда (почти) не идут с телефона компании, это левые частные номера. Никакой маркировки тут не было и не будет.
Не совсем, рынок сбыта это косвенная задача, все остальные страны для США скорее ресурсы (человеческие и материальные) и помойка (оставить грязное производство что бы гадили в воздухе и в море). Меня больше удивляет, почему при таких сказочных условиях (рисуют себе деньги которые все страны покупают за реальные активы и имеют огромный интеллектуальный ресурс плюс нехилый материальный) в США еще не создали рай, одна медицина удивляет, сказочно крутая но не доступна большинству, страдающий средний класс и огромное неравенство в богатствах.
если камнем преткновения является реклама (а она само собой является) то о ней и говорить нужно, а не о индексации и кешировании
Запрет на индексацию это буквально другое - это про возможность найти (массам а не единицам) страницу, которую (ее владелец) попросили не индексировать,.. т.е. речь не о сокрытии или преобразовании информации, а о порядке работы поисковых систем (больших, с массовым клиентом). Но вот что подразумевает cloudflare, обвиняя perplexity в этом - хз.
В свете проблем с доступом к информации и ее централизации у социальных сетей, считаю принципиально запрет на доступ информации вредным. И так социальные сети сделали доступ к информации ограниченным, монополизировав к ней доступ лично для себя (что бы торговать естественно, не своим но искусственно таковым сделав), то ограничивать доступ к информации вне социальных сетей это .. ну как ноги себе самому себе отрезать, если твои руки уже кто то пилит, типа за компанию что ли?
Речь идет об индексировании или о чтении результата?
Идексирование - это чтение содержимое с сохранением и возможностью поиска в будущем
Чтение результата это буквально чтение и показ его на экране (пусть и в видеоизмененном виде, например саморизация или использование в ответе).
Первое - да, индексировать нехорошо, второе - нет, это адекватное использование контента, а то так можно договориться до запретов браузеров. И да, проблема использования контента сайта без явного перенаправления пользователя на него не нова, гугл помнится до сих пор позволяет смотреть на картинки из поиска, скачивать их (причем высокого качества, правда не всегда работает) прямо из интерфейса поисковой системы,.. это то же самое.
Отличный вырожденный пример, помните мобильную opera turbo? она преобразует веб страницу в свой сжатый формат, упрощая верстку, значительно уменьшая скачиваемый объем... технически сайт 'открывается' роботом на серверах opera, читается, преобразуется, и результат отправляется пользователю... это будем запрещать?
```
В деревне живут трое друзей: Алексей, Борис и Виктор.
Один из них — кузнец, другой — пекарь, третий — плотник.
Кузнец живёт ближе всех к реке.
Плотник живёт дальше всех от леса.
Борис живёт между Алексеем и Виктором.
Алексей — не кузнец.
Виктор — не пекарь.
Пекарь живёт ближе к лесу, чем кузнец.
Кто кем работает?
```
реши эту задачу перебором
Скрытый текст
Нужно определить, кто кем работает, при наличии следующих пунктов:
Персона Оставшиеся варианты профессий Алекей кузнец, пекарь, плотник Борис кузнец, пекарь, плотник Виктор кузнец, пекарь, плотник
Условия
Кузнец живёт ближе всех к реке.
Плотник живёт дальше всех от леса.
Борис живёт между Алексеем и Виктором. (по расположению вдоль дороги к реке)
Алекей — не кузнец.
Виктор — не пекарь.
Пекарь живёт ближе к лесу, чем кузнец.
Перебор
Шаг 1 – Ограничение по профессиям
Так как Алекей точно не кузнец, у него остаются две профессии:
пекарь
плотник
Так как Виктор точно не пекарь, у него остаются две профессии:
кузнец
плотник
Следовательно, Борис вынужден быть пекарём, потому что все профессии должны быть разными.
Персона Профессия Алекей ? (пекарь / плотник) Борис Пекарь Виктор ? (кузнец / плотник)
Шаг 2 – Расположение по реке
Кузнец живёт ближе всех к реке, значит его объезд находится справа (самый правый).
Если Виктор является кузнецом → он самый правый.
Если Алекей бы был кузнецом, условие Алекей — не кузнец нарушило бы бы, поэтому это невозможно.
Таким образом Виктор – кузнец и находится дальше всего от леса (слева от всего) и ближе всего к реке (с правой стороны).
Объезд Профессия 1 (дальн. от реки) Плотник (Виктор) 2 (середина) ? 3 (ближе к реке) Пекарь (Борис)
Шаг 3 – Борис живёт между Алексеем и Виктором
Если Виктор находится слева, а Борис справа от него, то Алекей должен быть слева от Бориса.
Таким образом Алекей – левый объект (объезд 1), а Борис – средний (объезд 2).
Получаем расположение:
Приоритет по дереву (от северо‑запада к юго‑востоку) Персона 1 (дальн. от леса) Алекей 2 (середина) Борис 3 (ближе к реке) Виктор
Шаг 4 – Проверка оставшихся условий
Плотник живёт дальше всех от леса. Алекей (объезд 1) действительно дальше всех от леса → Алекей должен быть плотником. ✔️
Пекарь живёт ближе к лесу, чем кузнец. Борис (объезд 2) находится ближе к лесу, чем Виктор (объезд 3) → условие выполнено. ✔️
Пекарь (Борис) действительно ближе к лесу, чем кузнец (Виктор). ✔️
Алекей не кузнец. ✔️
Виктор не пекарь. ✔️
Итог
Персона Профессия Алекей Плотник Борис Пекарь Виктор Кузнец
у gpt нет долговременной памяти, точнее что то есть похожее, но как следствие невероятной избыточности по весам, и особенности сбора обучающего датасета.
Все что 'знает' ИИ - это то что вы поместите в его контекстное окно, и то, с увеличением этого окна, все начинают путаться в данных.
Текущий ИИ еще далек от AGI (но кажется асимптотически к нему приближается) и уж тем более не ASI. Но все бегают с криками - 'оно буквы считать не умеет, закапывайте'.
Не бойтесь, AGI будет достигнут, в этом практически нет сомнения, и 'желанные' увольнения с робких 5-10% в узких областях, превратятся в 80% от рабочего населения (останутся либо очень дешевая рабочая сила, либо наоборот, редкие и очень skilled специалисты, с изворотливым умом и нестандартным мышлением) .
Это новый дивный мир, когда тебе в лицо говорят, "я тебя защищаю от грабителей и мошенников" и при этом залезают в карман и грабят, естественно ни от каких мошенников не защищаю.
Он уже давно такой, всякие защиты от террористов то же в ту же степь, хотя конечно же на словах начинания просто отличные.
какие примеры запросов делали для генерации?
приложение для инференса (llama.cpp/vllm/..) делает это самостоятельно, если запуск нейросети делать самому (в этом случае у тебя будет цикл где ты получаешь по одному токену, в нем и контролируй), то зависит от библиотеки.
Еще, если библиотека или сервер не умеют tool calling, можно попробовать structured output, описать условие завершения генерации, и уже самому все перезапускать, но tool calling кажется все уже поддерживают
исполнение модели прерывается (приложение ищет завершенный json определенной структуры), на клиенте код выполняет функцию, то что она вернула, добавляется в текущее контекстное окно и генерация продолжается
в своем приложении можно при вызове api (и в промпте) указать какие методы как вызывать, в зависимости от того какой inference используется, например vllm, llama.cpp (lm studio/ollama/..)
Как вы собирали обучающий и тестовый датасет? Есть ли у вас свой набор системных промптов, генерация на которых собралась?
а статью не запилите? пожалуйста
я про это и говорю, если вас не устраивает что пользователь не смотрит рекламу (лучше сервис не получает прибыль) а контент потребляет, то об этом и надо обсуждать.
Только тогда и пользователя этого бизнеса пожалуйста не забудьте, который этот контент туда занес.
p.s. на хабре контент кстати допускается к копированию по CC BY 3.0 лицензии.
С позиции perplexity каким боком саморизация вредна? какому бизнесу?
Саморизация это упрощенное представление (не важно, верное или нет), худшее к чему это может привести, это плохой результат поиска (не найдется искомое) и неверное понимание информации (тем более бизнесу на это наплевать), люди и без ИИ прекрасно делали и то и другое.
Мне кажется тут начальники другого уровня и приходят они не 'в пятое управление' а в баню с пивком и там решают вопросики.
Полагаю маркировка это только повод стрясти с бизнеса деньги, не больше
А разве маркировку не вводили что бы победить конкуренцию во имя монополии единицы производителей?
обычно в стране законотворчество делают с оглядкой на заинтересованных лиц, как минимум опсосы это олигополия с явно не нулевым лобби, как минимум они должны были участвовать в производстве этого бреда (вангую там просто бардак и левая рука не знает что делает правая).
Вангую ОпСоСы доиграются, и население полностью (процесс в принципе уже идет) уйдут в интернет, есть наверное еще какой то заметный процент населения, для которых интернет звонки это что то за гранью (особенно когда UI какого-нибудь telegram ставит в тупик средней подкованности пользователя), но это будет меняться быстрее, если цены на звонок станут расти.
Абсолютно бесполезная деятельность, вредная всем, потому что трата ресурсов на ненужные действия. Спам и мошенничество никогда (почти) не идут с телефона компании, это левые частные номера. Никакой маркировки тут не было и не будет.
Не совсем, рынок сбыта это косвенная задача, все остальные страны для США скорее ресурсы (человеческие и материальные) и помойка (оставить грязное производство что бы гадили в воздухе и в море). Меня больше удивляет, почему при таких сказочных условиях (рисуют себе деньги которые все страны покупают за реальные активы и имеют огромный интеллектуальный ресурс плюс нехилый материальный) в США еще не создали рай, одна медицина удивляет, сказочно крутая но не доступна большинству, страдающий средний класс и огромное неравенство в богатствах.
.
если камнем преткновения является реклама (а она само собой является) то о ней и говорить нужно, а не о индексации и кешировании
Запрет на индексацию это буквально другое - это про возможность найти (массам а не единицам) страницу, которую (ее владелец) попросили не индексировать,.. т.е. речь не о сокрытии или преобразовании информации, а о порядке работы поисковых систем (больших, с массовым клиентом). Но вот что подразумевает cloudflare, обвиняя perplexity в этом - хз.
В свете проблем с доступом к информации и ее централизации у социальных сетей, считаю принципиально запрет на доступ информации вредным. И так социальные сети сделали доступ к информации ограниченным, монополизировав к ней доступ лично для себя (что бы торговать естественно, не своим но искусственно таковым сделав), то ограничивать доступ к информации вне социальных сетей это .. ну как ноги себе самому себе отрезать, если твои руки уже кто то пилит, типа за компанию что ли?
Речь идет об индексировании или о чтении результата?
Идексирование - это чтение содержимое с сохранением и возможностью поиска в будущем
Чтение результата это буквально чтение и показ его на экране (пусть и в видеоизмененном виде, например саморизация или использование в ответе).
Первое - да, индексировать нехорошо, второе - нет, это адекватное использование контента, а то так можно договориться до запретов браузеров. И да, проблема использования контента сайта без явного перенаправления пользователя на него не нова, гугл помнится до сих пор позволяет смотреть на картинки из поиска, скачивать их (причем высокого качества, правда не всегда работает) прямо из интерфейса поисковой системы,.. это то же самое.
Отличный вырожденный пример, помните мобильную opera turbo? она преобразует веб страницу в свой сжатый формат, упрощая верстку, значительно уменьшая скачиваемый объем... технически сайт 'открывается' роботом на серверах opera, читается, преобразуется, и результат отправляется пользователю... это будем запрещать?
Как и всегда, все зависит от запроса...
Скрытый текст
Нужно определить, кто кем работает, при наличии следующих пунктов:
Персона Оставшиеся варианты профессий Алекей кузнец, пекарь, плотник Борис кузнец, пекарь, плотник Виктор кузнец, пекарь, плотник
Условия
Кузнец живёт ближе всех к реке.
Плотник живёт дальше всех от леса.
Борис живёт между Алексеем и Виктором. (по расположению вдоль дороги к реке)
Алекей — не кузнец.
Виктор — не пекарь.
Пекарь живёт ближе к лесу, чем кузнец.
Перебор
Шаг 1 – Ограничение по профессиям
Так как Алекей точно не кузнец, у него остаются две профессии:
пекарь
плотник
Так как Виктор точно не пекарь, у него остаются две профессии:
кузнец
плотник
Следовательно, Борис вынужден быть пекарём, потому что все профессии должны быть разными.
Персона Профессия Алекей ? (пекарь / плотник) Борис Пекарь Виктор ? (кузнец / плотник)
Шаг 2 – Расположение по реке
Кузнец живёт ближе всех к реке, значит его объезд находится справа (самый правый).
Если Виктор является кузнецом → он самый правый.
Если Алекей бы был кузнецом, условие Алекей — не кузнец нарушило бы бы, поэтому это невозможно.
Таким образом Виктор – кузнец и находится дальше всего от леса (слева от всего) и ближе всего к реке (с правой стороны).
Объезд Профессия 1 (дальн. от реки) Плотник (Виктор) 2 (середина) ? 3 (ближе к реке) Пекарь (Борис)
Шаг 3 – Борис живёт между Алексеем и Виктором
Если Виктор находится слева, а Борис справа от него, то Алекей должен быть слева от Бориса.
Таким образом Алекей – левый объект (объезд 1), а Борис – средний (объезд 2).
Получаем расположение:
Приоритет по дереву (от северо‑запада к юго‑востоку) Персона 1 (дальн. от леса) Алекей 2 (середина) Борис 3 (ближе к реке) Виктор
Шаг 4 – Проверка оставшихся условий
Плотник живёт дальше всех от леса.
Алекей (объезд 1) действительно дальше всех от леса → Алекей должен быть плотником. ✔️
Пекарь живёт ближе к лесу, чем кузнец.
Борис (объезд 2) находится ближе к лесу, чем Виктор (объезд 3) → условие выполнено. ✔️
Пекарь (Борис) действительно ближе к лесу, чем кузнец (Виктор). ✔️
Алекей не кузнец. ✔️
Виктор не пекарь. ✔️
Итог
Персона Профессия
Алекей Плотник
Борис Пекарь
Виктор Кузнец
Так всё условие zadania удовлетворяет.
у gpt нет долговременной памяти, точнее что то есть похожее, но как следствие невероятной избыточности по весам, и особенности сбора обучающего датасета.
Все что 'знает' ИИ - это то что вы поместите в его контекстное окно, и то, с увеличением этого окна, все начинают путаться в данных.
Текущий ИИ еще далек от AGI (но кажется асимптотически к нему приближается) и уж тем более не ASI. Но все бегают с криками - 'оно буквы считать не умеет, закапывайте'.
Не бойтесь, AGI будет достигнут, в этом практически нет сомнения, и 'желанные' увольнения с робких 5-10% в узких областях, превратятся в 80% от рабочего населения (останутся либо очень дешевая рабочая сила, либо наоборот, редкие и очень skilled специалисты, с изворотливым умом и нестандартным мышлением) .