С недавних пор Perplexity поменяли лимиты на использование моделей и разных режимов, но в веб-интерфейсе толком негде посмотреть их. Как вариант вот тут можно глянуть: https://www.perplexity.ai/rest/rate-limit/all
Да это я скорее "на подумать". Знаю, что некоторым потенциальным клиентам это будет важно и неплохо будет указать этот момент на сайте или странице вашего продукта в будущем.
локально (localhost) - сейчас у меня это работает через Ollama;
У пользователей может появиться много вопросов про то, как это развернуть локально и безопасно. Из серии - может ли оно работать полноценно на отключенном от интернета устройстве? Как будет происходить обновление ПО? Если облако, то как обеспечивается безопасное хранение и передача информации? OCR + AI тоже на базе ollama?
Торговые компании, которые являются клиентами крупнейших банков и выручка которых за прошедший год превышает 120 млн рублей, также должны будут обеспечить возможность оплаты товаров и услуг цифровой формой национальной валюты с 1 сентября 2026 года.
Есть масса похожих вариантов подписки за 300-500р/год. По функционалу не отличаются от вариантов за $20 в месяц. Насколько я понял, это промо-тарифы для некоторых корпоративных клиентов и Perplexity в последний месяц забанили очень много таких аккаунтов (за нарушение правил сервиса - они не предназначены для перепродажи), но у кого-то аккаунт за 400р. продолжает спокойно работать уже больше полугода.
В продолжение топика про источники поиска поделюсь алгоритмом при проверке фактов. Использовал его недавно при подготовке презентации.
1) Отключите источник поиска Web -> в новом чате [Составь содержание для слайдов презентации (либо укажите любой ваш запрос). Формат вывода результата: файл content.md].
Прямой настройки весов для источников я не встречал, но можно попробовать донастроить под себя:
1) Убрать из выдачи результаты из определенных источников: [ваш запрос] -site:vc.ru
2) Если важна точность и чистые источники, то после нескольких итераций обычного поиска самостоятельно составить список ссылок на качественные материалы и/или скачать и загрузить их в Space, а затем отключить поиск по Web (чтобы работал только с загруженными источниками). Тут можно и в NotebookLM от Google поработать аналогично.
3) Уже после получения отчета посмотреть, какие источники он использовал, и от себя дать разбивку по весам, а затем попросить пересобрать отчет с учетом ваших вводных. Но это подходит, наверное, если вы работаете в какой-то определенной сфере и запросы примерно в одной области. Хотя можно, думаю, прямо в промпте или настройках Space указать, что из определенных источников (перечислить сайты) информацию нужно брать с наименьшим весом/приоритетом или выделять в отдельный блок.
Добавлю по теме. Все чаще стал замечать в документации разных SaaS разделы для LLM. Там либо простой txt, либо markdown. Еще встречал рекомендации создавать адаптированные sitemaps для краулеров Perplexity, GPTBot, ClaudeBot
При загрузке файла Perplexity разделяет его на текстовые чанки и индексирует (RAG), но ему не хватит контекстного окна, чтобы увидеть все 30k+ записей одновременно для агрегации и поиска ответов на ваш вопрос, и он начинает выдумывать. В вашем кейсе нужно прямо переключить модель с семантического анализа на вычисления, а для этого в Perplexity хорошо подойдет режим Labs.
В Labs есть контейнер, который выполняет Python и JavaScript (Node.js), т.е. он может и код написать, и прогнать ваш JSON через pandas у себя на сервере. Можно один раз сделать дашборд и потом просто актуализировать его из данных нового файла - этакий no-code.
Примерный промпт:
На основе загруженного файла data.json из Assets создай веб-приложение для анализа этих данных. Реализуй функцию uploadNewFile в интерфейсе, чтобы я мог подгружать свежие данные сам, и графики обновлялись автоматически.
Не за что. Обычно, если сталкиваюсь с такими ситуациями, один раз заморачиваюсь, пишу похожий промпт и сохраняю его в шорткаты или заметки. Никогда не знаешь, где это потом пригодится.
Даже если в промпте явно указано: "используй только эти URL", Perplexity может подтянуть не весь контент страницы, а только фрагменты, которые посчитает релевантными, или вообще возьмет только закэшированную копию. Тут ещё есть нюанс: краулер Perplexity при переходе по ссылке часто получает "сырой" HTML, а динамический контент, подгружаемый JavaScript (таблицы характеристик, цены), может не попасть в контекст.
При этом Comet Assistant имеет прямой доступ к содержимому (видит актуальное состояние DOM), то есть вы явно даёте ему полный источник данных. Так что такие запросы, по моему опыту, лучше делать через Comet Assistant.
Если не хочется скачивать Comet, то попробуйте такой промпт (evidence-based extraction): Сравни модели X и Y только по данным со страниц: [URL модели X] [URL модели Y]. Составь список всех характеристик, которые явно указаны хотя бы на одной из страниц. Для каждой характеристики заполни таблицу: значение X / значение Y / “не найдено”. Важно: после каждого значения добавь короткую дословную цитату в кавычках и URL страницы, где это указано. Если значение не найдено - пиши "не найдено на странице" и не делай предположений и дополнений из внешних источников.
А где у вас хранится этот json, насколько он большой и насколько часто он обновляется? Спрашиваю, потому что в некоторых случаях Perplexity кэширует какую-то версию файла, и пока вы прямо её не проиндексируете, будет врать, что оперирует актуальными данными.
Полагаю, такое может происходить из-за особенностей работы Perplexity с индексированными данными. Попробуйте ради эксперимента сделать вот так (как я записал на видео ниже). Промпт для примера "Проведи сравнительный анализ технических характеристик видеокамер и выведи результаты в виде таблицы" и через @ добавляете открытые вкладки как источники поиска.
С недавних пор Perplexity поменяли лимиты на использование моделей и разных режимов, но в веб-интерфейсе толком негде посмотреть их. Как вариант вот тут можно глянуть: https://www.perplexity.ai/rest/rate-limit/all
Теперь скидка для студентов не 75%, а 50%. При продлении на следующий год имейте в виду
Да это я скорее "на подумать". Знаю, что некоторым потенциальным клиентам это будет важно и неплохо будет указать этот момент на сайте или странице вашего продукта в будущем.
У пользователей может появиться много вопросов про то, как это развернуть локально и безопасно. Из серии - может ли оно работать полноценно на отключенном от интернета устройстве? Как будет происходить обновление ПО? Если облако, то как обеспечивается безопасное хранение и передача информации?
OCR + AI тоже на базе ollama?
Постепенно формируется инфраструктура под цифровой рубль https://cbr.ru/press/event/?id=25772 По этому стриму тоже дедлайн 1 сентября:
Кстати, отличный способ вытащить все данные разом. Это, я так понимаю, они по GDPR обязаны делать. В Claude нашел аналогичную функцию
Есть масса похожих вариантов подписки за 300-500р/год. По функционалу не отличаются от вариантов за $20 в месяц. Насколько я понял, это промо-тарифы для некоторых корпоративных клиентов и Perplexity в последний месяц забанили очень много таких аккаунтов (за нарушение правил сервиса - они не предназначены для перепродажи), но у кого-то аккаунт за 400р. продолжает спокойно работать уже больше полугода.
однокурсники шутят, что так хоть часть стоимости учебы отбивают 😅
В продолжение топика про источники поиска поделюсь алгоритмом при проверке фактов. Использовал его недавно при подготовке презентации.
1) Отключите источник поиска Web -> в новом чате [Составь содержание для слайдов презентации (либо укажите любой ваш запрос). Формат вывода результата: файл content.md].
В конце промпта добавьте:
2) Потом сделайте пару раз fact-check (можно даже несколько раз разными нейронками)
Этот процесс можно использовать для любых задач, где нужно провести проверку фактов.
P.S. При желании можно дополнить алгоритм evidence-based extraction https://habr.com/ru/articles/986744/#comment_29419830 но у меня и без этого результат был хорошим.
Прямой настройки весов для источников я не встречал, но можно попробовать донастроить под себя:
1) Убрать из выдачи результаты из определенных источников:
[ваш запрос] -site:vc.ru2) Если важна точность и чистые источники, то после нескольких итераций обычного поиска самостоятельно составить список ссылок на качественные материалы и/или скачать и загрузить их в Space, а затем отключить поиск по Web (чтобы работал только с загруженными источниками). Тут можно и в NotebookLM от Google поработать аналогично.
3) Уже после получения отчета посмотреть, какие источники он использовал, и от себя дать разбивку по весам, а затем попросить пересобрать отчет с учетом ваших вводных. Но это подходит, наверное, если вы работаете в какой-то определенной сфере и запросы примерно в одной области. Хотя можно, думаю, прямо в промпте или настройках Space указать, что из определенных источников (перечислить сайты) информацию нужно брать с наименьшим весом/приоритетом или выделять в отдельный блок.
Добавлю по теме. Все чаще стал замечать в документации разных SaaS разделы для LLM. Там либо простой txt, либо markdown.
Еще встречал рекомендации создавать адаптированные sitemaps для краулеров Perplexity, GPTBot, ClaudeBot
Тоже верно)
Пишите если что. Думаю, это популярный кейс и многим будет полезно
При загрузке файла Perplexity разделяет его на текстовые чанки и индексирует (RAG), но ему не хватит контекстного окна, чтобы увидеть все 30k+ записей одновременно для агрегации и поиска ответов на ваш вопрос, и он начинает выдумывать. В вашем кейсе нужно прямо переключить модель с семантического анализа на вычисления, а для этого в Perplexity хорошо подойдет режим Labs.
В Labs есть контейнер, который выполняет Python и JavaScript (Node.js), т.е. он может и код написать, и прогнать ваш JSON через pandas у себя на сервере. Можно один раз сделать дашборд и потом просто актуализировать его из данных нового файла - этакий no-code.
Примерный промпт:
На основе загруженного файла data.json из Assets создай веб-приложение для анализа этих данных. Реализуй функцию uploadNewFile в интерфейсе, чтобы я мог подгружать свежие данные сам, и графики обновлялись автоматически.Вот что у меня получилось на тестовых данных
Не за что. Обычно, если сталкиваюсь с такими ситуациями, один раз заморачиваюсь, пишу похожий промпт и сохраняю его в шорткаты или заметки. Никогда не знаешь, где это потом пригодится.
Даже если в промпте явно указано: "используй только эти URL", Perplexity может подтянуть не весь контент страницы, а только фрагменты, которые посчитает релевантными, или вообще возьмет только закэшированную копию. Тут ещё есть нюанс: краулер Perplexity при переходе по ссылке часто получает "сырой" HTML, а динамический контент, подгружаемый JavaScript (таблицы характеристик, цены), может не попасть в контекст.
При этом Comet Assistant имеет прямой доступ к содержимому (видит актуальное состояние DOM), то есть вы явно даёте ему полный источник данных.
Так что такие запросы, по моему опыту, лучше делать через Comet Assistant.
Если не хочется скачивать Comet, то попробуйте такой промпт (evidence-based extraction):
Сравни модели X и Y только по данным со страниц: [URL модели X] [URL модели Y]. Составь список всех характеристик, которые явно указаны хотя бы на одной из страниц. Для каждой характеристики заполни таблицу: значение X / значение Y / “не найдено”. Важно: после каждого значения добавь короткую дословную цитату в кавычках и URL страницы, где это указано. Если значение не найдено - пиши "не найдено на странице" и не делай предположений и дополнений из внешних источников.Есть такое. Тут разве что в своих дата-центрах хостить и самим поддерживать такие модели.
А где у вас хранится этот json, насколько он большой и насколько часто он обновляется? Спрашиваю, потому что в некоторых случаях Perplexity кэширует какую-то версию файла, и пока вы прямо её не проиндексируете, будет врать, что оперирует актуальными данными.
Полагаю, такое может происходить из-за особенностей работы Perplexity с индексированными данными. Попробуйте ради эксперимента сделать вот так (как я записал на видео ниже). Промпт для примера "Проведи сравнительный анализ технических характеристик видеокамер и выведи результаты в виде таблицы" и через @ добавляете открытые вкладки как источники поиска.
А попробуйте через Comet Assistant эту задачу выполнить. Вот только выберите опцию "Act for me"