pgvector ... добавляет поддержку векторных операций в привычную нам базу данных. Уже не терпится попробовать в деле это расширение, но пока не ясно, когда и для каких задач могла бы я это применить.
Ну, например так разработчик одной векторной БД (не pgvector) использует её для ускорения работы Claude Code на больших кодовых базах:
Так можно любое достижение вычеркнуть, просто подбираете нужный порог "значимости", и вуаля: "Пароход? Ну это же игрушечный. Какая была выручка? Ой, не смешите."
Остальные будут ждать и прочитают уже обновлённое значение из L2. Я, к сожалению, не нашёл готовых библиотек для распределённых кэшей, реализующих этот функционал. Если вы знаете о таких, то напишите в комментариях.
Это же подсистема, а не библиотека. Ребята предусмотрели интерфейс для запросов наружу, но у каждого решения будут свои требования к слою кэширования. Кто же станет в библиотеку запихивать, скажем, Redis?
Увидел упоминание об эффекте "Полианны"... вот ссылка на фильм, снятый по роману Элинор Портер "Полианна", где девочка изменяет людей вокруг себя, обучая их находить хорошее в обстоятельствах их жизни и фокусироваться на этом хорошем: https://www.kinopoisk.ru/film/332348/?utm_referrer=www.google.com
Фоновый шум у них довольно сильный, как в плотно набитом коллцентре. На паузах срабатывает шумодав, но как только человек начинает говорить, шум снова слышно. Мне звонили десятки раз, и могу сказать, что шум всегда примерно одинаковый.
Второй момент - неповторяемость телефонных номеров. Там, видимо, система подмены информации об исходящем номере, или просто перенаправление звонка, чтоб на принимающей стороне нельзя было заблокировать входящий по номеру телефона. И у звонящего нет никакой возможности повлиять на эту систему. Просишь перезвонить - приходит входящий с другого номера, голос тот же. Спрашиваешь, как же так, товарищ капитан из "отдела по экономическим преступлениям" (дословно цитирую), вы же с того же аппарата звоните? Начинает выдумывать, что там техника работает, всё меняет. А ему нужно же еще интонацию "сурового полицейского" поддерживать, "я тут на вас время трачу...", ну не тратьте на меня время, положите трубку - не может, по скрипту нельзя на той стороне трубку бросать.
принципом устройства сетевых пирамид является attentialism (перевода термина на русский так и не появилось). Сильно упрощая, твое место в сетевой иерархии определяется тем, сколько внимания ты в состоянии привлечь.
После прочтения вашей статьи можно дополнить формулировку: "Внимание стало ресурсом, ресурсом исчерпаемым. За него происходит конкуррентная борьба."
Ну представьте, что у вас список коммерческих предложений, 1000 файлов. Это масштаб бизнеса среднего размера. В каждом файле есть список из 20 существенных пунктов, отличающих одно КП от другого.
Эту информацию можно засунуть в название файла? Мне кажется нет.
Поиск по содержимому, очевидно, найдет нужный документ по ключевому словосочетанию, например "доставка морем". Поди догадайся, какой из пунктов понадобится при поиске, чтобы вынести его в название файла.
По русски называется "конечный автомат"
https://ru.wikipedia.org/wiki/Конечный_автомат
Ну, например так разработчик одной векторной БД (не pgvector) использует её для ускорения работы Claude Code на больших кодовых базах:
https://milvus.io/blog/why-im-against-claude-codes-grep-only-retrieval-it-just-burns-too-many-tokens.md
Как-то начинашь задумываться, насколько "настоящее" резервирование при двух подстанциях на территории одного предприятия.
Как минимум они обслуживаются одной группой людей, у которой один начальник, один чеклист. Ну и уровень стресса тоже один.
Просто почитайте предыдущие статьи этого автора, это такая тема: анти-хайп, но тоже хайп.
Так можно любое достижение вычеркнуть, просто подбираете нужный порог "значимости", и вуаля: "Пароход? Ну это же игрушечный. Какая была выручка? Ой, не смешите."
Это же подсистема, а не библиотека. Ребята предусмотрели интерфейс для запросов наружу, но у каждого решения будут свои требования к слою кэширования. Кто же станет в библиотеку запихивать, скажем, Redis?
Расскажите, пожалуйста, поподробнее, как именно реализовано:
Жаль только что автор дает такие чудесные советы, но не отвечает на вопросы в комментах...
Если можно, расскажите подробнее, как очередь с задержкой поддерживает требуемую скорость?
Увидел упоминание об эффекте "Полианны"... вот ссылка на фильм, снятый по роману Элинор Портер "Полианна", где девочка изменяет людей вокруг себя, обучая их находить хорошее в обстоятельствах их жизни и фокусироваться на этом хорошем:
https://www.kinopoisk.ru/film/332348/?utm_referrer=www.google.com
Понял, спасибо!
Ребята, видимо, пришли из стандартизации, там свой язык. Не айтишный.
А как быть с перестановкой значимых полей в названии?
Например "Доска длина 5м 4х20см" и "Доска 4х20см длина 5м"
Фоновый шум у них довольно сильный, как в плотно набитом коллцентре. На паузах срабатывает шумодав, но как только человек начинает говорить, шум снова слышно.
Мне звонили десятки раз, и могу сказать, что шум всегда примерно одинаковый.
Второй момент - неповторяемость телефонных номеров. Там, видимо, система подмены информации об исходящем номере, или просто перенаправление звонка, чтоб на принимающей стороне нельзя было заблокировать входящий по номеру телефона. И у звонящего нет никакой возможности повлиять на эту систему.
Просишь перезвонить - приходит входящий с другого номера, голос тот же. Спрашиваешь, как же так, товарищ капитан из "отдела по экономическим преступлениям" (дословно цитирую), вы же с того же аппарата звоните?
Начинает выдумывать, что там техника работает, всё меняет. А ему нужно же еще интонацию "сурового полицейского" поддерживать, "я тут на вас время трачу...", ну не тратьте на меня время, положите трубку - не может, по скрипту нельзя на той стороне трубку бросать.
И порядок слов обратный: "наподобие громадины жили". Учились у магистра Йоды?
Интересно пересекается вот с этой статьей на Хабре (Почему надувается пузырь персональных данных):
После прочтения вашей статьи можно дополнить формулировку: "Внимание стало ресурсом, ресурсом исчерпаемым. За него происходит конкуррентная борьба."
А там, видать, мамкин дидосер поднагрузил и "не пущщал".
Если не секрет, какой на этом этапе получился расход токенов на всю систему?
Ну представьте, что у вас список коммерческих предложений, 1000 файлов. Это масштаб бизнеса среднего размера. В каждом файле есть список из 20 существенных пунктов, отличающих одно КП от другого.
Эту информацию можно засунуть в название файла? Мне кажется нет.
Поиск по содержимому, очевидно, найдет нужный документ по ключевому словосочетанию, например "доставка морем". Поди догадайся, какой из пунктов понадобится при поиске, чтобы вынести его в название файла.
DiHalt чтоль писал? Уж больно слог знакомый.