Именно lmmich я не рассматривал. По февральской статье, его основная фишка - хранение фото и шаринг. Есть поиск по описанию и распознавание лиц. Но на английском.
Для хранения и шаринга у меня есть Nextcloud. А поиск на русском сделать, как оказалось, не сильно сложно.
И, конечно, не будем забывать про фатальный недостаток всех этих решений, Not Invented Here.
Похоже, что первичный OCR надо делать другим инструментом, не нейросетью или хотя бы не этой нейросетью. А потом делать исправление ошибок, сверку по ФИАС.
может привести к неопределённому ответу, потому что символический перевод не учитывает, что Гарри – человек и что «Уолден» – книга. Для человека это очевидно, а модель этого не видит.
Почему модель не может спросить у пользователя, что такое Уолден? Я имею в виду, были ли попытки реализации создания уточняющих вопросов к пользователю?
Гораздо глубже лежит тема уровней изолированности транзакций. И вот о ней Валера не знал. Как не знал и то, что Postgres, который он использует, по умолчанию обладает уровнем Read Committed и не блокирует чтение при записи.
В результате первый процесс, обновляющий сумму и статус, завершил работу уже после того, как второй процесс начал своё выполнение. Поэтому ключ идемпотентности просто не помог.
Для этого сначала запись блокируется оператором SELECT FOR UPDATE SKIP LOCKED или NOWAIT, а уж потом все остальное.
И как только вы начинаете расширяться — к примеру, добавляете партиционирование по месяцам (для MySql для этого включаете в уникальный индекс колонку created_at), — вы теряете идемпотентность, даже не заметив.
Не стоит путать уникальный индекс, первичный ключ и ключ партиционирования
Но в целом подборка кейсов и их решений достойная, спасибо
Как мы видим на графике, после пика в 2015 году (медиана ~288 тыс. просмотров) начался долгий период стагнации. Последние три года показывают отчётливый спад: с 103 тыс. в 2023 до 73 тыс. в 2025 году.
Если количество новых статей растет быстрее роста аудитории, то медианное количество просмотров будет неизбежно падать.
Будет прикольно, если окажется, что от архитектуры зависит, но не в той степени, как ожидалось. И студент совсем с другой внутренней организацией может перенять наклонности учителя. Пахнет новой теорией.
Через «Пуск» запустите x64 Native Tools Command Prompt for VS 2022 — специальную консольную среду, которая активирует нужные переменные.
Рекомендую запускать от имени администратора, решит проблему установки скомпилированного расширения в папку PostgreSQL.
set "PGROOT=C:\Program Files\PostgreSQL\17" && cd /d D:\pgvector && nmake /F Makefile.win && nmake /F Makefile.win install
Вы это из readme pgvector скопировали? там в скриптах где-то ошибка работы с длинными именами, поэтому вместо рекомендуемого set "PGROOT=C:\Program Files\PostgreSQL\17" лучше использовать короткие имена в пути: set PGROOT=C:\PROGRA~1\POSTGR~1\17
И по дате. Но одной даты мало, нужно ещё сравнивать похожесть снимков.
А как же они ищут фото по строке, если не по описаниям? Или описание к каждому фото надо самому создать?
Кстати, да, повторы и мало отличающиеся фото можно отследить по близости их векторов.
Именно lmmich я не рассматривал. По февральской статье, его основная фишка - хранение фото и шаринг. Есть поиск по описанию и распознавание лиц. Но на английском.
Для хранения и шаринга у меня есть Nextcloud. А поиск на русском сделать, как оказалось, не сильно сложно.
И, конечно, не будем забывать про фатальный недостаток всех этих решений, Not Invented Here.
Теперь они будут в агентах. Для нас разницы никакой, визуального и информационного мусора меньше не станет.
Похоже, что первичный OCR надо делать другим инструментом, не нейросетью или хотя бы не этой нейросетью. А потом делать исправление ошибок, сверку по ФИАС.
И вот видео и аудиозапись перестают быть доказательством чего-либо
Еще одна методика "как отказать кандидату"
Хотя пару плюсиков я поставил, почитать было интересно.
Почему модель не может спросить у пользователя, что такое Уолден? Я имею в виду, были ли попытки реализации создания уточняющих вопросов к пользователю?
Так я и предлагаю изменить подход - ставить лок на платеж в самом начале обработки, чтобы никто его не забрал.
Зависит от сценария обработки, и так, и так можно сделать.
Конструкция FOR UPDATE ставит лок, а SKIP LOCKED нужен для того, чтобы не тратить время на те записи, где лок уже стоит
Для этого сначала запись блокируется оператором SELECT FOR UPDATE SKIP LOCKED или NOWAIT, а уж потом все остальное.
Не стоит путать уникальный индекс, первичный ключ и ключ партиционирования
Но в целом подборка кейсов и их решений достойная, спасибо
Если количество новых статей растет быстрее роста аудитории, то медианное количество просмотров будет неизбежно падать.
Будет прикольно, если окажется, что от архитектуры зависит, но не в той степени, как ожидалось. И студент совсем с другой внутренней организацией может перенять наклонности учителя. Пахнет новой теорией.
Наверное, этот эффект проявляется только тогда, когда архитектура студента идентична или очень близка архитектуре учителя.
Или в вашем. Этот аргумент работает в обе стороны.
Это отсев, расслабьтесь
Массовыми автоматическими откликами вы гробите весь смысл пользования HH. А так норм.
Рекомендую запускать от имени администратора, решит проблему установки скомпилированного расширения в папку PostgreSQL.
Вы это из readme pgvector скопировали? там в скриптах где-то ошибка работы с длинными именами, поэтому вместо рекомендуемого set "PGROOT=C:\Program Files\PostgreSQL\17" лучше использовать короткие имена в пути: set PGROOT=C:\PROGRA~1\POSTGR~1\17