Articles / Bookmarks / Profile of kacetal / Habr

Artem @kacetal

Java dev

ProfileArticlesPostsNewsComments161

devmark Jun 23 at 13:00

Spring AI: retrieval augmented generation

Easy

8 min

Kotlin*Java*Programming*Artificial Intelligence

Tutorial

Spring AI, который только недавно получил первую стабильную версию, уже предоставляет довольно много возможностей для работы с RAG (retrieval augmented generation).

Благодаря этому подходу нейросеть перед тем, как дать ответ на запрос пользователя, выполнит поиск подходящей информации в векторном хранилище. Причём каждый документ хранится не в виде текста, а в виде массива чисел (т.н. «векторов»).

Процесс преобразования различных документов в такой векторный формат выполняется опять же с помощью LLM и называется embedding («встраивание»). Хорошая новость заключается в том, что всё это можно легко сделать с помощью Spring AI.

GlobalSign_admin Jun 22 at 16:20

Кликджекинг по двойному щелчку. Новый приём обманного UI

4 min

2.8K

GlobalSign corporate blogJavaScript*BrowsersInterfaces*Information Security*

Кликджекинг (подделка UI) — известный приём обмана пользователей интернета, когда поверх видимой страницы располагается невидимый слой, куда загружается фальшивка. То есть пользователю кажется, что он вводит пароль на доверенной странице, но на самом деле вводит его в стороннюю форму, которая принадлежит злоумышленнику.

В последние годы его риск значительно снизился, потому что все браузеры по умолчанию запретили межсайтовые куки, в то время как самые опасные варианты использования требуют авторизации жертвы на целевом сайте.

Однако несколько месяцев назад в Сети впервые замечены случаи кликджекинга по двойному щелчку. Вредоносные действия выполняются в промежутке между первым и вторым кликами незаметно для жертвы. Более продвинутая версия атаки работает практически на всех сайтах и в любых браузерах.

Читать дальше →

+17

TantorLabs Jun 6 at 13:46

Внутристраничная очистка в индексах PostgreSQL

Easy

12 min

2.5K

Тантор Лабс corporate blogPostgreSQL*Database Administration*

Tutorial

Внутристраничная очистка (HOT cleanup) — это оптимизация, благодаря которой старые версии строк могут эффективно удаляться из блоков таблиц. Освобождённое место используется под размещение новой версии строки. Освобождается только место, занимаемое версиями строк, вышедшими за горизонт базы данных (xmin horizon). В статье рассматривается алгоритм работы аналогичной оптимизации для индексов. Если горизонт удерживается, то ни внутристраничная очистка, ни вакуум не могут освободить место, и тогда новая версия строки вставляется в другой блок. Увидим на примере стандартного теста pgbench, как сильно может снижаться производительность при удержании горизонта базы данных (в случае когда есть сессия с долгим запросом или транзакцией) и разберемся в причинах снижения производительности.

+16

igor_suhorukov Dec 1 2023 at 06:14

На грани ИИ: пример поиска и обработки векторов в PostgreSQL + pgvector

Medium

9 min

17K

PostgreSQL*Programming*Java*Data Mining*Data Engineering*

На Хабре было много упоминаний pgvector в обзорах Postgresso. И каждый раз новость была про место которое где-то за границей и далеко. Многие коммерческие решения для хранения и поиска векторов в базе данных нынче не доступны, а pgvector доступен любому, тем более в самой популярной базе в России. Применим pgvector для задачи поиска похожих домов по инфраструктуре для детей в Москве.

В этой статье покажу на этом практическом примере как хранить, кластеризовать алгоритмом DBSCANвекторы и искать по ним в базе данных. В примере задача с векторами на грани типичного хранения и обработки результатов работы нейросетевых моделей в базе данных.

+12

igor_suhorukov Jun 3 at 15:43

Семантический поиск по статьям Хабра в PostgreSQL + индексация текстов LLM в Ollama

Medium

21 min

5.2K

PostgreSQL*Artificial IntelligenceJava*Open source*

Покажу вам практическую реализацию семантического поиска на основе векторных представлений - эмбеддингов из текста. Здесь я создам систему, которая анализирует статьи с Хабра, извлекает из них темы и ключевые слова с помощью локально работающих больших языковых моделей LLM, и на основе этих данных создает векторные представления для эффективного поиска по смыслу, а не по запросу на вхождение определенного текста.

+30

mmorev Dec 17 2024 at 09:00

Мониторинг бизнес-процессов с помощью OpenTelemetry

17 min

10K

Конференции Олега Бунина (Онтико) corporate blogРайффайзен Банк corporate blogDevOps*High performance*

Tutorial

Если у вас большой сложный продукт, который разрабатывают несколько команд, бывает трудно избежать ситуации, когда продакшен лежит, бизнес стоит, а инженеры несколько часов перекидывают стрелки друг на друга. При этом каждый считает, что проблема на другой стороне. Чтобы найти верное решение, нужен не столько подходящий инструмент, сколько общий подход для мониторинга всех частей приложения.

В этой статье расскажу, как мы объединили несколько разных команд разработки Райффайзен Онлайн общим Observability и с помощью исключительно технических метрик отслеживаем здоровье бизнес-процессов. Как всё это помогает мгновенно находить первопричину сбоя. Как устроен OpenTelemetry и как с его помощью рассчитать доступность приложения в девятках, а также MTTR (Mean Time to Recovery).

+24

ph_piter Apr 29 at 12:29

Книга: «RESTful Web API: Паттерны и практики»

5 min

7.4K

Издательский дом «Питер» corporate blogAPI*System Analysis and Design*Professional literature*

Привет, Хаброжители!

В мире, где 70% бизнес-транзакций происходят в цифровом формате, качественные API становятся критически важными. Они связывают сервисы, обеспечивают бесперебойную работу приложений и позволяют компаниям масштабироваться. Но как создать API, которые не просто работают, а остаются стабильными, безопасными и удобными для разработчиков даже спустя годы?

Издательство Sprint book представляет новинку — «RESTful Web API: Паттерны и практики». Майк Амундсен, автор книги, признанный эксперт в области веб-архитектуры, делится своим многолетним опытом. В «RESTful Web API» он собрал более 70 проверенных паттернов и практик, которые помогут вам проектировать API, способные выдерживать высокие нагрузки, адаптироваться к изменениям и минимизировать риски.

Читать дальше →

+13

alex_rum Nov 11 2024 at 07:15

Пример использования Spring Data и Redis для временного хранения персональных данных

9 min

Java*

From sandbox

Translation

Некоторые компании, работающие с персональными данными пользователей, сталкиваются с невозможностью хранить их в течение долгого периода времени из-за правовых ограничений. Такое часто можно встретить в финтехах. Позволяется сохранить данные на очень короткое время, которые также должны быть удалены сразу после использования в целях сервиса. Существует несколько вариантов решения этой задачи. В данном посте я показываю упрощенный пример микросервиса, работающего с чувствительной информацией, используя Spring и Redis.

aio350 Apr 22 at 08:05

React Reconciliation: скрытый механизм, управляющий компонентами

Easy

11 min

4.2K

Timeweb Cloud corporate blogJavaScript*ReactJS*Algorithms*Website development*

Review

Translation

❯ Механизм согласования

В моих предыдущих статьях (1, 2) я подробно рассматривал, как работает React.memo, а также делился более эффективными подходами к оптимизации производительности с помощью компоновки. Однако для глубокого понимания работы React необходимо разобраться в основном механизме, лежащем в основе всех этих оптимизаций – алгоритме согласования (reconciliation).

Согласование – это процесс, в результате которого React приводит DOM в соответствие с деревом компонентов. Именно этот механизм позволяет реализовать декларативный подход к программированию на React: вы формулируете свои намерения, а React самостоятельно определяет, как выполнить эти намерения наилучшим образом и с наименьшими затратами.

Читать дальше →

+15

ph_piter Apr 22 at 11:10

Книга: «Elasticsearch для разработчиков: индексирование, анализ, поиск и агрегирование данных. 2-е изд.»

5 min

2.8K

Издательский дом «Питер» corporate blogData storage*Professional literature*

Привет, Хаброжители!

Вы знакомы с Elasticsearch? Это мощный инструмент для работы с большими объемами данных. Его гибкость, масштабируемость и высокая производительность делают его незаменимым в современных IT-решениях. Книга Анурага Шриваставы «Elasticsearch для разработчиков» — это подробное руководство, которое шаг за шагом раскрывает все аспекты работы с этой технологией: от базовых принципов до сложных сценариев использования.

Шривастава начинает с основ, постепенно погружая читателя в мир Elasticsearch, и к концу книги даже новичок сможет уверенно работать с индексами, запросами, агрегациями и геоданными. Практические примеры и четкие объяснения помогают закрепить знания, а структура книги позволяет изучать материал в удобном темпе.

Читать дальше →

+10

ArthurSupertramp Jan 24 at 11:44

Пишем идеальную mobile-first галерею

Medium

9 min

2.8K

Website development*HTML*JavaScript*CSS*

Привет, меня зовут Артур, и я люблю плавные интерфейсы, CSS и современные подходы. Сегодня хочу поговорить с вами о задаче, которая настигает, пожалуй, каждого фронтенд разработчика: о создании галереи.

aegnis Mar 12 at 11:08

Snake, альтернатива Slick slider на чистом JavaScript

Easy

4 min

2.2K

CSS*JavaScript*jQuery*HTML*Website development*

Review

Для создания современных сайтов разработчики все чаще стали пользоваться реактивными фреймворками или чистым JavaScript, отказываясь при этом от библиотеки jQuery. Однако остаются плагины, от которых не так просто отказаться. К таким относится Slick slider. Он очень удобен в использовании и сочетает в себе все необходимые для создания каруселей опции.

winkyBrain Mar 21 at 08:25

signals в качестве альтернативы useState в React

Easy

6 min

4.4K

ReactJS*JavaScript*Website development*

Tutorial

Привет, хабр! Больше года назад я впервые узнал про сигналы, а три месяца назад @Sin9k записал видео на эту тему. И поскольку сигналы по-прежнему обходят стороной, попробую немного исправить ситуацию)

В материале будет использоваться обёртка signals-react, так как изначально рассматриваемая библиотека написана под Preact.

neketli Mar 6 at 10:16

Webpack, Vite или Rspack: что это за зоопарк или чем собирать микрофронтенды в 2025?

Medium

7 min

9.9K

VueJS*JavaScript*

Review

From sandbox

Привет! Разбираясь с микрофронтендами в монорепозитории для проекте с Vue3 пришёл к выводу, что так много уделяется внимания гибкости в построении архитектуры и бизнес-задачам, что все боятся заниматься улучшением "условий труда" связанных со сборкой приложения! Решил что эта задачка как раз мне подходит и представляю вашему вниманию небольшую статью которая возможно поможет вам сделать выбор или подтолкнет попробовать новые инструменты сборки фронтенда! Для справки - микрофронтенды у нас на Module Federation, Nx для управления монорепозиторием, общаемся мы через GraphQL, тестируем с Jest и конечно куда без TypeScript. Проект активно развивается, и с ростом его масштабов столкнулись с вопросом: какой сборщик лучше всего справится с нашими задачами? Webpack уже давно с нами, но его медлительность заставляет искать альтернативы. Vite обещает молниеносную разработку, а Rspack — производительность без сложной миграции. Давайте разберёмся, что подойдёт именно нам — и, возможно, вам.

+10

OlegIct Mar 7 at 10:08

Семь фаз вакуумирования в PostgreSQL

Medium

11 min

4.6K

PostgreSQL*

Review

From sandbox

В статье описан алгоритм вакуумирования PostgreSQL и приводится сравнение числа сканирований индексов в 17 версии PostgreSQL и предыдущих версиях.

Есть пять фаз вакуумирования каждой таблицы, mwiew, toast и индексов на них: SCAN_HEAP, VACUUM_INDEX, VACUUM_HEAP, INDEX_CLEANUP, VACUUM TRUNCATE. Помимо них есть подготовительная фаза инициализации и завершающая фаза.

OlegIct Mar 7 at 11:27

Техника TOAST (The Oversized-Attribute Storage Technique) в PostgreSQL

Medium

13 min

PostgreSQL*

Review

Если строка не помещается в блок (страницу), то в PostgreSQL применяется техника выноса полей в отдельную таблицу, называемую TOAST-таблица. Техника выноса и хранения называется TOAST (The Oversized-Attribute Storage Technique, техника хранения атрибутов большого размера). В статье достаточно детально рассматривается алгоритм работы TOAST. Знание алгорима и его граничные значения полезно, чтобы понимать каким образом хранятся данные в таблицах.

Sravni_Tech Mar 6 at 14:15

Postgres как поисковый движок

12 min

11K

Сравни corporate blogPostgreSQL*Search engines*

Translation

Поиск — это сложно. Важная часть многих приложений, которую нелегко реализовать правильно. Особенно в случае с RAG-пайплайнами, где на качество поиска завязан весь процесс.

Хотя семантический поиск в моде, старый добрый лексический поиск по-прежнему остается базой. Семантические методы могут улучшить результаты, но эффективнее всего они работают, когда добавляются к прочному фундаменту текстового поиска.

Эрик Закариассон, разработчик и автор блога Anyblockers, рассмотрел в своей статье, как использовать Postgres для создания надёжной поисковой системы. В рамках задачи автор объединил три техники:

1. Полнотекстовый поиск с tsvector

2. Семантический поиск с pgvector

3. Нечёткое сопоставление с pg_trgm

4. Бонус: BM25

Возможно, это не оптимальный подход для любой ситуации, но отличная альтернатива созданию отдельного поискового сервиса; отправная точка, которую можно реализовать и масштабировать в рамках существующей базы данных Postgres.

+57

alena_bobrova Feb 25 at 09:29

Обработка ошибок Axios

10 min

3.8K

Райффайзен Банк corporate blogWebsite development*TypeScript*ReactJS*JavaScript*

Привет, Хабр! Меня зовут Алёна, я senior фронтенд-разработчик отдела разработки ПО для розничного бизнеса в Райффайзенбанке. Недавно передо мной встала задача улучшения пользовательского опыта обработки ошибок запросов к бэкенду. Я решила комплексно исследовать эту тему на примере HTTP-клиента Axios.

Если при отправке запросов с помощью Axios возникает ошибка — клиентское приложение получает аргумент, который может быть экземпляром объекта, производного от системного класса Error, или любым типом. Он может содержать много информации и не всегда понятно, что самое важное для определения типа исключения и способа обработки. Поэтому я выделала 4 категории ошибок запросов, сделанных при помощи Axios, которые нужно по-разному интерпретировать.

aio350 Feb 17 at 08:45

Чеклист для tsconfig.json

Medium

15 min

8.5K

Timeweb Cloud corporate blogWebsite development*TypeScript*JavaScript*

Review

Translation

В этой статье я расскажу о настройках TypeScript, определяемых в файле tsconfig.json, которых я использую в своих проектах.

❯ 1. Возможности, не затрагиваемые в этой статье

В этой статье описывается в основном настройка проектов, в которых все локальные модули являются ESM. Мы почти не будем говорить об импорте CommonJS.

Также мы не будем говорить о следующем:

импорт и проверка типов обычного JavaScript — настройках allowJs и checkJs
настройка JSX. См. раздел "JSX" карманной книги по TS
"проекты" (полезно для монорепозиториев): настройка composite и др. См.:
- раздел "Ссылки на проекты" карманной книги по TS
- статья "Создание простых монорепозиториев с помощью пространств имен (namespaces) npm и ссылок на проекты TS"

Читать дальше →

+24

badcasedaily1 Feb 17 at 13:16

Обзор Kotlin Flow

Easy

5 min

5.8K

OTUS corporate blogKotlin*Programming*

Review

Привет, Хабр!

В этой статье рассмотрим, как работает Kotlin Flow — инструмент для асинхронной обработки данных. Flow позволяет легко получать данные по мере их готовности, не блокируя основной поток, а также управлять отменой, обработкой ошибок и сменой контекста.

2 3 ...

8 9