Articles / Profile of Safreliy / Habr

Савелий @Safreliy

Программист-математик

ProfileArticles13PostsNewsComments20

Safreliy Oct 8 at 11:19

Как мы обеспечили +33% к точности на сложных SQL-запросах

Medium

9 min

1.9K

Postgres Professional corporate blogArtificial IntelligenceMachine learning * SQL * PostgreSQL *

Tutorial

Традиционные подходы к генерации SQL-запросов часто полагаются на инструктированные языковые модели, но они могут быть неэффективными и неточными. Мы рассмотрим новый подход, основанный на использовании Reinforcement Learning для дообучения моделей, который может улучшить точность и эффективность генерации SQL.

+15

Safreliy Jun 27 at 11:03

Будущее ИИ — формальные грамматики

Easy

19 min

2.8K

Postgres Professional corporate blogNatural Language Processing * Machine learning * Mathematics * Artificial Intelligence

Tutorial

Почему даже самая мощная LLM иногда выдаёт бессмысленные фразы и противоречия? Всё дело в экспоненциальном росте вариантов (N^M) и свободном копировании человеческих ошибок. Читайте статью, чтобы узнать, как мы с помощью формальных грамматик превращаем хаотичную генерацию в управляемый синтез, усиливая роль семантики и соблюдая структурные правила.

+11

Safreliy May 28 at 09:27

На START, внимание, марш: как победить галлюцинации и научить LLM точным вычислениям

Easy

4 min

2.1K

Postgres Professional corporate blogArtificial IntelligenceMachine learning * Python *

Review

START — опенсорсная LLM для точных вычислений и проверки кода. В START решены две главные проблемы большинства обычных моделей: галлюцинации и ошибки в многоэтапных расчетах. В статье разберемся, зачем и как именно эти проблемы решены.

+11

Safreliy May 7 at 18:20

LLM пайплайны укрощают сложность баз данных, или как мы подружили ИИ с БД без ИБД

Easy

12 min

5.9K

Postgres Professional corporate blogPostgreSQL * SQL * Machine learning * Artificial Intelligence

Case

Большие языковые модели (Large Language Model, LLM) используют в разных областях: с их помощью генерируют программный код, ищут информацию, озвучивают реплики чат-ботов. А вот при работе с реляционными данными языковые модели часто ошибаются.

Чтобы справиться с этими ошибками, в мы разработали три пайплайна для работы с базами данных. Эти пайплайны представляют собой цепочку связанных между собой языковых моделей: каждая из них генерирует свой ответ, и следующая модель работает с ответом предыдущей. Таким образом мы получаем дополнительный контекст, и запрос к базе данных становится точнее.

+14

Safreliy Mar 28 at 16:45

Уже через год мы будем общаться с базами данных по-русски

Easy

4 min

27K

Postgres Professional corporate blogDatabase Administration * Artificial IntelligenceSQL * PostgreSQL *

По прогнозу Gartner, запросы на естественном языке вытеснят SQL уже в 2026 году. Возможно, прогноз Gartner чересчур оптимистичный, но если они и ошибаются, то только в сроках — сам переход на естественный язык в работе с БД неизбежен.

109

Safreliy Nov 13 2024 at 07:01

Нейронные оптимизаторы запросов в реляционных БД (Часть 3): Погружение в ранжирование

Medium

12 min

2.9K

Postgres Professional corporate blogMachine learning * Artificial IntelligenceAlgorithms * High performance *

Review

Ранжирование — это уникальная разновидность задач в машинном обучении, обособленная как от классификации, так и регрессии. Заключительная статья по нейрооптимизаторам в РСУБД, как ни странно, связана именно с ней. Бум в развитии подобных моделей произошёл совсем недавно — в 2023 году, что мы с вами подробно разберём. Сначала погрузимся в ранжирование в целом, а затем увидим, как в соответствии с новой постановкой задачи адаптировались методы поиска оптимального плана исполнения запроса.

+12

Safreliy Oct 4 2024 at 11:24

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации

Medium

11 min

Postgres Professional corporate blogAlgorithms * PostgreSQL * Artificial IntelligenceMachine learning *

Review

Нельзя просто взять и заменить нейросетями миллионы человеко-часов, вложенных в разработку классических оптимизаторов запросов реляционных СУБД. Надёжность, гибкость и скорость — ключевые характеристики экспертных систем, которые нарабатывались и отлаживались десятилетиями.

В прошлой статье рассказали о пионерах в области нейросетевых оптимизаторов, которые создали плацдарм для развития подобных ML-систем и их последующего вывода на уровень коммерческих продуктов. В этой же — затронем относительно стабильные подходы, не требующие гигантских вычислительных кластеров и удовлетворяющие большую часть потребностей бизнеса. Серебряной пули, конечно, не существует, но с каждым из этих методов можно прийти к оптимальному решению для конкретной задачи.

+13

Safreliy Sep 9 2024 at 10:54

Нейронные оптимизаторы запросов в реляционных БД (Часть 1)

Medium

15 min

8.8K

Postgres Professional corporate blogAlgorithms * PostgreSQL * Artificial IntelligenceMachine learning *

Review

В 1970-х годах известный программист Эдгар Кодд разработал математически выверенную теорию организации данных в виде таблиц (реляций). С тех пор утекло немало воды — появилось большое количество различных коммерческих и open-source реляционных систем управления базами данных (РСУБД). Скоро стало понятно, что эффективное получение данных из базы — задача далеко не тривиальная. Если говорить прямо, она нелинейная и в общем случае NP-сложная.

Когда SQL-запрос становится немного сложнее: SELECT * FROM table, у нас появляется огромная вариативность его исполнения внутри системы — и не всегда понятно, какой из возможных вариантов эффективнее как по памяти, так и по скорости. Чтобы сократить огромное количество вариантов до приемлемого, обычно используются так называемые эвристики — эмпирические правила, которые придуманы человеком для сокращения пространства поиска на несколько порядков. Понятное дело, эти правила могут отсечь и сам оптимальный план выполнения запроса, но позволяют получить хоть что-то приемлемое за адекватное время.

В последние годы в связи с активным развитием ML начали развиваться и нейронные оптимизаторы запросов —особенность которых в том, что они самостоятельно, без участия человека, находят необходимые закономерности в выполнении сложных планов исходя из обучения на огромном количестве данных. Тенденция началась приблизительно в 2017 году и продолжается до сих пор. Давайте посмотрим, что уже появилось в этой области в хронологическом порядке и какие перспективы нас ждут.

+33

Safreliy Mar 18 2024 at 08:58

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 3)

Medium

12 min

3.5K

3D-graphics * Algorithms * Machine learning * RoboticsArtificial Intelligence

Review

Мир, в котором мы с вами живём и который непосредственно ощущаем, является объёмным: расположение любой точки в нём можно описать тремя координатами, и этот факт элементарно зашит в нашу природу. Чем больше “понимания” система искусственного интеллекта будет иметь относительно истинной сущности вещей, включая их расположение, форму и объем, тем легче она будет справляться с задачами, которые до сих пор мог выполнять только человек.

В этой статье разберём, как ИИ помогает решать одну из ключевых задач робототехники, а именно - понимание и ориентация в объёмных пространствах!

Safreliy Feb 26 2024 at 08:50

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 2)

Medium

7 min

4.5K

AR and VRArtificial IntelligenceMachine learning * Algorithms * 3D-graphics *

Review

В предыдущей статье мы уже затрагивали задачу реконструкции 3D-объектов по их 2D-изображениям. В этой же углубимся в реконструкцию с головой! Вообще говоря, как мне кажется, сейчас мы рассмотрим гораздо более концептуально интересные методы, а именно - HSP и Mesh R-CNN. Это база, которая просто должна осесть в головах всех любителей ИИ в 3D!

+12

Safreliy Feb 1 2024 at 05:25

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 1)

Medium

9 min

7.7K

3D-graphics * Algorithms * Machine learning * Artificial IntelligenceAR and VR

Review

В последнее время мы оцениваем на удивление много проектов, так или иначе связанных с 3D-пространством и ML-моделями. По всей видимости по прошествии 2023 года люди воодушевились и начали видеть возможность реализации тех идей, которые ранее просто-напросто казались научной фантастикой - и они не ошибаются! Исследователи и разработчики последних технологий достигли сногсшибательных результатов. В связи с этим хотел бы накидать цикл обзорных статей, которых как мне лично, так и нашей рабочей группе очень сильно недоставало в процессе ресёрча.

+13

Safreliy Dec 26 2023 at 13:28

Генеративные рекомендательные системы: как мы научились предсказывать заказы пользователей

Medium

6 min

Artificial IntelligenceMachine learning * Algorithms *

Case

Привет, Хабр!

Продолжая развитие темы рекомендательных систем с моей последней статьи, я бы хотел рассказать о подходе, до которого мы с моей командой самостоятельно дошли и воплотили в жизнь на существующем проекте. Речь идёт о настраиваемом автоэнкодере, но совсем не важно, как я его обозвал, важно то, как он работает - прейдём к сути!

Safreliy Jun 9 2023 at 16:21

Модификация алгоритма FP Growth или как правильно ухаживать за своими деревьями

Hard

8 min

3.9K

Data Mining * Algorithms * Mathematics * Machine learning * Data Engineering *

From sandbox

✏️ Technotext 2023

Привет, Хабр!

В поисках варианта алгоритма FP Growth, который мог бы удовлетворить моим потребностям, я столкнулся с неожиданным и крайне удивительным обстоятельством - все решения из коробки не предполагали разбиения данных на батчи (относительно небольшие наборы элементов) и последующем обучении на них. Также они не были способны дообучаться на вновь полученных транзакциях да и в целом были заточены на единовременный анализ всей транзакционной базы данных. Меня это смутило - неужели в эпоху обработки больших данных не было подробно описано или хотя бы выложено на всеобщее обозрение ни одной реализации подобного алгоритма. Возможно, я не первый, кто придумал что-то подобное, и в кулуарах научных статей найдутся схожие идеи - что ж, в любом случае это мой личный опыт и я надеюсь в каком-либо приближении он окажется вам полезен или хотя бы интересен.

Как мы обеспечили +33% к точности на сложных SQL-запросах

Будущее ИИ — формальные грамматики

На START, внимание, марш: как победить галлюцинации и научить LLM точным вычислениям

LLM пайплайны укрощают сложность баз данных, или как мы подружили ИИ с БД без ИБД

Уже через год мы будем общаться с базами данных по-русски

Нейронные оптимизаторы запросов в реляционных БД (Часть 3): Погружение в ранжирование

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации

Нейронные оптимизаторы запросов в реляционных БД (Часть 1)

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 3)

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 2)

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 1)

Генеративные рекомендательные системы: как мы научились предсказывать заказы пользователей

Модификация алгоритма FP Growth или как правильно ухаживать за своими деревьями

Information

Specialization