Статьи / Закладки / Профиль Rustemhak / Хабр

Рустем@Rustemhak^{read⁠-⁠only}

Пользователь

ПрофильКомментарии2Закладки37

IgorSh63 11 янв в 07:14

Data-Feeling-School-RAG-Challenge или по ту сторону баррикад

Простой

6 мин

6.7K

Искусственный интеллект

Кейс

Сезон ИИ в разработке

Не буду одинок, если предположу, что большинство читателей при встрече с чат ботом любой ценой отказывается от его услуг, и ищет способы выхода на живого человека. Причин тому много и основная из них это выдача чат ботом информации далекой от ожидаемой. А какова цена создания системы, которая мало мальски отвечает ожидаемо на задаваемые пользователем вопросы?

askid 23 сен 2025 в 19:27

OpenCode: Революция в мире AI-инструментов для разработки

Средний

8 мин

74K

Python * Go * Rust * Data Engineering * Developer Relations *

Обзор

Привет, коллеги! Сегодня хочу поделиться с вами своими размышлениями о терминальном AI-агенте OpenCode и его сравнении с другими популярными решениями на рынке. После нескольких месяцев активного использования различных AI-инструментов для кодирования, могу с уверенностью сказать: OpenCode — это действительно что-то особенное.

aabanker 13 окт 2025 в 13:16

Как я подружил бэкенд с API AmoCRM: связь сущностей, отправка данных, защита от дублей

Средний

14 мин

5.2K

TypeScript * JavaScript * CRM-системы *

Из песочницы

Интеграция простой формы с AmoCRM на «бумаге» выглядит просто. Кажется, что можно просто отправить контакт, создать лид, прикрепить товары к сделке — и готово». На практике всё наоборот.

Честно говоря, документация AmoCRM сначала меня запутала. Я полез гуглить по моей ситуации (связка формы с CRM) почти ничего. Посмотрел ролик на YouTube про библиотеку. Понял основы, но всё равно оставалось куча вопросов.

Дело в том, что AmoCRM в упор не видит дубликаты контактов и товаров. При очистке дублей из админки ничего не удаляется. Все из-за уникальных ID, которые назначаются при отправке данных.

После множества экспериментов, я все таки смог подружить небольшой бэкенд и API AmoCRM.

kucev 30 дек 2024 в 18:03

GraphRAG: Повышение точности и полноты GenAI

4 мин

16K

Big Data * Data Engineering * Data Mining * Искусственный интеллектМашинное обучение *

Перевод

GraphRAG предоставляет «граф знаний» LLM. В отличие от текстовых документов, эти структуры данных четко отображают взаимосвязи между объектами.

Ivanich-spb 27 ноя 2025 в 12:09

3 главных инсайта о «взломах» LLM из исследования StrongREJECT

Простой

5 мин

7.4K

Блог компании Data Feeling SchoolИнформационная безопасность * Искусственный интеллектИсследования и прогнозы в IT * CTF *

Обзор

Сезон ИИ в разработке

Всем привет!
Погружаюсь в новую для себя область AI Security, в связи с чем решил написать несколько обзоров на самые обсуждаемые исследования и статьи по этой теме. Сегодня поговорим про взлом LLM и неожиданные выводы исследования StrongReject.

Джейлбрейкнуть

tw0face 14 окт 2025 в 04:51

Печать голосом в любом приложении, дейтинг с астрологическим подбором партнера — и ещё 8 российских стартапов

5 мин

4.9K

Блог компании Product RadarБизнес-модели * Монетизация веб-сервисов * Венчурные инвестицииРазвитие стартапа

Дайджест

10 новых российских продуктов для автоматизации E2E тестирования на естественном языке, управления здоровьем, календарно-сетевого планирования проектов и многого другого. Битва за «Продукт недели» началась!

Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.

tw0face 7 окт 2025 в 04:50

Создание онлайн-очередей для клиентов офлайн-бизнеса, автоматизация найма «все в одном» — и ещё 8 российских стартапов

5 мин

Блог компании Product RadarБизнес-модели * Монетизация веб-сервисов * Венчурные инвестицииРазвитие стартапа

Дайджест

10 новых российских продуктов для планирования финансов, управления стандартами и качеством, генерации фоновой музыки, практики разговорного английского и многого другого. Битва за «Продукт недели» началась!

Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.

svtDanny 5 янв 2025 в 09:25

Алгоритмы спекулятивного инференса LLM

Средний

5 мин

7.3K

Машинное обучение * Искусственный интеллектАлгоритмы * Высоконагруженные системы * Open source *

Обзор

За последние годы качество LLM моделей сильно выросло, методы квантизации стали лучше, а видеокарты мощнее. Тем не менее качество генерации все еще напрямую зависит от размера весов и, как следствие, вычислительной сложности.
Кроме того, генерация текста авторегрессионна - токен за токеном по одному, потому ее сложность зависит от размера контекста и количества генерируемых токенов.

Но генерация текста не всегда имеет однородную сложность, так же как мы во многом мыслим идеями, а слова произносим «на автомате». В статье обсудим алгоритмы, позволяющие использовать эту неоднородность для ускорения.

IlyaRice 22 мар 2025 в 11:54

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

Средний

23 мин

93K

Машинное обучение * Data Engineering * Natural Language Processing * Искусственный интеллект

Кейс

Когда новичок пытается построить свою первую вопросно-ответную LLM систему, он быстро узнаёт, что базовый RAG - это для малышей и его нужно "прокачивать" модными техниками: Hybrid Search, Parent Document Retrieval, Reranking и десятки других непонятных терминов.
Глаза разбегаются, наступает паралич выбора, ладошки потеют.

А что, если попробовать их все?
Я решил потратить на подготовку к соревнованию 200+ часов и собственноручно проверить каждую из этих методик.
Получилось настолько удачно, что я выиграл конкурс во всех номинациях.

Теперь рассказываю, какие техники оказались полезными, а какие нет, и как повторить мой результат.

+161

emilmubarakov 29 июн 2025 в 15:15

MVP vs MLP: почему минимально жизнеспособного продукта уже недостаточно в 2025 году

Простой

5 мин

69K

Управление проектами * Управление продуктом * Дизайн мобильных приложений * ДизайнПрограммирование *

Из песочницы

Вмире стартапов назревает сдвиг: классический подход Minimum Viable Product (MVP) больше не гарантирует успеха. Если раньше пользователи были готовы мириться с сырыми прототипами, которые «просто работали», то в 2025 году планка качества поднялась так высоко, что одной лишь функциональности уже недостаточно. Современные пользователи ожидают продуманный и приятный UX с первого касания — продукт должен не только работать, но и вызывать восторг. Здесь на сцену выходит концепция Minimum Lovable Product (MLP): стратегия запуска, ориентированная на создание любимого продукта с первого дня. Разберёмся, почему MVP теряет актуальность, чем отличается MLP и как компаниям адаптироваться, чтобы завоёвывать сердца пользователей в 2025 году.

+22

naumtsevalex 8 июн 2025 в 12:10

RecSys + DSSM + FPSLoss is all you need

Простой

3 мин

3.4K

Big Data * Машинное обучение *

Из песочницы

Упрощать и искать похожие детали, очень полезный навык! Предлагаю быстро пробежаться и попробовать найти ту самую серебряную пулю в RecSys !

Поехали →

naumtsevalex 15 июн 2025 в 02:10

Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация

Средний

23 мин

12K

Машинное обучение * Математика * Python * Алгоритмы * Искусственный интеллект

Туториал

У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение.

Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять, но так же не лишая полноты!

Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу! Это самое важное, оно происходит в секции с кодом.

Будет здорово получить ваши задачи и разобрать в следующих выпусках!

Как только разберетесь приступайте к части 2!

Взглянуть на старое под новым углом →

naumtsevalex 12 июн 2025 в 01:24

Валерий Бабушкин & MLinside, часть 1 | Автократия. System Design. Lego & Sport. Срезание углов

Простой

4 мин

9.6K

Data Engineering * IT-стандарты * Исследования и прогнозы в IT * Читальный залМашинное обучение *

Обзор

На днях посмотрел подкаст с Валерием Бабушкиным. Как всегда, было очень приятно слушать, и я хочу поделиться с вами основными тезисами, которые я для себя вынес.

Узнаем как быстро вникнуть в ML System Design, чем лего и спорт помогают, и почему важно уметь срезать углы на работе!

Порассуждать вместе с Валерой Бабушкиным

Stanislav9801 21 янв 2025 в 09:15

Мастер-класс по точечному переносу изменений между ветками в git

Простой

7 мин

53K

Блог компании Data Feeling SchoolGit * Системы управления версиями * GitHub * Управление разработкой *

Из песочницы

Представьте ситуацию: вы нашли критический баг в проекте, исправили его в feature-ветке, но до полного слияния ещё далеко. Или вам срочно нужно перенести одно конкретное изменение из текущей ветки в другую. В таких случаях git cherry-pick становится вашим секретным оружием.

+27

mkgs210 6 фев 2023 в 08:31

Предсказание оттока пользователей

10 мин

15K

Python * Визуализация данных * Искусственный интеллектМашинное обучение * Хакатоны

Из песочницы

Обработка данных и применение основных видов регрессий для решения задач на Kaggle, на примере соревнования "Предсказание оттока пользователей" от DeepLearningSchool МФТИ.

artmaro 3 окт 2024 в 09:00

Replit Agent программиста не заменит! Или как мы пробовали писать код с помощью нейросети

Средний

10 мин

6.2K

Блог компании RaftБлог компании Конференции Олега Бунина (Онтико)ХакатоныИскусственный интеллектМашинное обучение *

Кейс

Привет, Хабр! Это компания Raft и я — руководитель AI продуктов Евгений Кокуйкин. А на фото выше — троица из нашей команды — техлид Саша Константинов, AI Project Manager & QA Lead Толя Разумовский и Data scientist Арсений Пименов на конференции Олега Бунина AIConf. Недавно в сети появился Replit Agent с многообещающими заявлениями. Мол, этот инструмент пишет код лучше программистов и скоро их заменит. Хотя в Raft мы и пишем код по старинке — вручную, но следим за технологиями и стремимся использовать новшества там, где это может быть полезно. Решили испытать Replit Agent в деле и даже устроили внутри команды мини-хакатон. Делимся впечатлениями.

+11

artmaro 30 сен 2024 в 14:05

Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

Средний

15 мин

Блог компании RaftИскусственный интеллектИнформационная безопасность * Хранение данных * Машинное обучение *

Туториал

Как компания, которая внедряет прикладные решения, мы хотим знать, насколько они безопасны. Расскажу про основные риски, связанные с использованием LLM в корпоративной среде, и способы от них защититься. Если вы хотите узнать больше об уязвимостях и техниках защиты LLM — можно ознакомиться с моим докладом для AIConf 2024 группы компаний Онтико.

odmin227 7 мая 2024 в 09:00

Откуда Deezer знает, какая музыка нравится новым пользователям?

Сложный

9 мин

5.5K

Алгоритмы * Big Data * Машинное обучение * Научно-популярноеЗвук

Обзор

Привет, Хабр! Меня зовут Данил Картушов.

В этом посте я расскажу, как музыкальная платформа Deezer, используя метаданные, с первых секунд научилась рекомендовать персонализированные треки новым пользователям!

▶️ Начнем!

0x7o 8 янв 2022 в 22:35

keyT5 или генерация ключевых слов из текста

4 мин

8.1K

Машинное обучение * Искусственный интеллектNatural Language Processing * Программирование *

Из песочницы

Я попытался обучить русскоязычную модель ruT5-base и ruT5-large на задаче извлечения ключевых слов из текста.

slivka_83 3 окт 2022 в 18:19

ClearML | Туториал

9 мин

52K

Data Mining * Big Data * Машинное обучение *

Туториал

Cезон Data Mining

ClearML — это довольно мощный фреймворк, основным предназначением которого является трекинг ML-экспериментов. Для рассмотрения его возможностей построим небольшой пайплайн обучения ML-модели...

Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

+11