Статьи / Закладки / Профиль konica / Хабр

Все потоки

@konica^{read⁠-⁠only}

Пользователь

ПрофильЗакладки19

Devenir-Glorieux 9 окт 2025 в 11:29

Как я сделал LLM-сервис, который понимает буровые сводки

Простой

5 мин

6K

Python * Будущее здесьData Engineering *

Из песочницы

Привет! Меня зовут Стас, я занимаюсь R&D в компании ROGII.

Я пришёл в ROGII после нескольких лет работы «в поле» — от тундры Уренгойских месторождений до Сахалина. Там я понял, что буровые данные живут в хаосе: у каждого вендора — свой формат, у каждой скважины — свой стиль отчёта.
Когда я оказался в компании, которая консолидирует буровые данные в облаке, задача встала ребром: нужно научить машину понимать суточные рапорты так же, как это делает инженер.

Мы собрали 507 PDF‑файлов (всего 14 678 страниц) и выделили 23 типа отчётов по признаку компании и структуры.
Но традиционные подходы: ручной ввод, регулярки, rule‑based и классический NLP — оказались или неэффективными, или нежизнеспособными.
Тогда я обратился к LLM.

Читать далее

+4

sergei_ai 11 янв в 11:16

Как я заменил BI-дашборд на AI-чат: архитектура RAG-системы для 600K записей

Средний

7 мин

12K

Python * Машинное обучение * PostgreSQL * Data Engineering * Natural Language Processing *

Из песочницы

После 10 лет внедрения BI-систем (Qlik Sense, Power BI, Data Lens) я понял одну вещь: дашборд — это не решение. Это данные для решения. А между данными и решением — пропасть, которую преодолевает человек.

В этой статье покажу, как построил RAG-систему с чат-интерфейсом для базы из 600 000 записей техники из Федресурса. Без философии — только архитектура, код и грабли.

Читать далее

+11

netvolk_online 10 мар в 18:21

«Хранилище Google переполнено»: Как очистить Gmail от мусора и обойти покупку подписки

Простой

3 мин

54K

Облачные сервисы *

Туториал

Рано или поздно каждый пользователь экосистемы Google сталкивается с уведомлением о том, что бесплатные 15 ГБ пространства закончились. Письма перестают приходить, файлы на Диск не загружаются, а Google настойчиво предлагает оформить ежемесячную подписку.

Но прежде чем доставать карту (а с определенного момента оплатить подписку в целом стало весьма нелегкой задачей), стоит разобраться, чем именно занято место.

Чаще всего проблема не в важных документах, а в цифровом мусоре, который годами копился в вашей почте.

Читать далее

+60

Pro-AI 10 мар в 10:21

Gemini 3.1 Pro: Что нового? Как использовать нейросеть в России без VPN

Простой

10 мин

52K

Блог компании StudyAI

Подробный разбор возможностей нейросети Gemini 3.1 Pro: видео, текст, генерация изображений и музыки. Узнайте, как использовать Gemini в России без VPN, купить подписку и писать промпты.

Читать далее

-3

ab429 5 мар в 17:56

Claude Code + NotebookLM: собираем бесплатную RAG-систему для глубокого ресерча

Простой

7 мин

44K

Искусственный интеллект

Туториал

Если вы работаете с Claude Code, то наверняка знакома следующая ситуация: нужно проанализировать большой объём документов, а встроенный веб-поиск выдаёт поверхностные результаты, и токены тают на глазах. Недавно мне попалось интересное решение, которое почти отлично и почти бесплатно решает мои хотелки. Хочу рассказать о нем и как его настроить - совершенно ничего сложного, просто хороший лайфхак.

Читать далее

+37

sergei_ai 5 мар в 15:06

Одна функция, которая заменила аналитика

Средний

5 мин

11K

Искусственный интеллектPython * Машинное обучение *

Кейс

Финансовый директор Алексей каждый понедельник тратил несколько часов на анализ продаж. Сейчас — 4 минуты 30 секунд. Рассказываю, как Python + Claude API превращают немые таблицы в диалог: задаёшь вопрос — получаешь ответ с цифрами и выводом. Без BI, без SQL, без аналитика в цепочке. ~75 строк кода, реальные грабли с 1С и контекстным окном.

Читать далее

-2

akzhankalimatov 4 мар в 17:29

Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code

Средний

13 мин

18K

Искусственный интеллектТекстовые редакторы и IDE * Управление продуктом * Управление проектами * Open source *

Обзор

Ваш проект перевалил за 100 тысяч строк. Вы просите агента внедрить новую фичу скажем, добавить OAuth-авторизацию с тремя провайдерами. Агент бодро берётся за работу, пишет первые файлы... а на середине начинает путать имена middleware, дублировать уже существующие хелперы и предлагать структуру, которая противоречит всему, что было до этого. Вы поправляете, он соглашается, делает ещё пару шагов и снова забывает, о чём вы договорились три сообщения назад.

Знакомо? Это не баг конкретной модели. Это фундаментальная проблема архитектуры, при которой один агент с одним контекстом пытается держать в голове всё: и вашу архитектуру, и текущую задачу, и результаты поиска, и логи тестов, и историю обсуждения.

И Cursor, и Claude Code пришли к одному ответу - субагенты. Но реализовали его по-разному

Читать далее

+18

Neurosonya 27 фев в 11:13

Notion запустила Custom Agents. Почему это важный сигнал для рынка ИИ-агентов

Простой

4 мин

7K

Управление продуктом * Управление проектами * Облачные сервисы * Машинное обучение * Искусственный интеллект

Обзор

Notion запустила кастомных AI-агентов, которые сами работают по расписанию и триггерам, а за этим релизом скрывается куда более важный сдвиг. Похоже, мы входим в этап, где ИИ перестает быть просто чатом по запросу и превращается в постоянного цифрового исполнителя, который работает в фоне 24/7.

Разбираю, что именно показал релиз Notion, при чем тут Ramp, Remote, OpenClaw и Kimi Claw, и почему все это может быть началом новой гонки агентов.

Читать далее

+1

Svortex 24 фев в 21:31

«Разблокируй телефон» — как я реализовал фейковый мессенджер для допроса

Средний

14 мин

21K

Open source * Разработка мобильных приложений * Криптография * Информационная безопасность *

Туториал

Привет, Хабр! Я разрабатываю open-source мессенджер Xipher (C++/Android), и одна из фич, которую пришлось проектировать особенно тщательно — Panic Mode. Это система правдоподобной отрицаемости (plausible deniability): при вводе специального PIN-кода мессенджер показывает полностью фейковую, но убедительную базу данных с поддельными чатами, а параллельно отправляет скрытый SOS-сигнал на сервер.

В статье разберу архитектуру целиком — от криптографического разделения баз до генерации правдоподобных фейков и маскировки panic-алерта под рутинный сетевой запрос. Весь код — из реального проекта.

Исходники открыты — ссылка на GitHub в конце статьи.

Читать далее

+31

dimakpa 10 фев в 09:13

Как мы автоматизировали чанкование для RAG в Gramax: от прототипа до 95%+ точности

5 мин

8.5K

Блог компании GramaxАнализ и проектирование систем * Веб-разработка * Искусственный интеллектПрограммирование *

Кейс

Недавно на Хабре вышла статья про создание RAG-системы для строительных ГОСТов. Команда Цифрового стандарта проделала титаническую работу — полгода вручную разбивали документы на смысловые чанки. Респект за настойчивость и результат.

Их история вдохновила поделиться собственным опытом. Мы тоже столкнулись с проблемой чанкования для умного поиска по базе знаний. Тоже прошли через RAG, векторные базы и поиски оптимального решения. Но пошли по пути полной автоматизации.

Всем привет, меня зовут Дима, я делаю ИИ-функции в Gramax. Эта статья для тех, кто сейчас воюет с чанками вручную или пытается найти оптимальный подход. Делимся нашим путем от быстрого прототипа до продакшен-решения с метриками 90%+.

Читать далее

+15

PSDK_XP 9 фев в 12:11

Приручаем монстра: Как я пересадил Windows 10 на диету из Windows XP и сэкономил память

Простой

4 мин

29K

Старое железоWindows * Операционные системыOpen source *

Из песочницы

[СПОЙЛЕР: Используется на настоящем железе, могут быть детекты на VirusTotal, но это не вирусы. Это ложное срабатывание из-за того что многие утилиты вроде UltraUXthemepatcher лезут в системные ресурсы] Многие считают, что кастомизация Windows — это просто «накатить тему и обои». Но если ваша цель — не только визуал, но и реальная производительность, приходится брать в руки скальпель. В этой статье я расскажу, как я декомпозировал тяжеловесную оболочку «десятки», заменив её модульными компонентами из эпохи золотого века софта. Итог: интерфейс ест всего 70 МБ ОЗУ, а процессор в простое честно показывает 0%.

Для начала: история создания пака

На самом деле, этот проект родился не из желания «хайпануть» на ретро-эстетике. Всё началось с моего бати. У него есть старый рабочий ноутбук, который он наотрез отказывается менять — привычка, «намоленные» программы и всё такое. Но когда на него принудительно прилетела Windows 10, начался ад. Система буквально задыхалась под весом современных анимаций и фоновых процессов.

Батя ворчал: «Верни мне мою XP, там всё летело, а тут кнопки по полчаса открываются!». И я решился на авантюру.

Страхи и риски были запредельные.

Читать далее

+48

timonin 25 янв в 07:33

Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия

Простой

3 мин

29K

Обзор

Всем привет! Команда Qwen от Alibaba выложила в открытый доступ Qwen3-TTS — нейросетевую модель для синтеза речи с клонированием голоса. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

Читать далее

+33

akazant 2 янв в 19:45

Базовый RAG-компонент для локального семантического поиска на Питоне

9 мин

13K

Поисковые технологии * Python * Программирование * Искусственный интеллект

Кейс

Сезон ИИ в разработке

quad_rag_core — лёгкое Python-ядро для локального RAG, которое автоматически отслеживает изменения в папках, индексирует их в Qdrant и поддерживает эмбеддинги в актуальном состоянии. Изначально проект задумывался как инструмент MCP (Model Context Protocol), но стал основой для любой системы локального семантического поиска.

Зачем это нужно

В процессе работы с кодовой базой через LLM-агентов и при необходимости локального семантического поиска по файлам проекта обнаружилась проблема. Инструменты агентской разработки вроде Kilo Code предоставляют встроенную функцию семантического поиска, но в компании заявляют, что в будущем эта функциональность может стать платной. Сразу задумался о том чтобы сделать свою подсистему поиска. Простые запросы к MCP-серверу на поиск и обновление тут не подойдут - система поиска должна иметь полный контроль над контекстом - она должна автоматически узнавать, что файл удалён, функция изменена или добавлен новый документ, без необходимости перезапуска индексации.

От идеи к архитектуре

В начале планировался простой MCP-сервер, который принимает команды поиска и обновления, индексирует текстовые файлы и PDF, использует Qdrant как векторное хранилище и эмбеддит локально.

В ходе проектирования стало понятно: вся логика отслеживания файлов, парсинга, чанкинга и синхронизации с Qdrant — это переиспользуемое ядро, а не часть MCP-протокола.

Так появился quad_rag_core — отдельный Python-модуль, который не знает ничего про MCP или другие внешние интерфейсы, но готов к ним подключаться.

Читать далее

+12

Robastik 29 дек 2025 в 02:05

Как эффективно работать с ИИ: Руководство для начинающего

Простой

5 мин

24K

Искусственный интеллектИсследования и прогнозы в IT * Карьера в IT-индустрииКачество кода * Конференции

Обзор

Группа авторов (к которым я не отношусь) провела опрос постоянных пользователей ии-инструментов с акцентом на практические вопросы. Что получается и что - нет, как получается и как - нет, для чего, для кого и т.п. На момент обзора ответы дали 139 опрошенных, среди которых самые разные специальности и опыт в профессии ойти.

Формат показался актуальным и информативным, но трудновоспринимаемым, поскольку ответы собраны в экселе (который прилагается). Поэтому сделано текстовое обобщение в notebookLM, которое под катом. Бонусом - майнд мэп по опросу.

Для меня опрос в виде обзора нового не дал, а вот в исходных данных интересное нашлось. По этой причине текст рекомендую тем, кто понимает, что не понимает, но хочет понять.

Если у вас получается в ии и вы готовы обменяться опытом, то присоединяйтесь к опросу.

Читать далее

+2

Teodor_Dre 28 дек 2025 в 13:16

Что такое MCP-сервер, и зачем он нужен

Простой

15 мин

29K

VueJS * JavaScript * Программирование *

Из песочницы

Привет, Хабр! Меня зовут Андрей Слесаренко — frontend‑разработчик с опытом работы более 8 лет. Прошёл путь от джуна до тимлида, работал над разными высоко‑нагруженными проектами. В начале этого года начал активно использовать LLM‑агентов в повседневной работе — и за это время набил немало шишек.

В этой статье хочу поделиться своим опытом, где мои ожидания разошлись с результатом, а также рассказать об основных «шишках», которые я набил при работе с агентами.

Читать далее

+11

GodAdministrator 28 дек 2025 в 07:28

Люди! Делайте же нормальные файлы EXCEL! (ч.2)

Средний

4 мин

27K

Управление проектами * Удалённая работаФинансы в ITВизуализация данных * Microsoft Excel

Туториал

Начало тут

По своей сути, каждая новая экселька это отдельный мирок. Я бы даже выразился "некая от отдельная приложуха"! И чтобы она была живой, понятной не только тебе и действительно стала полезным инструментом ты должен понять, а на какой вопрос она отвечает?

Это не совсем ТЗ. Тех.задание (пусть и самому себе) ты будешь продумывать в голове на следующем шаге. А это чуть более глубокий вопрос: какую именно потребность ты закроешь в самом конце, проделав кучу работы, всё собрав, подсчитав и отформатировав?

Читать далее

+3

varabyo 23 дек 2025 в 10:37

RAG — это главное. Почему специализированные LLM реже галлюцинируют

10 мин

17K

КиберпанкМашинное обучение * Будущее здесьНаучно-популярноеИскусственный интеллект

Аналитика

Когда закрылся Skype, этого почти никто уже и не заметил. Хотя сервис когда-то был синонимом термина «видеосвязь». Но потом видеозвонки внедрили везде — в браузеры, мессенджеры, корпоративный софт, экосистемы, а Skype не успел адаптироваться... Возможно, с LLM происходит нечто подобное. Универсальные LLM впечатляют глубиной эрудиции — но для решения конкретных проблем совершенно непригодны. Хотя они быстро и уверенно отвечают на вопросы, выдавая целые «портянки» текста, часто эти ответы представляют собой галлюцинации или «воду», с выдуманными ссылками.

Читать далее

+33

AlDemidov 9 июн 2025 в 11:54

Как автоматизировать создание CJM с помощью ИИ?

Простой

7 мин

14K

Блог компании X5 TechКлиентская оптимизация * Искусственный интеллектIT-компании

Меня зовут Александр Демидов, я бизнес-аналитик в X5 Tech. В этой статье я постараюсь по существу рассказать как я полюбил создавать карты клиентского пути (CJM), что помогло мне делать их в 4 раза быстрее и почему искусственный интеллект настоящая палочка-выручалочка при верном подходе.

Читать далее

+9

GrantM 27 июн 2024 в 16:53

Может уже сами с нейросетями сделаем дизайн для нашего продукта? От идеи до запуска на маркетплейс, пошаговая инструкция

14 мин

36K

Блог компании RUVDS.comДизайнНаучно-популярноеИскусственный интеллектБиология

✏️ Технотекст 7

— Добрый день, хотим дизайн вот заказать для упаковки нашей продукции на маркетплейсах.
— Ой, ну это короче бюджет нужен.
— А по срокам как?
— Давайте сначала ТЗ составим, а там уже и сроки почувствуем.

Примерно так происходит начало общения с большинством дизайн-студий при поиске без знакомств, просто в интернете.

В чём проблема?

Читать дальше →

+88