Обновить
0
@konicaread⁠-⁠only

Пользователь

Отправить сообщение

Как я сделал LLM-сервис, который понимает буровые сводки

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6K

Привет! Меня зовут Стас, я занимаюсь R&D в компании ROGII.

Я пришёл в ROGII после нескольких лет работы «в поле» — от тундры Уренгойских месторождений до Сахалина. Там я понял, что буровые данные живут в хаосе: у каждого вендора — свой формат, у каждой скважины — свой стиль отчёта.
Когда я оказался в компании, которая консолидирует буровые данные в облаке, задача встала ребром: нужно научить машину понимать суточные рапорты так же, как это делает инженер.

Мы собрали 507 PDF‑файлов (всего 14 678 страниц) и выделили 23 типа отчётов по признаку компании и структуры.
Но традиционные подходы: ручной ввод, регулярки, rule‑based и классический NLP — оказались или неэффективными, или нежизнеспособными.
Тогда я обратился к LLM.

Читать далее

Как я заменил BI-дашборд на AI-чат: архитектура RAG-системы для 600K записей

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели12K

После 10 лет внедрения BI-систем (Qlik Sense, Power BI, Data Lens) я понял одну вещь: дашборд — это не решение. Это данные для решения. А между данными и решением — пропасть, которую преодолевает человек.

В этой статье покажу, как построил RAG-систему с чат-интерфейсом для базы из 600 000 записей техники из Федресурса. Без философии — только архитектура, код и грабли.

Читать далее

«Хранилище Google переполнено»: Как очистить Gmail от мусора и обойти покупку подписки

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели54K

Рано или поздно каждый пользователь экосистемы Google сталкивается с уведомлением о том, что бесплатные 15 ГБ пространства закончились. Письма перестают приходить, файлы на Диск не загружаются, а Google настойчиво предлагает оформить ежемесячную подписку.

Но прежде чем доставать карту (а с определенного момента оплатить подписку в целом стало весьма нелегкой задачей), стоит разобраться, чем именно занято место.

Чаще всего проблема не в важных документах, а в цифровом мусоре, который годами копился в вашей почте.

Читать далее

Gemini 3.1 Pro: Что нового? Как использовать нейросеть в России без VPN

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели52K

Подробный разбор возможностей нейросети Gemini 3.1 Pro: видео, текст, генерация изображений и музыки. Узнайте, как использовать Gemini в России без VPN, купить подписку и писать промпты.

Читать далее

Claude Code + NotebookLM: собираем бесплатную RAG-систему для глубокого ресерча

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели44K

Если вы работаете с Claude Code, то наверняка знакома следующая ситуация: нужно проанализировать большой объём документов, а встроенный веб-поиск выдаёт поверхностные результаты, и токены тают на глазах. Недавно мне попалось интересное решение, которое почти отлично и почти бесплатно решает мои хотелки. Хочу рассказать о нем и как его настроить - совершенно ничего сложного, просто хороший лайфхак.

Читать далее

Одна функция, которая заменила аналитика

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели11K

Финансовый директор Алексей каждый понедельник тратил несколько часов на анализ продаж. Сейчас — 4 минуты 30 секунд. Рассказываю, как Python + Claude API превращают немые таблицы в диалог: задаёшь вопрос — получаешь ответ с цифрами и выводом. Без BI, без SQL, без аналитика в цепочке. ~75 строк кода, реальные грабли с 1С и контекстным окном.

Читать далее

Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели18K

Ваш проект перевалил за 100 тысяч строк. Вы просите агента внедрить новую фичу скажем, добавить OAuth-авторизацию с тремя провайдерами. Агент бодро берётся за работу, пишет первые файлы... а на середине начинает путать имена middleware, дублировать уже существующие хелперы и предлагать структуру, которая противоречит всему, что было до этого. Вы поправляете, он соглашается, делает ещё пару шагов и снова забывает, о чём вы договорились три сообщения назад.

Знакомо? Это не баг конкретной модели. Это фундаментальная проблема архитектуры, при которой один агент с одним контекстом пытается держать в голове всё: и вашу архитектуру, и текущую задачу, и результаты поиска, и логи тестов, и историю обсуждения.

И Cursor, и Claude Code пришли к одному ответу - субагенты. Но реализовали его по-разному

Читать далее

Notion запустила Custom Agents. Почему это важный сигнал для рынка ИИ-агентов

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7K

Notion запустила кастомных AI-агентов, которые сами работают по расписанию и триггерам, а за этим релизом скрывается куда более важный сдвиг. Похоже, мы входим в этап, где ИИ перестает быть просто чатом по запросу и превращается в постоянного цифрового исполнителя, который работает в фоне 24/7.

Разбираю, что именно показал релиз Notion, при чем тут Ramp, Remote, OpenClaw и Kimi Claw, и почему все это может быть началом новой гонки агентов.

Читать далее

«Разблокируй телефон» — как я реализовал фейковый мессенджер для допроса

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели21K

Привет, Хабр! Я разрабатываю open-source мессенджер Xipher (C++/Android), и одна из фич, которую пришлось проектировать особенно тщательно — Panic Mode. Это система правдоподобной отрицаемости (plausible deniability): при вводе специального PIN-кода мессенджер показывает полностью фейковую, но убедительную базу данных с поддельными чатами, а параллельно отправляет скрытый SOS-сигнал на сервер.

В статье разберу архитектуру целиком — от криптографического разделения баз до генерации правдоподобных фейков и маскировки panic-алерта под рутинный сетевой запрос. Весь код — из реального проекта.

Исходники открыты — ссылка на GitHub в конце статьи.

Читать далее

Как мы автоматизировали чанкование для RAG в Gramax: от прототипа до 95%+ точности

Время на прочтение5 мин
Охват и читатели8.5K

Недавно на Хабре вышла статья про создание RAG-системы для строительных ГОСТов. Команда Цифрового стандарта проделала титаническую работу — полгода вручную разбивали документы на смысловые чанки. Респект за настойчивость и результат.

Их история вдохновила поделиться собственным опытом. Мы тоже столкнулись с проблемой чанкования для умного поиска по базе знаний. Тоже прошли через RAG, векторные базы и поиски оптимального решения. Но пошли по пути полной автоматизации.

Всем привет, меня зовут Дима, я делаю ИИ-функции в Gramax. Эта статья для тех, кто сейчас воюет с чанками вручную или пытается найти оптимальный подход. Делимся нашим путем от быстрого прототипа до продакшен-решения с метриками 90%+.

Читать далее

Приручаем монстра: Как я пересадил Windows 10 на диету из Windows XP и сэкономил память

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели29K

[СПОЙЛЕР: Используется на настоящем железе, могут быть детекты на VirusTotal, но это не вирусы. Это ложное срабатывание из-за того что многие утилиты вроде UltraUXthemepatcher лезут в системные ресурсы] Многие считают, что кастомизация Windows — это просто «накатить тему и обои». Но если ваша цель — не только визуал, но и реальная производительность, приходится брать в руки скальпель. В этой статье я расскажу, как я декомпозировал тяжеловесную оболочку «десятки», заменив её модульными компонентами из эпохи золотого века софта. Итог: интерфейс ест всего 70 МБ ОЗУ, а процессор в простое честно показывает 0%.

Для начала: история создания пака

На самом деле, этот проект родился не из желания «хайпануть» на ретро-эстетике. Всё началось с моего бати. У него есть старый рабочий ноутбук, который он наотрез отказывается менять — привычка, «намоленные» программы и всё такое. Но когда на него принудительно прилетела Windows 10, начался ад. Система буквально задыхалась под весом современных анимаций и фоновых процессов.

Батя ворчал: «Верни мне мою XP, там всё летело, а тут кнопки по полчаса открываются!». И я решился на авантюру.

Страхи и риски были запредельные.

Читать далее

Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели29K

Всем привет! Команда Qwen от Alibaba выложила в открытый доступ Qwen3-TTS — нейросетевую модель для синтеза речи с клонированием голоса. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

Читать далее

Базовый RAG-компонент для локального семантического поиска на Питоне

Время на прочтение9 мин
Охват и читатели13K

quad_rag_core — лёгкое Python-ядро для локального RAG, которое автоматически отслеживает изменения в папках, индексирует их в Qdrant и поддерживает эмбеддинги в актуальном состоянии. Изначально проект задумывался как инструмент MCP (Model Context Protocol), но стал основой для любой системы локального семантического поиска.

Зачем это нужно

В процессе работы с кодовой базой через LLM-агентов и при необходимости локального семантического поиска по файлам проекта обнаружилась проблема. Инструменты агентской разработки вроде Kilo Code предоставляют встроенную функцию семантического поиска, но в компании заявляют, что в будущем эта функциональность может стать платной. Сразу задумался о том чтобы сделать свою подсистему поиска. Простые запросы к MCP-серверу на поиск и обновление тут не подойдут - система поиска должна иметь полный контроль над контекстом - она должна автоматически узнавать, что файл удалён, функция изменена или добавлен новый документ, без необходимости перезапуска индексации.

От идеи к архитектуре

В начале планировался простой MCP-сервер, который принимает команды поиска и обновления, индексирует текстовые файлы и PDF, использует Qdrant как векторное хранилище и эмбеддит локально.

В ходе проектирования стало понятно: вся логика отслеживания файлов, парсинга, чанкинга и синхронизации с Qdrant — это переиспользуемое ядро, а не часть MCP-протокола.

Так появился quad_rag_core — отдельный Python-модуль, который не знает ничего про MCP или другие внешние интерфейсы, но готов к ним подключаться.

Читать далее

Как эффективно работать с ИИ: Руководство для начинающего

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели24K

Группа авторов (к которым я не отношусь) провела опрос постоянных пользователей ии-инструментов с акцентом на практические вопросы. Что получается и что - нет, как получается и как - нет, для чего, для кого и т.п. На момент обзора ответы дали 139 опрошенных, среди которых самые разные специальности и опыт в профессии ойти.

Формат показался актуальным и информативным, но трудновоспринимаемым, поскольку ответы собраны в экселе (который прилагается). Поэтому сделано текстовое обобщение в notebookLM, которое под катом. Бонусом - майнд мэп по опросу.

Для меня опрос в виде обзора нового не дал, а вот в исходных данных интересное нашлось. По этой причине текст рекомендую тем, кто понимает, что не понимает, но хочет понять.

Если у вас получается в ии и вы готовы обменяться опытом, то присоединяйтесь к опросу.

Читать далее

Что такое MCP-сервер, и зачем он нужен

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели29K

Привет, Хабр! Меня зовут Андрей Слесаренко — frontend‑разработчик с опытом работы более 8 лет. Прошёл путь от джуна до тимлида, работал над разными высоко‑нагруженными проектами. В начале этого года начал активно использовать LLM‑агентов в повседневной работе — и за это время набил немало шишек.

В этой статье хочу поделиться своим опытом, где мои ожидания разошлись с результатом, а также рассказать об основных «шишках», которые я набил при работе с агентами.

Читать далее

Люди! Делайте же нормальные файлы EXCEL! (ч.2)

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели27K

Начало тут

По своей сути, каждая новая экселька это отдельный мирок. Я бы даже выразился "некая от отдельная приложуха"! И чтобы она была живой, понятной не только тебе и действительно стала полезным инструментом ты должен понять, а на какой вопрос она отвечает?

Это не совсем ТЗ. Тех.задание (пусть и самому себе) ты будешь продумывать в голове на следующем шаге. А это чуть более глубокий вопрос: какую именно потребность ты закроешь в самом конце, проделав кучу работы, всё собрав, подсчитав и отформатировав?

Читать далее

RAG — это главное. Почему специализированные LLM реже галлюцинируют

Время на прочтение10 мин
Охват и читатели17K

Когда закрылся Skype, этого почти никто уже и не заметил. Хотя сервис когда-то был синонимом термина «видеосвязь». Но потом видеозвонки внедрили везде — в браузеры, мессенджеры, корпоративный софт, экосистемы, а Skype не успел адаптироваться... Возможно, с LLM происходит нечто подобное. Универсальные LLM впечатляют глубиной эрудиции — но для решения конкретных проблем совершенно непригодны. Хотя они быстро и уверенно отвечают на вопросы, выдавая целые «портянки» текста, часто эти ответы представляют собой галлюцинации или «воду», с выдуманными ссылками.

Читать далее

Как автоматизировать создание CJM с помощью ИИ?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели14K

Меня зовут Александр Демидов, я бизнес-аналитик в X5 Tech. В этой статье я постараюсь по существу рассказать как я полюбил создавать карты клиентского пути (CJM), что помогло мне делать их в 4 раза быстрее и почему искусственный интеллект настоящая палочка-выручалочка при верном подходе.

Читать далее

Может уже сами с нейросетями сделаем дизайн для нашего продукта? От идеи до запуска на маркетплейс, пошаговая инструкция

Время на прочтение14 мин
Охват и читатели36K

— Добрый день, хотим дизайн вот заказать для упаковки нашей продукции на маркетплейсах.
— Ой, ну это короче бюджет нужен.
— А по срокам как?
— Давайте сначала ТЗ составим, а там уже и сроки почувствуем.

Примерно так происходит начало общения с большинством дизайн-студий при поиске без знакомств, просто в интернете.

В чём проблема?

Читать дальше →

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность