Обновить

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

Уровень сложностиСредний
Время на прочтение22 мин
Охват и читатели7.4K

Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.

Читать далее

Вторая Западная Сибирь: как забытая идея советского геолога может перевернуть нефтедобычу

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели69K

Когда мы говорим о будущем российской нефти, в голове обычно возникает стандартный набор образов: ледоколы, буровые платформы в Арктике, сверхглубокие скважины и бесконечная геологоразведка в поисках новых месторождений. Мы привыкли думать, что нефть нужно искать там, где нас еще нет.

Но что, если главная нефтяная провинция будущего находится прямо у нас под ногами — на тех самых месторождениях, которые мы считаем «выработанными»? Что, если «вторая Западная Сибирь» — это не новая география, а новый способ смотреть на старые промыслы?

В этой статье мы разберем, почему при текущих технологиях мы оставляем в земле до 70% нефти, как советский геолог Иван Нестеров еще десятилетия назад предложил элегантное решение этой проблемы, и почему сегодня, глядя на свежие публикации китайских ученых в журнале Physics of Fluids, мы рискуем упустить шанс стать лидерами новой технологической волны — волны, которую сами же и начали.

Читать далее

Настраиваем паука для сбора данных: как работает фреймворк Scrapy

Время на прочтение6 мин
Охват и читатели11K

В Точке мы обучаем наших AI-ассистентов, а для этого нужно много данных. В статье расскажу, как быстро собрать информацию практически с любого сайта при помощи фреймворка Scrapy. 

Читать далее

Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели18K

Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.

Читать далее

Concurrency testing — отлавливаем состояния гонки

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели4.4K

В статье разберём некоторые техники обнаружения плавающих багов, вызванных конкурентностью. Сделаем подход к автоматическому тестированию устойчивости веб-сервисов к различным race condition. Примеры будут на python + asyncio + sqlalchemy, но эти подходы применимы к любым моделям конкурентности, которые подвержены состояниям гонки.

Читать далее

Ушел к другому, или топ-6 причин, почему клиенты меняют вендоров ITSM-решений

Время на прочтение4 мин
Охват и читатели5.2K

Привет, Хабр! Эту статью написал вендор ITSM-решений. Поэтому вы вправе ожидать толстого самопиара в духе «мы лучше всех, выбирайте нас». Но мы пойдем другим путем.

За годы работы накопились сотни разговоров с клиентами — кто уходил и кто возвращался. Мы научились видеть в этих историях закономерности, о которых в отрасли не принято говорить вслух.

В статье — откровенный разбор причин, по которым компании меняют ITSM-вендора. Мы покажем, как закрываем эти боли. А еще расскажем, по каким причинам уходят от нас, почему с этим не боремся и порой сами отговариваем клиентов от покупки нашего решения. Читайте, если уже задумывались о смене вендора.

Читать далее

В активном поиске: как вести базовый и продвинутый учет ИТ-активов

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.9K

Между поиском отношений и учетом активов много общего: анализируем, что в наличии, а чего не хватает, рассчитываем на длительный срок годности, держим часть экземпляров про запас. Но если в дейтинге тотальный контроль — это красный флаг, в ITAM фиксация каждого шага — зеленый свет для эффективного управления.

Привет, Хабр! Меня зовут Кира, я — аналитик в ITSM 365, специализируюсь на кейсах управления ИТ-активами. Расскажу, что заложено в нашей сервис деск системе для стандартного учета и как оторваться по полной в кастомизации на примере управления подписками и выдачей доступов.

Читать далее

Дело не в тебе: почему айтишники долго ищут работу, а эйчары — IT-специалистов

Время на прочтение7 мин
Охват и читатели38K

Привет, Хабр! Я — Настя Антоненко, менеджер продукта ITSM 365 HR. Работаю на стыке HR и IT, поэтому слежу за наймом по отрасли и хочу поделиться наблюдениями. 

Войти в айти становится все сложнее. Так, динамика Индекса HH в области информационных технологий показывает, что с сентября прошлого года количество резюме на одну открытую вакансию выросло в 2 раза. При этом, по данным исследования StackOverflow, только пятая часть разработчиков довольна своей работой.

У меня много знакомых, которые регулярно откликаются на вакансии, ходят на собеседования нон-стопом — и раз за разом получают отказы. Айтишники жалуются на плохих рекрутеров, легионы онлайн-курсантов и дискриминацию по возрастному признаку, а рекрутеры — на дефицит хороших специалистов. Кто из них прав и что со всем этим делать? 

Читать далее

Волшебный Koog. Пишем Kotlin-агент широкого профиля KMP

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели11K

Всем привет! С вами Анна Жаркова, руководитель мобильной практики ГК Юзтех. Что ж, за последние полгода мир разработки и мир ИИ скакнули и ушли далеко вперед. Теперь знания работы с агентами, умение написать не только правильный промт, но и собственные скиллы (навыки) для этих агентов, готовить свои mcp для погружения в контекст задачи, проекта, становятся не только полезными, но и обязательными для разработчиков и IT-специалистов. Уже многие используют как специальные IDE с ИИ-агентами (Claude, Cursor, Windsurf и т.п), так и встраиваемые в привычные VsCode и AndroidStudio в виде плагинов. Можно не ограничиваться готовым настраиваемым функционалом, а пойти дальше и написать свой собственный агент. И сегодня мы поговорим про такое решение, использование специального фреймворка от JetBrains Koog для разработки свои агентов. С его помощью мы создадим агент для генерации простых KMP приложений и кросс-платформенных задач и подключим к плагину Continue dev.

Небольшой спойлер: сам агент был написан при участии Cursor, и про нюансы его создания читайте в конце статьи.

Читать далее

Оживляем диаграммы последовательности: PlantUML и немного кода

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели8.9K

Привет!

В этой статье хочу поделиться способом создания диаграмм последовательности, на которых пользователь может сам изменять степень детализации отображаемой информации.

Если хочет — может раскрыть больше деталей, если нужно наоборот — может скрыть избыточные.

А также, помимо самого способа создания, хочу рассказать, как получилось прийти именно к такому варианту динамических диаграмм последовательности.

Будет PlantUML, JavaScript, HTML и немного разочарования в ИИ :-)

P.S. Не смотрите на то, что читать статью якобы много-много минут. Текста там не много, все код виноват :-)

Читать далее

Эволюционная архитектура ПО: уроки теории Дарвина

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели5.6K

Концепция эволюционной архитектуры (Evolutionary Architecture) — очень популярный в наши дни подход к проектированию программного обеспечения, при котором система способна адаптироваться и развиваться без потери функциональности. Этот подход подробно описан в книге «Эволюционная архитектура. Автоматизированное управление программным обеспечением» Нила Форда и др. 

На связи Кирилл Маканков, iOS-разработчик в ПСБ. В этой статье я хочу проанализировать эволюционную архитектуру сквозь призму теории Дарвина и определить, действительно ли этот подход позволяет ПО эволюционировать. 

Читать далее

Не все RPS одинаково полезны: уроки нагрузочного тестирования core-системы

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели8.8K

Когда мне пришла идея написать эту статью, я предполагала, что это будет хроника ошибок, от которых мы бы хотели предостеречь техническое сообщество: как мы наивно полагались на «синтетику», а «видовое многообразие» сервисов раскрыло нам глаза.

Но по мере подготовки материала пришло осознание, что проблема не в том, что мы ошиблись в методике, а в том, что для core-системы, пропускающей сотни тысяч разнородных запросов в секунду, достичь точного воспроизведения боевой нагрузки практически невозможно.

Под катом рассказ о том, как мы двигались от упрощенных моделей к глубокому изучению специфики поведения системы, а по пути осознали, что нужно не выбирать между крайностями, а комбинировать подходы и учитывать риски.

Читать далее

От «Долгого Джонта» Кинга до pip install: пишем HAL для атомного манипулятора

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.7K

Начал с фантазий про телепортацию из рассказа Кинга, закончил Python-пакетом для управления атомным микроскопом. Симулятор вместо оборудования за $500K, замена LabVIEW на asyncio, drop-in для RL-агента.

Читать далее

At-least-once. Это не баг провайдера. Это ваша архитектурная проблема

Уровень сложностиСложный
Время на прочтение37 мин
Охват и читатели7.7K

Думал, зайду в крипту и буду просто дёргать API блокчейна. Не вышло.

Захожу в проект. Стек: FastAPI, PostgreSQL, Redis как Celery broker, Celery workers, Docker, Web3. Стартап на хайпе, деньги реальные, архитектура собрана на коленке. Смотрю на архитектуру платёжного процессинга и первая мысль: ребята, вы серьёзно? Финансовые операции с реальными деньгами, без idempotency вообще, Redis как брокер без persistence, Web3.py синхронные вызовы внутри Celery тасков.

Разговор был короткий: задача такая, чини что есть. Сроки горели.

Читать далее

Вот как сегодня устроено российское производство

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели12K

Что общего между крышечкой от колы, трубой в ванной, медицинской маской и подгузником Huggies? Полипропилен — один из самых популярных пластиков в мире.

Привет! Меня зовут Игорь, недавно я побывал на одном из заводов — «Томскнефтехим».

Читать далее

Путешествие одного промпта: Что на самом деле происходит под капотом у LLM?

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели12K

Загадка работы LLM: что происходит, когда вы нажимаете Enter? Разбираем пошагово путь вашего промпта от токенизации до генерации ответа. Узнайте, как устроены большие языковые модели, как ими управлять и какие мифы они развеивают.

Читать далее

Pattern matching в .NET

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели10K

Привет, Хабр! Меня зовут Митя, я инженер-программист в Контуре. Во время написания кода анализаторы иногда предлагают заменить привычные конструкции на pattern matching. Однако то, что призвано повысить читаемость, нередко делает код более трудным для восприятия, особенно, если не понимать, во что именно разворачиваются те или иные конструкции. И в один из дней я задался вопросом: а есть ли какие-нибудь подводные камни при использовании pattern matching и во что именно его преобразует компилятор? В этой статье — мои мысли и заметки.

Читать далее

LLM как декодер в ASR: опыт адаптации SOTA архитектуры для спонтанной русскоязычной речи

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели6.3K

Привет, Хабр! Меня зовут Коля, я разработчик машинного обучения в команде речевых технологий Контура. Мы разрабатываем собственную систему распознавания речи (ASR), которая ежедневно переваривает миллионы звонков и записей видеоконференций, чтобы потом использовать их для речевой аналитики качества коммуникаций с клиентами и для создания протоколов и резюме встреч в Контур.Толке.

Мы постоянно работаем над тем, чтобы дать пользователям лучшее качество и опыт взаимодействия с нашими продуктами: борьба уже давно идет за десятые доли процента WER (Word Error Rate) – особенно сложные и трудные для распознавания случаи.

В конце прошлого года Nvidia изрядно встряхнула Open Source комьюнити, выкатив серию новеньких моделей распознавания речи. Одна из них нам особенно приглянулась: Canary-Qwen-2.5B на архитектуре SALM (Speech Augmented Language Model), установившая новый рекорд по качеству в HuggingFace OpenASR, благодаря использованию гибридного подхода, совмещающего речевой энкодер и LLM в своей работе.

Мы в Контуре решили не проходить мимо и проверить: а как эта новоиспеченная SOTA покажет себя на наших реалиях — на русском языке, в домене телефонии и видеоконференций, в условиях, когда у нас нет десятков тысяч часов размеченных людьми данных.

Читать далее

Собеседования 2026: почему мы до сих пор нанимаем «ходячие Википедии», а не инженеров?

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели43K

Привет! На связи Дима — Senior Frontend разработчик в Doubletapp. В этой статье я расскажу, как эффективно собесить фронтендеров. Мой стек — Vue, Nuxt, поэтому примеры будут на основе моего опыта, но текст подойдет для всех разработчиков и нанимающих менеджеров.

В этой статье 

- Что я понял спустя 80+ собеседований? 
- Как собесят на рынке?
- Почему это все не работает
- Фактор ИИ и «подготовленных» кандидатов
- Как проводить инженерное интервью: 4 принципа

Читать далее

12 когнитивных искажений пользователя: как они влияют на вас, ваш продукт, и что с этим делать?

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели7.7K

Мы привыкли думать, что свободно ориентируемся в интерфейсах: выбираем отель, оформляем страховку, переключаемся между тарифами — будто бы полностью контролируем процесс. Но в реальности на эти решения влияет не только рациональный расчёт. FOMO заставляет торопиться, фрейминг меняет оценку выгоды, эффект авторитета повышает доверие к «рекомендованному», а переоценка вероятностей и другие искажения смещают оценку рисков и ожидаемой пользы.

В итоге именно такие эффекты нередко определяют поведение пользователя и влияют на ключевые метрики продукта: от конверсии и CTR до CSAT и удержания.

В этой статье мы рассмотрели travel-tech через призму поведенческой психологии и собрали распространённые когнитивные эффекты, которые встречаются на пути пользователя — от поиска направления до посадки в самолёт. Рассказали:

- как эти эффекты проявляются в реальных сценариях; 

- как их диагностировать с помощью данных и исследований; 

- какие продуктовые решения помогают снижать эмоциональные искажения или использовать их этично.

Будет полезно всем, кто работает с продуктовыми метриками, интерфейсами, исследованиями, или в целом стремится узнать больше о психологии пользователя онлайн-сервисов. 

Читать далее
1
23 ...