Статьи / Профиль valiotti / Хабр

Николай Валиотти@valiotti

Data Engineering & Data Analytics @ leftjoin.ru

Подписчики

ПрофильСтатьи7ПостыНовостиКомментарии13

valiotti 15 дек 2025 в 10:40

Строим витрину данных с Claude через MCP

Простой

3 мин

6.9K

Анализ и проектирование систем * Data Engineering *

Туториал

Давайте разберем, как выглядит работа с MCP, на реальном примере из опыта моего дата-консалтинга. В этой статье теории не будет, только практика, много скриншотов и пара лайфхаков.

valiotti 21 ноя 2025 в 10:59

Как выбрать MCP-сервер: практическое руководство

Простой

5 мин

8.7K

IT-инфраструктура * Искусственный интеллект

Туториал

MCP-сервер — инструмент, который связывает вашу ИТ-инфраструктуру и LLM и за счет этого делает работу с ИИ эффективнее и проще. Но этих серверов уже очень много, и может быть непонятно, как найти среди них подходящий вариант. В этой статье поделюсь своими лайфхаками.

Если вы решите использовать ИИ в работе, то, скорее всего, столкнетесь с одной большой проблемой.

Какой бы детальный промпт вы ни написали для ChatGPT или Claude, они все равно не видят все ваши данные, документацию и историю изменений. Еще и функционал ограничен: вы можете только отправлять запросы в чат, а потом самостоятельно руками копировать ответ и вставлять в код. Из-за этого с небольшими задачами нейросети справляются, но полноценно интегрировать их в большой проект на долгий срок — занятие довольно муторное.

Или оно скорее было таковым, пока Anthropic не представила MCP или Model Context Protocol. Это протокол, который управляет обменом данными между LLM и вашими источниками — базами, API, IDE и так далее. В рамках этого протокола модель может сама активно включаться в рабочий процесс (под присмотром человека, конечно). А если точнее:

valiotti 24 окт 2025 в 10:24

dbt 101: что нужно знать на старте и лучшие практики

Простой

5 мин

8.8K

Data Engineering * Хранение данных *

Кейс

dbt — это фреймворк для трансформации данных внутри хранилища и отличный инструмент для аналитиков и дата-инженеров на больших проектах, где число SQL-скриптов может переваливать за сотни. Мы с командой много работаем с dbt, и в этой статье хочу поделиться своим опытом: расскажу о его ключевых элементах и некоторых лучших практиках на примере одного кейса.

Это не гайд, как развернуть dbt и создать проект, а знакомство с тулом для тех, кто пока с ним не работал и хочет разобраться, что это вообще такое.

valiotti 11 июл 2025 в 09:52

Веб-аналитика. Как свести данные из разных систем, разобраться в моделях атрибуции и не сойти с ума

Простой

11 мин

5.5K

Анализ и проектирование систем * Веб-аналитика *

Туториал

Большинство компаний так или иначе заявляют о себе в интернете — делают сайты, ведут соцсети, покупают рекламу и размещаются у блогеров. Все это требует вложений и иногда — немаленьких, поэтому бизнесу нужен инструмент, который позволял бы отслеживать, насколько эффективно расходуются деньги и какие каналы приводят больше всего людей. Веб-аналитика — это именно такой инструмент.

Веб-аналитика — это способ понять, как пользователи взаимодействуют с сайтом, откуда они пришли и что делали. Она помогает отследить путь от первого посещения до целевого действия и оценить эффективность разных маркетинговых активностей.

В этой статье мы расскажем про основы, которые надо знать, чтобы начать эффективно выстраивать веб-аналитику в своей компании: источники данных, способы сбора, метрики и особенности разных каналов привлечения клиентов.

valiotti 2 июн 2022 в 08:09

Анализируем речь с помощью Python: Как и о чем говорят на YouTube-канале «вДудь»?

8 мин

21K

Искусственный интеллектМашинное обучение * Визуализация данных * Проектирование API * Python *

Выход практически каждого ролика на канале «вДудь» считается событием, а некоторые из этих релизов даже сопровождаются скандалами из-за неосторожных высказываний его гостей.

Сегодня при помощи статистических подходов и алгоритмов ML мы будем анализировать прямую речь. В качестве данных используем интервью, которые журналист Юрий Дудь (признан иностранным агентом на территории РФ) берет для своего YouTube-канала. Посмотрим с помощью Python, о чем таком интересном говорили в интервью на канале «вДудь».

+20

valiotti 10 янв 2022 в 10:04

Как писать посты в стиле Артемия Лебедева? Подробный анализ телеграм-канала и кое-что еще

9 мин

27K

Машинное обучение * Искусственный интеллектВизуализация данных * Serverless *

Дисклеймер номер один: 18+. В этой статье присутствует ненормативная лексика, так как автор текстов, которые мы анализируем, не стесняется в выражениях. Мы не хотим никого задеть или оскорбить чьи-то чувства, присутствие мата объясняется лишь объектом нашего исследования.

Все знают телеграм-канал Артемия Лебедева, в котором очень часто можно увидеть хлесткое матерное слово, а некоторые его посты и вовсе неоднозначны. Я и мой коллега Егор решили как следует разобраться в семантике текстов Артемия, скачали все посты телеграм-канала и проанализировали его словарный диапазон. Сегодня мы обсудим важные этапы исследования и, что самое главное, обсудим аналитические выводы о телеграм-канале Артемия Лебедева.

Изначально, мы поставили перед собой следующие задачи: собрать тексты всех постов и метаинформацию о них, получить динамику подписчиков на канале, а после провести описательный и семантический анализы собранных данных. Но нам удалось сделать даже больше — в результате мы смогли обучить нейронную сеть на текстах Артемия Лебедева.
Теперь мы можем писать тексты для тг-канала Лебедева без него самого. Правда-правда.
Хотите узнать как?

Читать дальше →

+25

valiotti 20 окт 2021 в 07:13

Используем serverless для построения аналитики на данных из AmoCRM в Yandex.Cloud

7 мин

7.3K

Облачные сервисы * Data Engineering * Serverless * Хранение данных *

Из песочницы

Сегодня почти любая современная компания собирает, хранит и использует данные о своей деятельности, используя облачные технологии. В этой статье вы можете узнать о том, как можно вытащить данные из AmoCRM, обработать их с помощью функций и проанализировать с помощью DataLens. Этот кейс решила команда дата-аналитиков Valiotti Analytics совместно с командой Yandex.Cloud.

+13