Обновить
23
0
Николай Валиотти@valiotti

Data Engineering & Data Analytics @ leftjoin.ru

Отправить сообщение

Строим витрину данных с Claude через MCP

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели6.7K

Давайте разберем, как выглядит работа с MCP, на реальном примере из опыта моего дата-консалтинга. В этой статье теории не будет, только практика, много скриншотов и пара лайфхаков. 

Читать далее

Как выбрать MCP-сервер: практическое руководство

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.6K

MCP-сервер — инструмент, который связывает вашу ИТ-инфраструктуру и LLM и за счет этого делает работу с ИИ эффективнее и проще. Но этих серверов уже очень много, и может быть непонятно, как найти среди них подходящий вариант. В этой статье поделюсь своими лайфхаками. 

Если вы решите использовать ИИ в работе, то, скорее всего, столкнетесь с одной большой проблемой. 

Какой бы детальный промпт вы ни написали для ChatGPT или Claude, они все равно не видят все ваши данные, документацию и историю изменений. Еще и функционал ограничен: вы можете только отправлять запросы в чат, а потом самостоятельно руками копировать ответ и вставлять в код. Из-за этого с небольшими задачами нейросети справляются, но полноценно интегрировать их в большой проект на долгий срок — занятие довольно муторное.

Или оно скорее было таковым, пока Anthropic не представила MCP или Model Context Protocol. Это протокол, который управляет обменом данными между LLM и вашими источниками — базами, API, IDE и так далее. В рамках этого протокола модель может сама активно включаться в рабочий процесс (под присмотром человека, конечно). А если точнее:

Читать далее

dbt 101: что нужно знать на старте и лучшие практики

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели8.1K

dbt — это фреймворк для трансформации данных внутри хранилища и отличный инструмент для аналитиков и дата-инженеров на больших проектах, где число SQL-скриптов может переваливать за сотни. Мы с командой много работаем с dbt, и в этой статье хочу поделиться своим опытом: расскажу о его ключевых элементах и некоторых лучших практиках на примере одного кейса.

Это не гайд, как развернуть dbt и создать проект, а знакомство с тулом для тех, кто пока с ним не работал и хочет разобраться, что это вообще такое.

Читать далее

Веб-аналитика. Как свести данные из разных систем, разобраться в моделях атрибуции и не сойти с ума

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели2.1K

Большинство компаний так или иначе заявляют о себе в интернете — делают сайты, ведут соцсети, покупают рекламу и размещаются у блогеров. Все это требует вложений и иногда — немаленьких, поэтому бизнесу нужен инструмент, который позволял бы отслеживать, насколько эффективно расходуются деньги и какие каналы приводят больше всего людей. Веб-аналитика — это именно такой инструмент. 

Веб-аналитика — это способ понять, как пользователи взаимодействуют с сайтом, откуда они пришли и что делали. Она помогает отследить путь от первого посещения до целевого действия и оценить эффективность разных маркетинговых активностей. 

В этой статье мы расскажем про основы, которые надо знать, чтобы начать эффективно выстраивать веб-аналитику в своей компании: источники данных, способы сбора, метрики и особенности разных каналов привлечения клиентов. 

Читать далее

Анализируем речь с помощью Python: Как и о чем говорят на YouTube-канале «вДудь»?

Время на прочтение8 мин
Охват и читатели21K

Выход практически каждого ролика на канале «вДудь» считается событием, а некоторые из этих релизов даже сопровождаются скандалами из-за неосторожных высказываний его гостей.

Сегодня при помощи статистических подходов и алгоритмов ML мы будем анализировать прямую речь. В качестве данных используем интервью, которые журналист Юрий Дудь (признан иностранным агентом на территории РФ) берет для своего YouTube-канала. Посмотрим с помощью Python, о чем таком интересном говорили в интервью на канале «вДудь».

Читать далее

Как писать посты в стиле Артемия Лебедева? Подробный анализ телеграм-канала и кое-что еще

Время на прочтение9 мин
Охват и читатели27K


Дисклеймер номер один: 18+. В этой статье присутствует ненормативная лексика, так как автор текстов, которые мы анализируем, не стесняется в выражениях. Мы не хотим никого задеть или оскорбить чьи-то чувства, присутствие мата объясняется лишь объектом нашего исследования.

Все знают телеграм-канал Артемия Лебедева, в котором очень часто можно увидеть хлесткое матерное слово, а некоторые его посты и вовсе неоднозначны. Я и мой коллега Егор решили как следует разобраться в семантике текстов Артемия, скачали все посты телеграм-канала и проанализировали его словарный диапазон. Сегодня мы обсудим важные этапы исследования и, что самое главное, обсудим аналитические выводы о телеграм-канале Артемия Лебедева

Изначально, мы поставили перед собой следующие задачи: собрать тексты всех постов и метаинформацию о них, получить динамику подписчиков на канале, а после провести описательный и семантический анализы собранных данных. Но нам удалось сделать даже больше — в результате мы смогли обучить нейронную сеть на текстах Артемия Лебедева.
Теперь мы можем писать тексты для тг-канала Лебедева без него самого. Правда-правда.
Хотите узнать как?

Читать дальше →

Используем serverless для построения аналитики на данных из AmoCRM в Yandex.Cloud

Время на прочтение7 мин
Охват и читатели7.1K

Сегодня почти любая современная компания собирает, хранит и использует данные о своей деятельности, используя облачные технологии. В этой статье вы можете узнать о том, как можно вытащить данные из AmoCRM, обработать их с помощью функций и проанализировать с помощью DataLens. Этот кейс решила команда дата-аналитиков Valiotti Analytics совместно с командой Yandex.Cloud.

 

Читать далее

Информация

В рейтинге
Не участвует
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Зарегистрирован
Активность