Pull to refresh
50
17.7
Алерон @Aleron75

Data Scientist маминой подруги

Send message

Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов

Level of difficultyEasy
Reading time7 min
Views1.9K

Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов.

Мы соберём RAG-пайплайн, который по запросу проанализирует последние новости по интересующим темам и выдаст понятный отчёт. Разберём пошагово всю структуру и подумаем, как можно развивать и улучшить эту систему.

Читать далее

Self-RAG: LLM сама выбирает, когда ей нужен контекст

Level of difficultyEasy
Reading time7 min
Views4.5K

Сегодня различные методы для улучшения ваших LLM ассистентов как никогда актуальны и важны, особенно, если мы говорим про бизнес интеграцию. Сейчас расскажу про технологию Self-RAG, которую мы опробовали, почему она нам показалась выгодна в наших задачах и подводные камни, на которые мы наткнулись при развертывании данной системы. А также как мы всё это локально поднимали и делали кастом.

Читать далее

Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее

Level of difficultyMedium
Reading time5 min
Views1.1K

Алгоритм Recovering Difference Softmax (RDS) — полноценный подход к оптимизации уведомлений и контента для повышения вовлеченности пользователей. Алгоритм выбирает единственно лучший вариант, удерживая пользователей дольше и возвращая их чаще.

Если коротко, улучшает работу алгоритмов машинного обучения, особенно когда нужно делать выбор из нескольких вариантов.

Как RDS превращает простые сигналы в рост вовлечённости? Разбираемся в статье!

Читать далее

Грязные схемы на собеседованиях: как мошенники используют разработчиков и обманывают работодателей

Level of difficultyEasy
Reading time7 min
Views7.3K

Хотите узнать, как при найме кандидаты могут вас обмануть или как, устраиваясь на работу, случайно создать себе серьёзные проблемы? Тогда эта статья точно для вас.

⚠️ Этическое предисловие

Эта история основана на реальном кейсе одной организации, которая массово поставляла кандидатов на рынок труда в разных регионах и направлениях.

Сотрудники организации получили серьёзные проблемы с правоохранительными органами. А сотрудник, которого трудоустроили через такую схему, оказался в центре внимания как внутренней, так и внешней службы безопасности - с допросами, проверками и серьёзными последствиями.

Читать далее

Model Context Protocol (MCP): как подружить нейросети со всеми API за пару кликов

Level of difficultyEasy
Reading time9 min
Views10K

Казалось бы, совсем недавно мир только начал знакомиться с тем, что такое большие языковые модели (LLM). Вскоре после этого появились их многочисленные вариации — на любой вкус и цвет, от узкоспециализированных до универсальных моделей. Затем началась волна интеграций: LLM начали встраивать в различные сервисы, приложения и API, упрощая и автоматизируя рутинные процессы.

Следующим стало появление LLM-агентов — интеллектуальных систем, способных самостоятельно принимать решения и выполнять сложные задачи, взаимодействуя с внешними сервисами. Вместе с ростом их популярности возникла новая проблема — отсутствие единого стандарта взаимодействия между агентами и их окружением.

И вот, компания Anthropic представила решение этой задачи — новый протокол Model Context Protocol (MCP), который стандартизирует взаимодействие агентов с различными сервисами и между собой.

Давайте разберёмся, что такое MCP, и с чем его едят!

Читать далее

Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу

Level of difficultyEasy
Reading time4 min
Views8K

Теперь всё, что раньше делали люди — создание курсов, проверку ответов, адаптацию персонализированных заданий — почти полностью взял на себя ИИ.

Duolingo — это уже давно не просто приложение с разноцветными совами и скучными заданиями. В 2025-м генеративный ИИ позволил Duolingo быстро создавать новые курсы, и за год почти удвоить число языковых курсов! Как им это удалось и что это значит лично для тебя — рассказываем подробнее...

Читать далее

Правда или нет, что Google победил Cursor?

Level of difficultyEasy
Reading time4 min
Views20K

Вы, вероятно, уже слышали, что Google выпустил Firebase Studio как полноценную среду для AI-разработки, основанную на мощной модели Gemini. 

Очевидно, гигант не захотел отставать и тоже запрыгнул в поезд хайпа AI-продуктов. Но способен ли он составить реальную конкуренцию популярному Cursor?

Сегодня мы погрузимся в мир двух популярных AI-инструментов для разработки: облачной платформы Firebase Studio от Google и интегрированного AI-редактора Cursor от Anysphere.

Читать далее

Собеседовали 25 джунов в Data Science: кого стоит брать и почему?

Level of difficultyEasy
Reading time5 min
Views2.2K

Привет, чемпион! Меня зовут Артём, я работаю в Сбере и преподаю в Вышке. Сегодня поговорим о текущей ситуации с наймом джунов в Data Science. Для начала немного личной истории.

Несколько лет назад, только начиная свой путь в Data Science, я наткнулся на анонс большого и насыщенного курса «Введение в соревновательный Data Science». Сомневался, стоит ли покупать: хотелось скорее устроиться на работу, чем получить золотую медаль на Kaggle. В итоге купил и не прогадал — на собеседовании отлично пригодились знания по отбору признаков. Но интереснее другое: спустя пару недель автор курса, Алерон Миленкин, заметил мою 300-дневную серию на Stepik и позвал пообщаться. Так мы встретились в офисе Додо, поговорили про рынок труда в DS, и съели пару додстеров. Тогда я понял главное: нетворкинг решает почти всё — именно благодаря ему я позже нашёл работу и начал преподавать.

Читать далее

Вайб-кодинг: революция для стартаперов или ловушка для программистов? Обзор инструментов

Level of difficultyEasy
Reading time4 min
Views17K

Привет, чемпион! В этой статье я Никита и мой биг бро Алерон  мы вместе окунёмся в одну из самых хайповых тем года — vibe-coding решения. Почему это "болото"? Сейчас расскажем!

Вроде бы сначала всё выглядит просто: красиво, удобно, даже соблазнительно. Но спустя неделю ты уже перестаёшь писать код и просто таскаешь блоки, задаваясь вопросом: "А зачем я JS учил?". И это не шутка! Многие после первого успеха с vibe-coding начинают по-другому смотреть на разработку и сроки реализации. Но GitHub удалять рано — у всего есть оборотная сторона.

🔥vibe-coding — это проклятие или подарок Прометея? Давай разбираться.

Читать далее

Mixture of Experts: когда нейросеть учится делегировать

Level of difficultyMedium
Reading time8 min
Views1.3K

Представьте, что у вас есть большой и сложный проект, и вы наняли двух управленцев: Кабан-Кабаныча и Руководителева. Вы даете им одинаковую задачу: набрать штат сотрудников и выполнить ваш проект. Вся прибыль вместе с начальным бюджетом останется у них.

Кабан-Кабаныч решил, что нет смысла платить отдельным специалистам по DevOps, backend, ML и другим направлениям, и нанял всего одного сотрудника за 80 монеток. Этот бедняга работал в стиле «один за всех» и, естественно, быстро выгорел и «умер». Кабан-Кабаныч, не долго думая, нанял еще одного такого же сотрудника. В итоге вы вернулись и увидели печальную картину: задачу никто не решил, остался лишь Кабан-Кабаныч и кладбище несчастных сотрудников.

Читать далее

SmolAgents: или как заставить LLM работать на тебя за 30 минут

Reading time4 min
Views9.9K

Представьте, что вы — настоящий папа Карло, который хочет оживить своего робота, но не простого, а на основе больших языковых моделей (LLM). Ваш робот будет не только разговаривать, но и использовать специальные инструменты, которые помогут ему взаимодействовать с сайтами, кодом и даже выполнять ваши повседневные задачи.

Простыми словами, агент — это комбинация модели искусственного интеллекта (LLM) и инструментов, которые вы ему предоставляете для выполнения конкретных задач.

Привет, чемпионы! В этой статье расскажу, как создать своего собственного AI-агента, который сможет помогать вам в различных задачах, и покажу это на конкретных примерах.

Читать далее

Vision Transformer-применение трансформеров в задачах компьютерного зрения

Level of difficultyEasy
Reading time4 min
Views3.5K

Привет, чемпионы! 🎉

Готов окунуться в мир Vision Transformer (ViT) и узнать, как трансформеры, изначально созданные для обработки текста, завоевали признание в компьютерном зрении? Тогда приступим!

Данная работа полезна, если для вас "внимание-это все, что вам нужно" и вас интересует, как стали использовать трансформеры в других областях глубокого обучения.

Читать далее

30 трюков на Python с описанием преимущества

Level of difficultyEasy
Reading time6 min
Views16K

Причет, чемпионы! У меня тут нашлось время собрать коллекцию хитростей на python🐍 в примерах. Примеры давно копились у меня в черновиках, и вот делюсь! Это первая часть, поехали!

Изучить трюки 🐍

Улучшаем python код в пару кликов

Level of difficultyEasy
Reading time7 min
Views3.2K

Разрабатывая огромные проекты в команде сталкиваешься с проблемой, что люди не понимают друг друга, и каждый пишет в своей стилистике. Поэтому в дальнейшем будет трудно поддерживать этот код

В статье научимся писать код в единой стилистике и даже делать это автоматически.

Улучшать проекты!

5 способов оптимизации функций в Python

Level of difficultyEasy
Reading time3 min
Views3.2K

Всегда полезно уметь ускорить выполнение кода на python, особенно если мы имеем дело с большими объемами данных или часто вызываемыми функциями. 

В этой статье мы рассмотрим 5 простых, но эффективных способов оптимизации функций в Python, которые помогут вам сделать ваш код быстрее и эффективнее.

Ускорить свой код!

Топ 5 продвинутых инструментов Data Science. Изучи за выходные и будешь выделяться

Level of difficultyMedium
Reading time10 min
Views16K

Привет, чемпионы! Сегодня рассмотрим, как облегчить себе жизнь, применяя 5 инструментов в своих проектах. Эти инструменты улучшат ваш код, сделают ваш pipeline более стабильным и позволят не писать один код по 10 раз. Круто? Погнали!

Изучать новое!

Дообучаем Llama 3.1 у себя дома

Level of difficultyMedium
Reading time8 min
Views33K

Привет, чемпионы!

С каждым днем появляется все больше и больше LLM. Их метрики растут с таким же бешеным темпом. Но в узких областях знаний они до сих пор дают осечку. Почему это происходит и как с эти бороться? - Разбираем универсальный код для дообучения LLM на своих данных!

Дообучать LLM!

Делаем своего AI стилиста на python

Level of difficultyEasy
Reading time3 min
Views4.3K

Привет, чемпионы!

AI решение, которые я разберу в этой статье - после запуска в телеграм привлекло почти органически внимание 70 000 новых пользователей за месяц, а всего было произведено 400 000 генераций. Разбираю, как реализовал сама ML модель. Погнали!

Переодеть коллег

PandasAI — кратно ускоряем работу аналитика данных в одну строчку

Level of difficultyEasy
Reading time5 min
Views14K

Ускоряем написание кода при работе с таблицами и библиотекой Pandas с помощью PandasAI в несколько раз за пару строк. Хитрецы уже используют ...

Читать далее

Midjourney и промпты для пиксельных артов

Reading time2 min
Views5.4K

Привет, чемпионы!

Часто ли вы обращаетесь к Midjourney или Stable Diffusion, чтобы нарисовать фантастический арт? Я да - нравится позалипать пару минут на фантастический арт. Давайте сегодня учиться генерировать подобные пикчи за пару кликов:

Посмотреть промпты
1

Information

Rating
483-rd
Location
Сочи, Краснодарский край, Россия
Works in
Registered
Activity

Specialization

Data Scientist, ML Engineer
Lead
From 800,000 ₽
Python
OOP
Bash
Git
SQL
Linux
Docker
Java
PostgreSQL
Nginx