Articles / Profile of Aleron75 / Habr

Алерон @Aleron75

Data Scientist маминой подруги

ProfileArticles42Posts190News2Comments177

Aleron75 Apr 21 at 14:50

Mixture of Experts: когда нейросеть учится делегировать

Medium

8 min

1.6K

Data Feeling School corporate blogMachine learning *

Tutorial

Представьте, что у вас есть большой и сложный проект, и вы наняли двух управленцев: Кабан-Кабаныча и Руководителева. Вы даете им одинаковую задачу: набрать штат сотрудников и выполнить ваш проект. Вся прибыль вместе с начальным бюджетом останется у них.

Кабан-Кабаныч решил, что нет смысла платить отдельным специалистам по DevOps, backend, ML и другим направлениям, и нанял всего одного сотрудника за 80 монеток. Этот бедняга работал в стиле «один за всех» и, естественно, быстро выгорел и «умер». Кабан-Кабаныч, не долго думая, нанял еще одного такого же сотрудника. В итоге вы вернулись и увидели печальную картину: задачу никто не решил, остался лишь Кабан-Кабаныч и кладбище несчастных сотрудников.

Aleron75 Apr 9 at 21:20

SmolAgents: или как заставить LLM работать на тебя за 30 минут

4 min

11K

Data Feeling School corporate blogArtificial IntelligenceMachine learning *

Представьте, что вы — настоящий папа Карло, который хочет оживить своего робота, но не простого, а на основе больших языковых моделей (LLM). Ваш робот будет не только разговаривать, но и использовать специальные инструменты, которые помогут ему взаимодействовать с сайтами, кодом и даже выполнять ваши повседневные задачи.

Простыми словами, агент — это комбинация модели искусственного интеллекта (LLM) и инструментов, которые вы ему предоставляете для выполнения конкретных задач.

Привет, чемпионы! В этой статье расскажу, как создать своего собственного AI-агента, который сможет помогать вам в различных задачах, и покажу это на конкретных примерах.

+18

Aleron75 Apr 1 at 17:58

Vision Transformer-применение трансформеров в задачах компьютерного зрения

Easy

4 min

4.4K

Machine learning *

Review

Привет, чемпионы! 🎉

Готов окунуться в мир Vision Transformer (ViT) и узнать, как трансформеры, изначально созданные для обработки текста, завоевали признание в компьютерном зрении? Тогда приступим!

Данная работа полезна, если для вас "внимание-это все, что вам нужно" и вас интересует, как стали использовать трансформеры в других областях глубокого обучения.

Aleron75 Jan 23 at 13:58

30 трюков на Python с описанием преимущества

Easy

6 min

17K

Data Feeling School corporate blogPython *

Tutorial

Причет, чемпионы! У меня тут нашлось время собрать коллекцию хитростей на python🐍 в примерах. Примеры давно копились у меня в черновиках, и вот делюсь! Это первая часть, поехали!

Изучить трюки 🐍

Aleron75 Sep 6 2024 at 09:52

Улучшаем python код в пару кликов

Easy

7 min

3.8K

Python *

Tutorial

Разрабатывая огромные проекты в команде сталкиваешься с проблемой, что люди не понимают друг друга, и каждый пишет в своей стилистике. Поэтому в дальнейшем будет трудно поддерживать этот код

В статье научимся писать код в единой стилистике и даже делать это автоматически.

Улучшать проекты!

-7

Aleron75 Sep 5 2024 at 08:15

5 способов оптимизации функций в Python

Easy

3 min

3.7K

Big Data * Data Engineering * Python *

Review

Всегда полезно уметь ускорить выполнение кода на python, особенно если мы имеем дело с большими объемами данных или часто вызываемыми функциями.

В этой статье мы рассмотрим 5 простых, но эффективных способов оптимизации функций в Python, которые помогут вам сделать ваш код быстрее и эффективнее.

Ускорить свой код!

Aleron75 Aug 30 2024 at 07:09

Топ 5 продвинутых инструментов Data Science. Изучи за выходные и будешь выделяться

Medium

10 min

16K

Data Engineering * DevOps * Machine learning * Data Mining * Python *

Tutorial

Привет, чемпионы! Сегодня рассмотрим, как облегчить себе жизнь, применяя 5 инструментов в своих проектах. Эти инструменты улучшат ваш код, сделают ваш pipeline более стабильным и позволят не писать один код по 10 раз. Круто? Погнали!

Изучать новое!

+15

Aleron75 Aug 28 2024 at 07:07

Дообучаем Llama 3.1 у себя дома

Medium

8 min

37K

Python * Programming * Machine learning * Artificial Intelligence

Tutorial

Привет, чемпионы!

С каждым днем появляется все больше и больше LLM. Их метрики растут с таким же бешеным темпом. Но в узких областях знаний они до сих пор дают осечку. Почему это происходит и как с эти бороться? - Разбираем универсальный код для дообучения LLM на своих данных!

Дообучать LLM!

+25

Aleron75 Aug 20 2024 at 10:35

Делаем своего AI стилиста на python

Easy

3 min

4.4K

Data Engineering * Business Models * Mathematics * Big Data * Python *

Case

Привет, чемпионы!

AI решение, которые я разберу в этой статье - после запуска в телеграм привлекло почти органически внимание 70 000 новых пользователей за месяц, а всего было произведено 400 000 генераций. Разбираю, как реализовал сама ML модель. Погнали!

Переодеть коллег

Aleron75 Jul 1 2024 at 07:32

PandasAI — кратно ускоряем работу аналитика данных в одну строчку

Easy

5 min

15K

Python * Data Mining * Big Data * DevOps * Data Engineering *

Case

Ускоряем написание кода при работе с таблицами и библиотекой Pandas с помощью PandasAI в несколько раз за пару строк. Хитрецы уже используют ...

Aleron75 May 30 2024 at 12:21

Midjourney и промпты для пиксельных артов

2 min

5.8K

Data Engineering * Big Data * UML Design * Data Mining *

Case

Привет, чемпионы!

Часто ли вы обращаетесь к Midjourney или Stable Diffusion, чтобы нарисовать фантастический арт? Я да - нравится позалипать пару минут на фантастический арт. Давайте сегодня учиться генерировать подобные пикчи за пару кликов:

Посмотреть промпты

Aleron75 Mar 15 2023 at 07:32

Угнали все мои телеграм каналы на 50к+ подписчиков. Вернул спустя месяц. План действий

Easy

4 min

14K

Social networks and communities

Tutorial

Привет, чемпион!

Недавно у меня угнали несколько телеграм каналов. Рассказываю, как вовзращал и что делать, чтоб с вами такого не произошло.

Будем считать, что читатель этой статьи столкнулся с кражей своих доступов к телеграм каналу. Кратко расскажу мою историю и далее пошаговый план действий.

+12

Aleron75 Dec 14 2022 at 09:00

ChatGPT пройдёт собеседование по Data Science вместо вас

10 min

18K

RUVDS.com corporate blogMachine learning * Algorithms * Python * Big Data *

Привет, чемпион!

Возможно, ты сейчас готовишься к собеседованию в какую-нибудь IT-компанию. Скорее всего, тебе будут задавать технические вопросы, поэтому тебе приходится готовиться. Но, возможно, ты всё равно не сможешь ответить на все вопросы правильно. Как быть?!

А слышал ли ты про новую умную chatGPT? А что, если Я тебе скажу, что больше готовиться к собеседованиям так усердно не нужно! Что?! Задаваемые тебе вопросы можно делегировать chatGPT.

В общем, нет времени объяснять, давай устроим собес для chatGPT по Data Science и узнаем, сможет ли сетка его пройти?! Всё по классике — спрашиваем вопросы по 4 секциям:

Программирование — Python и алгоритмы,
Написание SQL-запросов,
Data Science и статистика,
ML System Design.

Читать дальше →

+41

Aleron75 Dec 9 2022 at 11:37

Мое первое серебро на Kaggle или как стабилизировать ML модель и подпрыгнуть на 700 мест вверх

6 min

11K

Artificial IntelligenceMachine learning * Big Data * Algorithms * Python *

Привет, чемпион!

Летом прошел чемпионат на Kaggle - "American Express - Default Prediction", требовалось предсказывать - выйдет ли пользователь в дефолт или нет. Табличное соревнование в 5К участников с очень плотным лидербордом.

Вот ведь парадокс, все умеют решать табличные соревнования, все знают, что бустинги "стреляют" точнее всех, но почему-то все равно не все могут забраться в топ лидерборда. В чем проблема?! Мы с командой все-таки смогли забрать серебро? и сейчас я расскажу, как можно было выиграть медаль в этом чемпионате.

+15

Aleron75 Sep 16 2022 at 12:00

Как мы взяли бронзу вместо золота на Kaggle или умей верно выбрать сабмит

7 min

3.4K

Python * Big Data * Data Engineering *

Привет, чемпион!

Мы тут недавно потратили месяц на соревнование «UW-Madison GI Tract Image Segmentation» и не взяли золото. Золотую медаль не взяли, но теперь у каждого из нас есть первая бронза. И сейчас мы кратко расскажем про сработавшие подходы в сегментации. А еще расскажем, что можно было сделать, чтоб все-таки забрать золото. (Спойлер: мы были в шаге от золота ...)

Aleron75 Aug 3 2022 at 09:00

Feature Engineering или стероиды для ML моделей

6 min

20K

RUVDS.com corporate blogPython * Data Engineering * Big Data *

Привет, чемпион!

Часто при построении ML моделей мало просто взять сильную модель. Оказывается, иногда грамотная предобработка данных существенно важнее. Сегодня речь пойдёт про feature engineering.

Рассмотрим несколько кейсов на эту тему более подробно. Данные будут упрощённые, но обещаю, от этого примеры не станут менее интересными ?.

Читать дальше →

+34

Aleron75 Jul 26 2022 at 09:00

Получил доступ к Dalle-2. Вы не поверите, что может нарисовать машина… Дизайнеры больше не нужны

4 min

150K

RUVDS.com corporate blogBig Data * Machine learning * Popular scienceImage processing *

Текст генерации: furry monster with green eyes looking at us, the word «habrahabr» in the background, digital art, blue background, 3d

Привет, чемпион!

Недавно мне посчастливилось стать обладателем доступа к API Dalle-2. Если ты ещё не слышал про Dalle, то это такая CLIP-архитектура, обученная на огромном корпусе пар текст-изображение. Иначе говоря — она умеет генерировать очень качественные изображения из текста. Отличить результаты генерации от рисунков человека иногда просто невозможно! Это одновременно впечатляет и в то же время — немного шокирует.

По сравнению с предыдущей версией — DALL-E 2 умеет генерировать изображения в более высоком разрешении (1024×1024 пикселей, что в 16 раз превышает разрешение в предыдущей версии модели) да ещё и намного быстрее. Более того, DALL-E 2 позволяет редактировать уже существующие изображения.

Нет больше терпения ждать, давайте же опробуем её!

Читать дальше →

+214

817

Aleron75 Jul 12 2022 at 09:00

В Data Science не нужна математика (Почти)

6 min

93K

RUVDS.com corporate blogMathematics * Python * Data Engineering * Big Data *

Привет, чемпион!

Ребята с «вышкой» всё время умничают, что в Data Science нужна «математика», но стоит копнуть глубже, оказывается, что это не математика, а вышмат.

В реальной повседневной работе Data Scientist'а я каждый день использую знания математики. Притом очень часто это далеко не «вышмат». Никакие интегралы не считаю, детерминанты матриц не ищу, а нужные хитрые формулы и алгоритмы мне оперативнее просто загуглить.

Решил накидать чек-лист из простых математических приёмов, без понимания которых — тебе точно будет сложно в DS. Если ты только начинаешь карьеру в DS, то тебе будет особенно полезно. Мощь вышмата не принижаю, но для старта всё сильно проще, чем кажется. Важно прочитать до конца!

Читать дальше →

+123

Aleron75 Apr 5 2022 at 09:00

8 ошибок, из-за которых ты проиграешь в соревновательном Data Science

8 min

17K

RUVDS.com corporate blogData Engineering * Algorithms * Machine learning *

Привет, чемпион!

Если ты читаешь этот пост, значит, тебе стало интересно, не допускаешь ли этих ошибок ты?! Почти уверен, что ты допускал эти ошибки хотя бы раз в жизни. Мы не застрахованы от совершения ошибок, такова наша человеческая натура — ошибаться для нас естественно. Однако, я постараюсь уберечь тебя от тех ошибок, которые совершал сам или замечал у других.

Так вышло, что за время участия в чемпионатах по соревновательному анализу данных я достаточно часто бывал в призовых местах. Однако, бывали случаи, когда я лишался призовых по глупости или неосторожности. Рассказываю по порядку.

Читать дальше →

+49