Articles / Bookmarks / Profile of lozy

@lozy_rc

User

Profile Publications 1Comments 35Bookmarks 38

Vladislav_Polyakov 23 hours ago

Быстрая оценка эффекта рекламы/события на ключевые показатели: Python + Causal Impact

Medium

4 min

536

Python*Programming*Open data*Data visualization*Machine learning*

From sandbox

Приветствую, меня зовут Владислав Поляков, я аналитик данных в Сбербанке. Сегодня я хочу поделиться, пожалуй, самым простым и быстрым способом оценки эффекта рекламы/события на ключевые показатели. Способ заключается в использовании библиотеки pycausalimpact для Python. Документация к библиотеке.

Вводные:

Данные: Данные ЦБ РФ по ключевой ставке и объему выданных кредитов с 2013 года.

Что будем оценивать?: Как повышение ключевой ставки повлияло на объем выданных кредитов.

Как будем оценивать?: С помощью библиотеки pycausalimpact для Python

+10

nrsharip Mar 18 at 17:32

Основные типы распределений вероятностей в примерах

Medium

15 min

21K

Python*Algorithms*Mathematics*Statistics in ITInfographics

From sandbox

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, покупок товаров является обычным и необходимым явлением. Любые изменения в пользовательском опыте на сайте компании (внешний вид, структура, контент) приводят к изменениям в работе пользователя и, как результат, изменения наблюдаются в собираемых данных. Важным элементом анализа изменений данных и его фундаментом является использование основных типов распределений случайных величин, от понимания которых напрямую зависит качество оценки значимости наблюдаемого изменения. Рассмотрим их подробнее на наглядных примерах.

+58

Morlena106 Feb 20 at 18:19

Автоматизируем создание отчетов в Word с данными из Excel на Python

Easy

7 min

38K

Python*Development for Office 365*

Tutorial

До смешного простой код, который может сэкономить вам кучу времени в будущем. И как фанат автоматизации, который старается избегать любой однообразной и рутинной работы, я от таких решений просто в восторге.

+33

IvanZaycev0717 Dec 10 2023 at 19:50

Пишем приложение на Python для подготовки к собеседованиям по Python

6 min

26K

Python*Programming*ООP*

На конец 2023 года язык программирования Python является самым популярным по индексу TIOBE. Что касается работы, то по количеству вакансий в мире язык Python занимает второе место (после JavaScript/TypeScript). Поэтому у соискателей на должность, где требуется Python, возникает потребность подготовки к собеседованиям.

В этой статье я расскажу о том, как используя Python, можно написать desktop-приложение для ОС Windows, которое поможет быстро, эффективно и абсолютно бесплатно подготовиться к собеседованиям по Python.

Parfois Nov 2 2023 at 22:45

Как уменьшить галлюцинации ChatGPT: 6 способов

Easy

5 min

Self Promo

Tutorial

Одна из главных проблем при работе с нейросетями – их склонность выдумывать недостоверные ответы. Это называется "галлюцинациями". Чтобы их избегать, нужно понимать, как составлять промты. В этой статье я расскажу о шести способах уменьшить галлюцинации. Все дело в том, как вы создаете запросы.

Галлюцинации – это явление, при котором ChatGPT генерирует контент, который не соответствует реальности. Это может произойти из-за недостаточности данных для обучения, неправильной интерпретации входных данных или из-за особенностей архитектуры модели. Это ведет к некорректным или вводящим в заблуждение результатам.

Специалисты по машинному обучению предлагают разные решения проблемы. Среди них – создание специализированных наборов данных, использование обучения с подкреплением (RLHF), использование поисковой нейросети, которая будет парсить внешнюю информацию для генеративной нейросети и др. CEO OpenAI Сэм Альтман считает, что устранить галлюцинации удастся за 1,5-2 года. Тогда будет найден баланс между креативностью и идеальной точностью ответов.

Я же исследовал вопрос с точки зрения пользовательского опыта – как улучшать ответы модели с помощью промтов. Для примеров я использовал чат MashaGPT, который дает удаленный доступ к ChatGPT.

Terentew Oct 21 2023 at 12:58

Майнд-карта успешной физической трансформации. Питание. Тренировки. Мотивация

7 min

11K

Reading roomPopular scienceHealth

Review

Это базовая база из разряда «если ты не делаешь этого, тогда я не знаю, на что ты рассчитываешь», применимая в почти любой ситуации.
Нюансы опущены. Их много и часто касаются индивидуальных особенностей каждого и, как правило, накладываются уже на эту базу.

С этой майнд-картой теперь весь твой путь у тебя перед глазами. А если застрянешь на каком-то этапе, ты будешь знать, что делать дальше.
Ниже по тексту будет описание майнд-карты, чтобы рекомендации из нее не выглядели голословными.

Успехов тебе!

+20

maxcoolmakarov Jul 4 2023 at 11:46

Оформляем красивые отчеты и приложения в Streamlit и запускаем в облака

Easy

6 min

8.1K

Python*Interfaces*Data visualization*Amvera corporate blog

Tutorial

Создаем красивый отчет или веб приложение на Python при помощи Streamlit и делимся им через облачный сервис с развертыванием через GIT.

roman_salesai May 5 2023 at 20:53

Data-driven рост с помощью науки о данных и машинного обучения

Easy

20 min

2.1K

Big Data*Sales management*

Big data season

Машинное обучение меняет способы использования данных компаниями для обеспечения прибыльного роста, предоставляя возможность опередить своих конкурентов. Ведущие игроки на вашем рынке уже используют науку о данных и машинное обучение в частности для принятия более эффективных решений в области маркетинга, продаж и успешного обслуживания клиентов. Еще не поздно воспользоваться этой возможностью - технологические компании могут ускорить свой рост, приняв пять ведущих практик.

dKosarevsky Apr 18 2023 at 20:16

Создай своего ИИ-ассистента с помощью ChatGPT и Streamlit

Medium

10 min

35K

Python*API*Open Data Science corporate blogArtificial IntelligenceThe future is here

Tutorial

Автор: Дмитрий Косаревский

Привет, Хабр! 👋

Меня зовут Дима Косаревский, я инженер данных (DE), увлеченный Data Science и всем, что связано с этим направлением.
Data Science позволяет извлекать ценную информацию из огромных объемов данных при помощи статистических и вычислительных методов.

В последнее время эти ИИ, вроде ChatGPT, врываются прямо во все сферы. И вот благодаря увлечению Data Science можно использовать этих ботов, чтобы помогать людям, да ещё и пообщаться с ними на разные темы. Здорово, правда?

ChatGPT действительно впечатляет. Он не только общается на разные темы, но еще и стихи сочинять умеет.
Вот один из примеров, которые я получил недавно:

Поехали 🚀

+27

ANazarov Apr 14 2023 at 02:18

Регрессионный анализ в DataScience. Часть 3. Аппроксимация

Medium

72 min

13K

Python*Data Mining*Mathematics*Statistics in IT

Tutorial

В предыдущих обзорах (https://habr.com/ru/articles/690414/, https://habr.com/ru/articles/695556/) мы рассматривали линейную регрессию. Пришло время переходить к нелинейным моделями. Однако, прежде чем рассматривать полноценный нелинейный регрессионный анализ, остановимся на аппроксимации зависимостей.

Про аппроксимацию написано так много, что, кажется, и добавить уже нечего. Однако, кое-что добавить попытаемся.

При выполнении анализа данных может возникнуть потребность оперативно построить аналитическую зависимость. Подчеркиваю - речь не идет о полноценном регрессионном анализе со всеми его этапами, проверкой гипотез и т.д., а только лишь о подборе уравнения и оценке ошибки аппроксимации. Например, мы хотим оценить характер зависимости между какими-либо показателями в датасете и принять решение о целесообразности более глубокого исследования. Подобный инструмент предоставляет нам тот же Excel - все мы помним, как добавить линию тренда на точечном графике:

+14

pas-zhukov Apr 2 2023 at 22:32

Titanic Survivors Data Research

Medium

17 min

8.6K

Python*Machine learning*

From sandbox

15 апреля 1912 года произошло крушение парохода «Титаник», став одной из самых значимых катастроф в истории человечества. В данной статье исследованы данные пассажиров Титаника, сделаны и проверены предположения о влиянии определённых факторов на вероятность человека выжить в той катастрофе. Анализ данных сопровождается примерами кода на Python, с использованием пакета Pandas. Построена и обучена модель нейронной сети, предсказывающая вероятность человека выжить в катастрофе с точностью 0.78 на тестовых данных. Модель построена на базе фреймворка pyTorch.

+10

ru_vds Mar 28 2023 at 16:00

Всё, что вам нужно — это внимание (часть 1)

Hard

14 min

23K

Machine learning*RUVDS.com corporate blogArtificial IntelligenceNatural Language Processing*

Translation

Источник

Примечание переводчика: Недавно на Хабре мы рассказывали о статьях, которые нужно прочитать, если вы хотите заниматься искусственным интеллектом. Среди них была культовая статья Attention is all you need, выпущенная в 2017 году. С неё началось развитие больших языковых моделей, в том числе всем известного чат-бота ChatGPT. Оказалось, что у такой важной статьи нет перевода на русский язык. Мы решили исправить это. Ниже вы найдёте перевод первой части статьи, вторая часть доступна по ссылке.

Краткое содержание

Наиболее распространённые модели преобразования последовательностей основаны на сложных рекуррентных или свёрточных нейронных сетях, которые включают энкодер и декодер. В самых успешных моделях энкодер и декодер соединяются с помощью механизма внимания. В статье авторы предлагают новую простую архитектуру нейронных сетей — Трансформер. Он основан исключительно на механизмах внимания, без рекуррентности или свёрток. Эксперименты на двух задачах машинного перевода показали лучшее качество, а также больше возможностей к распараллеливанию и меньшие временные затраты на обучение. Модель достигает 28.4 по метрике BLEU на задаче перевода с английского на немецкий на данных WMT 2014, что превосходит предыдущий лучший результат на 2 пункта. На задаче перевода с английского на французский на данных WMT 2014 модель достигла наилучшего результата для решения, основанного на одной модели — 41.8 по метрике BLEU — после всего 3.5 дней обучения на 8 GPU, что составляет совсем небольшую часть тех вычислительных мощностей, которые были затрачены на обучение лучшей модели, известной из имеющихся публикаций. Авторы показывают, что Трансформер может также успешно применяться и в других задачах, таких как, например, синтаксический разбор предложений на английском языке с использованием как больших, так и весьма ограниченных наборов данных для обучения.

Читать дальше →

+59

PatientZero Mar 17 2023 at 08:41

Стохастический язык программирования на основе алгоритмов Маркова

13 min

26K

Abnormal programming*Programming*Mathematics*

Translation

MarkovJunior — это вероятностный язык программирования, в котором программы являются сочетаниями правил перезаписи, а инференс выполняется при помощи распространения ограничений. MarkovJunior назван в честь математика Андрея Андреевича Маркова, придумавшего и исследовавшего то, что сейчас называется алгоритмами Маркова.

Читать дальше →

+139

mr-pickles Aug 22 2022 at 12:05

4 анти-паттерна pandas и способы борьбы с ними

12 min

21K

Python*System Analysis and Design*API*Wunder Fund corporate blog

Translation

Pandas — это мощная библиотека для анализа данных, API которой обладает широкими функциональными возможностями. Этот API позволяет решить любую задачу, связанную с обработкой данных, несколькими способами. Некоторые из подходов к решению задач лучше других. Часто бывает так, что пользователи pandas узнают о подходах, не отличающихся особой эффективностью, привыкают к ним и постоянно их применяют. Этот материал посвящён разбору четырёх анти-паттернов pandas и рассказу о приёмах работы, которые стоит использовать вместо них.

Автор черпал вдохновение из многих источников, ссылки на которые даны в статье. В частности — из замечательной книги Effective Pandas.

+26

Terentew Mar 13 2023 at 10:50

6 заблуждений о похудении

Easy

8 min

8.5K

Health

Opinion

Попробую внести ясность в этот вопрос.

Бывает, читая статью про похудение, не так интересна статья, как комментарии к ней, где каждый отчасти соглашаясь с автором «да это же очевидно, чтобы похудеть, нужно меньше есть», добавляет что-то со своей колокольни «но как можно худеть, если плохие гормоны/замедленный метаболизм/тяга на сладкое/» и т.д.

Я тренирую онлайн и один из частых запросов подопечных — это снижение веса. Я не диетолог, и не составляю рацион для людей с заболеваниями ЖКТ и прочее. Я не нутрициолог, и не составляю рационы по микроэлементам, чтобы восполнить дефициты веществ etc. Я — тренер и мотивирую (заставляю) подопечных тренироваться под моим контролем до тех пор, пока это не войдет в устойчивую привычку, а чтобы тренинг не сопровождался упадком сил, травмами, недовосстановлением, помогаю корректировать питание. Да и яркие результаты в тренировках возможны только при правильно подобранном рационе. Когда все эти условия выполняются, мой подопечный неизбежно худеет, даже тогда, когда такой задачи не ставилось.

Так что накопившийся опыт позволяет порассуждать в этом направлении и разобрать частые заблуждения относительно процесса снижения веса, которые очередной раз встретились в комментариях.

+11

fruitourist Mar 9 2023 at 22:30

Пишем нейросеть для сегментации снимков со спутника

Easy

16 min

Python*Machine learning*Artificial Intelligence

Tutorial

Прочитав несколько известных статей по сегментации спутниковых снимков земли, я решил попробовать создать и обучить свою модель нейросети для этой задачи. И конечно, в процессе возникало много вопросов, своими ответами на которые я решил поделиться в рамках этого туториала. Поделиться так подробно и просто, как это было бы понятно таким новичкам, как я.

BashNiPineft Mar 3 2023 at 08:42

Автоматизируй это: как мы упрощаем создание проектной документации в нефтянке (часть 2)

Medium

9 min

3.8K

Programming*IT careerSoftwareIT-companiesРН-БашНИПИнефть corporate blog

Case

В первой части мы рассказывали, как нефтяные компании создают проектно-технические документы (ПТД) на разработку месторождений, насколько это большая, трудоемкая и очень рутинная работа. Причем, помноженная на десятки выполняемых проектных документов в год. Умножим это количество документов на несколько разных сценариев, которые по закону мы должны рассматривать в каждом проекте, и получим просто колоссальный объем работ.

oksmoron Jan 17 2023 at 09:00

ML-задача на 30 минут: гадаем по cookie

5 min

19K

Entertaining tasksBig Data*HackathonMachine learning*МТС corporate blog

Case

«Я тебя по IP вычислю!» – помните такую угрозу из интернета времен нулевых годов? Мы в Big Data МТС решили выяснить, можно ли составить хотя бы приблизительное представление о человеке, обладая информацией о сайтах, которые он посещает. Мы сгенерировали полусинтетические данные, чтобы понять, насколько смелыми можно быть в этих ваших интернетах.

Приглашаем вас попробовать составить портрет пользователя на основе этих данных и посмотреть, насколько точным он получится. Также под катом вы найдете наш baseline решения, написание которого займет около получаса.

+33

Eldalex Jan 29 2023 at 12:33

React+Django как написать Hello World

26 min

41K

Django*ReactJS*

From sandbox

Создание веб приложения на основе React и Django, с базой данных на postgress, небольшое прощупывание RabbitMQ и чуть-чуть nginx, потом объясню зачем. Ах да! Завернём все в контейнеры и заставим подниматься в три команды!

+13

Firemoon Jan 24 2023 at 16:10

SD – это Linux, а Midjourney – Mac: краткое полное руководство по Stable Diffusion

13 min

78K

IT Infrastructure*Selectel corporate blogMachine learning*Artificial IntelligenceIT-companies

Tutorial

Вот таких тирекс-тянок выдает нейросеть

Текст про Midjourney привлек внимание, и в комментариях наметилась дискуссия про Stable Diffusion. Аргументы убедили меня попробовать SD самостоятельно, но вскоре я понял, что это не самая простая задача. Сообщество любителей Stable Diffusion произвело на свет множество удобных инструментов, которые своим количеством и сложностью могут отпугнуть новичков.

Всю неделю, что я экспериментировал с нейросетью, я боролся с желанием SD добавлять вторичные гендерные признаки по моим запросам и грустил, смотря на результаты генерации котиков. О своих страданиях частично писал в личном Telegram-канале — подписывайтесь! В этом же тексте — собрал основные советы по работе со Stable Diffusion и подвел итог, сравнив эту нейросеть с Midjourney.

Читать дальше →

+104