Pull to refresh
21
0
Игорь Моисеев @Eth_Moses

Experimentation Analysis Team Lead, Ozon Tech

Send message

Шесть уровней метавселенной математики

Reading time6 min
Views41K

Когда я был маленький, я думал, что математика - это очень формальная наука. Как бы не так! Когда о нас, математиках, говорят как о сухарях — это ложь! (с) 17 мгновений весны.

Приглашаю вас в путешествие по 6 уровням вселенной математики - от полностью формального до философско-поэтического, и заодно мы ответим на вопрос, является ли теорема Геделя теоремой или мета-теоремой.

Читать далее
Total votes 75: ↑72 and ↓3+92
Comments168

Царица наук: математика, беспощадная ты мука

Level of difficultyEasy
Reading time7 min
Views36K

Дайджест про то, как и зачем учить математику, 
если ты взрослый

С самых юных лет было очевидно, что я — естественнонаучник: ребёнок, выросший в семье инженеров и с неподдельным интересом обожающий всё живое, зелёное и биологическое. Дальше началось смешное: во дворе была филологическая гимназия, а чего далеко ходить... В свою очередь, гимназии нужны были олимпиадники и вот она, математика и мама с грозными задачниками, ибо в школе нас просто не учили (была вообще импортная адаптивная программа с усеченной геометрией). Для школы и вуза стараний родителей хватило, для олимпиад нет: физика шла на ура, а математика с приличным скрипом. Как я сейчас говорю, «не щёлкало». Сейчас мне 37 лет и я нет‑нет, да возвращаюсь к математике, хотя она мне точно не нужна ни в работе, ни в увлечении.

Читать далее
Total votes 49: ↑45 and ↓4+63
Comments163

Начинаем работу с PyTorch 2.0 и Hugging Face Transformers

Reading time6 min
Views14K

В этом посте разберем работу с PyTorch 2.0 и Hugging Face Transformers на примере fine‑tune модели BERT для классификации текста.

PyTorch 2.0 лучше по производительности, скорости работы, более удобный для Python, но при этом остается таким же динамическим, как и ранее.

1. Настройка окружения и установка PyTorch 2.0.

2. Загрузка и подготовка датасета.

3. Fine‑tune и оценка модели BERT с помощью Hugging Face Trainer.

4. Запуск инференса и тестирование модели.

Читать далее
Total votes 13: ↑13 and ↓0+13
Comments4

Человечество против искусственного интеллекта: может ли развитие нейросетей привести к катастрофе

Level of difficultyEasy
Reading time21 min
Views58K

История про «восстание машин» давно знакома всем любителям научной фантастики, но после взрывного роста возможностей нейросетевых языковых моделей (вроде ChatGPT) об этом риске заговорили и вполне серьезные исследователи. В этой статье мы попробуем разобраться – есть ли основания у таких опасений, или это всего лишь бред воспаленной кукухи?

Читать далее
Total votes 107: ↑95 and ↓12+105
Comments174

Как наладить код-ревью, если ты совсем один

Level of difficultyEasy
Reading time3 min
Views8.5K

Код-ревью – это хорошо. Оно помогает улучшить качество кода, наладить сотрудничество в команде, познакомить каждого разработчика с самыми отдаленными уголками кодовой базы, до которых он бы не скоро добрался, делая только назначенные ему задачи. Из всего того, чем обычно занимаются программисты, именно в код-ревью лучше всего видна справедливость поговорки «Одна голова – хорошо, а две – лучше».

А как быть программисту, работающему в одиночку? Ведь голова у него – всего одна, если конечно он не мутант. И именно этой головой разработчик пишет код – который потом неплохо бы поревьювить. Как отревьювить свой же код, если ты сам его автор,э и просто физически не можешь взглянуть на него глазами другого человека? Казалось бы, в таком случае выполнить код-ревью невозможно, это – неразрешимая проблема, тупик!

Читать далее
Total votes 32: ↑28 and ↓4+32
Comments17

Titanic Survivors Data Research

Level of difficultyMedium
Reading time17 min
Views10K

15 апреля 1912 года произошло крушение парохода «Титаник», став одной из самых значимых катастроф в истории человечества. В данной статье исследованы данные пассажиров Титаника, сделаны и проверены предположения о влиянии определённых факторов на вероятность человека выжить в той катастрофе. Анализ данных сопровождается примерами кода на Python, с использованием пакета Pandas. Построена и обучена модель нейронной сети, предсказывающая вероятность человека выжить в катастрофе с точностью 0.78 на тестовых данных. Модель построена на базе фреймворка pyTorch.

Читать далее
Total votes 9: ↑8 and ↓1+10
Comments6

Пора забывать GridSearch — встречайте ProgressiveGridSearch. Фракталы в ML, постепенно увеличиваем разрешение

Level of difficultyMedium
Reading time8 min
Views7.7K

Здравствуйте, меня зовут Николай Стрекопытов и я придумал как подбирать гиперпараметры бескомпромиссно лучше GridSearch’а. Нужно лишь изменить порядок вычислений. И да, это заявка на обновление индустриального стандарта - скоро вы сможете улучшить свои ML-пайплайны заменой нескольких строчек кода.

Читать далее
Total votes 28: ↑27 and ↓1+32
Comments11

Как быстрее узнать, что сервису плохо, или Realtime-детекция разладок с помощью CatBoost

Level of difficultyMedium
Reading time8 min
Views4.6K

Через любую высоконагруженную систему ежесекундно проходит огромный поток трафика. Релизы, хотфиксы, ddos-атаки, невалидные и ухудшающие эксперименты и многие другие события могут привести к проблемам, которые влияют на пользователей. Поэтому такие ситуации не терпят задержек.

Можно провести простую аналогию: если вы чем-то заболели, то лучше узнать об этом как можно раньше и тем самым минимизировать побочные эффекты после и в процессе выздоровления. Так и в сервисе: будь то баннерная крутилка, поиск, маркетплейс или онлайн-доставка пиццы.  

Меня зовут Владимир Точилин, я работаю в группе развития рекламных продуктов и стабильности. Вместе со своим коллегой, Александром Самусенко, я расскажу, как мы создали новый инструмент realtime-детекции разладок в проде рекламных технологий. Мы работаем с системой, где на отдельные кластеры нагрузка превышает 1000000 RPS. 

Историю будет интересно прочитать аналитикам, разработчикам и менеджерам любого уровня.

Читать далее
Total votes 19: ↑19 and ↓0+19
Comments5

Как создать свою собственную нейронную сеть с нуля на Python

Level of difficultyMedium
Reading time5 min
Views83K

Как создать свою собственную нейронную сеть с нуля на Python

Мотивация: в рамках моего личного пути к лучшему пониманию глубокого обучения я решил создать нейронную сеть с нуля без библиотеки глубокого обучения, такой как TensorFlow. Я считаю, что понимание внутренней работы нейронной сети важно для любого начинающего специалиста по данным. Эта статья содержит то, что я узнал, и, надеюсь, она будет полезна и вам!

Что такое нейронная сеть?

В большинстве вводных текстов по нейронным сетям при их описании используются аналогии с мозгом. Не углубляясь в аналогии с мозгом, я считаю, что проще описать нейронные сети как математическую функцию, которая отображает заданный вход в желаемый результат.

Нейронные сети состоят из следующих компонентов:

Читать далее
Total votes 19: ↑19 and ↓0+19
Comments19

ML-модель out-of-stock. Как контролировать доступность 200 млн товаров на рынке e-grocery?

Reading time9 min
Views4.9K

Привет! На связи Николай Шикунов и Леонид Сидоров из ML-команды СберМаркета. Модель, над которой мы работаем, прогнозирует наличие товаров на полках во всех точках, представленных в нашем приложении, и называется out-of-stock model. В этой статье хотим рассказать, какую проблему бизнеса мы решаем, как эволюционировал наш подход к управлению остатками с 2019 года и к чему мы пришли сейчас. 

Читать далее
Total votes 5: ↑5 and ↓0+5
Comments5

Прогнозирование спроса: как СберМаркет прогнозирует, что вы закажете вечером в пятницу

Reading time5 min
Views8.7K

image


Привет! Меня зовут Андрей Захаров, я Senior Data Scientist в СберМаркете. Когда вы заказываете продукты к пятничному ужину, мы должны быть уверены, что для доставки хватит сборщиков и курьеров. Поэтому мы прогнозируем число заказов в каждом магазине с точностью до часа. В статье — как мы это сделали на данных, которые устаревают уже за 3 месяца.

Читать дальше →
Total votes 6: ↑5 and ↓1+4
Comments9

Как работает нативная поддержка категорий в XGBoost

Level of difficultyEasy
Reading time10 min
Views2.3K

XGBoost и другие методы на основе дерева решений, обучающие модели при помощи градиентного подъема, принимают решение через сравнение, тогда как определить оператор сравнения категорий математически — это нетривиальная задача.


Ниже объясняется, какие есть варианты, подробно рассказывается об их плюсах и минусах. Особое внимание уделяется встроенной поддержке категориальных функций, представленных недавно в XGBoost и LightGBM.


Если вас интересует градиентный бустинг и его применение к дереву решений, посмотрите мою книгу.

Читать дальше →
Total votes 4: ↑2 and ↓20
Comments0

Вот что такое искусственный интеллект по мнению изобретателя байесовских сетей

Level of difficultyEasy
Reading time8 min
Views8.9K

Искусственный интеллект во многом обязан своими достижениями Джуде Перлу. В 1980-х он руководил работами, которые позволили машинам развить способности к вероятностному рассуждению. Сегодня Джуда Перл — один из самых ярых критиков в этой области. В своей последней книге «Почему? Новая наука о причинно-следственной связи» (англ. The Book of Why)? он утверждает, что [настоящему] искусственному интеллекту препятствует неполное понимание того, что на самом деле представляет собой интеллект. За ответами — к старту флагманского курса по Data Science — приглашаем под кат.

Читать дальше →
Total votes 14: ↑11 and ↓3+9
Comments8

Как снимали первую Матрицу и в чём её феномен

Reading time13 min
Views50K

В 1999 году на экраны кинотеатров вышло небывалое количество фильмов, ставших по-настоящему культовыми: «Зелёная миля», «Бойцовский клуб», «Красота по-американски», «Мумия», «Сонная лощина» и другие («Звёздные войны: Призрачная угроза» в этот список не включён осознанно, потому что ничего культового в нём нет). 

Но для очень многих именно выход на экраны «Матрицы» стал самым знаковым событием и даже изменил представление о реальности, без шуток. Парадокс в том, что по сути ничего революционного в этих идеях не было. Появление мессии — главная тема христианства (и не только), сомнение в реальности — это суть картезианства ещё 17 века, да и фильм «Вспомнить всё» иллюстрирует подобную мысль. Тем не менее «Матрица» — это настоящий феномен. Давайте посмотрим, как её создавали и порассуждаем, в чём же её парадокс.

Следовать за белым кроликом ?
Total votes 104: ↑98 and ↓6+117
Comments140

Сроки доставки заказов: как в Авито сделали прогноз более точным

Reading time9 min
Views24K

Привет! Меня зовут Андрей Васильченко, я аналитик в команде Авито Доставки. Несколько лет назад мы запустили это направление, чтобы дать возможность покупателям и продавцам из разных регионов отправлять товар друг другу. Мы доставляем товары в пункты выдачи, постаматы и курьером до двери. 

В этой статье я расскажу, почему мы считаем, что нужно работать над улучшением прогнозов сроков доставки для покупателей, как мы предсказывали их раньше, что изменили сейчас и что хотим учесть в будущем.

Читать далее
Total votes 10: ↑8 and ↓2+8
Comments8

Как на единственной фотографии, сделанной Уэббом, сошлись три величайших научных загадки

Reading time9 min
Views20K


Хотя с начала 20-го века мы узнали о Вселенной очень многое, в процессе мы наткнулись на несколько загадочных явлений, которые остаются непонятыми до сих пор. И, пожалуй, три самые большие из них — это:
  1. Тёмная энергия, управляющая расширением Вселенной и доминирующая в нашем космическом энергетическом бюджете. Природа её до сих пор неясна.
  2. Тёмная материя, которая не может состоять ни из одной из известных частиц Стандартной модели, но по массе перевешивает обычную (состоящую из атомов) материю в соотношении 5:1.
  3. Асимметрия материи и антиматерии, которая заключается в том, что на каждые 1,4 миллиарда фотонов во Вселенной приходится 1 протон или нейтрон, но нет соответствующих антипротонов или антинейтронов несмотря на то, что нам не известно ни одной реакции, которая могла бы создать протонов и нейтронов больше, чем антипротонов и антинейтронов.

Читать дальше →
Total votes 46: ↑44 and ↓2+60
Comments2

CJM как способ взглянуть на очевидные вещи по-новому

Level of difficultyEasy
Reading time6 min
Views3.2K

Привет, Хабр! Мы аналитики X5 Tech – Никита Карташёв и Яна Паршина. Никита руководит командой системных и бизнес-аналитиков и является счастливым обладателем звания ментора Цифровой Академии X5. Яна в прошлом системный и бизнес аналитик, сейчас развивает технологические решения IT4IT и всегда открыта новым знаниям. 

Мы каждый день работаем с пользовательским опытом покупателей и сотрудников X5 Group. Поэтому мы решили переложить наш опыт в текст и поделиться с вами нашим нестандартным подходом к использованию Customer Journey Map (CJM). Мы расскажем о новом формате проведения CJM, который мы придумали сами. И, кажется, он уже очень даже работает. Возможно, вы захотите применить этот метод и у себя. Статья может быть полезна тем, кто любит обучать, обучаться и экспериментировать.

Читать далее
Total votes 9: ↑9 and ↓0+9
Comments14

Московский Планетарий и его реконструкции

Level of difficultyEasy
Reading time8 min
Views4.8K


В Москве на сегодняшний день официально существует два планетария — Московский Планетарий и Планетарий Культурного Центра Вооруженных Сил РФ. О втором мало кто слышал (он довольно скромный в размерах, но тоже очень звёздный). Хотя, любители космической музыки могут вспомнить мои концерты — именно в том маленьком планетарии, пока Большой Планетарий Москвы был закрыт на долгую реконструкцию. Потом Московский Планетарий открылся, и у меня в нем тоже было несколько концертов. Сейчас — по прошествии многих лет — мало кто помнит, что Московский Планетарий закрывался, да еще и очень надолго, ведь сейчас он доступен практически каждый день (кроме вторника), а когда что-то у нас есть постоянно, мы и не думаем — «Каково это — жить без Планетария?»
Читать дальше →
Total votes 32: ↑31 and ↓1+42
Comments20

Как обнулялся Credit Suisse: разбираем траекторию погружения на дно швейцарского гига-банка

Reading time12 min
Views47K

167 лет истории, 50 тысяч сотрудников и почти полтора триллиона долларов под управлением – всё это не помешало второму по размеру швейцарскому банку уйти на дно в марте 2023 года. В этой статье мы разберемся, как многолетние скандалы вокруг Credit Suisse уронили когда-то великий банк.

Читать далее
Total votes 159: ↑145 and ↓14+162
Comments163

Information

Rating
Does not participate
Location
Россия
Works in
Date of birth
Registered
Activity