Статьи / Закладки / Профиль apovalov / Хабр

Валентин @apovalov^{read⁠-⁠only}

Пользователь

Профиль Закладки 45

wunder_editor 21 июн 2017 в 13:03

LSTM – сети долгой краткосрочной памяти

8 мин

227K

Блог компании Wunder FundАлгоритмы*Машинное обучение*

Перевод

Рекуррентные нейронные сети

Люди не начинают думать с чистого листа каждую секунду. Читая этот пост, вы понимаете каждое слово, основываясь на понимании предыдущего слова. Мы не выбрасываем из головы все и не начинаем думать с нуля. Наши мысли обладают постоянством.

Традиционные нейронные сети не обладают этим свойством, и в этом их главный недостаток. Представим, например, что мы хотим классифицировать события, происходящие в фильме. Непонятно, как традиционная нейронная сеть могла бы использовать рассуждения о предыдущих событиях фильма, чтобы получить информацию о последующих.

Решить эту проблемы помогают рекуррентые нейронные сети (Recurrent Neural Networks, RNN). Это сети, содержащие обратные связи и позволяющие сохранять информацию.

Читать дальше →

+37

datasanta 31 окт 2019 в 23:26

Считаем деньги. Выбор метрики в кредитном скоринге

4 мин

9.7K

Визуализация данных*Машинное обучение*Финансы в IT

Когда у вас есть какая-то система принятия решений по заемщику и нужно ее улучшить, то классическая постановка задачи в этом случае обычно звучит так. «Снизить просрочку, не уменьшив уровень одобрения». Либо: «Повысить уровень одобрения, не увеличив просрочку». Именно в такой постановке презентуют свои решения компании-вендоры, предоставляющие скоринговый балл. Такую же формулировку можно услышать на конференциях по скорингу, где презентуют свои достижения инхаус разработчики. К сожалению, никто подробно не раскрывает, что именно понимается под терминами просрочка и уровень одобрения.

Успешный результат работы презентуют так:

Читать дальше →

+17

feanoref 21 мар 2023 в 17:21

Полезные материалы по Data Science и машинному обучению, которые помогут пройти сквозь джунгли из терминов

Простой

8 мин

24K

Блог компании SelectelData Engineering*Искусственный интеллектМатематика*Машинное обучение*

Мнение

Привет, Хабр! Меня зовут Ефим, я MLOps-инженер в Selectel. В прошлом был автоматизатором, ML-инженером, дата-аналитиком и дата-инженером — и уже несколько лет падаю в пропасть машинного обучения и Data Science. Это буквально необъятная сфера, в которой почти нет ориентиров. Основная проблема в том, что разделов математики довольно много и все они, на первый взгляд, нужны в том же машинном обучении.

В этой статье делюсь полезными материалами, которые помогут найти и заполнить теоретические и практические проблемы и основательно подойти к своему профессиональному развитию. Добро пожаловать под кат!

Читать дальше →

+59

AlfaTeam 21 дек 2022 в 16:50

Подкасты, книги, курс: подборка интересного по Data Science

5 мин

6.1K

Блог компании Альфа-БанкBig Data*Машинное обучение*Data Engineering*

Большая книга по теории, большая книга не только по теории, подкасты и Стэнфордский курс — под катом 6 рекомендаций для изучения от наших Data Scientist'ов Лаборатории машинного обучения.

К рекомендациям

+20

mark-rtb 3 июн 2019 в 17:10

Машинное обучение в микрофинансах: строим скоринговую модель для клиентов с пустой кредитной историей

8 мин

15K

Big Data*Data Mining*Машинное обучение*Открытые данные*Финансы в IT

Recovery Mode

Нет кредитной истории — не дают кредиты, не дают кредиты — нет кредитной истории. Замкнутый круг какой-то. Что делать? Давайте разбираться.

Привет! Меня зовут Марк, я data scientist в компании Devim. Недавно мы запустили модель для скоринга заемщиков МФК “До Зарплаты”, у которых отсутствует кредитная история. Хочу поделиться опытом поиска данных, особенностями конструирования и интерпретации признаков.

Читать дальше →

+12

cointegrated 12 сен 2017 в 13:21

Как понять, что ваша предсказательная модель бесполезна

15 мин

26K

Машинное обучение*

Из песочницы

При создании продуктов на основе машинного обучения возникают ситуации, которых хотелось бы избежать. В этом тексте я разбираю восемь проблем, с которыми сталкивался в своей работе.

Мой опыт связан с моделями кредитного скоринга и предсказательными системами для промышленных компаний. Текст поможет разработчиками и дата-сайнтистам строить полезные модели, а менеджерам не допускать грубых ошибок в проекте.

Этот текст не призван прорекламировать какую-нибудь компанию. Он основан на практике анализа данных в компании ООО "Ромашка", которая никогда не существовала и не будет существовать. Под "мы" я подразумеваю команду из себя и моих воображаемых друзей. Все сервисы, которые мы создавали, делались для конкретного клиента и не могут быть проданы или переданы иным лицам.

Какие модели и для чего?

Пусть предсказательная модель — это алгоритм, который строит прогнозы и позволяет автоматически принимать полезное для бизнеса решение на основе исторических данных.

Читать дальше →

+34

Kris_stn 11 мая 2023 в 11:43

Байесовский подход к АБ тестированию

Средний

10 мин

12K

Блог компании GlowByteBig Data*Машинное обучение*

Обзор

Cезон big data

Байесовский подход к АБ-тестам — альтернатива частотному (фреквентистскому) подходу. Поговорим о том, как заменить p-value на более интерпретируемые метрики, используя байесовские методы. На примере теста конверсии сравним частотный и байесовский подходы.

+32

nnazarov 8 июн 2023 в 11:19

А/Б тесты с метрикой отношения. Дельта-метод

8 мин

19K

Блог компании X5 TechPython*Математика*Статистика в IT

Туториал

Привет, Хабр! В этой статье разберём, что такое метрики отношения. Узнаем, почему критерий Стьюдента не работает. Попробуем применить бутстреп к зависимым данным. Изучим дельта-метод — способ оценки А/Б тестов с метрикой отношения.

vankastor 21 фев 2023 в 16:28

Методы анализа A/B тестов: как выбрать правильный метод для каждого типа метрик и размера выборки

Средний

10 мин

19K

Блог компании Лига СтавокPython*Аналитика мобильных приложений*Управление продуктом*Статистика в IT

Туториал

Все, кто работает с аналитикой и продуктами, знают, что проведение А/Б тестирования — важный шаг для повышения эффективности бизнеса. Однако не всегда понятно, как проводить этот тест и какие статистические методы использовать. В этой статье я постараюсь помочь вам разобраться в этом вопросе. Вместо теоретических рассуждений будут практические советы, как выбирать метрики, как использовать различные статистические методы и примеры кода на Python, которые можно использовать сразу же. Эта статья станет незаменимой шпаргалкой для всех, кто планирует провести А/Б тест, и будет полезной как для новичков, так и для профессионалов.

iConText_Group 23 авг 2023 в 14:13

Эксперимент в Яндекс Метрике: как провести A/B-тест и что учесть при подготовке

10 мин

8.5K

IT-компанииПовышение конверсии*Интернет-маркетинг*Веб-аналитика*

Из песочницы

Что такое A/B-тестирование и как его провести с помощью инструмента «Эксперименты» в Яндекс Метрике, рассказала Валерия Чистова, веб-аналитик iConText Group.

boygenius 31 янв 2023 в 14:29

Теория вероятностей в машинном обучении. Часть 1: модель регрессии

28 мин

26K

Блог компании Open Data ScienceМатематика*Машинное обучение*Статистика в ITИскусственный интеллект

В данной статье мы подробно рассмотрим вероятностную постановку задачи машинного обучения: что такое распределение данных, дискриминативная модель, i.i.d.-гипотеза и метод максимизации правдоподобия, что такое регрессия Пуассона и регрессия с оценкой уверенности, и как нормальное распределение связано с минимизацией среднеквадратичного отклонения.

В следующей части рассмотрим метод максимизации правдоподобия в классификации: в чем роль кроссэнтропии, функций сигмоиды и softmax и как кроссэнтропия связана с "расстоянием" между распределениями вероятностей и почему модель регрессии тоже обучается через минимизацию кроссэнтропии. Затем перейдем от метода максимизации правдоподобия к байесовскому выводу и его различным приближениям.

Данная серия статей не является введением в машинное обучение и предполагает знакомство читателя с основными понятиями. Задача статей - рассмотреть машинное обучение с точки зрения теории вероятностей, что позволит по новому взглянуть на проблему, понять связь машинного обучения со статистикой и лучше понимать формулы из научных статей. Также на описанном материале строятся более сложные темы, такие как вариационные автокодировщики (Kingma and Welling, 2013), нейробайесовские методы (Müller et al., 2021) и даже некоторые теории сознания (Friston et al., 2022).

+23

EdisonSoftware 25 янв 2020 в 16:13

20 библиотек для эффектного iOS-приложения

6 мин

15K

Блог компании EdisonРазработка под iOS*Разработка мобильных приложений*Дизайн мобильных приложений*Swift*

Перевод

Из огромного количества iOS-библиотек нет особого смысла составлять какие-то рейтинги. Поэтому просто представляем двадцатку эффектных/полезных инструментов для тех, кто пишет приложения под гаджеты Apple.

Все анимации являются ссылками на свои полноразмерные версии.

Большой траффик - много гиф-анимации

+21

almazrafi 20 янв 2020 в 08:09

Swift: Контейнеры для хранения значений по ключу

5 мин

6.7K

Swift*Программирование*Проектирование и рефакторинг*Разработка мобильных приложений*Разработка под iOS*

Туториал

Представьте, что вам необходимо сохранить идентификатор пользователя в UserDefaults. Каким будет первый шаг?

Обычно дело начинается с добавления константы для ключа и проверок на его уникальность. Это актуально и для большинства других хранилищ типа "ключ-значение". И последствия примитивного дизайна таких хранилищ не ограничиваются ключами, интерфейс в виде бессистемного набора методов приводит к целому ряду возможных проблем:

Ошибки в написании ключей: могут использоваться разные ключи для чтения и записи одной и той же сущности.
Незафиксированный тип значения: например, по одному и тому же ключу можно записать число, а считать строку.
Коллизия ключей: в различных частях проекта могут записываться разные сущности с одинаковым ключом.

В идеальном мире от этих проблем должен защищать компилятор, не позволяя собрать проект, если присутствует конфликт ключа или не соответствует тип значения. Чтобы реализовать такое безопасное хранилище, можно воспользоваться контейнерами для значений, и это пошаговое руководство поможет их "приготовить" на примере UserDefaults.

Читать дальше →

AndrewShmig 27 мая 2019 в 21:42

Введение в машинное обучение

19 мин

61K

Искусственный интеллектМашинное обучение*

Туториал

Полный курс на русском языке можно найти по этой ссылке.
Оригинальный курс на английском доступен по этой ссылке.

+32

Kaspersky_Lab 15 ноя 2016 в 12:54

Простыми словами: как работает машинное обучение

7 мин

42K

Блог компании «Лаборатория Касперского»Машинное обучение*Информационная безопасность*

В последнее время все технологические компании твердят о машинном обучении. Мол, столько задач оно решает, которые раньше только люди и могли решить. Но как конкретно оно работает, никто не рассказывает. А кто-то даже для красного словца машинное обучение называет искусственным интеллектом.

Как обычно, никакой магии тут нет, все одни технологии. А раз технологии, то несложно все это объяснить человеческим языком, чем мы сейчас и займемся. Задачу мы будем решать самую настоящую. И алгоритм будем описывать настоящий, подпадающий под определение машинного обучения. Сложность этого алгоритма игрушечная — а вот выводы он позволяет сделать самые настоящие.

Читать дальше →

+30

WildGreyPlus 21 авг 2017 в 15:27

Concurrency в Swift 3 и 4. Operation и OperationQueue

31 мин

80K

Swift*Программирование*Разработка мобильных приложений*Разработка под iOS*

Если вы хотите добиться UI отзывчивости вашего iOS приложения, выполняя такие затратные по времени куски кода, как загрузка данных из сети или обработка изображений, то вам нужно использовать продвинутые паттерны, связанные с многопоточностью (сoncurrency), иначе работа вашего пользовательского интерфейса (UI) начнет сильно замедляться и даже может привести к полной его «заморозке». Вам нужно убрать ресурсо-затратные задачи с main thread (главного потока), который отвечает за выполнение кода, отображающего ваш пользовательский интерфейс (UI).

В текущей версии Swift 3 и ближайшей Swift 4 (осень 2017) это можно сделать двумя способами, которые пока не связаны с встроенными языковыми конструкциями Swift, начало реализации которых будет только в Swift 5 (конец 2018).

Один из них использует GCD (Grand Central Dispatch) и ему посвящена предыдущая статья. В этой статье мы покажем, как достичь отзывчивости UI в iOS приложениях с помощью таких абстрактных понятий, как операция Operation и очередь операций OperationQueue. Мы также покажем в чем различие этих двух подходов и какой из них в каких ситуациях лучше использовать.

Код для этой статьи можно посмотреть на Github.

Читать дальше →

+10

GospodinHoroschii 15 окт 2019 в 23:30

Опыт переезда iOS Developer в Германию по визе на поиск работы

10 мин

17K

IT-эмиграция

Из песочницы

Добрый день, дорогой читатель!

В этом посте я бы хотел рассказать о том, как я переехал в Германию, в Берлин, как нашел работу и получил Голубую Карту, и какие подводные могут ожидать людей, решивших повторить мой путь. Я надеюсь, что моя статья будет полезна тебе, если ты хочешь получить новый, интересный, профессиональный IT-опыт.

Прежде чем начать, я хотел бы выразить особую благодарность автору поста. Что-то из его публикации мне удалось повторить, поэтому в некоторых моментах, этот пост будет содержать схожую информацию, но суть этого поста — показать на примере моего опыта изменения, которые произошли спустя несколько лет.

Почему именно виза на поиск работы, а не Голубая Карта сразу? Как уже было сказано, самое главное — время.

26 февраля 2018 я подал комплект документов на визу и 28 февраля виза уже была на руках. А 15 марта 2018 вылетел в Берлин. Виза выдается на 6 месяцев беспрерывного пребывания на территории Германии.

В добавок ко времени, появляется возможность увидеть будущего работодателя в живую, что также хорошо и для работодателя, когда он видит тебя. И как итог, нашел работу за 2 недели с момента прилета в Берлин.

Здесь можно найти список основных документов на эту визу. А здесь общую информацию по визе. Данные постоянно обновляются.

Я не первый кто это скажет, но тут не поспоришь — важен психологический настрой. Нужно загореться желанием сделать задуманное, это будет видно окружающим и будущему работодателю, что только лишь повысит твои шансы на успех.

Но обо всем по порядку.

Читать дальше →

+32

236

ITSumma 31 окт 2019 в 18:58

Изоляция, тревожность и депрессия на удалённой работе

7 мин

45K

Блог компании ITSummaЗдоровьеУправление персоналом*Управление сообществом*Фриланс

Перевод

Статьи о дистанционной работе часто рисуют картину с коктейлями на пляже, путешествиями по миру и другими наслаждениями, вызывая зависть в социальных сетях. Эта статья не такая.

Кто везде — тот нигде. Кто проводит жизнь в странствиях, у тех в итоге гостеприимцев множество, а друзей нет.

Сенека.

В 23 года я расстался с девушкой, продал или раздал почти все вещи, собрал чемодан и забронировал билет в один конец на Тайвань. Я жил мечтой о путешествиях и абсолютной свободе, понятия не имея, что начинается самый несчастный период моей жизни.

Для протокола, прекращение долгосрочных отношений и уход от семьи, друзей и любых других значимых человеческих связей в мире — ужасная идея. Добавьте отсутствие баланса между работой и жизнью — и получите готовый рецепт депрессии.

Читать дальше →

+52

habr_career 19 сен 2019 в 14:21

Насколько региональные зарплаты разработчиков отличаются от московских, если учесть стоимость жизни

5 мин

86K

Блог компании Хабр КарьераИсследования и прогнозы в IT*Карьера в IT-индустрииУправление персоналом*

По следам нашего общего обзора зарплат за первое полугодие 2019, продолжаем уточнять отдельные аспекты, либо не вошедшие в обзор, либо затронутые лишь поверхностно. Сегодня более подробно посмотрим на региональные особенности зарплат:

Узнаем, сколько платят разработчикам, живущим в российских городах-миллионниках и городах поменьше.
Впервые разберёмся, насколько зарплаты региональных разработчиков отличаются от зарплат московских, если учесть также и стоимость жизни.

Данные по зарплатам мы берём из калькулятора зарплат «Моего круга», в котором пользователи указывают зарплаты, которые получают на руки после вычета всех налогов и могут также смотреть любые другие зарплаты в ИТ.

Читать дальше →

+144

744

fillpackart 17 сен 2019 в 15:12

Как разработчик, я никогда не знаю себе цену, потому что её нет. Но вся система построена так, как будто она есть

11 мин

105K

Карьера в IT-индустрииУправление персоналом*

Каждый раз перед собесом я говорю себе: "Спокойно, не нужно ничего выдумывать, доучивать и врать, твоих знаний и опыта достаточно для того, что бы работать у них. Ты усилишь любую команду, тебе есть что предложить, а пробелы в твоих знаниях — приемлемы. Если бы они знали о твоих навыках всё, что знаешь ты, они бы точно тебя взяли". Но когда начинается собеседование, я всегда перестаю в это верить. Все два часа интервью я хожу как по минному полю, что бы не дай бог не спалиться, что я чего-то не знаю.

Читать дальше →

+181

324