Понимаю, почему так может показаться. Но мы стараемся не огораживать, а помогать быть увиденными. По отзывам с прошлых мероприятий, они помогают многим рассеять сомнения на старте карьеры
Спасибо. Но думаю в DS без Python никак. Даже если смотреть чисто с точки зрения разработчика. Часто проще поднять микросервис с моделью на Python и уже в него ходить из Go'шного например, чем пытаться имплементировать архитектуру модели.
Ключевая идея этой книги показать что и простым языком можно объяснять сложные вещи. Не всем удается разглядеть за терминологией серьезных книг заложенные принципы. Но вообще вы правы конечно. Есть очень много книг по статистике в которых гораздо больше информации. Мне в свое время очень понравилась книга "Статистика для всех" Сара Бослаф.
Спасибо, получилось кратко и ясно, круто.
С появлением BERT все NLP архитектуры стали строить на ячейках трансформерах, неужели архитектуры на двунаправленых слоях LSTM ячеек изжили себя? Есть ли информация у автора, о применении предобучения по типу BERT или XLNet для рекуррентных сеток? Я использовал архитектуру FLAIR На задаче выделения именованных сущностей неплохие результаты показывает.
Все таки тип предобучения или тип используемых базовых ячеек дает такие результаты?
Отличный комментарий.
Хотелось бы добавить, что максимальная сумма начислений тело займа*2.5, с 1 Июля будет тело займа*2, а с 1 января 20го, тело займа*1.5.
Кстати, ав него можно внести внезапно возникший фактор риска, типа если какой то персональный фактор должен блокировать выдачу? Не ждать, пока научится, что таким людям не давать, а запретить директивно.
Вы правы. Это хорошая практика и такие правила существуют. Но их сложно найти и работают они на 1-2% клиентов.
С 28 января вступили в силу ограничения от центробанка, которые делают предложенную бизнес модель экономически нецелесообразной. А с 1 Июля вступят в силу новые ограничения. Так что уже сейчас микрозайм это полезный финансовый инструмент, для многих категорий пользователей.
Согласен с вами, пустая кредитная история (ки) не единственный фактор мешающий получению кредита. Но если ки есть, пусть и негативная, то это уже другая совокупность заемщиков, и по ним ключевыми будут признаки из ки. А вот когда она пустая, то ту найти факторы для оценки сложно. Про скоринговую модель для таких клиентов я и стараюсь написать.
При обучении модели тренировочную выборку разделял на train test, проверял AUC и F1 на test. Затем проверял эти же метрики на отложенном test сете, который разделен временным промежутком с тренировочным.
Пробовал оба значения, признак с использованием медианы дает больший прирост показателей, поэтому остановился на нем. Да и медиана более устойчива к выбросам.
Пилообразный вид, возможно вы правы. Думаете это плохо в контексте скоринга?
Понимаю, почему так может показаться. Но мы стараемся не огораживать, а помогать быть увиденными. По отзывам с прошлых мероприятий, они помогают многим рассеять сомнения на старте карьеры
Классно! Почитаю, если окажется для DS важным добавлю в список. Может есть еще рекомендации? Будет полезно развивать, дополнять статью.
А почему именно в такой последовательности?
Спасибо. Но думаю в DS без Python никак. Даже если смотреть чисто с точки зрения разработчика. Часто проще поднять микросервис с моделью на Python и уже в него ходить из Go'шного например, чем пытаться имплементировать архитектуру модели.
Есть опасение что это нарушит авторские права.
Ключевая идея этой книги показать что и простым языком можно объяснять сложные вещи. Не всем удается разглядеть за терминологией серьезных книг заложенные принципы.
Но вообще вы правы конечно. Есть очень много книг по статистике в которых гораздо больше информации. Мне в свое время очень понравилась книга "Статистика для всех" Сара Бослаф.
Спасибо за развернутый комментарий и дополнение про DDD обязательно добавлю её в следующую статью посвященную развитию навыков разработки.
Я покупал за 1к примерно.
Но так как предложение уникальное то все во власти продавца.
Я периодически отслеживаю сети книжные. Пару месяцев назад находил в книжном в Новосибе. Но вообще она очень редкая.
Рад что понравилась подборка.
Если есть рекомендации книг для новичков в DS накидывайте в комментарии.
Спасибо за перевод. Две последних анимации с вниманием особенно понравились!
С появлением BERT все NLP архитектуры стали строить на ячейках трансформерах, неужели архитектуры на двунаправленых слоях LSTM ячеек изжили себя? Есть ли информация у автора, о применении предобучения по типу BERT или XLNet для рекуррентных сеток? Я использовал архитектуру FLAIR На задаче выделения именованных сущностей неплохие результаты показывает.
Все таки тип предобучения или тип используемых базовых ячеек дает такие результаты?
Хотелось бы добавить, что максимальная сумма начислений тело займа*2.5, с 1 Июля будет тело займа*2, а с 1 января 20го, тело займа*1.5.
Вы правы. Это хорошая практика и такие правила существуют. Но их сложно найти и работают они на 1-2% клиентов.
Особенно влияют наши любимые зимние и весенние каникулы, по 7-10 дней. :)
Пилообразный вид, возможно вы правы. Думаете это плохо в контексте скоринга?