Как стать автором
Обновить

Компания Skillfactory временно не ведёт блог на Хабре

Сначала показывать

«Все сходится» — лучший комплимент дата-сайентисту

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров876

Алгоритмы и модели машинного обучения оценивают по разным параметрам: от них зависит, насколько быстро и точно работает модель. Один из таких параметров — сходимость, или конвергенция алгоритма. Сходимость показывает, насколько быстро модель достигает «оптимума» — точки, за которой меньше ошибается и делает более точные прогнозы. 

Читать далее

Фрактальная размерность: что это и как вычислить

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.3K

Фрактальная размерность описывает сложность объектов, которые нельзя измерить обычными параметрами, такими как длина или площадь. Например, снежинка при увеличении не становится проще — каждая ее деталь открывает еще более мелкие элементы. Разбираем, что такое фрактальная размерность и основные методы ее вычисления. 

Читать далее

Переобучение моделей: гайд и советы для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.5K

С развитием нейросетей появляются новые вызовы. Один из них — переобучение моделей. Совместно с Александром Рыжковым, ментором Skillfactory, руководителем команды LightAutoML и 4х Kaggle Grandmaster, разбираемся, что такое переобучение, хорошо ли это и как его избежать.

Читать далее

Модели BERT для машинного обучения: гайд для начинающих

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров5.7K

BERT (Bidirectional Encoder Representations from Transformers) — это одна из ключевых моделей обработки естественного языка (NLP), построенная на архитектуре трансформера.

Читать далее

Анализ временных рядов: полное руководство для начинающих

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров9.7K

Временной ряд — это последовательность значений, которые протекают и измеряются в определенном временном промежутке. К бытовым примерам временного ряда можно отнести метеорологические наблюдения или колебания цен на рынке. 

Аналитикам такие наборы данных позволяют выявлять закономерности, прогнозировать будущее и предлагать бизнесу обоснованные решения. В этой статье разберемся, с чего начать осваивать анализ временных рядов, вместе с Team Lead Data Scientist в VK Максимом Кулаевым. 

Читать далее

Истории

Совершенный код: 10 книг по веб-разработке для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.8K

Книги — отличный способ узнать больше и начать изучать новую профессию. Составили подборку учебников по программированию, которые помогут познакомиться с веб-разработкой. 

Читать далее

Support Vector Machine: +1 алгоритм машинного обучения для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.4K

Метод опорных векторов — это алгоритм машинного обучения, применяемый для задач линейной и нелинейной классификации, регрессии и обнаружения аномальных данных. С его помощью можно классифицировать текст, изображения, обнаружить спам, идентифицировать почерк, анализировать экспрессии генов, распознавать лица, делать прогнозы и так далее. SVM адаптируется и эффективен в различных приложениях, поскольку может управлять многомерными данными и нелинейными отношениями.

Читать далее

Какие минусы работы в IT: собрали мнения айтишников

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров23K

Работа в стол, ненормированный график и другие проблемы IT

В интернете только и разговоров о том, как здорово быть айтишником. Большая востребованность и разнообразный рынок вакансий, удаленная работа, высокая зарплата, возможность участвовать в международных проектах…

Но за всем этим мы иногда забываем, что работа в IT — это тоже работа, со своими проблемами и минусами. Рассказываем со слов айтишников, что им не нравится в работе.

Читать далее

Мобильный гейминг — тоже круто: топ игр на телефон для iOS и Android

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров20K

Во что поиграть с телефона, если «три в ряд» уже надоели

Если вы устали от бесконечных кликеров и поиска пар — давайте поговорим о чем-то более любопытном. Мобильный гейминг развивается, и сейчас для iOS и Android можно найти множество интересных игр: от классических квестов до MMORPG.

Собрали для вас подборку мобильных игр, которые показались нам особенно интересными. Некоторые из них — платные. Другие доступны бесплатно, но могут содержать рекламу или внутриигровые покупки. 

Читать далее

Обзор платформы Kaggle для начинающих: от состязаний до менторской программы

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров5.7K

В IT-среде название Kaggle часто ассоциируется только с соревнованиями. Но на самом деле это полноценная социальная сеть и база данных для специалистов в сфере Data Science и ML.

Подготовили обзор, чтобы помочь новичкам разобраться в Kaggle. Разбираем, что площадка предлагает джунам и опытным специалистам, как пользоваться ее функциями и с какими задачами она может помочь.

Читать далее

Что такое технология TTS, как устроена и каких сферах используется синтез речи

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров2.4K

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере. 

Читать далее

Предварительная обработка данных в машинном обучении: инструкция, инструменты, полезные ресурсы для начинающих

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров5.7K

Рассказываем, зачем обрабатывать данные перед загрузкой в модель, как провести предобработку и какие инструменты использовать.

Читать далее

От автоматонов до драконов: 9 ожидаемых игр осени 2024

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров9.9K

Составили список девяти перспективных игр, которые скоро выйдут на рынок.

И еще четырех игр, которые могут зарелизить в этом году (но это не точно).

Читать далее

CV в медицине: как компьютерное зрение помогает лечить болезни

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2K

Вместе с Кириллом Симоновым, ML-разработчиком с экспертизой в компьютерном зрении, разбираемся в принципах работы CV и рассказываем, какие задачи технология решает в медицине.

Читать далее

Ближайшие события

27 января
Deckhouse Conf 2025
Москва
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

Странные вопросы и комментарии на собеседованиях в IT

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров31K

На собеседованиях в IT-компании можно услышать неожиданные вещи — от предложений пройти тест на детекторе лжи до комментариев о личной жизни. Мы собрали истории пяти специалистов, которые сталкивались с подобными ситуациями или наблюдали их со стороны.

Читать далее

Введение в Feature Engineering для начинающих дата-сайентистов и ML-инженеров

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров3.5K

Подготовили гайд о том, какие бывают признаки, когда и с помощью каких методов проводить генерацию фич и как решить распространенные ошибки при работе с признаками. 

Составить его помогла Виктория Тюфякова, Senior Data Scientist компании ecom.tech.

Читать далее

Notion уходит из России: подборка сервисов, которые можно использовать вместо него

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров44K

Популярный сервис для управления проектами Notion прекращает работу в России с 9 сентября. Рассказываем, как выгрузить данные из Notion, продолжить пользоваться после блокировки и чем заменить инструмент.

Читать далее

Гайд по работе языковых моделей для начинающих

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров11K

Вместе с дата-сайентистом и биоинформатиком Марией Дьяковой подготовили подробный гайд о том, как устроены языковые модели и что нужно знать, чтобы начать с ними работать.

Читать далее

Transfer learning: подробный гайд для начинающих

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров4.8K

Вместе с Марией Жаровой, Data Scientist в Альфа-Банк, подготовили гайд по трансферному обучению.

Разбираем основные принципы, механизмы и инструменты TL, рассказываем, где и как его используют, и даем конкретные кейсы для тренировки.

Читать далее

Bug Bounty для новичков: зачем компании платят за взлом своих продуктов и как в этом поучаствовать

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров4.4K

Многие IT-компании платят людям за обнаружение уязвимостей и багов в их софте, сервисах, веб-сайтах или инфраструктуре. 

В обмен на сообщения об уязвимостях исследователи безопасности могут получить вознаграждение, известность и уважение в индустрии, а еще — интересный оффер на работу.

Рассказываем, как развивалась практика Bug Bounty, где искать такие проекты и какие скилы нужны белому хакеру.

Читать далее
1
23 ...