Как стать автором
Обновить
78.28
Skillfactory
Учим работать в IT на курсах и в магистратурах
Сначала показывать

MapReduce: гид для начинающих

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров1.4K

Разберем роль модели MapReduce в составе Hadoop, а также расскажем, как использовать его отдельно и насколько это эффективно.

Читать далее

Федеративное обучение: учимся вместе, не раскрывая секретов

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров492

Как обучать ML-модели на большом объеме данных из разных источников, сохраняя их конфиденциальность? Ответ — федеративное машинное обучение (Federated Learning, или FL). Эксперт простыми словами на примерах рассказывает, что это такое, как работает и в каких областях применяется

Читать далее

Векторизация текста в NLP: от слов к числам

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.4K

Перед началом работы с NLP-моделями текст нужно преобразовать в понятный модели вид. Этот процесс называется векторизацией, и без него невозможно представить современный NLP. По сути, мы превращаем слова, предложения или целые документы в векторы — наборы чисел, которые отражают определенные характеристики текста. 

Рассказываем о векторизации подробнее вместе с экспертом.

Читать далее

Алгоритм k-means и метод локтя: кластеризация данных с примерами на Python

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3K

Кластеризация данных — одна из ключевых задач машинного обучения. Она позволяет группировать объекты в однородные кластеры на основе их характеристик. Один из самых популярных, простых и эффективных методов кластеризации — это алгоритм k-means. 

Рассмотрим, как работает k-means, познакомимся с методом локтя для определения числа кластеров и проиллюстрируем их применение на реальных данных с помощью языка программирования Python.

Читать далее

«Все сходится» — лучший комплимент дата-сайентисту

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.2K

Алгоритмы и модели машинного обучения оценивают по разным параметрам: от них зависит, насколько быстро и точно работает модель. Один из таких параметров — сходимость, или конвергенция алгоритма. Сходимость показывает, насколько быстро модель достигает «оптимума» — точки, за которой меньше ошибается и делает более точные прогнозы. 

Читать далее

Фрактальная размерность: что это и как вычислить

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.9K

Фрактальная размерность описывает сложность объектов, которые нельзя измерить обычными параметрами, такими как длина или площадь. Например, снежинка при увеличении не становится проще — каждая ее деталь открывает еще более мелкие элементы. Разбираем, что такое фрактальная размерность и основные методы ее вычисления. 

Читать далее

Переобучение моделей: гайд и советы для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.8K

С развитием нейросетей появляются новые вызовы. Один из них — переобучение моделей. Совместно с Александром Рыжковым, ментором Skillfactory, руководителем команды LightAutoML и 4х Kaggle Grandmaster, разбираемся, что такое переобучение, хорошо ли это и как его избежать.

Читать далее

Модели BERT для машинного обучения: гайд для начинающих

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров6.8K

BERT (Bidirectional Encoder Representations from Transformers) — это одна из ключевых моделей обработки естественного языка (NLP), построенная на архитектуре трансформера.

Читать далее

Анализ временных рядов: полное руководство для начинающих

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров12K

Временной ряд — это последовательность значений, которые протекают и измеряются в определенном временном промежутке. К бытовым примерам временного ряда можно отнести метеорологические наблюдения или колебания цен на рынке. 

Аналитикам такие наборы данных позволяют выявлять закономерности, прогнозировать будущее и предлагать бизнесу обоснованные решения. В этой статье разберемся, с чего начать осваивать анализ временных рядов, вместе с Team Lead Data Scientist в VK Максимом Кулаевым. 

Читать далее

Совершенный код: 10 книг по веб-разработке для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров6.4K

Книги — отличный способ узнать больше и начать изучать новую профессию. Составили подборку учебников по программированию, которые помогут познакомиться с веб-разработкой. 

Читать далее

Support Vector Machine: +1 алгоритм машинного обучения для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.5K

Метод опорных векторов — это алгоритм машинного обучения, применяемый для задач линейной и нелинейной классификации, регрессии и обнаружения аномальных данных. С его помощью можно классифицировать текст, изображения, обнаружить спам, идентифицировать почерк, анализировать экспрессии генов, распознавать лица, делать прогнозы и так далее. SVM адаптируется и эффективен в различных приложениях, поскольку может управлять многомерными данными и нелинейными отношениями.

Читать далее

Какие минусы работы в IT: собрали мнения айтишников

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров23K

Работа в стол, ненормированный график и другие проблемы IT

В интернете только и разговоров о том, как здорово быть айтишником. Большая востребованность и разнообразный рынок вакансий, удаленная работа, высокая зарплата, возможность участвовать в международных проектах…

Но за всем этим мы иногда забываем, что работа в IT — это тоже работа, со своими проблемами и минусами. Рассказываем со слов айтишников, что им не нравится в работе.

Читать далее

Мобильный гейминг — тоже круто: топ игр на телефон для iOS и Android

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров23K

Во что поиграть с телефона, если «три в ряд» уже надоели

Если вы устали от бесконечных кликеров и поиска пар — давайте поговорим о чем-то более любопытном. Мобильный гейминг развивается, и сейчас для iOS и Android можно найти множество интересных игр: от классических квестов до MMORPG.

Собрали для вас подборку мобильных игр, которые показались нам особенно интересными. Некоторые из них — платные. Другие доступны бесплатно, но могут содержать рекламу или внутриигровые покупки. 

Читать далее

Обзор платформы Kaggle для начинающих: от состязаний до менторской программы

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров6.5K

В IT-среде название Kaggle часто ассоциируется только с соревнованиями. Но на самом деле это полноценная социальная сеть и база данных для специалистов в сфере Data Science и ML.

Подготовили обзор, чтобы помочь новичкам разобраться в Kaggle. Разбираем, что площадка предлагает джунам и опытным специалистам, как пользоваться ее функциями и с какими задачами она может помочь.

Читать далее

Что такое технология TTS, как устроена и каких сферах используется синтез речи

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров2.8K

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере. 

Читать далее

Предварительная обработка данных в машинном обучении: инструкция, инструменты, полезные ресурсы для начинающих

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров6.6K

Рассказываем, зачем обрабатывать данные перед загрузкой в модель, как провести предобработку и какие инструменты использовать.

Читать далее

От автоматонов до драконов: 9 ожидаемых игр осени 2024

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров10K

Составили список девяти перспективных игр, которые скоро выйдут на рынок.

И еще четырех игр, которые могут зарелизить в этом году (но это не точно).

Читать далее

CV в медицине: как компьютерное зрение помогает лечить болезни

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2.1K

Вместе с Кириллом Симоновым, ML-разработчиком с экспертизой в компьютерном зрении, разбираемся в принципах работы CV и рассказываем, какие задачи технология решает в медицине.

Читать далее

Странные вопросы и комментарии на собеседованиях в IT

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров31K

На собеседованиях в IT-компании можно услышать неожиданные вещи — от предложений пройти тест на детекторе лжи до комментариев о личной жизни. Мы собрали истории пяти специалистов, которые сталкивались с подобными ситуациями или наблюдали их со стороны.

Читать далее

Введение в Feature Engineering для начинающих дата-сайентистов и ML-инженеров

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров4.1K

Подготовили гайд о том, какие бывают признаки, когда и с помощью каких методов проводить генерацию фич и как решить распространенные ошибки при работе с признаками. 

Составить его помогла Виктория Тюфякова, Senior Data Scientist компании ecom.tech.

Читать далее
1
23 ...

Информация

Сайт
www.skillfactory.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия
Представитель
Skillfactory School