Статьи / Профиль anna

@anna_zh

Пользователь

Профиль Публикации 2Комментарии Закладки

anna_zh 30 ноя 2020 в 13:16

Spark 3.0: новые возможности и примеры их использования – часть 1

6 мин

7.4K

Блог компании New Professions LabScala*Apache*Big Data*Data Engineering*

Туториал

Перевод

К нашей новой программе "Apache Spark на Scala для дата-инженеров" и вебинару о курсе, который пройдет 2 декабря, мы подготовили перевод обзорной статьи о Spark 3.0.

Spark 3.0 вышел с целым набором важных улучшений, среди которых: повышение производительности с помощью ADQ, чтение бинарных файлов, улучшенная поддержка SQL и Python, Python 3.0, интеграция с Hadoop 3, поддержка ACID.

В этой статье автор постарался привести примеры использования этих новых функций. Это первый первый материал о функциональности Spark 3.0 и у этой серии статей планируется продолжение.

anna_zh 9 ноя 2020 в 21:24

5 подходов к разметке данных для проектов машинного обучения

4 мин

7.8K

Блог компании New Professions LabОбработка изображений*Машинное обучение*

Перевод

Когда мы в конце прошлого года перерабатывали свой курс по Deep Learning, чтобы сделать его более наглядным и ориентированным на кейсы из реальной бизнес-практики, мы включили в него новый модуль по разметке данных на крауд-платформе "Яндекс.Толока".

Но так как краудсорсинг -- это не единственный способ разметки, мы подготовили для новых слушателей курса перевод статьи из блога Lionbridge с обзором основных подходов к разметке данных в Deep Learning.