Pull to refresh
0
0
Юрий Березенцев @ybsnow

Аналитик данных

Send message

Кластеризация текста в PySpark

Level of difficultyMedium
Reading time9 min
Views7.5K

Привет, Хабр!

На связи участники профессионального сообщества NTA Кухтенко Андрей, Кравец Максим и Сиянов Артем.

Любой текст – это не просто коллекция слов, он содержит мысли и намерения его автора. Но вручную невозможно обработать огромное количество текстовой информации и понять какие данные они могут содержать. В таком случае нам поможет кластеризация текста, которая позволит получить представление о данных.

Узнать больше о кластеризации текста
Total votes 6: ↑5 and ↓1+8
Comments5

Ищем ответ на главный вопрос Вселенной, жизни и всего такого в новом сезоне ML на Хабре

Reading time17 min
Views22K

Меня зовут Андрей Аврамчук, я старший продюсер спецпроектов в Хабре, принёс не ответ на главный вопрос, а пока только новый сезон на Хабре — «Машинное обучение», который мы проводим совместно с ВТБ с 1 по 31 марта. Будем искать вместе, и да поможет нам магия ML.

UPD. Сезон закончился, итоги можно посмотреть в этой статье.

Артур Филип Дент?
Total votes 16: ↑15 and ↓1+30
Comments11

10 первых ошибок в карьере ML-инженера

Level of difficultyEasy
Reading time12 min
Views26K

Работа ML-инженера заключается не только в обучении моделей — хороший специалист погружается в бизнес-контекст, умеет доносить мысли до коллег без ML-бэкграунда, а также не забывает про тесты, дизайн-документы и документацию. 

Богдан Печёнкин, автор Симулятора ML, собрал 10 ошибок специалистов, которые зачастую встречаются в первые годы карьеры.

Узнать больше
Total votes 39: ↑39 and ↓0+39
Comments23

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity

Specialization

Data Analyst, Data Scientist
Junior
From 170,000 ₽
Python
SQL
Spark