Comments / Profile of gansior

Alexander Gansior - Александр Гансиор@gansior_al

data scientist, Python, PySpark, Hadoop, Kafka

ProfileArticles2PostsNewsComments10

Более 14 лет ставлю цели на год: рассказываю, как и почему этот процесс работает у меня

gansior_al Jan 1 2025 at 16:40

Очень хороший стиль изложения у автора. Увлек. Дочитал до конца. Спасибо. Есть полезные идеи и мысли.

Извлечение признаков из текстовых данных с использованием TF-IDF

gansior_al Jul 20 2024 at 05:15

Сложно назвать word2vec более современным методом. Создан в 2013 году.

Как я получил сертификат TensorFlow-разработчика (и как его получить вам)

gansior_al Oct 10 2021 at 16:18

Спасибо за пост!!

Включение гибридной графики в Ubuntu на ноутбуках Nvidia + Intel (OpenGL, Vulkan)

gansior_al Aug 13 2021 at 09:47

Выбираю - NVIDIA (Performance Mode) или NVIDIA On-Demand - перестает работать HDMI. Перехожу на интегрированную карту все начинает работать. Как можно исправить?

Проектирование RESTful API с помощью Python и Flask

gansior_al Dec 6 2019 at 16:43

Маленькая ошибочка в коде метода GET нужно писать
task = list(filter(lambda t: t['id'] == task_id, tasks))

Краткое руководство по Dash — Python веб-фреймворк для создания дэшбордов. Installation + Dash Layout

gansior_al Dec 6 2019 at 02:31

В последнем примере кода маленькая error написано values=['MTL', 'SF'], а надо value=['MTL', 'SF']. В общем спасибо за статью.

CQM — другой взгляд в глубоком обучении для оптимизации поиска на естественном языке

gansior_al Sep 16 2019 at 08:41

При обработке текстов создается словарь. Как правило на 200 Gb текста словарь составляет всего 1-2 M слов во всех словоформах. После устранения всех ошибок, и лемматизации и т.д. словарь уменьшается до 70-150 К. Полная матрица отношений займет примерно 30 Gb. Но для расчетов ее не применяют т.к. она практически пустая. Поэтому «комбинаторный взрыв» не происходит.

CQM — другой взгляд в глубоком обучении для оптимизации поиска на естественном языке

gansior_al Sep 16 2019 at 04:28

Конечно может. Но надо четко понимать, что первый шаг — это дать алгоритму поработать на массиве данных в которых будет осуществляться поиск. Он создаст все эти калибровочные слои — которые в общем- то представляют из себя своеобразные фильтры.

Предложения относительно уязвимостей и защиты моделей машинного обучения

gansior_al Jul 6 2019 at 07:50

Если мошенник может обмануть обученную модель, значит проблема в полноте данных?
Модель надо дообучать. (Условие — мошенник не имеет доступ к данным)

Как создать отдел Data Science и не облажаться

gansior_al Apr 29 2019 at 01:57

Это правильно. Т.к. в некоторых компаниях уже осознают, что у них есть данные, но что с ними делать еще не знают.

Information

Specialization