Комментарии / Профиль kayak116 / Хабр

Олег Замощин @kayak116

Пользователь

Профиль Публикации 4Комментарии 36Закладки 11

Один день из жизни специалиста технической поддержки. Часть 2. Фиксим ошибки в обработке трафика

kayak116 29 ноя 2023 в 12:00

Но если в последнем меме поменять надписи местами, будет тоже норм )

Посмотреть

Прокуратура заинтересовалась разработчиками российских нейросетей, а также бесчинства кокаиновых бегемотов

kayak116 15 ноя 2023 в 14:47

"скользкие жиробасы" - это 5! без GPT статью писали?

Посмотреть

VPN-сервис Surfshark перестал работать в России

kayak116 12 дек 2022 в 23:23

а это сработало у кого-то (настройка вручную)?

Посмотреть

Замена клавиатуры панели управления душевой кабины Albatros

kayak116 26 мая 2022 в 16:57

Не знаю, почему именно эта статья появилась у меня в ленте. Бросилась в глаза фраза "Обратились ко мне за помощью с неработающей душевой кабиной Albatros. Основной блок был залит водой" - казалось бы, почему? :)) Ушел под кат и зачитался.

Посмотреть

Гугл финанс перестал транслировать данные российских акций — что делать? (UPD: починили)

kayak116 22 ноя 2021 в 10:54

Да, спасибо, статью видел. Там ровно эти три метода и рассматриваются. Ссылка под описанием Яху финанс "Попробовать таблицу" - битая, поэтому не смог понять, получилось ли у вас оттуда получить данные по российским компаниям (у меня - нет).

Посмотреть

Гугл финанс перестал транслировать данные российских акций — что делать? (UPD: починили)

kayak116 21 ноя 2021 в 23:21

Спасибо за статью! Судя по моим экспериментам:

API Мосбиржи тоже очень долго все отдает, иногда просто виснет в режиме "загрузка". IMPORTHTML с yahoo finance почему-то российские акции грузить не хочет (NYSE - ок). У вас так же? GOOGLEFINANCE самый бодрый, но там нет привилегированных акций наших (

Посмотреть

Самый неадекватный кандидат за мою карьеру

kayak116 12 дек 2020 в 14:17

Вляпались туфелькой в повидло, с кем не бывает. Но это все тоже over-реакция. Надо уже взять себя в руки, а то даже только своими действиями имиджевый урон себе наносите.

+10

Посмотреть

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

kayak116 5 ноя 2019 в 16:10

Спасибо за статью! А не встречали что-то вроде готового EAST-детектора именно для цифр а не букв? Или проще файн-тьюнить на цифры их обученные модели?

Посмотреть

Анализируем тональность текстов с помощью Fast.ai

kayak116 5 ноя 2019 в 12:30

Не очень понятно, можете привести практический пример такой задачи? Вот например демо DeepPavlov.ai, где решается другая задача, а именно нахождение ответов на заданные вопросы по приложенному тексту.

Посмотреть

Превращаем скрипты в красивые инструменты для машинного обучения

kayak116 30 окт 2019 в 23:07

Ого, а так можно было?! Класс

Посмотреть

Анализируем тональность текстов с помощью Fast.ai

kayak116 28 окт 2019 в 12:22

ну да, плюс-минус… процентов 30 разницы :-)))

Посмотреть

Ищем пневмонию на рентгеновских снимках с Fast.ai

kayak116 14 окт 2019 в 15:47

Насчет суждения эффективности по валидации — согласен. В идеале я бы и оставил все три датасета не смешивая их — train/val/test. Но исходный датасет включал только 16 изображений в папке val и в любом случае для валидации надо было что-то придумать. ZlodeiBaal указал на грубую ошибку с моей стороны — перемешивать train, val, test данные, разбивая их на train и validation было нельзя, т.к. в train попадаются по несколько изображений одного и того же человека. Таким образом система валидировалась на уже обученных данных, показывая неадекватные результаты. Можно было взять часть данных для валидации из test, но непонятно, насколько оставшаяся часть была бы генерализированной, т.к. подробного описания данных на kaggle нет. Авторы кернелов, с которыми я сравнивал свои результаты, в итоге просто поделили на train (включив туда и val) и валидировались на test, предъявляя результат как эффективность системы. Сейчас хотя бы яблоки сравниваем с яблоками.

Посмотреть

Ищем пневмонию на рентгеновских снимках с Fast.ai

kayak116 14 окт 2019 в 12:23

Это все уже сделал — вообще на другой машине, т.е. результат воспроизводимый.
В этом и была изначальная гипотеза, что PyTorch + FastAI почти на дефолтных настройках дадут результат лучше, чем большинство стандартных решений.
С первой попытки у меня не вышло :) Но в итоге по сути подтвердилось.
Кстати, раз уж все равно потратили столько времени, сможете ли сориентировать, откуда fastai/PyTorch/TensorFlow может взять веса для модели, если я их точно стёр из стандартных папок? Или что еще (если не веса) может быть такого сохранено локально, что повлияет на результат обучения, если потом переобучать с нуля? Понятно, transfer learning вроде весов ImageNet здесь не учитываем.

Посмотреть

Ищем пневмонию на рентгеновских снимках с Fast.ai

kayak116 13 окт 2019 в 22:03

Ради интереса, попробовал перенести val в test, обучаясь только на train. Результаты не ухудшились, что говорит о том, что val и test похоже не пересекаются и утечек данных не происходит. Вот confusion matrix:

По итогу хочу сказать вам огромное спасибо за потраченное время. Скорость обучения в такие моменты возрастает в разы )

Посмотреть

Ищем пневмонию на рентгеновских снимках с Fast.ai

kayak116 13 окт 2019 в 18:53

Вы правы по всем пунктам. Снес все полностью, обучил заново. При этом модель обучалась на train и val, а валидировалась на test. При этом accuracy, precision и recall существенно снизились, но это все равно немного выше, чем например здесь.

Посмотреть

Ищем пневмонию на рентгеновских снимках с Fast.ai

kayak116 13 окт 2019 в 17:02

Не совсем понял. У меня деление 80/20 идет только по папкам train и val. Папка test теперь ни в обучении, ни в валидации не участвует совсем никак — она полностью отделена. Это видно по логам. Каким образом у меня хоть кто-то может попасть из test в train?

Посмотреть

Ищем пневмонию на рентгеновских снимках с Fast.ai

kayak116 13 окт 2019 в 15:46

Спасибо за ценное замечание, статью поправил :)
Давайте еще раз зафиксируем — проверять эффективность модели на результатах валидации некорректно. Действительно, перед тем, как начать, я зашел в 3-4 кернела и везде увидел что результат смотрят по валидации, поэтому сделал также.
Сейчас полностью отделил тестовую выборку и эффективность модели измеряю именно по ней. Тем не менее, результат все равно выше, чем указанные в начале таргеты.

Посмотреть

Pre-sale инженер — личный психолог сейла или человек на границе денег и техники

kayak116 5 апр 2018 в 12:00

Решил не делать скандальных заголовков вида «BSDM практики в пресейле» для накручивания просмотров статьи? :) Привет от московских коллег!

Посмотреть

Учим компьютер писать как Толстой, том I

kayak116 2 дек 2017 в 18:25

Спасибо за попытку! Я бы привел результаты тестов, как бы ужасны они ни были

Посмотреть

RNN: может ли нейронная сеть писать как Лев Толстой? (Спойлер: нет)

kayak116 23 ноя 2017 в 18:06

Вообще ни с чем не спорю. См. дисклеймер — «Профессионалы Deep Learning скорее всего не найдут тут ничего интересного»