Комментарии / Профиль kitaisky / Хабр

Как стать автором

Константин Шитьков @kitaisky

DS

Профиль Публикации 4Комментарии 30Закладки 1

Прогнозирование авиапассажиропотока между городами РФ

kitaisky 30 янв 2023 в 11:40

У вас пока задача прогнозирования спроса. Для бизнеса актуальнее задача ценообразования в разрезе максимизации прибыли. А тут обычной регрессией на спрос не обойдешься - нужно копать в сторону моделей эластичности и навешивать многоруких бандитов для оптимизации цены билета на конкретную дату, а можно еще и для конкретного класса покупателей.

0

Посмотреть

Что сделали с новой электричкой: ЭП2ДМ, на чём вы поедете в пригородах

kitaisky 19 дек 2022 в 23:17

Технически возможно повесить 3, но сделано максимально всрато и неудобно - проектрировщики видимо не пробовали подумать, как этим будут пользовтаься

+3

Посмотреть

Зоопарк ML-моделей или лучший справочник на Хабре

kitaisky 25 окт 2022 в 13:08

Mediapipe

0

Посмотреть

Как работает Stable Diffusion: объяснение в картинках

kitaisky 19 окт 2022 в 18:47

Я не спорю, но в статье визуализация входа как матрица 3х3, что отсылает таки к стандартным методам обработки именно изображений. С ваших слов это матрица 77х[размерность датентного пространства] - мне кажется это не логично, и что скорее там тогда одномергый вектор, к которому как раз из 77 векторов текстового представления подмешивается новая информация. Хотелось бы этот момент прояснить.

0

Посмотреть

Как работает Stable Diffusion: объяснение в картинках

kitaisky 19 окт 2022 в 18:23

77 этт количество векторов из текстового описания, как я понимаю, а юнет вроде для картинок изначально, типа 512х512х3. Видимо этеншн подмешивает в латентное представление сумму из этих 77

0

Посмотреть

Как работает Stable Diffusion: объяснение в картинках

kitaisky 19 окт 2022 в 17:43

Там u-net для одномерных векторов используется? Не мог в это въехать, спасибо.

0

Посмотреть

Как работает Stable Diffusion: объяснение в картинках

kitaisky 19 окт 2022 в 17:35

Подмешивает в вектор картинки в латентном пространстве? А в резнет она потом перед подачей разворачивается обратнотв картинку?

0

Посмотреть

Экзибит, прокачай мой трансформер или Основные идеи по улучшению модели трансформера с 2018 по 2020 год (часть 2)

kitaisky 19 окт 2022 в 07:40

Именно что "самостоятельно" обучать - основная проблема таки как раз в этом. Про дистилляцию -возможно, но таки опять же тут сетку нужно учить с нуля. Возмьжно небольшие сетки на такой архитектуре могут хорошо подходить для решения кааих-то задач, не связанных с языковым моделязыковым моделированием, гдк нужны гигантские объемы данных - я бы с удовольствием почитал о применении указанных выше архитектур к каким-нибудь табличкам, рядам и прочему.

0

Посмотреть

Экзибит, прокачай мой трансформер или Основные идеи по улучшению модели трансформера с 2018 по 2020 год (часть 2)

kitaisky 18 окт 2022 в 18:17

Это все конечно интересно, но на практике упирается в то, какую архитектуру выберут и предобучат большие дяди, и после этого будут использовать для решения своих задач все остальные.

0

Посмотреть

Как работает Stable Diffusion: объяснение в картинках

kitaisky 18 окт 2022 в 13:04

Я так и не понял, как используется векторное представление текста. На вход ResNet у нас подается картинка с шумом(или ее проекция во внутреннее пространство?), а как на ее обработку сеткой влияет этэншн и текстовый вектор?

0

Посмотреть

Анализ временных рядов, применение нейросетей (1 часть)

kitaisky 17 окт 2022 в 16:12

Добавить опиание специфики применения трансформеров для временных рядов. А так смысл статьи в том, что если хотите во врменнные ряды, то сейчай SOTA это трансформеры - а дальше сами разбирайтесь)

+2

Посмотреть

Анализ временных рядов, применение нейросетей (1 часть)

kitaisky 17 окт 2022 в 15:18

В тексте есть общие слова про трансформеры - где тут про их применение к временным рядам кроме отсылок к статьям? "Архитектура очень похожа на оригинальный трансформер. В качестве оптимизатора в этой работе использовался Adam. Для регуляризации авторы добавили dropout и dropout rate - 0.2 для каждого слоя." - очень информативно конечно)

+1

Посмотреть

Анализ временных рядов, применение нейросетей (1 часть)

kitaisky 17 окт 2022 в 11:22

Заходишь почитать про применение трансформеров, а в сухом остатке только ссылка на пару статей по теме.

+1

Посмотреть

Диффузионные Нейросети — самый актуальный подход к генерации изображений

kitaisky 17 окт 2022 в 10:59

Спасибо за первоисточник

0

Посмотреть

Как удалить «неудаляемые» приложения со смартфона

kitaisky 25 дек 2021 в 09:40

Спасибо, так заработало)

0

Посмотреть

Кластерный анализ корпуса текстов

kitaisky 23 ноя 2021 в 17:11

В ноутбуке в колабе по ссылке на гитхаб. Там конечно саммари такое себе - часто получается склейка новостей, и выглядит диковато)

0

Посмотреть

Улучшаем генеративных чатботов на нейросети ruGPT3: умный ранжировщик ответов

kitaisky 15 окт 2021 в 11:23

Поясните, как из токенов получается вектор, который подается на ваш обучаемый классификатор?

"Входной слой — это слой встраивания, он ставит вектор в соответствие каждому индексу. Последовательность индексов заменяется на матрицу. Изначально векторы либо выбираются случайными, либо задаются предварительно обученные, а далее, во время обучения сети могут обучаться вместе со всей сетью при помощи обратного распространения ошибки (backpropagation)."

Что здесь вектор, что здесь индекс?

Самое интересное место, но и самое мутное.

Как я понимаю, мы прогоняем полученные токены через векторизатор, получаем векторы для каждого сгенеренного варианта фразы, потом ранжируем по расстоянию. Не очень понял, как считаем вектор для всего предыдущего диалога - токенизируем и прогоняем весь предыдущий текст диалога?

И еще - ваша модель нужна для выбора вариантов, сгенеренных ruGPT? А просто перплексию фразы на языковой модели вы не сравнивали?

PS как-то очень запутанно написано - если бы тема не была интересна, то прошел бы мимо

+1

Посмотреть

Создайте средство проверки на плагиат с помощью машинного обучения

kitaisky 14 окт 2021 в 10:55

"метод query_pinecone принимает вводимое пользователем содержимое статьи, преобразует его в сопоставления векторов, а затем запрашивает индекс Pinecone, чтобы найти похожие статьи." - хотелось бы узнать, как происходит само преобразование и поиск.

0

Посмотреть

Простая нейронка без библиотек и многомерных массивов

kitaisky 18 сен 2021 в 08:29

Да, сама статья не особо полезна - новичку сложно, остальные и так наверное уже разобрались, тут скорее просто порадоваться за подход автора :)

0

Посмотреть

Детекция объектов с помощью YOLOv5

kitaisky 16 сен 2021 в 15:48

Спасибо за замечание, попробую дополнить.

0

Посмотреть

1