Pull to refresh
38
2
Кирилл Косолапов@kirillkosolapov

CEO Amvera

Send message

Ну никто же не говорит об универсальности предлагаемого подхода. Но развертывать обновления просто делая push в мастер - это реально не сложно. А так можно и Heroku использовать, правда они бесплатные тарифы убирают.

Если прочитать тексты песен группы "Мельница", лично у меня складывается чувство, что без нейросети там не обошлось!

Тут вопрос не такой однозначный. Учитывая, что себестоимость для нас - это только железо (нет смысла брать с самих себя деньги за свое облако), то совсем дешево. Но если брать по стоимости биллинга на платформе, то получится примерно в 2 раза меньше, чем в Яндекс облаке, т.е. около 20 т.р..

Они неплохо себя чувствуют, насколько можно судить со стороны на основе анализа трафика и т.д.. Другой вопрос, что они уже так не растут как раньше, так как их продукт уже не настолько революционен и появилось много сильных конкурентов. Но и мы делаем не полную копию, а скорее просто вдохновились самой концепцией.

К слову у ряда вендоров есть специальные отраслевые решения, которые дают приемлемые цифры в таких акустических условиях, правда их нет в открытом доступе.

Да, но для этого нужно иметь качественно размеченные 10+ часов (а чтобы хорошо работало - сильно больше). Классическую архитектуру можно адаптировать под клиента имея только тексты. Но скорее всего архитектуры подобные Wav2Vec2.0 скоро окончательно победят гибриды.

Было бы интересно почитать статью про end2end системы.

Ссылки на кернелы добавил в тело статьи, в этом вы правы, так будет более корректно. Из кернелов брались только визуализации (графики и т.д.), чтобы не изобретать велосипед. Содержание текста полностью оригинальное.
Ссылка на источник есть в первом абзаце, во втором предложении. Статья — обзор решений с конкурса, которые каждый может подробно изучить перейдя по указанной ссылке (подсвечена синим). Это именно обзор, который не претендует на новые инсайты, т.е. описывает решения описанные несколькими участниками конкурса, в том числе и указанное вами решение по вашей ссылке.
В решениях на конкурсе Lightgbm показал хорошие результаты. Но разница с другими алгоритмами в основе которых композиция деревьев небольшая. Хотя, конечно, если разница есть, лучше использовать лидирующий алгоритм.
Планирую на эту тему написать еще 1-2 статьи, где рассмотреть тему глубже. Спасибо за идею сделать алгоритм с последовательным исключением ряда признаков, и показать как это влияет на метрики. Обязательно нужно попробовать.
Возможно, там всего несколько респондентов ответили, и назвали «оптимистичные» цифры. Т.к. данные из опроса, есть вероятность искажения реальной картины.
Указанный вами пост от ODS действительно является качественным изложением про временные ряды. Но текущая статья затрагивает немного другие аспекты, и написана, чтобы люди интересующиеся тематикой могли дополнить свои знания. Если вы ее внимательно прочитаете, общего с указанной вами статьей, только перечень алгоритмов, но это логично, так как обе статьи описывают устоявшиеся подходы к решению задачи. Понимаю, что вам нравится оставлять негативные комментарии, но пожалуйста, не надо это делать для каждой статьи, даже если они вам не нравятся. Конструктивную критику вы всегда можете написать в личные сообщения, и я постараюсь ее учесть в следующих статьях, либо отредактировав текущую. Надеюсь на ваше понимание.
Дела с сетями действительно обстоят хорошо, но вычленение смысла из контента нетривиальная задача. Тут вопрос скорее трудозатрат и добавочного эффекта. Добавление каждого следующего процента качества стоит нелинейно дороже. И есть точка, где это становится нецелесообразно. Для научной статьи, такая работа подойдет, а во бизнес заказчик уже может не потянуть бюджет. Не в курсе, какой сейчас алгоритм у Нетфликс, но возможно, там что то подобное.
Пример с Google был про нахождение близких товаров по изображению. И там существуют отдельные проблемы из-за разных текстур, форм и т.д… Как правило, каждый кейс имеет много особенностей, и их учет в работе с изображениями занимает больше времени, чем работа с матрицами, а результат работы с матрицей товарных предпочтений получается лучше. Вы правы, сейчас обработка больших матриц не проблема. К сожалению, не у каждого клиента есть достаточно данных для успешного применения нейросетей и т.д.
Вы правы, по Лайфхаку №1 можно использовать методы оптимизации для поиска весов, либо подобрать итеративно руками.

По Лайфхаку №8, глубокое понимание необходимо, и нужно выбирать наиболее подходящую метрику, RMSE далеко не всегда подходит, и нужно отталкиваться от кейса, полностью с вами согласен.
Думаю, сейчас так и есть. Но когда был конкурс (более 10 лет назад), у них могла быть другая бизнес модель, они вообще начинали с проката фильмов на дисках по почте.
Уважаемый roryorangepants, в статье указаны ссылки на источники, на основе которых написана статья, ваш комментарий не совсем корректен. Но буду рад, если вы подробно изложите пожелания по будущим статьям в личном сообщении, я обязательно их учту при написании статей. Конструктивная критика и обратная связь всегда полезны.
К сожалению, не увидел при создании возможности поменять на перевод, а при редактировании поменять нельзя. Выделил жирным ссылку, чтобы не путать читателей.

Information

Rating
1,431-st
Works in
Date of birth
Registered
Activity