Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
сети уже обогнали всякие GMM-HMM
Во-первых, причём здесь FFT вообще? Я не давал никаких общих утверждений.
сети уже обогнали всякие GMM-HMM-based модели
cети обогнали более старые методы, вот стандартные примеры: speech recognition— снова наивное утверждение «из гугла». В частности, в speech recognition, используется целая комбинация различных методов. Там и HMM, и FFT и чего только нет. Да, там есть и нейро сети. Но говорить что нейросети лучше HMM — это как сравнивать трактор с формулой 1. А вы это заявляли:
сети уже обогнали всякие GMM-HMM-based модели
сети уже обогнали всякие GMM-HMM-based модели на крупных бенчмарковых датасетах в других задачах, связанных со звуком, и я не вижу причин, почему в классификации музыки это было бы иначе.
fft — модель данных, не лучше не хуже GMM-HMM-based
В частности, в speech recognition, используется целая комбинация различных методов. Там и HMM, и FFT и чего только нет. Да, там есть и нейро сети.
Я не говорю, что «нейронные сети в целом лучше HMM». Я говорю, что на конкретных задачах и датасетах сейчас сети являются state-of-the-art.
FFT — не модель данных, а алгоритм преобразования сигнала, и к предмету спора он не имеет ни малейшего отношения.
Зачем отрицать факт того, что это работает лучше при наличии достаточного объема данных и вычислительных мощностей (но в 2018 году этого вдоволь)?
Я хочу конкретики, а вы уклоняетесь от нее. Вы сказали слова «сети уже обогнали». Я задал вопрос — в чем? Ответа нет.
Но так как эта модель есть результат FFT — то это уже имеет отношения к предмету диалога.
Да при наличии достаточного времени ( а это и есть выч ресурс) и памяти — я вообще любую задачу решу, тупо перебором. И мне нейросети не нужны при этом. Проблема в том что этих ресурсов всегда мало. И если есть более точный и быстрый метод — то он лучше. И все его ищут. Но некоторые совершенно не хотят копать предметную область, они уверовали в серебряные пули, большие объемы данных, как бы симуляцию мозга нейросетями.
Это шутка? Я привёл конкретный список задач на два комментария выше. Я привёл конкретную статью
Самое вкусное подсветил жирным. Если это действительно так, то почему на том же ImageNet последние пять лет побеждают сети?
Конечно я не собираюсь читать что вы там нагуглили
На ImageNet сети соревнуются с сетями, как намекает само название.
Ну и как с вами тогда общаться?
Иначе бы вы такого не писали, конечно.
после долгой работы с CNN в сегментации изображений, Вы открыли мне, что они еще и со звуком хорошо заходят.
Печально, что после прочтения поста, вы решили, что это для меня "открытие". Применить можно все ко всему, как вы и сказали. Хоть прямо на битах все обучай. Интересно то, какие результаты подобные методы выдают, насколько требовательны к датасету, сколько времени тратится на обучение.
Вы открыли мне, что они еще и со звуком хорошо заходят.
— ну блин нельзя полагаться на магию библиотек. я перемешал и оно заработало — в жизни должны быть очень веские доказательства чтоб так делать
Классификация музыкальных композиций по исполнителям с помощью Скрытых Марковских Моделей