Думаю с нуля - дорого. Полагаю можно купить - это обычно дешевле чем с нуля разрабатывать. Автор, а подробнее может отдельной статьей MVP как считаете сами можно такой поднять полностью? Или надо звать подрядчиков?
Просто из опыта, одна из составляющих метрики, по таким задачам, лучше брать такую, чтобы близкие или просто переформулированные задачи имели близкие эмбединги. К примеру: (2+3)/4 должна иметь близкий эмбединг к (3+2)/4, а так же близкий к 3/4+0.5
А для экспортеров, площадки типа амазон, ebay и т.д. не анализировали? Но вообще круто, считаю одним из лучших примеров как математику можно интегрировать в бизнес.
@darinka666 на самом деле,судя по результатам (а датасет хороший и объемный), нужно что-то менять в структуре сети. И если исходить из того что с начала года гпт4 стал хуже работать и в том числе на математических задачах, то...
еще вопрос. а эмбединг предложения смотрели? на сколько близкие задачи близки векторно?
Не убирайте такую возможность, ставить ручками ударение. Очень удобно (понимаю что это мне, а не всем, но реально сделать голос похожим на человеческую речь иначе сложно)
По мне уровень почти яндексовских премиальных голосов получается.
И хочу поблагодарить, огромная работа, супер результат.
А насколько сложно добавить клонирование голоса, ну пусть на 80% похожести? (для мошенников мало, для многих проектов достаточно)
В буржуйских проектах, открытых эта штука есть, пишут что достаточно и 10 минут текста, но только без русского языка. Ооо, в общем русский у нас отстает от мировых трендов TTS.
Думаю с нуля - дорого.
Полагаю можно купить - это обычно дешевле чем с нуля разрабатывать.
Автор, а подробнее может отдельной статьей MVP как считаете сами можно такой поднять полностью?
Или надо звать подрядчиков?
Не обратил сразу внимания.
Да, уже обратился. Получил рекомендацию.
Работа и интерпретация показались мне интересными, хотел воспроизвести ваш результат, взял предложенный вами ноут https://github.com/spather/transformer-experiments/blob/master/nbs/models/transformer.ipynb
Запустил в коллаб. Ошибки.
Нет библиотек и прочего.
Подскажите есть ли готовый ноутбук, чтобы можно было воспроизвести ваши результаты?
Просто из опыта, одна из составляющих метрики, по таким задачам, лучше брать такую, чтобы близкие или просто переформулированные задачи имели близкие эмбединги.
К примеру: (2+3)/4 должна иметь близкий эмбединг к (3+2)/4, а так же близкий к 3/4+0.5
А для экспортеров, площадки типа амазон, ebay и т.д. не анализировали?
Но вообще круто, считаю одним из лучших примеров как математику можно интегрировать в бизнес.
Спасибо за классный пример.
@darinka666 на самом деле,судя по результатам (а датасет хороший и объемный), нужно что-то менять в структуре сети.
И если исходить из того что с начала года гпт4 стал хуже работать и в том числе на математических задачах, то...
еще вопрос. а эмбединг предложения смотрели? на сколько близкие задачи близки векторно?
Так нет ссылки.
По мне уровень почти яндексовских премиальных голосов получается.
И хочу поблагодарить, огромная работа, супер результат.
А насколько сложно добавить клонирование голоса, ну пусть на 80% похожести? (для мошенников мало, для многих проектов достаточно)
В буржуйских проектах, открытых эта штука есть, пишут что достаточно и 10 минут текста, но только без русского языка. Ооо, в общем русский у нас отстает от мировых трендов TTS.