Pull to refresh
16K+
345
Alexander Veysov@snakers4

Machine Learning / Data Science

41,2
Rating
445
Subscribers
Send message

Доехал апдейт v5_5_ru с Евгением.

Русскоязычные модели не принимают латиницу.

Не может или не хочет?

Помощь следствию не принесет прибыль можно прикрываться тайной связи.

А потом нарушать её продавая данные десятков миллионов абонентов, а это принесет прибыль)

Стандартный пример из репозитория, секция v5 → SSML:

Пример
ssml_sample = """
              <speak>
              <p>
                  Когда я просыпаюсь, <prosody rate="x-slow">я говорю довольно медленно</prosody>.
                  Пот+ом я начинаю говорить своим обычным голосом,
                  <prosody pitch="x-high"> а могу говорить тоном выше </prosody>,
                  или <prosody pitch="x-low">наоборот, ниже</prosody>.
                  Пот+ом, если повезет – <prosody rate="fast">я могу говорить и довольно быстро.</prosody>
                  А еще я умею делать паузы любой длины, например, две секунды <break time="2000ms"/>.
                  <p>
                    Также я умею делать паузы между параграфами.
                  </p>
                  <p>
                    <s>И также я умею делать паузы между предложениями</s>
                    <s>Вот например как сейчас</s>
                  </p>
              </p>
              </speak>
              """

sample_rate = 48000
speaker = 'xenia'              
audio = model.apply_tts(ssml_text=ssml_sample,
                        speaker=speaker,
                        sample_rate=sample_rate)
display(Audio(audio, rate=sample_rate))

Послушал, звучит как надо. Где тут может быть ошибка — сложно понять без примера.

Такой возможности нет.

<s>

Ммм … а представьте, если можно будет ещё и получить доступ к переписке в одном известном мессенджере через такие же обезличенные сервисы. Его же не разрабатывает частная компания, которая крутит рекламу направо-налево?

Они же не будут продавать вашу переписку, правда? За это же есть ответственность, как и за нарушение тайны связи и сливы всей базы с персональными данными, правда?

</s>

Если без шуток — с мобилы по ходу вообще нельзя ни на какие сайты заходить в принципе, лол. Ну и конечно всегда адблок.

А со СДЭК и Яндексом ответственности никакой не было.

@Antxak — не увидел, а про какую компанию речь в статье? Может стоит перенести свой телефонный номер от неё?

Про Гитлаб, прежде чем создавать там зеркала, если вы российский разработчик, то советую задать Гуглу вот такой вопрос, и дальше уже принимать решение:

gitlab country of origin

Но лучше, имхо, как писали выше, поднять self-hosted решение и делать там mirror.

Что касается конвертации, то ONNX-версии у нас естественно есть, но мы их придерживаем для заказчиков, когда нужна какая-то особенная кастомизация / сборка под особенное железо.

Что касается самого ONNX, тогда вся обвязка будет торчать, придется заводить пакет как минимум, и как следствие реально портативность не вырастет (тут не просто одна голая TTS модель).

Что касается именно этого проекта - даже если и публиковать какие-то артефакты в onnx, то вижу мало смысла лить им воду на мельницу.

Ну у нас не требует, после прогрева на 4 потоках процессора синтез выдает более 100 секунд аудио в секунду

В стихах нужно соблюдение внутреннего ритма. То есть нужно знать размер и под него подстраивать рисунок.

Решение задачи чтения стихов чем-то сродни пению песен. Это как бы продукт совсем с ортогональными целями.

Включая пунктуационные паузы, как внутри, так и между предложениями.

Для тонкого управления паузами сейчас есть SSML.

Сам Pytorch сделал экспорт своих моделей.

Но там их новый компилятор и теряется возможность запускать модели со всеми фишками, можно чисто голую модель дергать.

То есть нужен будет обвязочный код.

Доехало обновление v5_4_ru с интонацией в вопросах https://habr.com/ru/articles/1015942/

Ну просто иначе без них получается примерно такая картина — кто активно занимается парсингом рунета и рассматривает его как рынок (например, Гугл) у того и лучше модели, что как бы логично.

А почему тут в сравнении нет сеток Сбера и Яндекса?

Поскольку Bluetooth всегда включён, телефоны, ноутбуки, смарт-часы, наушники, автомобили и медицинские устройства постоянно передают информацию о своём присутствии.

Ну ... базовое правило цифровой гигиены — выключать интерфейсы, которые не нужны, когда они не нужны.

Добавили в v5_3_ru, с фиксами микробагов.

Добрый день!

Английского языка нет в списке поддерживаемых.

Для иных языков, вставка нескольких слов на "иностранном" работает почти нативно, то есть автопереключение не имеет смысла, так как модель и так априори говорит на всех языках, а на паре иностранных слов обычно примеры обычно звучат нормально.

Добавили в v5_2_ru, где убраны `numpy` и scipy из зависимостей торч-пакета.

По сравнению с 95% выдачи Хабра, статья вроде хорошая, видно, что решали реальную задачу, за это спасибо. Но отсутствие ответов от автора статьи на горящие вопросы конечно выдаёт PR-слоп. Пиарщики сделали текст и забыли, народ поднял важные вопросы - но ответов конечно не будет.

Цифры подтвердили гипотезу. После включения фич на базе offer_id для новых товаров мы увидели заметный рост:

заказы новинок: +5%

Но если дать так сказать benefit of doubt статье, то вот главный вывод выглядит очень неубедительно.

Понятно, что грести против течения сложно, но если проблема холодного старта это "месяцы" простоя, то продажи какой-то новой когорты новых товаров должны вырасти, ну не знаю, на 30-50%. Грубо говоря было 2 продажи, стало 22. А в среднем, учитывая, что есть и плохие товары, стало +30% (на низкой базе, было 10 товаров по 1 продаже, а стало там 50 продаже на 10 товаров).

Что касается самого Озона, тот тут на вас озорливо смотрят не просто слоны, а библейские бегемоты в комнате, без решения которых решение это задачи выглядит скорее как "сахарная пилюля":

  • "Наследование" выдач. Кто-то раскрутил карточку с зелеными квадратами - а потом продаёт там синие круги. Отзывы можно вроде сортировать, но вся информация зачастую перепутана, продавцу глубоко плевать, что там есть 10 моделей и он по сути дезинформирует покупателей;

  • 95% отзывов это или бред "ставлю оценку но не открывал товар" или заказуха. Ну сделайте как в стиме - что чтобы сделать отзыв надо купить товар (как-то жулики обходят всё, по сути отзывы без видео бесполезны);

  • Ужасный каталогизатор. Ну украдите у яндекс-маркета фильтры или его клонов (до 2022 был е-каталог, для электроники есть просто ритейлеры типа регард или никсов). По сути я вынужден выбирать на 2-3 экранах лишнего, потому что нет фильтров. Просто поднимайте выше в выдаче заполненные карточки. Дайте кнопку юзерам - карточка указана неверно, как-то мотивируйте нормально, а не левыми баллами;

  • Поиск вроде работает (он не ужасный), но подмешивает какую-то хрень всегда, даже когда я указываю всё вплоть до бренда и фасовки. А фильтров таких просто не существует.

А где и как протестировать?

Модели доступны для скачивания в указанном репозитории

1
23 ...

Information

Rating
213-th
Registered
Activity