Обновить
9
0.2

Пользователь

Отправить сообщение

Эти технократы саккумулировали все свободные деньги из экономики, и я за них рад. В кои-то веки жить хорошо, и даже гораздо лучше всех, смогли не только лживые политики, жестокие силовики, жадные коммерсы, беспринципные преступники всех мастей - а люди умственного труда, работающие во благо прогресса.

Слог красивый. Интересно только, насколько это доказано, что вымирания и обледенения на Земле были связаны с прохождениями Солнечной системы через разные сектора Галактики. Вообще, выглядит убедительно.

Ну всё же "писать на Rust" и "переписывать с C на Rust" - это разные вещи. Как "сочинять" и "переводить". Хороший переводчик не обязательно должен быть хорошим сочинителем.

Это нереально. Не каждому дано учить. Преподавание - само по себе профессия.

Gemini оффлайн не запустить.

Интересно, можно ли обучить LLM на проверку тетрадей школяров? Учитывая, что школьная программа стандартизована, думаю, это будет не невозможно.

Нет здоровых LLM, есть недообследованные.

Ну, Гугловская нейросеть вполне успешно предсказывает погоду, и недорого по сравнению с предыдущей экспертной системой. Чем не предсказание будущего?

Не совсем понятно, как IPO компании Cerebras повысило бы риски утечки технологий в Китай? Та же Nvidia торгуется на бирже, и тем не менее они подчиняются американскому регулятору.

Тем более это не такой и рокет-сайенс. Активно разрабатываются фотонные и квантовые вычисления, и это будет гораздо круче и энергетически эффективнее и решений Cerebras, и NVidia.

С омографами в белорусском легче, т.к. письменная речь подстраивается под устное произношение. Например, в русском "молоко", "молоки" (железы) -- сложно определить ударение не зная наверняка. В белорусском "малако" и "малокі" -- если есть "о" или "ё" - они почти наверняка под ударением. Либо если есть сочетание слогов с гласными "...а...е..." либо "...я...е..." -- буква "е" чаще будет ударная.

Но это конечно всё не важно, модель-акцентор сама должна вытянуть эти закономерности из словаря.

Я ещё попробовал голоса bel_dmitriy и ru_dmitriy. Как я понимаю, это один человек записывал образцы на двух языках, и на них учили модель. Я предложил модели v5_cis_base озвучить одно и то же предложение на белорусском. В итоге, в синтезированной речи разницы по звучанию практически нет. То есть bel_dmitriy и ru_dmitriy звучат почти идентично с русским выговором.

Несмотря на критику, ваша новая модель v5_cis_base - однозначно лучший синтезатор TTS для белорусского языка на сегодня. Раньше я пробовал вашу v3 с украинским голосом mikyta, транскрибировал белорусский текст украинскими буквами и расставлял ударения - получалось довольно неплохо, но всё же украинский акцент чувствовался местами. Например, слово "Магілёўскі" (Могилёвский) он произносил как "Магілёвскі". Сейчас же bel_anatoliy в v5 -- это несомненно новый уровень, поздравляю!

Да, конечно, текст был с расставленными ударениями.

Можете сбросить фрагмент записей Дмитрия и Ларисы, чтобы там была буква "ч" в разных сочетаниях?

Внезапно, украинские голоса 'ukr_igor' и 'ukr_roman' очень хорошо озвучивают белорусский текст! Акцента почти нет.

Здорово, что сейчас у вас все 3 языка (русский, белорусский и украинский) реализуются одной моделью.

Сегодня дошли руки проверить белорусский язык, на модели v5_cis_base, в Колабе.

model, example_text = silero_tts(language='bel', speaker=model_id)

И сразу затык:

AssertionError: Language not in the supported list ['ru', 'en', 'de', 'es', 'fr', 'ba', 'xal', 'tt', 'uz', 'ua', 'indic', 'cyrillic', 'multi']

Подскажите, что указывать для белорусского? 'cyrillic'?

OK оставил language='ru' (не уверен правильно ли это).

Из 3 предложенных белорусских голосов:

  • bel_anatoliy - звучит довольно аутентично, лучший вариант.

  • bel_dmitriy - явный русский акцент.

  • bel_larisa - звучит неплохо, но всё же чувствуются смягчения как в русском "чь", "чи", "че" и подобное. В белорусском языке звук "ч" всегда твёрдый, т.е. "ч", "чы", "чэ".

Возможно, установка language='ru' повлияла на акцент.

Можно проговаривать про себя реплики в чатах, с интонациями вместо смайликов. :)

1
23 ...

Информация

В рейтинге
2 910-й
Зарегистрирован
Активность