Pull to refresh
9
0.2

Пользователь

Send message

Эти технократы саккумулировали все свободные деньги из экономики, и я за них рад. В кои-то веки жить хорошо, и даже гораздо лучше всех, смогли не только лживые политики, жестокие силовики, жадные коммерсы, беспринципные преступники всех мастей - а люди умственного труда, работающие во благо прогресса.

Слог красивый. Интересно только, насколько это доказано, что вымирания и обледенения на Земле были связаны с прохождениями Солнечной системы через разные сектора Галактики. Вообще, выглядит убедительно.

Ну всё же "писать на Rust" и "переписывать с C на Rust" - это разные вещи. Как "сочинять" и "переводить". Хороший переводчик не обязательно должен быть хорошим сочинителем.

Это нереально. Не каждому дано учить. Преподавание - само по себе профессия.

Интересно, можно ли обучить LLM на проверку тетрадей школяров? Учитывая, что школьная программа стандартизована, думаю, это будет не невозможно.

Ну, Гугловская нейросеть вполне успешно предсказывает погоду, и недорого по сравнению с предыдущей экспертной системой. Чем не предсказание будущего?

Не совсем понятно, как IPO компании Cerebras повысило бы риски утечки технологий в Китай? Та же Nvidia торгуется на бирже, и тем не менее они подчиняются американскому регулятору.

Тем более это не такой и рокет-сайенс. Активно разрабатываются фотонные и квантовые вычисления, и это будет гораздо круче и энергетически эффективнее и решений Cerebras, и NVidia.

С омографами в белорусском легче, т.к. письменная речь подстраивается под устное произношение. Например, в русском "молоко", "молоки" (железы) -- сложно определить ударение не зная наверняка. В белорусском "малако" и "малокі" -- если есть "о" или "ё" - они почти наверняка под ударением. Либо если есть сочетание слогов с гласными "...а...е..." либо "...я...е..." -- буква "е" чаще будет ударная.

Но это конечно всё не важно, модель-акцентор сама должна вытянуть эти закономерности из словаря.

Я ещё попробовал голоса bel_dmitriy и ru_dmitriy. Как я понимаю, это один человек записывал образцы на двух языках, и на них учили модель. Я предложил модели v5_cis_base озвучить одно и то же предложение на белорусском. В итоге, в синтезированной речи разницы по звучанию практически нет. То есть bel_dmitriy и ru_dmitriy звучат почти идентично с русским выговором.

Несмотря на критику, ваша новая модель v5_cis_base - однозначно лучший синтезатор TTS для белорусского языка на сегодня. Раньше я пробовал вашу v3 с украинским голосом mikyta, транскрибировал белорусский текст украинскими буквами и расставлял ударения - получалось довольно неплохо, но всё же украинский акцент чувствовался местами. Например, слово "Магілёўскі" (Могилёвский) он произносил как "Магілёвскі". Сейчас же bel_anatoliy в v5 -- это несомненно новый уровень, поздравляю!

Да, конечно, текст был с расставленными ударениями.

Можете сбросить фрагмент записей Дмитрия и Ларисы, чтобы там была буква "ч" в разных сочетаниях?

Внезапно, украинские голоса 'ukr_igor' и 'ukr_roman' очень хорошо озвучивают белорусский текст! Акцента почти нет.

Здорово, что сейчас у вас все 3 языка (русский, белорусский и украинский) реализуются одной моделью.

Сегодня дошли руки проверить белорусский язык, на модели v5_cis_base, в Колабе.

model, example_text = silero_tts(language='bel', speaker=model_id)

И сразу затык:

AssertionError: Language not in the supported list ['ru', 'en', 'de', 'es', 'fr', 'ba', 'xal', 'tt', 'uz', 'ua', 'indic', 'cyrillic', 'multi']

Подскажите, что указывать для белорусского? 'cyrillic'?

OK оставил language='ru' (не уверен правильно ли это).

Из 3 предложенных белорусских голосов:

  • bel_anatoliy - звучит довольно аутентично, лучший вариант.

  • bel_dmitriy - явный русский акцент.

  • bel_larisa - звучит неплохо, но всё же чувствуются смягчения как в русском "чь", "чи", "че" и подобное. В белорусском языке звук "ч" всегда твёрдый, т.е. "ч", "чы", "чэ".

Возможно, установка language='ru' повлияла на акцент.

Можно проговаривать про себя реплики в чатах, с интонациями вместо смайликов. :)

1
23 ...

Information

Rating
2,930-th
Registered
Activity