Статьи / Профиль ceoofmsc / Хабр

Герман Березин@ceoofmsc

ML-инженер

Подписчики

ПрофильСтатьи4ПостыНовости1Комментарии8

ceoofmsc 9 дек 2024 в 06:00

NLP: когда машины начинают понимать нас (Часть 3)

Средний

13 мин

8.7K

Natural Language Processing * Машинное обучение * Искусственный интеллектPython * Программирование *

FAQ

В этой статье мы продолжим изучение NLP и перейдем к более продвинутым темам, которые являются главными для построения современных приложений и моделей в области обработки естественного языка. А также создадим и обучим модели самостоятельно, используя TensorFlow/Keras и PyTorch.

ceoofmsc 8 дек 2024 в 06:30

NLP: когда машины начинают понимать нас (Часть 2)

Средний

8 мин

6.8K

Программирование * Natural Language Processing * Машинное обучение * Искусственный интеллектPython *

FAQ

В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.

ceoofmsc 7 дек 2024 в 07:00

NLP: когда машины начинают понимать нас (Часть 1)

Простой

6 мин

13K

Natural Language Processing * Искусственный интеллектМашинное обучение *

FAQ

Представьте, что вы можете разговаривать с компьютером так же естественно, как с обычным человеком. Вы задаёте вопросы, получаете ответы, даёте команды - и это всё на вашем родном языке. Именно этим и занимается обработка естественного языка (Natural Language Proccessing, или NLP) - область искусственного интеллекта, которая фокусируется на взаимодействии между компьютерами и людьми с помощью естественного языка.

Цель NLP - научить компьютеры понимать, интерпретировать и генерировать человеческую речь и текст так же, как это делаем мы. Это включает в себя не только распознавание слов, но и понимание их смысла, контекста и эмоций.

ceoofmsc 6 дек 2024 в 11:15

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

Простой

6 мин

3.6K

Natural Language Processing * Искусственный интеллектМашинное обучение *

Из песочницы

Перевод

VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shot - способность модели генерировать речь для голоса, который она не слышала во время обучения. Другими словами, модель может синтезировать речь для нового диктора, основываясь лишь на коротком аудио образце его голоса (prompt).

Основанная на своем предшественнике VALL-E, новая итерация вводит два значительных улучшения: Repetition Aware Sampling и Grouped Code Modeling.

Repetition Aware Sampling (Выборка с учетом повторений) решает проблему зацикливания, с которой сталкивался предыдущий VALL-E. Если модель начинает повторять одни и те же звуки, она автоматически переключается на более точный метод выбора, чтобы избежать "застревания". Grouped Code Modeling (Моделирование групп кодов) - звуковые коды группируются и обрабатываются вместе, как слоги в словах. Это ускоряет синтез речи и позволяет модели лучше учитывать контекст, делая речь более естественной и связной.

Синтез речи из текста (TTS) направлен на генерацию высококачественной речи из текстового ввода с высокой степенью ясности и разборчивости.

NLP: когда машины начинают понимать нас (Часть 3)

NLP: когда машины начинают понимать нас (Часть 2)

NLP: когда машины начинают понимать нас (Часть 1)

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

Информация

Специализация