Обновить
256K+

Звук

Это «ж-ж-ж» неспроста

147,96
Рейтинг
Сначала показывать
Порог рейтинга

Запилили TG-бота для склейки голосовух - https://t.me/voicemixbot

👍 Зачем.

  1. Сложно наговорить длинную 3-минутную мысль за раз красиво. Вместо этого, ясно произнеси отдельные фразы по 5 сек друг за другом, продумав каждую.

  2. Мысль приходит только на улице во время прогулки и с собой только телега, монтировать дома никто не будет, а итоговая цельная голосовуха с красивой мыслью нужна уже сейчас чтобы кому-то переслать.

  3. Хочешь записать инновационный трек из склейки пердежа, скрипа двери и крика бомжей в метро, но прямо сейчас без инвестиций в монтаж и продюсирование.

🧰 Как пользоваться.

  1. Заходим в @voicemixbot - ему уйдёт команда start.

  2. Шлем голосовухи друг за другом. После каждой видим ADD N, где N - её порядковый номер (начиная с нуля). Это значит, голосовой кусок вставился в ряд. Не говори следующую голосовуху, пока не получил ADD.

  3. Удалить последнюю голосовуху - pop. Когда понял, что последней голосовухе нужен новый дубль. Вернёт SIZE N, где N - новое общее число эпизодов в проекте.

  4. Всё сказал: пишем makeили go. Получаем цельный файл. Забыл что-то сказать - докидываем голосовух в конец и снова make .

  5. Пишем clear если надо начать новый файл.

💎 Команды.

  • clear - забыть всё, начать новый проект

  • info - статус текущего проекта

  • make - склеить текущий проект (цепь голосовух) в один файл

  • name TEXT - указать название TEXT для вашей итоговой записи

  • pop - удалить последнюю голосовуху из стека

  • amp 1 или amp 0 - включить или выключить автоусиление тихой речи.

  • bitrate N - установить битрейт, где N - между 2000 и 50000
    23000 - достаточно для прилично звучащей речи

  • mk N MESSAGE - поставить текстовую метку MESSAGE перед куском номер N. Нумерация с нуля. N - это тот номер, который фигурирует в ответе "ADD"

  • fade N, N - число миллисекунд: длительность плавного перехода между фразами.

Метки.

00:00 - Приветствие
00:21 - Музыка
00:31 - Новости
01:04 - О погоде

Чтобы получить такую таблицу временных меток под записью, отправляй нужный текст перед той голосовухой, на начало которой этот текст должен ссылаться. Текстом считается любой текст, которого нет в таблице команд. Если вы хотели поставить метку перед уже отправленной голосовухой, но забыли это сделать, то используйте команду mk N (см выше).

🔌 Технические детали.

Кодируем речь кодеком OPUS, он прекрасно звучит даже на битрейте 24k, где mp3 бы уже умер. "/" в начале команды не важен. /pop и pop работают одинаково. Цепь голосовух мы называем "проект". У каждого проекта есть уникальное случайное служебное имя вида d7_uaUcUXc0. Помнить его не надо. Команда clear создаёт новый проект с новым именем, забывая предыдущий навсегда. Лимит кусков в проекте - 200, но лучше не рисковать. make 13 минутного файла будет работать 3 минуты. Написано на голимом C++20, libopus, libogg, epoll.

⌛ Лимиты.

  1. Одна голосовуха - не более 60 секунд.

  2. Число голосовух в проекте - 200 штук.

  3. Получается суммарно более 2 часов на один файл, но стало страшно. В будущем возможно порежем лимит результирующего файла чем-то на уровне 10 минут.

🔒Безопасность и надёжность.

clear удаляет голосовухи с сервера бота. Бекапов нет. ФС сервера - в ramdisk. Наговорил, скомпилил - забери себе, не растягивай проект на неделю. Сервер не стабилен, падает раз в неделю с переналивом всей OS с нуля. У админа доступ ко всем голосовухам (как у админы телеграм к личкам), но чаще падает сервер с данными, чем админу охота покопаться. Если придёт майор с бутылкой - всех сдадим, но рамдиск (может быть уже нечего). Метаданные о пользователях не собираем, спамить не будем - даже БД нет. Точнее, есть, но в рамдиске. Если сервер не отвечает, то он либо сдох и ему скоро автоматически нальют образ по вотчдогу, либо занят компиляцией чьего-то проекта - отправь команду info и подожди. Устраивать DoS и хакерство с отправкой гиговых видосов и фоток не надо: бот даже не начнёт качать. В целом, наверное вы можете его положить, но мы просто пнём сервак и он забудет всё плохое в жизни, рамдиск же.

https://t.me/voicemixbot в общем.

Теги:
-5
Комментарии7

Микрофоны ДЭМШ-1А, которыми оснащался скафандр первого космонавта Юрия Гагарина, были разработаны на тульском предприятии «Октава» (позже Особое конструкторское бюро «Октава»). Речь идет о дифференциальном электромагнитном малогабаритном шумостойком микрофоне ДЭМШ-1А. Именно эта модель, а точнее два таких микрофона — основной и резервный — были встроены в скафандр «СК-1» первого космонавта. Они являлись частью гарнитуры шлема и работали в составе бортовой аппаратуры связи «Заря». 

Юрий Гагарин с Сергеем Королёвым перед полетом. В шлеме скафандра виден встроенный микрофон ДЭМШ-1А. Кадр снят 12 апреля 1961 года. Фото: Минобороны РФ
Юрий Гагарин с Сергеем Королёвым перед полетом. В шлеме скафандра виден встроенный микрофон ДЭМШ-1А. Кадр снят 12 апреля 1961 года. Фото: Минобороны РФ
Теги:
+4
Комментарии2

Представлен открытый генератор речи OmniVoice, который может создавать аудио на более чем 600 языках. Решение клонирует любые голоса без цензуры. Достаточно короткой записи на 5-10 секунд. Скорость модели в 40 раз быстрее, чем генерация в реальном времени. Можно настроить любые параметры аудио: пол, возраст, шёпот. Есть онлайн-демо, сама модель на HuggingFace,

Теги:
+5
Комментарии1

Представлен открытый мультиплатформенный проект Snowify. Это аналог Spotify в виде музыкального плеера с кодом на JavaScript без рекламы и без регистрации. Музыка стримится с YouTube Music. Все функции Spotify на месте: списки треков, текст песен, плейлисты с рекомендациями и даже синхронизация с облаком. При этом в интерфейсе нет ничего лишнего, что отвлекало бы от музыки. Проект поддерживает кастомные плагины.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии2

Сделал тут небольшое приложение для прослушивания музыки из сине белой соцсети

• бесплатно 
• без рекламы
• с офлайн режимом
• не нужно скачивать

Актуально больше всего для ios, так для андроидов есть всякие vkX, но при этом моё приложение не требует авторизации 

Написано на $mol

P.S. Закрепите на рабочем столе как веб приложение

P.P.S Если актуально и нужны новые функции, сделаю за небольшой Донати

накидал за 1 вечер, пишу пост в тот же день
накидал за 1 вечер, пишу пост в тот же день
Теги:
Всего голосов 3: ↑1 и ↓2-1
Комментарии0

Краткая история развития ЭВМ - от механических счётов до современных LLM в рифму за две минуты!

Теги:
Всего голосов 5: ↑1 и ↓4-3
Комментарии0

Изучаем гитару, басс, пианино и музыкальную теорию дома. В сети собрали все нужные сайты с теорией и практикой:

Теги:
Рейтинг0
Комментарии0

Вышел открытый проект Voicebox — локальная нейросеть‑клонер, по сути бесплатная альтернатива ElevenLabs. Это буквально «голосовой фотошоп» без ограничений и подписок. Работает просто: загрузили короткий кусок аудио — получили голос.

  • Клонирует голос по короткому аудио.

  • Генерирует речь из текста любым клоном.

  • Собирает разговоры/подкасты из нескольких голосов.

  • Записывает и расшифровывает аудио.

  • Все работает локально. Все проекты и озвучки хранятся на ПК. Дальше можно озвучивать тексты, видео, презентации, мемы или делать диалоги из нескольких голосов.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Представлена открытая бесплатная ИИ-студия для работы с голосом MimikaStudio.

Проект умеет:

  • клонировать голос по трём секундам;

  • генерировать речь;

  • создавать аудиокниги и озвучивать текст;

  • поддерживает 23 языка, включая русский;

  • работает на ПК с требованием 8 ГБ ОЗУ;

  • работает на macOS, Windows и в веб-версии;

  • есть локальные модели.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Два проекта, с которыми можно выучить нотную грамоту и начать играть на музыкальных инструментах:

  • Muted — музыкальная теория. Гаммы, интервалы, кварто‑квинтовый круг, лады, тональность и остальная нотная грамота. Авторы объясняют материал максимально подробно и чётко, любые звуки можно прослушать и запомнить.

  • Musicca — прокачиваем музыкальный слух и отрабатываем теорию, которую получили с Muted. Ставим аккорды, учимся попадать в ритм, читаем ноты и даже учим сольфеджио.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Открытый проект ebook2audiobook превращает любую электронную книгу в полноценную аудиокнигу. Работает просто: закидываете epub, pdf или даже обычный txt и на выходе получаете готовый аудиофайл с главами, нормальной озвучкой и метаданными. Подойдёт, если не любите читать глазами, но хотите слушать книги в дороге или на тренировке. Работает локально на ПК и поддерживает множество языков и даже умеет клонировать голос. Можно озвучить книгу своим голосом или профессиональным диктором. Идеально для студентов, тех кто учит языки, или просто хочет слушать свои книги офлайн без подписок и облаков.

Теги:
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

Представлен бесплатный открытый проект HeartMuLa, который генерирует музыку на уровне платных ИИ-студий. Это полноценная музыкальная «студия всё в одном»: можно создавать треки по описанию, делать песни в стиле любимых артистов и работать с готовым аудио.

Что умеет HeartMuLa:

  • пишет тексты песен через встроенный чат-бот;

  • генерирует треки с вокалом и текстом длиннее 4 минут;

  • можно загрузить любой аудиофайл, и ИИ перенесёт его вайб и стиль в новый трек;

  • работает даже на слабом железе: локальная версия требует всего ~3 ГБ видеопамяти;

  • простой и понятный интерфейс. Фактически: бесплатный аналог Suno, но без подписок, ограничений и облака;

  • можно ставить локально и делать музыку прямо на своём ПК.

Теги:
Всего голосов 4: ↑2 и ↓2+2
Комментарии6

Ближайшие события

Nvidia представила нейронку PersonaPlex: Voice and Role Control for Full Duplex Conversational Speech Models, которая умеет разговаривать как реальный человек: без пауз, без остановок, без подхалимства и клишированных фраз. Можно вести диалог, перебивать друг друга, исправлять ИИ-собеседника, перестраивать общение. ИИ делает смысловые паузы, варьирует интонацию, использует междометия и даже «угукает», чтобы показать активное слушание. Подстраивается под речь и ситуацию за один промпт.

Проект на GitHub. Ссылка на Hugging Face.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Alibaba выпустила Qwen3-TTS, которую можно запустить локально на ПК. Нейростеть знает 10 языков, включая русский, работает с разными голосами — меняет пол, возраст, национальности, акценты, темп, тембр, а также различные звуковые эффекты. Работает за 0,1 секунды. Токенизатор на 12 Гц — можно максимально сжимать любое аудио без потери качества.

Ссылка на GitHub. Онлайн-демо доступно тут.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Представлен проект нейросети для звуковой генерации HeartMuLa, которая умеет создавать треки студийного качества, клонировать голоса и вставлять их в песни, умеет также делать транскрибции треков через Whisper.

Репозиторий проекта, ссылка на Hugging Face и на портал ModelScope

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Представлен открытый проект Handy, который освобождает руки пользователя и превращает микрофон в клавиатуру. Работает в Word, Telegram и даже в VS Code. Можно диктовать тексты в любом формате, приложении и любым голосом. Под капотом: Whisper от OpenAI или Parakeet от Nvidia. Все нейронки понимают русский. Проблем со вводом не будет. Работает полностью локально — все вычисления идут только на ПК. Сервис отсекает шумы, помехи, чихи и шмыганья — на выходе получается чистый звук, который идёт в такой же выверенный текст. Работает на macOS, Windows и Linux. Простой и понятный интерфейс. Разработчик регулярно обновляет решение.

Теги:
Всего голосов 8: ↑7 и ↓1+6
Комментарии6

Как подключить беспроводные наушники к... чему угодно.

В моём случае было желание подключить беспроводные наушники к телевизору, чтобы иметь возможность смотреть кино и не мешать (звуком) другим.

Ранее использовал радио наушники, база у которых подключалась через 3.5мм джек к аудио входу, но это были полноразмерные наушники (полностью закрывают уши), а я часто использую либо левый, либо правый наушник, чтобы иметь связь с окружающей реальностью ))) Так что начал искать вариант для моих Bluetooth наушников.

Итоги поисков завершились покупкой устройства, которое можно найти на AliExpress в поиске как "многофункциональный Bluetooth аудио приемник-передатчик".

В моём случае подключен через оптический аудио выход на телевизоре. В наличии также обычный 3.5мм jack, переходник jack на тюльпаны и coaxial. Работает и как приемник, и как передатчик.

Позволяет подключать 2 пары наушников.

...может кому то пригодится.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Открытый проект SpotX позволяет бесплатно слушать Spotify без рекламы и со всеми Premium-опциями. Всё, что нужно — актуальная версия Spotify и запустить на ПК одну команду.

Для Windows пишем в Powershell: iex "& { $(iwr -useb 'https://raw.githubusercontent.com/SpotX-Official/SpotX/refs/heads/main/run.ps1') } -new_theme".

Для MacOS, пишем в Терминале: bash <(curl -sSL https://spotx-official.github.io/run.sh).

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии1

$500 тысяч долларов в месяц заработал разработчик будильника для iPhone. Разработчик выпустил приложение, где просто сделал сигнал в несколько раз громче стандартного решения от Apple. Приложение стало популярным в App Store.

Теги:
Всего голосов 7: ↑6 и ↓1+6
Комментарии0