VibeVoice может довольно качественную русскую речь генерировать локально, но для модели максимального качества рекомендуется 24гб vram, и да голос там можно любой, достаточно образца секунд на 10, я брал от сюда Telegram
не знаю о чём вы, у меня нет айфона что бы проверить как оно именно там работает, но судя по скринам, но нет там чёрной подложки, серый только вижу, но местами всё же есть именно прозрачность с сильным блюром
а мне наоборот понравилось жидкое стекло, в настройках можно вернуть старую размытую прозрачность, но оно пока действительно не везде идентичное, где та пресловутая магия эпла где всё подогнано чётко и качественно, действительно разные окна имеют разные кнопки закрытия по размеру и разного дизайна, а так же разные радиусы скругления у окон и даже разный масштаб интерфейса..
у меня на М1 по началу лагала только анимация предпросмотра (просто на пробел) по ощущениям там было 25-30фпс, а затем перестала, даже на 4к мониторе, единственное что удручает это высокий инпут лаг по сравнению с вин 11 машиной
я с этим новым поиском понял что в принципе не плохой вариант если добавить учёт выбранного языка (а скорее наоборот), например я хочу запустить терминал и при нажатии на кнопку с буквами N/Т его покажет только если выбрана рус. раскладка, а при англ уже не покажет, там только на T/Е клавише, лишний раз смотреть на раскладку так себе решение, вот если бы кто написал такую замену поиска, думаю даже купил бы такой продукт
p.s. может быть можно даже расширение какое то написать для уже нового стокового поиска
можно сделать регулировку размытия, желательно плавную, что бы каждый себе в меру настроил бы прозрачность, сейчас там можно вернуть старый вариант в настройках, но я хотел бы просто плавную регулировку и что бы она везде была одинаковой, сейчас на виджетах и в нижней панели почему то есть различия, + вроде как говорили что этот эффект стекла должен будет сам под фон подстраиваться что бы всё было читабельно
думаю там нет проблемы с тем что он определяет ваш скрытый ip, скорее всего ваш сервер имеет ip который заблочен гуглом (у меня так же (NL)), я себе просто поставил отдельно хромиум с бесплатным расширением впн, и тудой всё работает
предполагаю что это часть стеклянно / прозрачного интерфейса, так же как и "Frutiger Aero", мне лично он нравится как и новый стиль у apple liquid glass
и для этого ставить приложение? вместо того что бы нажать на ссылку и двойным кликом прослушать файл прямо в браузере? и где гарантия что голосовой чат будет именно эту модель использовать + что оно не потребует регистрации?
подскажите, если не ошибся модель весит ~650гб, активных 27b параметров (если судить по gemma 3 27b это около 17gb) то из моего опыта с gpt-oss её реально запустить на 700gb ram + 24/32gb vram с приемлемой скоростью?
ну сколько можно новостную ленту засорять changelog-ами..
VibeVoice может довольно качественную русскую речь генерировать локально, но для модели максимального качества рекомендуется 24гб vram, и да голос там можно любой, достаточно образца секунд на 10, я брал от сюда Telegram
не знаю о чём вы, у меня нет айфона что бы проверить как оно именно там работает, но судя по скринам, но нет там чёрной подложки, серый только вижу, но местами всё же есть именно прозрачность с сильным блюром
Скрытый текст
кстати вдруг кому пригодиться, там есть эта обои-на в разрешении чуть выше чем 4к, помню что долго её искал Google Drive
ну время такое, я то же многие проекты так пишу и они работают без проблем, лучше уж так чем совсем не будет такого проекта
а мне наоборот понравилось жидкое стекло, в настройках можно вернуть старую размытую прозрачность, но оно пока действительно не везде идентичное, где та пресловутая магия эпла где всё подогнано чётко и качественно, действительно разные окна имеют разные кнопки закрытия по размеру и разного дизайна, а так же разные радиусы скругления у окон и даже разный масштаб интерфейса..
у меня на М1 по началу лагала только анимация предпросмотра (просто на пробел) по ощущениям там было 25-30фпс, а затем перестала, даже на 4к мониторе, единственное что удручает это высокий инпут лаг по сравнению с вин 11 машиной
я с этим новым поиском понял что в принципе не плохой вариант если добавить учёт выбранного языка (а скорее наоборот), например я хочу запустить терминал и при нажатии на кнопку с буквами N/Т его покажет только если выбрана рус. раскладка, а при англ уже не покажет, там только на T/Е клавише, лишний раз смотреть на раскладку так себе решение, вот если бы кто написал такую замену поиска, думаю даже купил бы такой продукт
p.s. может быть можно даже расширение какое то написать для уже нового стокового поиска
можно сделать регулировку размытия, желательно плавную, что бы каждый себе в меру настроил бы прозрачность, сейчас там можно вернуть старый вариант в настройках, но я хотел бы просто плавную регулировку и что бы она везде была одинаковой, сейчас на виджетах и в нижней панели почему то есть различия, + вроде как говорили что этот эффект стекла должен будет сам под фон подстраиваться что бы всё было читабельно
думаю там нет проблемы с тем что он определяет ваш скрытый ip, скорее всего ваш сервер имеет ip который заблочен гуглом (у меня так же (NL)), я себе просто поставил отдельно хромиум с бесплатным расширением впн, и тудой всё работает
основная проблема это качество сетки
чепуха, у меня и на телефоне и на пк и на маке видеообои..
предполагаю что это часть стеклянно / прозрачного интерфейса, так же как и "Frutiger Aero", мне лично он нравится как и новый стиль у apple liquid glass
Будущее, которое так и не наступило
и для этого ставить приложение? вместо того что бы нажать на ссылку и двойным кликом прослушать файл прямо в браузере? и где гарантия что голосовой чат будет именно эту модель использовать + что оно не потребует регистрации?
и?
хоть бы примеры выложили качества...
сделал пример
p.s. как по мне качество хуже чем в локальной VibeVoice где можно ещё и любой голос добавить из образца (так же есть в примере)
p.s.s. сделал ещё пару генераций, чуть получше стало, без странных пауз, но всё же не дотягивает до VibeVoice
только как я тогда запускал gpt-oss 120b на rtx 3060 12gb + 128gb ram при 7 ток/с
подскажите, если не ошибся модель весит ~650гб, активных 27b параметров (если судить по gemma 3 27b это около 17gb) то из моего опыта с gpt-oss её реально запустить на 700gb ram + 24/32gb vram с приемлемой скоростью?
интересно какой там принцип? фотоны же не чего не весят? или там эффект как у солнечных эл. панелей? или нагрев и испарение материала с поверхности?
не нужна, но и качество / скорость / пинг , не как у старлинка (через оборудование старлинка)