Что скажете насчет этого решения? Они утверждают, что достаточно 50 примеров, чтоб обучить робота. Плюс, имея всякие Vision LLM, SAM можно уже просто голосом давать команду. В эту сторону не копали еще?
model = transformers.AutoModelForCausalLM("path/to/llama/model")
# Adding this line automatically monkey-patches the model with the optimized Liger kernels
apply_liger_kernel_to_llama()
Утверждают, что можно на 20% быстрее обучить и потребление VRAM меньше на 60%
Я правильно понимаю, вы взяли Mistral-7B, добавили доп токены, и дообучили на своих данных? Если так, то почему у вас всякие суммаризации перестали работать?
Если тут есть казахи, скиньте видео. Хотел посмотреть, как работает переключение языка. Как понимает запросы, содержащие два языка. Как реагирует на просьбы отвечать на том или ином языке, может ли часть предложения на одном, а часть на другом говорить. При этом голоса на казахском и русском одинаковы или нет, есть ли акцент.
На днях человеку с БАС сделал телеграм бот. Он отправляет текстовое сообщение, в ответ получает аудиосообщение со своим голосом(свой голос= синтез речи+клонирование голоса). Он планирует использовать блютуфт колонку для воспроизведения. Сейчас тестирует
Достаточно в гугле набрать sberdevices qled 4k uhd и вот они ваши телевизоры это если сайт позволяет так фильтровать. а есть сайты, особенно на старых ms webforms, где все ваши фильтры применялись без изменения url.
Для себя увидел хороший кейс автоматизировать sbermarket. чтоб заранее система подготовила скрины со страницами товаров и в ТГ просто отправлял с запросом "Купить? Да/Нет". Пришел, сфоткал холодильник, отправил тг боту, через некоторое время минуты за 2-3 подтвердил все позиции из корзины и свободен. а то сейчас на это по 20-30 минут у жены уходит :(
В случае с ChatGPT можно сделать возможность указать свой токен и пусть запросы идут из клиента. Или если это сложно, просто довериться тебе. Для яндекс,bing, goolgle можно так же указать токены и пусть из сервера по API перевод запрашивает. Если есть переводчики для этого языка, которые могут работать без токена, то их можно то же включить. Например для башкирского есть https://bashkortsoft.ru/ где просто POST запрос. Для малых языков как правило первым появляется свой переводчик и только потом они в Яндекс/Bing/Google добавляются.
Спасибо большое. Очень крутые инстурменты и инструкции. Особенно для тех языков, где данных очень мало. По поводу SuperMinor предлагаю сделать такую доработку: подключить переводчики или даже чатжпт. Например при переводе вики можно использовать автоматический перевод NLLB. Человек обычно переводит автоматом, а потом правит руками. Это намного быстрее, нежели самому писать весь перевод.
Наверное сложно конкурировать с lego mindstorms. Да лего дороже, но тратят ведь не свои деньги. А зато столько соревнований по лего проводятся. А так жалко конечно, прикольные проекты. Но порог вхождения слишком высокий, нужен учитель, который разберется, нужны площадки, где ты можешь показать свои достижения. Без комьюнити сложно.
Теперь осталось посадить эту колонку на робота курьера от Яндекса и вот у тебя дома умный робот. Круто, молодцы. Сам сейчас собираю умную колонку и там столько нюансов, начиная от корпуса, заканчивая ML моделями, а тут еще и экран ?
Что скажете насчет этого решения? Они утверждают, что достаточно 50 примеров, чтоб обучить робота. Плюс, имея всякие Vision LLM, SAM можно уже просто голосом давать команду. В эту сторону не копали еще?
у RNNT качество лучше судя по их метрикам.
А GIGA AM какую использовали? GigaAM-CTC или GigaAM-RNNT?
код выпущен год назад. за это время ничего нового не появилось что ли?
Надо попробовать использовать Liger Kernel(https://github.com/linkedin/Liger-Kernel). Вроде достаточно добавить строку:
Утверждают, что можно на 20% быстрее обучить и потребление VRAM меньше на 60%
анализируете каждый кадр? или применяете какие то оптимизации, например анализ только i-frames
как получаете данные от ТВ
А почему печка, а не конвейрная лента?
И визуальный осмотр на компьютер вижен может заменить?
Я правильно понимаю, вы взяли Mistral-7B, добавили доп токены, и дообучили на своих данных?
Если так, то почему у вас всякие суммаризации перестали работать?
И про архитектуру можете сказать?
Если тут есть казахи, скиньте видео. Хотел посмотреть, как работает переключение языка. Как понимает запросы, содержащие два языка. Как реагирует на просьбы отвечать на том или ином языке, может ли часть предложения на одном, а часть на другом говорить. При этом голоса на казахском и русском одинаковы или нет, есть ли акцент.
Ты же говорил, что у тебя N см
Дак я же измерял когда метр еще был короче
На днях человеку с БАС сделал телеграм бот. Он отправляет текстовое сообщение, в ответ получает аудиосообщение со своим голосом(свой голос= синтез речи+клонирование голоса). Он планирует использовать блютуфт колонку для воспроизведения. Сейчас тестирует
Для себя увидел хороший кейс автоматизировать sbermarket. чтоб заранее система подготовила скрины со страницами товаров и в ТГ просто отправлял с запросом "Купить? Да/Нет". Пришел, сфоткал холодильник, отправил тг боту, через некоторое время минуты за 2-3 подтвердил все позиции из корзины и свободен. а то сейчас на это по 20-30 минут у жены уходит :(
В случае с ChatGPT можно сделать возможность указать свой токен и пусть запросы идут из клиента. Или если это сложно, просто довериться тебе.
Для яндекс,bing, goolgle можно так же указать токены и пусть из сервера по API перевод запрашивает.
Если есть переводчики для этого языка, которые могут работать без токена, то их можно то же включить. Например для башкирского есть https://bashkortsoft.ru/ где просто POST запрос. Для малых языков как правило первым появляется свой переводчик и только потом они в Яндекс/Bing/Google добавляются.
Спасибо большое. Очень крутые инстурменты и инструкции. Особенно для тех языков, где данных очень мало.
По поводу SuperMinor предлагаю сделать такую доработку: подключить переводчики или даже чатжпт. Например при переводе вики можно использовать автоматический перевод NLLB. Человек обычно переводит автоматом, а потом правит руками. Это намного быстрее, нежели самому писать весь перевод.
цвет ссылки показывает, что я уже заходил на не ваш сайт
Ну скорее для госслужащих эти телефоны. У них выбор или этот телефон или кнопочный.
Наверное сложно конкурировать с lego mindstorms. Да лего дороже, но тратят ведь не свои деньги. А зато столько соревнований по лего проводятся.
А так жалко конечно, прикольные проекты. Но порог вхождения слишком высокий, нужен учитель, который разберется, нужны площадки, где ты можешь показать свои достижения. Без комьюнити сложно.
Прикольный дисплей, спасибо за наводку.
Теперь осталось посадить эту колонку на робота курьера от Яндекса и вот у тебя дома умный робот. Круто, молодцы. Сам сейчас собираю умную колонку и там столько нюансов, начиная от корпуса, заканчивая ML моделями, а тут еще и экран ?