Pull to refresh
23
0
AigizK @AigizK

User

Send message

В случае с ChatGPT можно сделать возможность указать свой токен и пусть запросы идут из клиента. Или если это сложно, просто довериться тебе.
Для яндекс,bing, goolgle можно так же указать токены и пусть из сервера по API перевод запрашивает.
Если есть переводчики для этого языка, которые могут работать без токена, то их можно то же включить. Например для башкирского есть https://bashkortsoft.ru/ где просто POST запрос. Для малых языков как правило первым появляется свой переводчик и только потом они в Яндекс/Bing/Google добавляются.

Спасибо большое. Очень крутые инстурменты и инструкции. Особенно для тех языков, где данных очень мало.
По поводу SuperMinor предлагаю сделать такую доработку: подключить переводчики или даже чатжпт. Например при переводе вики можно использовать автоматический перевод NLLB. Человек обычно переводит автоматом, а потом правит руками. Это намного быстрее, нежели самому писать весь перевод.

цвет ссылки показывает, что я уже заходил на не ваш сайт

Ну скорее для госслужащих эти телефоны. У них выбор или этот телефон или кнопочный.

Наверное сложно конкурировать с lego mindstorms. Да лего дороже, но тратят ведь не свои деньги. А зато столько соревнований по лего проводятся.
А так жалко конечно, прикольные проекты. Но порог вхождения слишком высокий, нужен учитель, который разберется, нужны площадки, где ты можешь показать свои достижения. Без комьюнити сложно.

Прикольный дисплей, спасибо за наводку.

Теперь осталось посадить эту колонку на робота курьера от Яндекса и вот у тебя дома умный робот. Круто, молодцы. Сам сейчас собираю умную колонку и там столько нюансов, начиная от корпуса, заканчивая ML моделями, а тут еще и экран 😄

То что 4+ намного лучше и больше знает, соглашусь. Но простые задания, ради которых раньше отдельные модели пришлось бы тренировать, сейчас мы начали решать с помощью OpenChat. Можете тут поиграться: https://openchat.team/

Не так давно? 4 месяца уже как. Да и уже есть OpenChat 7B на уровне ChatGPT 3.5

У чатжпт галлюцинации можно легко отследить. Вы же даете известный текст, результат от чатжпт переводите обратно в нижний регистр и удаляете все знаки и сравниваете два текста. Если отличаются, там галлюцинации. Можно этот только кусок дать еще раз.
А так написали про Whisper. И вот его можно натравить на всяких блогеров, интервьюверов и насобирать еще больше датасета. Там возможно домен будет еще ближе к решаемым задачам.

А за статью и исходники большое спасибо.

Надо сказать, что они еще добавили поддержку новых малоресурсных языков, например мой родной башкирский. Качество перевода лучше чем у Bing,Yandex,NLLB-200,Glosbe. Хорошо понимает культуру, обычаи. Пока нет синтеза и распознавания речи, распознавания текста на картинке. Но с такими темпами, думаю не долго ждать.

С чего это дешевле? Разработка дизайна матрицы + сама матрица 3-10М. Потом каждый корпус будет стоить как 70-150% от стоимости текущих корпусов на 3D принтере. Ведь тут не миллионные тиражи.

Сами клавиши то же печатаете на 3D принтере? Если да, то как получаете такую гладкую поверхность?

А где корпус делали? У вас скорее мелкосерийное производство, а корпус выглядит как заводской.

Закрытые данные - это беда для всех языков. Особенно бесит, когда институт выиграл под это дело грант государственный, а потом не делится.
На Силеро зря ругаетесь. Так то частная компания, которая давала возможность пользоваться бесплатно своими продуктами(не для ком пользования конечно).
То что у вас лучше и открыто(сам пользуюсь вашей библиотекой, спасибо огромное!) позволит создавать еще качественнее TTS-ки. А всякие институты пусть и дальше сидят со своими данными.

Какова вероятность обучить по аналогии Сайги и на другие языки народов РФ и получить приемлемый результат?

Спасибо большое за такой подарок.
Кто нибудь еще бы выложил скрипты для обучения под nstruct,chat и тд :)

Ссылки в "Готовое решение" не работают

Мне кажется, если сделаете сразу ggml формат с разными версиями квантизации, упростите всем жизнь. Не у всех все таки A100 имеется, как у сбера 😁

Information

Rating
Does not participate
Date of birth
Registered
Activity