Похоже на морфологический анализатор и поиск по словарю и фразам. Если бы на марийском был словарь типа wiktionary, то можно было бы сделать что-то простое в таком духе.
Что можно сделать, так это поиск похожей фразы по смыслу в базе предложений или пример использования этого слова в другом предложении.
Привет, спасибо. В SuperMinor идея не сделать машинный перевод, а получить набор данных, чтобы можно было обучить на них нечто вроде чат-бота. Сами тексты будут на русском, а носители языков смогут их переводить на свой язык.
Это, конечно, можно будет в дальнейшем использовать для улучшения моделей машинного перевода. Но суть в том, чтобы сначала получить такие данные при помощи людей. Если вы являетесь носителем языка, для которого смогли бы перевести тексты, то тоже сможете подключиться к работе.
Для регистрации Сбер ID быть клиентом не обязательно, это просто способ аутентификации. И за пару невинных запросов тоже вроде бы ничего не цензурится.
Ограничение тем типа наркотиков, убийств и т.д. на обычные профессиональные кейсы типа сочинения текстов и генерации контента не должно влиять, если вы не политический обозреватель.
Для генерации стихов есть ряд хороших моделей у Ильи Козиева, советую их попробовать. И можно пряму у него поинтересоваться последними достижениями в этой области.
А какой системный промпт лучше использовать, если хочется погенерировать сказки через API GigaChat'а?
Тау.
Похоже на морфологический анализатор и поиск по словарю и фразам. Если бы на марийском был словарь типа wiktionary, то можно было бы сделать что-то простое в таком духе.
Что можно сделать, так это поиск похожей фразы по смыслу в базе предложений или пример использования этого слова в другом предложении.
Привет, спасибо. В SuperMinor идея не сделать машинный перевод, а получить набор данных, чтобы можно было обучить на них нечто вроде чат-бота. Сами тексты будут на русском, а носители языков смогут их переводить на свой язык.
Это, конечно, можно будет в дальнейшем использовать для улучшения моделей машинного перевода. Но суть в том, чтобы сначала получить такие данные при помощи людей. Если вы являетесь носителем языка, для которого смогли бы перевести тексты, то тоже сможете подключиться к работе.
Ну да, просто тут упор на малые языки и к качеству автоматического перевода большие вопросы.
Так-то можно просто предварительно добавить машинный перевод, а пользователи пусть исправляют.
Можно, а ты думаешь будет нормально работать с башкирским, чувашским и т.д.?
Прокуратура
Попробуйте поиграться с промптом
Видимо, да
Да банально политика, наркотики, суицид и другие пободные вещи. Просто про смерть, кстати, отвечает.
Для регистрации Сбер ID быть клиентом не обязательно, это просто способ аутентификации. И за пару невинных запросов тоже вроде бы ничего не цензурится.
Ограничение тем типа наркотиков, убийств и т.д. на обычные профессиональные кейсы типа сочинения текстов и генерации контента не должно влиять, если вы не политический обозреватель.
Желаю всем добиться желаемого и просто хорошо провести время!
Принято, спасибо.
Ага, yandexgpt — это 33B, а yandexgpt-lite — 7B, правильно?
Для генерации стихов есть ряд хороших моделей у Ильи Козиева, советую их попробовать. И можно пряму у него поинтересоваться последними достижениями в этой области.
https://habr.com/ru/companies/sberdevices/articles/660717/
Замеры производятся разметчиками на специальных платформах. Коллеги поправят, но, по-моему, перекрытие равнялось пяти.
Петр, привет. Мы обязательно перезамерим модели.
Подскажи, пожалуйста, а в документации где-то есть список доступных моделей и их характеристики? Так сразу не обнаружил.
А для какого дела хотели использовать?