Конечно, этот вопрос предусмотрен методикой text-to-SQL, иначе подхода не существовало бы. Смотрите примеры промтов во второй части статьи, в которых одновременно с основным запросом в языковую модель передаются схема базы данных (схемы всех либо подходящих по контексту таблиц) и, при наличии и необходимости, словарь знаний (являющийся просто набором фактов в свободной форме, часто размеченных в виде XML или JSON).
Как мне кажется, омонимизация далеко не всегда препятствует появлению имён собственных в русском языке. Хотя подобные правила есть, скажем, с правописанием частицы «не» — слитное или раздельное написание выбирается, кроме всего прочего, исходя из того, имеет ли слитная форма иное устоявшееся значение.
Думаю, многие согласятся с тем, что написание «Карпаты» довольно-таки чужеродно для русского языка, тем более что словацкий язык имеет невероятно схожие корни.
Плюс таблица ниже в статье на «Википедии» предлагает альтернативные способы транслитерации фамилий-прилагательных — с окончанием не только -ы, но и -ый. Подтверждение из справочника Калакуцкой (подраздел «Польские и чешские фамилии на -ский, -цкий»):
Вследствие родства русского и словацкого языков, при транскрипции имён собственных и названий со словацкого (как и с других славянских языков) учитываются многочисленные традиции, выражающиеся в оформлении фамилий по русскому образцу, в переводе отдельных частей географических названий и т. д. Так, например, словацкие фамилии, оканчивающиеся на ‑ký, передаются с помощью русского окончания ‑кий: Jablonický → Яблоницкий. В случае если перед ‑ý находится другая согласная (не k), то подобного рода транскрипция не производится: Hollý → Голли.
Да, тоже в какой-то момент захотелось добавить Gemini 2.5 Pro. Попробую уделить больше внимания этой модели в следующий раз.
Все запросы были заданы на русском, ведь для сегодняшних крупных моделей не составляет труда понимание нюансов разных языков. Промты приведены в идентичном виде, как я их писал в интерфейсе чат-бота.
Мне не удалось проверить, так как сервис (кажется) распознал наличие ВПН; причём зарегистрироваться в нём удалось, но сгенерить хотя бы один тест — уже нет. Но в списке на гланой, действительно, есть русский язык, так что он стопроцентно поддерживается.
Не совсем так. Мы тестируем, как уменьшенное число параметров сказывается на возможностях нейросетей, что модель теряет, а что нет. Обзоры локальных моделей полезны тем, кто собирается подключать их полностью через свой компьютер.
Спасибо, что напомнили! Один фрагмент я удалил из статьи, но всё же напишу его здесь в комментах:
***
Некоторые сервисы не включены в обзор: • Те, у которых сравнительно меньшее число параметров. Например, по этой причине решил не брать Qwen'ы (их модели содержат до 72 млрд параметров), Mistral'ы (до 123 млрд) и некоторые другие. Однако YandexGPT-5-Pro, также основанный на Qwen, включил в тест — и не зря, — поскольку модель дообучена на российских датасетах. • Мини-версии моделей, такие как 4o-mini или Grok-3-mini. В то же время они, как известно, хорошо показывают себя в областях STEM-наук и программирования. • Сервисы с очень низким качеством проверки, такие как LanguageTool. Сперва даже может показаться, что проверяет лишь орфографию, но это не так — к примеру, сервис распознает отсутствующую запятую перед союзом «а». В основном сервис заточен под орфографию. • Гигантская модель ChatGPT-4.5, так как, судя по обещаниям Альтмана, к ней скоро могут прикрыть доступ (в интерфейсе OpenAI она уже начала исчезать, но в API пока еще держится). • Сервис «Орфограммка». Предназначен для интерактивной проверки, где, как в Word, вы можете щелкать по выделенным фрагментам текста и выбирать одно из исправлений. Здесь распознаются не только ошибки, но и предлагаются улучшения, например устранения речевых штампов. Однако этот метод проверки, во-первых, полуавтоматический, а во-вторых, некоторые исправления предполагают по несколько вариантов правки, что будет уже не так честно по отношению к остальным участникам. Ну и это затруднило бы сравнение с остальными оппонентами.
Да, формат ссылки именно такой.
Конечно, этот вопрос предусмотрен методикой text-to-SQL, иначе подхода не существовало бы. Смотрите примеры промтов во второй части статьи, в которых одновременно с основным запросом в языковую модель передаются схема базы данных (схемы всех либо подходящих по контексту таблиц) и, при наличии и необходимости, словарь знаний (являющийся просто набором фактов в свободной форме, часто размеченных в виде XML или JSON).
Здравствуйте! Напишите в телеграме вот сюда: https://t.me/bothub_chat/25302.
Все фильмы ещё находятся в производстве.
Спасибо, поправил!
Как мне кажется, омонимизация далеко не всегда препятствует появлению имён собственных в русском языке. Хотя подобные правила есть, скажем, с правописанием частицы «не» — слитное или раздельное написание выбирается, кроме всего прочего, исходя из того, имеет ли слитная форма иное устоявшееся значение.
Точного регламента нет, но для русского языка более удобно с окончанием -ый (смотрите коммент ниже).
Думаю, многие согласятся с тем, что написание «Карпаты» довольно-таки чужеродно для русского языка, тем более что словацкий язык имеет невероятно схожие корни.
Плюс таблица ниже в статье на «Википедии» предлагает альтернативные способы транслитерации фамилий-прилагательных — с окончанием не только -ы, но и -ый. Подтверждение из справочника Калакуцкой (подраздел «Польские и чешские фамилии на -ский, -цкий»):
Готово, статья открыта.
(https://ru.wikipedia.org/wiki/Словацко-русская_практическая_транскрипция)
Кстати, добавил в конце новости ещё одно демонстрационное видео)
Добавил в конце новости ещё одно видео, где есть более реалистичные генерации)
Да, тоже в какой-то момент захотелось добавить Gemini 2.5 Pro. Попробую уделить больше внимания этой модели в следующий раз.
Все запросы были заданы на русском, ведь для сегодняшних крупных моделей не составляет труда понимание нюансов разных языков. Промты приведены в идентичном виде, как я их писал в интерфейсе чат-бота.
Мне не удалось проверить, так как сервис (кажется) распознал наличие ВПН; причём зарегистрироваться в нём удалось, но сгенерить хотя бы один тест — уже нет. Но в списке на гланой, действительно, есть русский язык, так что он стопроцентно поддерживается.
Насчёт MCP (Model Context Protocol) пока не могу сказать — хотелось бы сперва глянуть на реализацию, когда она будет опубликована. Впрочем, в любом случае можно обудет подключиться через API: https://bothub.chat/api/documentation/ru/, https://bothub.chat/api/documentation/ru/configuration, https://bothub.chat/api/documentation/ru/text_generation.
Добрый день! В сервисе BotHub есть интернальный загрузчик сайтов, который разбирает ссылки в промте пользователя и преобразует их в текстовый контент.
Не совсем так. Мы тестируем, как уменьшенное число параметров сказывается на возможностях нейросетей, что модель теряет, а что нет. Обзоры локальных моделей полезны тем, кто собирается подключать их полностью через свой компьютер.
Это не так, в нём даже есть кнопка «Исправить».
Постараюсь сделать дополнение в виде статьи или поста!
Спасибо, что напомнили! Один фрагмент я удалил из статьи, но всё же напишу его здесь в комментах:
***
Некоторые сервисы не включены в обзор:
• Те, у которых сравнительно меньшее число параметров. Например, по этой причине решил не брать Qwen'ы (их модели содержат до 72 млрд параметров), Mistral'ы (до 123 млрд) и некоторые другие. Однако YandexGPT-5-Pro, также основанный на Qwen, включил в тест — и не зря, — поскольку модель дообучена на российских датасетах.
• Мини-версии моделей, такие как 4o-mini или Grok-3-mini. В то же время они, как известно, хорошо показывают себя в областях STEM-наук и программирования.
• Сервисы с очень низким качеством проверки, такие как LanguageTool. Сперва даже может показаться, что проверяет лишь орфографию, но это не так — к примеру, сервис распознает отсутствующую запятую перед союзом «а». В основном сервис заточен под орфографию.
• Гигантская модель ChatGPT-4.5, так как, судя по обещаниям Альтмана, к ней скоро могут прикрыть доступ (в интерфейсе OpenAI она уже начала исчезать, но в API пока еще держится).
• Сервис «Орфограммка». Предназначен для интерактивной проверки, где, как в Word, вы можете щелкать по выделенным фрагментам текста и выбирать одно из исправлений. Здесь распознаются не только ошибки, но и предлагаются улучшения, например устранения речевых штампов. Однако этот метод проверки, во-первых, полуавтоматический, а во-вторых, некоторые исправления предполагают по несколько вариантов правки, что будет уже не так честно по отношению к остальным участникам. Ну и это затруднило бы сравнение с остальными оппонентами.