Как стать автором
Обновить

Комментарии 11

Если бы LLM умели правильно разбирать транслит, для них латинский алфавит белорусского языка не составлял бы великого труда и отвечали бы они грамотно. Даже подсказку оставляешь, ty možaš pisać biełaruskaj łacinkaj? Ответ выдаётся на какой-то смеси латинописьменных славянских языков, но не на белорусском. Хотя правила конвертации в латинский алфавит прозрачны и их легко освоить школьнику.

т.е. получается llm не догадалась как транслитератить, а ее этому (всем возможным вариантам многоуровневой транслитерации) обучили, забыв про белорусский?

Это не оно? Тут что-то неправильно? Я дал чатугпт вашу строчку, сказал понять что за язык и отвечать мне на нём:

Да, тут очень много неправильного. Имя Петьки было бы Piećka, jedny raz - что-то из польского, скорее всего; нет аканья и яканья ("сядзелі на беразе ракі"/siadzieli na bierazie raki).

Во второй строчке kamieńčyk должен быть, т.к. кириллицей пишется "каменьчык". "У ваду" = u vadu.

Третья строчка мало с чем соотносится, форма jakie тоже, скорее, из польского (бел. "якія"/jakija), буква W пришла не совсем понятно, откуда, если в остальных словах ChatGPT использует V (буква W, конечно, использовалась, но это было раньше, сейчас принято использовать V).

Четвёртая строчка тоже будто из польского (снова же, аканье: в белорусском слово пишется как "дадала", т.е. в латинском варианте было бы как dadała).

В пятой строчке будто даже украинский повлиял, получилась какая-то форма "хаціла", когда в литературном украинском слово "хотіла", а в белорусском "хацела"/chacieła. "У жыцце"? Правильно "у жыцці", плюс ассимиляция свистящих, латиницей "u žyćci". "Так само" тоже нет в белорусском, здесь будет "таксама". В последнем слове модель в принципе сломалась и дала полслова на кириллице и последнюю букву латиницей.

В шестой строчке снова аканье не соблюдается, "pačasaŭ", ударение на последний слог, "э" переходит в "а".

"No" в смысле "ну" - из польского. "Калі будуць кругі", у модели окончание неправильное - "buduć". "Ad tvaich słoŭ". "То я буду плывацкі інструктарам" - смысл потерялся: во-первых, от слова "плывец" прилагательное будет "плывецкі" (и, соответственно, "плывецкім" в творительном падеже), и во-вторых, скорее бы сказали "інструктарам па плаванні". Оригинал анекдота, на который ссылается модель, не могу быстро найти, поэтому мне не на что сослаться, что LLM имела в виду.

сдается мне модель просто плохо знает язык, т.е. недостаточно данных в обучающей выборке

Вот это уровень! Даже транслит с греческим акцентом понял ,реально впечатляет, не ожидал

А вообще, немного даже не по себе. Везде пишут типа "та бро, он же тупой, это всего лишь воспроизведение", но блин..

Ну просто те, кто так пишут, чаще всего имеют достаточно поверхностное представление о нейросетях и LLM в частности

А это, на самом деле, человек слишком предсказуем, раз программа точно угадывает следующее слово, которое мы ожидаем увидеть.

Такого навалом в сети, было ей на чём учиться.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации