Aliaksei_Rudak1 авг 2023 в 06:57

Переводчик ChatGPT против моего: кто кого?

Простой

4 мин

6.8K

Я пиарюсь

Комментарии 19

isBlaze 1 авг 2023 в 07:10

Вы конечно правы, что перевод в ChatGPT имеет особенности. Высокая цена, определенная доля рандома, фильтры толерастии. Но при этом, чатгпт — инструмент "всё в одном". Мы можем сгенерировать текст по запросу, поправить, перевести, проанализировать и получить код для выкладки в блог с форматированием. и всё в одном окне. поэтому, в силу простоты, он вполне отъест некоторую нишу у переводчиков в том числе.

Aliaksei_Rudak 1 авг 2023 в 07:21

На мой взгляд, ChatGPT будет захватывать большую нишу у компаний, которые занимаются локализацией, там где еще большая доля перевода человеком. Например: перевод игр, инструкций к технике или каких-то сложных вещей, где нужно перевести простыми словами, чтобы понять смысл.

zag2art 1 авг 2023 в 15:11

Скоро они отберут ваш хлеб почти полностью. Практика показывает, что машинная мощь все решает. Рано или поздно. Так было с кучей областей. В шахматах сначала самыми умными были программы, построенные на хитрых алгоритмах - а по итогу всех победила система осуществляющая чуть-ли не полный перебор. То же в Го, в компьютерном зрении и т.д. Прочтите статью - https://www.cs.utexas.edu/~eunsol/courses/data/bitter_lesson.pdf Может быть ее стоило бы перевести для Хабра

Aliaksei_Rudak 1 авг 2023 в 17:39

В ближайшем будущем будет замена рутинного труда, который легко автоматизировать. Все, что посложнее - вряд ли. Когда тот же ChatGPT сможет мне написать плагин для перевода сайта на Wordpress или Joomla, который будет работать, тогда может и поверю. В данный момент - вряд ли.

andrey_gavrilov 23 сен 2023 в 10:07

Да съест он ваш хлеб, и не подавится, это вообще даже не является предметом сомнений. И от вашей веры или неверия, желание или нежелания признать Реальность это вообще никак не зависит.

Единственное что здесь можно делать на вашем месте, это двигать ворота этого самого "в ближайшее время" или пытаться в сказанные вами "в данный момент" точка но факт - это не изменит: съест он ваш хлеб. Он, нейросетей ИИ, в итоге всех людей хлеб съест. Другое дело он этим нас накормит, напоит и обеспечит так, как мы и не мечтали, но факт фактом: с ИИ/ роботами с ИИ за работы, внешние по отношению к человеку, Человек не сможет конкурировать.

Helgy716 1 авг 2023 в 07:49

Пожалуйста, приводите графики от нуля, а то разница 91-93 у вас выглядит устрашающе.

Aliaksei_Rudak 1 авг 2023 в 07:49

спасибо, я уже заметил это )

Firsto 1 авг 2023 в 08:17

Напомнило)

janvarev 1 авг 2023 в 09:18

Справедливости ради, у метрики COMET все довольно плохо с бейзлайном в 0. Я, например, подавав оригинальную строку в качестве перевода (т.е. перевод не делался, сохранялась оригинальная строка), получал рейтинг от 50 до 80. Так что там имеет смысл сравнивать где-то от 80, тот же Гугл Транслейт и Дипл различаются где-то на 1 пункт, если не меньше - это надо иметь ввиду. (Переводчик старого поколения Argos выдает около 83).

Aliaksei_Rudak 1 авг 2023 в 09:49

Согласен, что COMET не идеальный, но среди переводчиков он сейчас наиболее популярный кроме BLEU. Выбирал между ним и BERTScore.

janvarev 1 авг 2023 в 10:08

Да, совершенно согласен. И я понимаю, почему выбрали COMET и BLEU - для них есть быстрый способ получить оценки на Питоне, сам им пользуюсь. Это просто замечание по бейзлайну - что от 0 не особо имеет смысл делать график :) (заметил, что в статье уже от 80, это прям хорошо)

iwram 1 авг 2023 в 09:52

>мы подготовили тестовые датасеты на семи языковых парах

Обычно далее пишут, можете ознакомиться и протестировать сами по ссылке --> Мы ведь максимально открыты. Правда?

Aliaksei_Rudak 1 авг 2023 в 11:52

Правда! Мы максимально открыты.

Качество перевода можете проверить тут

https://lingvanex.com/demo/

Если вам нужны тестовые датасеты - напишите на почту, также мы вам дадим бесплатный ключ API на перевод 20 миллионов и сами проверите )

sshikov 1 авг 2023 в 16:14

Попробуйте перевести любую компьютерную книгу, очень интересно, что вы сами скажете о качестве? На сегодняшний день, все что я пробовал, как правило никуда не годится (не ваш продукт, а скажем так, вообще все). Ну т.е. скажем переводим английский-русский что-нибудь компьютерное — получаем "текст, похожий на перевод", надо которым еще работать и работать. Даже близко на человеческий перевод не похоже.

Aliaksei_Rudak 1 авг 2023 в 17:41

Пробовали переводить такое. Там проблема не столько в переводе, сколько в парсере для сложной верстки страниц. Особенно когда Pdf. Сейчас работаем над этим, это очень сложная задача :)

sshikov 1 авг 2023 в 17:58

Ну, как по мне, там не в парсер упирается. Можно любой текст взять, хоть без форматирования. Во всяком случае, у меня претензии вовсе не к форматированию, а к смыслу, пропаданию согласования слов в предложении, выбору неправильных вариантов перевода слов, и т.п.

RockyMotion 4 авг 2023 в 06:47

Я конечно не так мощно гонял ChatGPT, а просто закидывал тексты туда и в DeepL и вот для предвзятого, абсолютно личного теста - DeepL на голову выше чем обе модели ChatGPT.

Aliaksei_Rudak 5 авг 2023 в 07:26

Согласен. Просто в интернете куча постов, что ChatGPT лучше DeepL по качеству. Вот я и решил проверить )

tumikosha 3 окт 2023 в 21:01

Это если просто переводить, а вот если нужно с выкрутасами всякими...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий