Как стать автором
Обновить

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

Уровень сложностиСредний
Время на прочтение27 мин
Количество просмотров62K
Всего голосов 25: ↑25 и ↓0+25
Комментарии7

Комментарии 7

Я очень люблю сравнение сервисов переводов, которые делают Intento и их недавний отчет говорит, что GPT-3.5-Turbo сейчас самый дешевый способ качественного перевода текста (в сравнении с чисто специализированными API, типа Google Translate или Deepl), а GPT-4 обошёл многие языковые сервисы перевода, особенно на творческих текстах. 

В общем-то, нет - https://github.com/janvarev/OneRingTranslator/blob/main/docs_md/ESTIMATIONS.md#comet-scores (если что, я сам поддерживаю этот бенчмарк и опенсорс переводчик с плагинами)

Результат COMET (переводы fr->en, en->fr, ru->en, en-ru)
Результат COMET (переводы fr->en, en->fr, ru->en, en-ru)

А учитывая, что Google Translate, в общем-то, по факту предоставляет бесплатный API endpoint для перевода, то всё остальное крайне с трудом с ним конкурирует.

(Тем не менее, очень хорошо, что такая статья переведена - просто хотел выразить свои мысли именно в теме переводов, которой занимаюсь)

Спасибо! Я тоже сторонник гугл транслейт и даже люблю его больше Deepl, а также радуюсь, что можно в Google sheets перевести ячейки бесплатно (если это 1000 отзывов, например), просто хотел указать, что LLM может и в перевод на хорошем уровне тоже. Давай исправлю чуть текст.

Кстати промпт по русски будет запросом или командной строкой.

Или указание, да. Добавлю в статью

Игорь, низкий поклон за твоё время, которое ты потратил чтобы мы могли сориентироваться в этом волшебном мире. Это ценно. Большое спасибо.

Подскажи, помимо упомянутого тобой курса от deeplearning.ai (который как будто for Developers), видел ли ты хорошие курсы для тех самых бизнес-руководителей, чтобы они не тонули в завышенных (или заниженных) ожиданиях, а, приложив конечные усилия, составили адекватную картину происходящего?

Цель: понять, можно ли решить конкретные прикладные задачи бизнеса с помощью GenAI.
Пока что не придумал ничего лучше чем смотреть все Beginner курсы на deeplearning.ai.
Может, ты знаешь более короткий путь?

Практически любой UI для локального запуска моделей сейчас имеет RAG. Но толи руки не из того места растут, толи все это затычка для хайпа - работает это пока никак. Пробовал с Lama 3.1 8B это запускать (сама модель в сравнении с Gemma 2 9B порадовала), скармливал книжку в 200 страниц. В ответ на вопрос "какие герои участвуют в рассказе" ответ "в этом рассказе нет героев". В общем не знаю...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории