ovsale 13 окт 2023 в 11:37

Классификация комментариев к Youtube видео с помощью GPT моделей. Точность и ее цена

Простой

7 мин

2.9K

Node.JS * Искусственный интеллектNatural Language Processing *

Туториал

Комментарии 8

combo_breaker 13 окт 2023 в 22:27

Если сделать системный промпт на английском, то стоимость будет меньше из-за особенностей токенизатора OpenAI. Интересно, какова была бы точность.

ovsale 14 окт 2023 в 08:53

да это то с чего я начал. но точность была ниже. в другом эксперименте для gpt-3.5 было 9/7 (error1 / error2) для английского промпта и 7/5 для русского. для gpt-4 - 2/3 для английского и 1/1 для русского. получается что интеллект для одного языка выше. стоимость ниже да, но точно стоимость я не сравнивал.

combo_breaker 14 окт 2023 в 09:18

Спасибо!

Кстати, вы использовали обычную чат-модель gpt-3.5-turbo, тогда как есть gpt-3.5-turbo-instruct. От последней при равной цене можно ожидать лучший результат в подобной работе. Но как у нее с русским языком - я не знаю.

ovsale 14 окт 2023 в 10:05

не пробовал но сейчас попробовал: ошибки 8/6 с gpt-3.5-turbo-instruct против 7/2 с gpt-3.5-turbo. вообще я инструкт модель не изучал потому что когда она вышла не понял в чем ее смысл.

combo_breaker 14 окт 2023 в 11:06

Модель instruct тренирована не на чатах, а на выполнении инструкций и прямых ответах на вопросы. Должно быть проще использовать в автоматизации, так как не должна просачиваться в ответы типичная для ChatGPT вода вроде "Sure, here is...". Видел сообщения о лучших способностях, например, может играть в шахматы https://www.reddit.com/r/GPT3/comments/16mefly/the_new_gpt_model_gpt35turboinstruct_can_play/?rdt=45819, лучше сочиняет тексты https://t.me/llm_under_hood/141, также у нее на момент выхода вроде бы не было склонности к самоцензуре, не знаю как сейчас.

ovsale 14 окт 2023 в 12:48

у меня ничего подобного не получается. работает быстрее да, но хуже.
пакетная классификация из статьи совсем не заработала: json возвращает с синтаксическими ошибками... не помню чтобы я когда то такое вообще видел...
ну и API несколько другой и на gpt-4 одной строчкой кода не переключишь...

den4ik_084720 14 окт 2023 в 13:48

А если сравнить с какой-нибудь моделью для NLI? Например этой

ovsale 14 окт 2023 в 14:10

это специально обученная для классификации модель? ее из облака можно использовать? или только локально?

потестил немного. определенно хуже чем gpt работает

и контекст ей нельзя сообщить как я понимаю, а это важно. без описания видео многие комментарии вообще непонятны

Зарегистрируйтесь на Хабре, чтобы оставить комментарий