Pull to refresh
1
Никита монич@CosmicMik

User

Send message

Раньше, я бы согласился с этой статьёй. Но мне "пощасливилось" работать лидом на проекте, где был очень сильный синьор. Как специалист - очень толковый. Делал все задачи в срок и давал очень ценные рекомендации на код ревью. Но то, как он это делал, приносила больше вреда, чем вся та польза которую он приносил компании. Я честно говоря столкнулся с таким впервые, когда у человека явные проблемы с софт скилами. Раньше мне казалось это чем-то надуманным. Никакие разговоры с ним не помогали. Человека просто пришлось уволить. И после этого результат стал лучше во всём - начиная от качества кода и заканчивая скоростью разработки - это командная работа и она требует умение работать в команде. Если этого нет - не важно какой у тебя уровень технических знаний. И умение здороваться и вежливо разговаривать не заменяет это (хотя часто они идут вместе).

К сожалению, не достаточно просто попросить модель сомневаться. Проблема в том, что современные CoT модели не могут забыть изначальный ложный аргумент, чтобы не происходило дальше. И это влияет на результат. Есть попытки именно научить модель сомневаться как часть её стандартного цикла размышлений. Можете посмотреть работу от DeepMind на этот счёт "Training Language Models to Self-Correct via Reinforcement Learning". Но там уже появляется вопрос, не приводит ли такое обучение к созданию внутри llm модели мира. А это уже совсем другой холивар )

Information

Rating
Does not participate
Registered
Activity

Specialization

Бэкенд разработчик
Java
Java Spring Framework
Docker