Pull to refresh
4
0.1

Developer

Send message

Как это реализовано технически? Через механизм обучения с подкреплением на основе обратной связи от человека (RLHF). Вместо классического обучения с учителем (supervised learning) на размеченных данных, здесь модель взаимодействует с реальными людьми, получает от них оценки своих действий и корректирует свое поведение, чтобы максимизировать награду.

Ну так это в статье написано что он учится у реальных людей (я не знаю, может не у пользователей, у каких-то специальных людей, но тем не менее). Даже если это не рандомные интернетовские тролли, а благонамеренные люди на зарплате - всё равно они научат его куче своих когнитивных искажений.

С людьми не всегда тоже самое. Умный человек нужное переспросит, погуглит, почитает литературу, а не кинется сразу галлюцинировать. А вот как понять что ИИ ответил верно, а не нафантазировал, даже если ты знаешь половину ответа (но не весь ответ)?

А стоило бы опрашивать.

Нет. Понять чужое - сложнее чем сделать свое.

Нет. У менеджеров голова по-другому устроена.

Нет. В системах сложнее hello, world визуальнай мусор только мешает.

Опрашивайте, тех кто о повышении просят - у них ещё теплится надежда что на вашу компанию есть смысл тратить время.

Квк составить правильный промпт, не зная заранее ответа на интересующий вопрос?

Именно поэтому Claude не будет генерировать опасный или оскорбительный контент, даже если его об этом просят - он обучен этого не делать.

Серьёзно? Кто-то всерьез полагается на то, что пользователи не научат его плохому?

Наконец, за кулисами Claude стоит целая команда, которая следит за безопасностью, непредвзятостью, защитой конфиденциальности. Продуманная система тестирования и контроля позволяет минимизировать риски, связанные с дезинформацией, незаконным контентом, нарушением приватности и прочими угрозами.

А, ну конечно нет, все как и везде, целая команда цензоров...

Вот англичанин, молодец, рассматривает вариант что придётся в Финляндии к KOI8 привыкать. А финны как бессмерные себя ведут. ;)

Часть про затмение вызывает недоумение. Что там тогда должно было начинаться если набегут тучки, и не на полчаса?

Ещё обязательно должен быть комментарий "если столько людей понимают неверно, то от него больше вреда, чем пользы".

явно пытается на лету переводить

Точно ли дело именно в переводе? Там разговор на такие темы, что и на родном языке стоит трижды подумать, прежде чем рот открывать. Я бы предположил что там скорее подбор дипломатических формулировок все ресурсы отжирает.

Есть уже мем - "буханка сразу хорошо вышла"

Для международного обозначения юаня используется тот же символ, что и для японской иены: ¥.

Очевидно поэтому.

все с натянутыми улыбками

Ну и сразу - до свидания.

class AesEncryptionManager() : EncryptionManager

Что заEncryptionManager здесь имеется в виду?

А для мам с мелкими детьми это прихоть?

Видосы, чатики, корпоративы... Не раскрыта только тема собственно работы. Остается предположить что с работой в любом возрасте одни и те же проблемы, и отдельного рассмотрения эта тема не заслуживает.

А потом крупные системы ложатся вот так...

Возможно потому, что на самом деле "упущенная прибыль" от таких падений не так велика? Ну вот сколько на самом деле таких людей, которые именно в эти 1.5 часа хотели расстаться со своими деньгами, и в итоге отказались от этой идеи? Может быть большинство просто подумало, "ну, это интернет, тут бывает сайты лежат", и зашли на следующий день и всё оплатили.

У Японии? О_О Это Япония уничтожила 35 млн. китайцев во Второй Мировой, а не наоборот.

Information

Rating
4,193-rd
Registered
Activity