Что интересно, когда я Codex предложил вызывать Claude (через вызов claude cli) для проверок результатов стадий исследования, он не то, что не спорил - стал вызывать сам в местах, где нужны проверки. Codex 5.4 high effort - реальный прогресс:)
У вас интересный проект, и для многих задач он точно полезен. Согласен, что дебаты внутри одной модели и проще в эксплуатации, и дешевле. Но мой пойнт в другом типе разнообразия. Когда вы создаете внутри Claude несколько персонажей, это все тот же Claude со своими сильным сторонами, слепыми зонами. Все персонажи делят одни и те же данные для обучения и приоритеты пост-обучения. В то же время на многих задачах, особенно нетривиальных, по моему опыту, тройка Claude, Codex, Gemini, зачастую по-разному видит сильные и слабые стороны в реешении. Так что мой тезис в том, что разнообразие типажей одной модели != разнообразию "мышления" разных моделей. Что касается Codex - это разовая установка, дальше все работает удобно.
>> Например, на упомянутом Matousec, Comodo ВСЕГДА побеждает с 2008 года (тогда еще даже антивируса не было и всегда побеждал Comodo Firewall). Выводы делайте сами.
Опять призывают сделать выводы из одного примера. Посмотрите победителей последних лет у тестовых лабораторий, которые здесь упоминались, AV-Test и AV-Comparatives: Trend Micro, F-Secure, BitDefender, Kaspersky Lab. По-моему выявить аффилированность по таким результатам — сплошная конспирология.
>> Вторая категория пользователей — вдумчивые и аккуратные. У них установлен антивирус «для галочки», но они и так знают что можно и что нельзя запускать.
А не поясните, как вдумчивость пользователя и знание чего нельзя запускать защитят его от 0-day эксплойта, размещенного на зараженном новостном сайте, к примеру?
Мне кажется тут вполне определенная безграмотность, причем уверенная в своей грамотности.
>> Так что все, что происходит в мире АВ-продуктов, это подтасовки, пиар и бабло.
И опять громкие выводы из сомнительных предпосылок, подкрепленных сомнительным же опытом имхо.
По-моему, самое ироничное, что аргументы автора ровно той же природы, за которую он критикует статью из журнала). В той статье выводы делаются из отдельных выбранных автором тестов, здесь так же выбираются отдельные тесты для контраргументов) Можно ли сделать из этого объективные выводы? Сомнительно.
Все равно, что из победы «Рубина» над «Барселоной» на Ноу-Камп в 2009-м году делать вывод, что Рубин как команда, как минимум не хуже классом. А ведь чемпионаты/кубки как раз и задумываются, чтобы сгладить результаты многочисленных игр и выявить самого стабильно достойного.
>> Ну с моей токи зрения ложные срабатывания лучше, чем неложные несрабатывания. Ибо лучше уж лишний раз выругаться, чем пропустить заразу.
Ну это до тех пор, пока из-за ложного срабатывания у вас не удалится системный файл или любимая игрушка)) Как правило, ложные срабатывания очень болезненны для пользователей.
>>AVG кстати без ложных срабатываний и 97.5% что тоже очень и очень неплохо.
97,5% — плохо это или неплохо? В том тесте, на которой вы ссылаетесь, с августа по ноябрь тестовая лаборатория исследовала антивирусы на 2360 реальных угрозах, встреченных в Интернете. И 97,5% детекта означает 59 пропущенных угроз за все это время, причем реальной малвары, т.к. всякие adware в тесте не участвовали. По-моему вполне так плохо.
Этот «феномен» уже исследовали и пришли к выводу, что абсурдность запроса есть специально выбранный префильтр, позволяющий отсеять из сотен тысяч получателей письма именно тех, с кем будут хорошие шансы получить желаемое. Если бы в этих письмах был более-менее адекватный текст мошенникам пришлось бы вести переписку со многими, причем в большинстве случаев безуспешную, а фильтр позволяет оставить натболее перспективных) research.microsoft.com/pubs/167719/whyfromnigeria.pdf
Имелось в виду, что адекватный закон да и его применение не противоречат здравому смыслу. Здесь налицо перегиб. И если бы этот случай был исключением. Ладно бы успокоились и проехали этот случай. Но нет — закон есть закон) Чем больше они делают себя заложниками подобных законов, принуждая себя исполнять их в неуместных случаях, тем быстрее они себя разрушают.
Что интересно, когда я Codex предложил вызывать Claude (через вызов claude cli) для проверок результатов стадий исследования, он не то, что не спорил - стал вызывать сам в местах, где нужны проверки. Codex 5.4 high effort - реальный прогресс:)
У вас интересный проект, и для многих задач он точно полезен. Согласен, что дебаты внутри одной модели и проще в эксплуатации, и дешевле.
Но мой пойнт в другом типе разнообразия.
Когда вы создаете внутри Claude несколько персонажей, это все тот же Claude со своими сильным сторонами, слепыми зонами. Все персонажи делят одни и те же данные для обучения и приоритеты пост-обучения.
В то же время на многих задачах, особенно нетривиальных, по моему опыту, тройка Claude, Codex, Gemini, зачастую по-разному видит сильные и слабые стороны в реешении.
Так что мой тезис в том, что разнообразие типажей одной модели != разнообразию "мышления" разных моделей.
Что касается Codex - это разовая установка, дальше все работает удобно.
Пока ведут себя прилично)
Ну как же. Если сделать эту фичу на интеловском планшете, причин покупки армового будет еще меньше
Нет, просто предъявлял на удачу. Работает только с использование магнитной полосы на карте.
Через Турцию, Эмираты
59.90
Только вернулся из Кореи. Вполне реально расплачиваться. Примерно в половине случаев удавалось воспользоваться картой «Мир».
Опять призывают сделать выводы из одного примера. Посмотрите победителей последних лет у тестовых лабораторий, которые здесь упоминались, AV-Test и AV-Comparatives: Trend Micro, F-Secure, BitDefender, Kaspersky Lab. По-моему выявить аффилированность по таким результатам — сплошная конспирология.
>> Вторая категория пользователей — вдумчивые и аккуратные. У них установлен антивирус «для галочки», но они и так знают что можно и что нельзя запускать.
А не поясните, как вдумчивость пользователя и знание чего нельзя запускать защитят его от 0-day эксплойта, размещенного на зараженном новостном сайте, к примеру?
Мне кажется тут вполне определенная безграмотность, причем уверенная в своей грамотности.
>> Так что все, что происходит в мире АВ-продуктов, это подтасовки, пиар и бабло.
И опять громкие выводы из сомнительных предпосылок, подкрепленных сомнительным же опытом имхо.
Все равно, что из победы «Рубина» над «Барселоной» на Ноу-Камп в 2009-м году делать вывод, что Рубин как команда, как минимум не хуже классом. А ведь чемпионаты/кубки как раз и задумываются, чтобы сгладить результаты многочисленных игр и выявить самого стабильно достойного.
Ну это до тех пор, пока из-за ложного срабатывания у вас не удалится системный файл или любимая игрушка)) Как правило, ложные срабатывания очень болезненны для пользователей.
97,5% — плохо это или неплохо? В том тесте, на которой вы ссылаетесь, с августа по ноябрь тестовая лаборатория исследовала антивирусы на 2360 реальных угрозах, встреченных в Интернете. И 97,5% детекта означает 59 пропущенных угроз за все это время, причем реальной малвары, т.к. всякие adware в тесте не участвовали. По-моему вполне так плохо.
research.microsoft.com/pubs/167719/whyfromnigeria.pdf