Ещё раз. 10 инстансов одной модели, с одинаковыми параметрами (но разным seed).
Это вполне достаточно, чтобы увидеть, что, возможно, на самом деле не модели по-разному умные, а что им по-разному везёт и сама статья выше — совершенно непоказательна.
Всё остальное что вы написали — это уже относится к поиску лучшего портфеля и совершенно не относится к существу той проблемы, на которую я указал.
PS: Мне про торги можно не рассказывать, я работаю непосредственно в финтехе.
Так ваше "на грани случайностей" — это просто статистический разброс. Подбрасывайте 1000 независимых монеток и некоторые монетки вам покажут отличный рост. Только это не значит, что какие-то из монеток как-то "умнее" других. Им просто повезло.
И нужно несколько независимых экземпляров каждлй модели. Хотя бы по 10 штук. Не обязательно давать им тороговать на реальном рынке — всегда можно эмулировать биржу по текущему курсу.
PS: Да, то, что он хлебнул ("ingested") воды - это тоже плохо.
Скорее всего это самое худшее. Отдельные радиоактивные частицы с поверхности кожи можно смыть либо они отшелушатся со временем, а вот если какая-то частица попала внутрь и там осталась (если не повезло) — то облучать организм она может всю жизнь.
Теперь OpenAI делает то же самое, но с качеством, присущим продукту, а не эксперименту. Вообще говоря, как-то странно тут гордиться каким-то особым качеством, с учётом того, что как минимум в отдельные моменты времени у OpenAI случались утечки, когда пользователи видели чужие чаты.
io_uring — *новую* высокопроизводительную... — io_uring появился в 2019 году, если что.
И обращу внимание на следующее, что следует упоминать каждый раз, когда речь идёт про io_uring:
In June 2023, Google's security team reported that 60% of the exploits submitted to their bug bounty program in 2022 were exploits of the Linux kernel's io_uring vulnerabilities. As a result, io_uring was disabled for apps in Android, and disabled entirely in ChromeOS as well as Google servers. Docker also consequently disabled io_uring from their default seccomp profile.
Что им предложили, то и взяли. Я думаю, что если кто-то придёт, разработает полноценный пайплайн и покажет его эффективность — то это примут. Но пока таких предложений не было.
Ага, так и представил, как вместо относительной типовой тарелки Starlink, китацы будут всем потребителям ставить 1.8-метровые телескопы с "высокотехнологичным массивом из 357 крошечных, индивидуально управляемых микрозеркал".
Если из-за отсутствия "осознания внутреннего содержания" робот размажет какую-то грязь по всему полу - это стоит считать признаком высокой эффективности работы робота в качстве "подметателя" или нет?
Вы в крупном городе небо вообще видели? Местами из-за засветки можно разве что за луной и солнцем наблюдать :(
"Да, вы совершенно правы! На фото пять ящериц."
Кто будет нести ответственность за неверное толкование договора ИИ-помошником?
Там, где можно смеяться.
Ещё раз. 10 инстансов одной модели, с одинаковыми параметрами (но разным seed).
Это вполне достаточно, чтобы увидеть, что, возможно, на самом деле не модели по-разному умные, а что им по-разному везёт и сама статья выше — совершенно непоказательна.
Всё остальное что вы написали — это уже относится к поиску лучшего портфеля и совершенно не относится к существу той проблемы, на которую я указал.
PS: Мне про торги можно не рассказывать, я работаю непосредственно в финтехе.
Так ваше "на грани случайностей" — это просто статистический разброс. Подбрасывайте 1000 независимых монеток и некоторые монетки вам покажут отличный рост. Только это не значит, что какие-то из монеток как-то "умнее" других. Им просто повезло.
И нужно несколько независимых экземпляров каждлй модели. Хотя бы по 10 штук.
Не обязательно давать им тороговать на реальном рынке — всегда можно эмулировать биржу по текущему курсу.
Скорее всего это самое худшее. Отдельные радиоактивные частицы с поверхности кожи можно смыть либо они отшелушатся со временем, а вот если какая-то частица попала внутрь и там осталась (если не повезло) — то облучать организм она может всю жизнь.
(xkcd-мем про 14 фреймворков)
io_uring — *новую* высокопроизводительную...— io_uring появился в 2019 году, если что.И обращу внимание на следующее, что следует упоминать каждый раз, когда речь идёт про io_uring:
2 - простое число.
Но у вас проблема не в этом. Вы "из A получается Б" и из "из В получается Б" говорите "А равно В" (упрощённо).
Уже много раз обсуждали, что упадок SO начался ещё до бума LLM. Это хорошо было видно в том числе в статистике.
Что им предложили, то и взяли. Я думаю, что если кто-то придёт, разработает полноценный пайплайн и покажет его эффективность — то это примут. Но пока таких предложений не было.
Вот благодаря таким подходам интернет сейчас стемительно превращается в помойку ИИ-контента и людям приходится даже делать проекты типа такого:
Low-background Steel: content without AI contamination
Только там ссылки нет. URL отсутствует.
Ага, так и представил, как вместо относительной типовой тарелки Starlink, китацы будут всем потребителям ставить 1.8-метровые телескопы с "высокотехнологичным массивом из 357 крошечных, индивидуально управляемых микрозеркал".
Звезда: 0.207 M⊙, где M⊙ - масса Солнца (1.9891x10^30 kg).
Планета: 0.168 MJ, где MJ - масса Юпитера (1.898 × 10^27 kg).
Source: https://www.nature.com/articles/s41550-025-02552-4
Т.е. планета-то большая, звезда маленькая, но по массе всё равно разница в 3 порядка.
Если из-за отсутствия "осознания внутреннего содержания" робот размажет какую-то грязь по всему полу - это стоит считать признаком высокой эффективности работы робота в качстве "подметателя" или нет?
Если на ядре делается spin wait, то и 100% - нормально.