Объективный критерий сравнения разных ИИ в настоящий момент это бенчмарки. То что какая-то система обладает моделью мира и способностью к рассуждению (по мнению её авторов), а другая не обладает (по их же мнению), не значит ровным счётом ничего, до тех пор пока не будет представлен класс задач или конкретный бенчмарк на котором новая система превосходит SOTA.
В области ИИ LLM сейчас на лидирующих позициях, это медицинский факт. Если кому-нибудь удастся обучить модель которая обойдёт топовые LLM-ки например на ARC-AGI-2 или HLE, буду только рад. Но пока нет измеримых результатов, говорить о качественном прорыве бессмысленно.
А моделью мира и способностью к рассуждениям LLM-ки уже сейчас вполне обладают. Эти способности даже у животных есть на некотором уровне.
То же что и в других service-based экономиках. Станут юристами, агентами по недвижимости, ландшафтными дизайнерами и бьютиблогерами. Будут генерить номинальный ВВП.
В том что технологическое отставание уже видно невооружённым глазом. У них с детства в подкорке вбито что их общественное устройство самое передовое и единственно правильное.
Каждая операция растяжения верёвки не меняет процент её длины которую преодолел муравей. Скорость "убегания" конца верёвки от муравья будет уменьшаться и, судя по всему, рано или поздно достигнет нуля и станет отрицательной. Расчёты надо проверить по-хорошему, но выглядит правдоподобно.
И если продолжать достраивать башню снизу, она теоретически может продолжаться насколько угодно влево (намного больше вырастая в высоту)? Кажется неинтуитивным.
Лампа накаливания остывает несколько минут, можно даже успеть добежать до соседнего здания. Мне в этой задаче другой момент показался неинтуитивным. В условии должно быть сказано что переключатели имеют положение вкл/выкл, т.е. с их помощью можно установить конкретное состояние лампочки, а не просто сделать инверсию.
Особенно давление 120/80, которое всегда считалось не пограничным а оптимальным. В оригинале ещё и "or on treatment", т.е. сниженное лекарствами тоже подпадает под критерий. Хорошо хоть "наличие сердца" не указали как фактор риска.
Представим, что нас только что наняли в Корпорацию директором отдела мошенничества. Вы знаете, что в конечном итоге будете нести ответственность за большинство случаев мошенничества, происходящих по этому паттерну. Какую сумму потерь вы должны сообщить в качестве целевого показателя вашему CEO?
Ноль?! Вы думаете, что директор отдела маркетинга мечтает тратить ноль на маркетинг!? Это объективно будет глупым целевым показателем.
Это будет глупым целевым показателем хотя бы потому что в него вряд ли получится уложиться, и вы окажетесь крайним.
У GPT по умолчанию только поверхностные сведения о российском законодательстве и особенностях сделок с недвижимостью. Если его использовать в чистом виде без файнтюна или системного промпта с экспертными знаниями, будет большой риск галлюцинаций.
Сделайте инструкцию для нейросети в текстовом виде, опишите как анализировать ответы, на что обращать внимание, что не так важно, и т.д. И подгружайте её вместе с ответами которые надо проанализировать.
Представьте программиста, который мастерски собирает для себя вспомогательные утилиты, а потом равнодушно отмахивается: «Честно? Мне они не нужны».
Представить себе человека собравшего коллекцию утилиток и библиотек которые могли бы пригодиться в будущем? И который так ни разу и не воспользовался большинством из них?
Так возрастные болезни включают себя и Альцгеймера с Паркинсоном. Да и оставаясь в разуме можно оказаться в таком состоянии что жизнь не мила станет. Я к тому что целью должно быть не продление жизни как таковое а замедление или предотвращение старения.
Статья ровно про обратное, то что при симптомах нужно не бежать за бадами а обследоваться и получать адекватное лечение. Хотя и неформат для Хабра.
Да, я бы и модель мира добавил в ту же копилку. У LLM хоть и есть слабые места, они скорее в другом и авторы из них упомянули разве что галлюцинации.
Объективный критерий сравнения разных ИИ в настоящий момент это бенчмарки. То что какая-то система обладает моделью мира и способностью к рассуждению (по мнению её авторов), а другая не обладает (по их же мнению), не значит ровным счётом ничего, до тех пор пока не будет представлен класс задач или конкретный бенчмарк на котором новая система превосходит SOTA.
В области ИИ LLM сейчас на лидирующих позициях, это медицинский факт. Если кому-нибудь удастся обучить модель которая обойдёт топовые LLM-ки например на ARC-AGI-2 или HLE, буду только рад. Но пока нет измеримых результатов, говорить о качественном прорыве бессмысленно.
А моделью мира и способностью к рассуждениям LLM-ки уже сейчас вполне обладают. Эти способности даже у животных есть на некотором уровне.
Так он особо и не нужен большинству. Кому понадобится - выучат.
То же что и в других service-based экономиках. Станут юристами, агентами по недвижимости, ландшафтными дизайнерами и бьютиблогерами. Будут генерить номинальный ВВП.
В том что технологическое отставание уже видно невооружённым глазом. У них с детства в подкорке вбито что их общественное устройство самое передовое и единственно правильное.
Эффект похожий на тот что в задаче про выгибающийся рельс.
Каждая операция растяжения верёвки не меняет процент её длины которую преодолел муравей. Скорость "убегания" конца верёвки от муравья будет уменьшаться и, судя по всему, рано или поздно достигнет нуля и станет отрицательной. Расчёты надо проверить по-хорошему, но выглядит правдоподобно.
У меня Андроид останавливает заряд на 85%, честно пишет что 85. Это может в конкретной прошивке заморочка.
В первой получается какая-то такая конструкция?
И если продолжать достраивать башню снизу, она теоретически может продолжаться насколько угодно влево (намного больше вырастая в высоту)? Кажется неинтуитивным.
Это ж минимум два с половиной месяца ещё ждать.
По теме: Пятилетний Самсунг, ёмкость хоть и уменьшилась заметно, но пока хватает больше чем на сутки.
Можно ввести понятие реального, мнимого и отрицательного компота. Только делить на 0 нельзя и в комплексных числах.
Лампа накаливания остывает несколько минут, можно даже успеть добежать до соседнего здания. Мне в этой задаче другой момент показался неинтуитивным. В условии должно быть сказано что переключатели имеют положение вкл/выкл, т.е. с их помощью можно установить конкретное состояние лампочки, а не просто сделать инверсию.
Особенно давление 120/80, которое всегда считалось не пограничным а оптимальным. В оригинале ещё и "or on treatment", т.е. сниженное лекарствами тоже подпадает под критерий. Хорошо хоть "наличие сердца" не указали как фактор риска.
Из бескислородного ила и бамбука с восточного склона Фудзиямы.
Это будет глупым целевым показателем хотя бы потому что в него вряд ли получится уложиться, и вы окажетесь крайним.
Очень странно что половина сотрудников не ушла к нормальным работодателям в течение пары месяцев после нововведения.
У GPT по умолчанию только поверхностные сведения о российском законодательстве и особенностях сделок с недвижимостью. Если его использовать в чистом виде без файнтюна или системного промпта с экспертными знаниями, будет большой риск галлюцинаций.
Сделайте инструкцию для нейросети в текстовом виде, опишите как анализировать ответы, на что обращать внимание, что не так важно, и т.д. И подгружайте её вместе с ответами которые надо проанализировать.
Представить себе человека собравшего коллекцию утилиток и библиотек которые могли бы пригодиться в будущем? И который так ни разу и не воспользовался большинством из них?
Вообще легко )
Так возрастные болезни включают себя и Альцгеймера с Паркинсоном. Да и оставаясь в разуме можно оказаться в таком состоянии что жизнь не мила станет. Я к тому что целью должно быть не продление жизни как таковое а замедление или предотвращение старения.