Design, setting, participants This cross-sectional analysis used ordinary least squares regression within the UK Biobank database, assessing 26 820 participants aged 53–86 years, categorised into two cohorts: Cohort 1 (10 067 participants, 56% female; completed all four cognitive tests of Fluid Intelligence/reasoning, Pairs Matching, Reaction Time and Prospective Memory) and Cohort 2 (16 753 participants, 56% female; completed only two cognitive assessments of Pairs Matching and Reaction Time).
Компьютер обыграл чемпиона мира 27 лет назад - какое киберунижение!
Бенчмарки для llm не создавались для оценки интеллекта, ни человеческого, ни языковой модели. Ну не стоит просто перед исследователем задачи - оценить интеллект. Оценить успешность в решении определённой задачи - да.
Хотя и здесь проблемы - то, оказывается, часть датасета могла быть скормлена модели при обучении, то при незначительном изменении формулировки задачи скор падает.
В результате оказывается, что создать качественный бенч для оценки способности llm решить определённую задачу на определённом наборе данных - само по себе нетривиальная проблема, какая там оценка интеллекта?
Я рассчитывал на какой-то аргумент, о котором можно поразмышать. Но не вышло
Повторю вопрос - как я могу оценить производительность собственного интеллекта? Чтобы затем применить тот же метод оценки к llm и произвести сравнение. По каким ключам искать статьи с описанием такого метода?
Решение одного или нескольких типов задач - это не оценка интеллекта, это оценка точности решения определенным образом сформулированнных задач.
В будущем компания планирует объединить свои большие языковые модели, чтобы создать более эффективную модель, которую будет можно назвать общим искусственным интеллектом (artificial general intelligence, AGI).
То есть сложим все Т9 в один суперпупер-Т9, это и будет agi? Амбиции как-то поугасли
Автор, надеюсь про го и раст ты пишешь лучше
И тут Остапа понесло
Не способен
Направленность там одна - инвестиций поднять
ну вот и подъехали волчьи цитаты
Резкий скачок от ассебмлера к gpt в соседних абзацах, при этом что там творчество, что тут гордость. В финале - снова что-то про токсичность.
Что хотел сказать автор?
Это список макулатуры, которой удобно разжигать камин, чтобы напротив огня читать настоящие книги для архитектора?
Компьютер обыграл чемпиона мира 27 лет назад - какое киберунижение!
Бенчмарки для llm не создавались для оценки интеллекта, ни человеческого, ни языковой модели. Ну не стоит просто перед исследователем задачи - оценить интеллект. Оценить успешность в решении определённой задачи - да.
Хотя и здесь проблемы - то, оказывается, часть датасета могла быть скормлена модели при обучении, то при незначительном изменении формулировки задачи скор падает.
В результате оказывается, что создать качественный бенч для оценки способности llm решить определённую задачу на определённом наборе данных - само по себе нетривиальная проблема, какая там оценка интеллекта?
Я рассчитывал на какой-то аргумент, о котором можно поразмышать. Но не вышло
Повторю вопрос - как я могу оценить производительность собственного интеллекта? Чтобы затем применить тот же метод оценки к llm и произвести сравнение. По каким ключам искать статьи с описанием такого метода?
Решение одного или нескольких типов задач - это не оценка интеллекта, это оценка точности решения определенным образом сформулированнных задач.
Чем вы меряете производительность интеллекта? Как я могу измерить, например, производительность собственного интеллекта?
Если подразумевать под agi навороченный t9 - ничего не мешает, конечно.
То есть сложим все Т9 в один суперпупер-Т9, это и будет agi? Амбиции как-то поугасли
Какая-то смесь разыгравшегося воображения, высосанных из пальца проблем и сугубо личных нравится - не нравится.
Делюсь мнением по просьбе автора. Мнение таково - место подобной писанине на пикабу
Это наследственное)
С такой аргументацией сложно спорить, не уронив IQ до уровня крутых шуток
о подобном сравнении речи не было
почему противники? или вы записываете в противники ИИ всех, кто скептично относится к предположению, что llm обладают какой-либо формой мышления?
"выйдите на улицу, взгляните, как много вокруг
тупыхимитирующих мышление людей" - это никакой не аргументВ чем цель подобных мизантропических выпадов?
У нас нет другого выхода, если только не начать называть мышлением "алгоритм предсказания последующего наиболее вероятного слова"