All streams
Search
Write a publication
Pull to refresh
-12
0.2
Алексей Суханов @FurySeer

User

Send message

Design, setting, participants This cross-sectional analysis used ordinary least squares regression within the UK Biobank database, assessing 26 820 participants aged 53–86 years, categorised into two cohorts: Cohort 1 (10 067 participants, 56% female; completed all four cognitive tests of Fluid Intelligence/reasoning, Pairs Matching, Reaction Time and Prospective Memory) and Cohort 2 (16 753 participants, 56% female; completed only two cognitive assessments of Pairs Matching and Reaction Time).

Автор, надеюсь про го и раст ты пишешь лучше

стартап Cognition Labs недавно разработал своего ИИ-инженера по имени Девин, который способен выполнять инженерные проекты практически автономно

Не способен

ну вот и подъехали волчьи цитаты

Резкий скачок от ассебмлера к gpt в соседних абзацах, при этом что там творчество, что тут гордость. В финале - снова что-то про токсичность.

Что хотел сказать автор?

Это список макулатуры, которой удобно разжигать камин, чтобы напротив огня читать настоящие книги для архитектора?

Компьютер обыграл чемпиона мира 27 лет назад - какое киберунижение!

Бенчмарки для llm не создавались для оценки интеллекта, ни человеческого, ни языковой модели. Ну не стоит просто перед исследователем задачи - оценить интеллект. Оценить успешность в решении определённой задачи - да.

Хотя и здесь проблемы - то, оказывается, часть датасета могла быть скормлена модели при обучении, то при незначительном изменении формулировки задачи скор падает.

В результате оказывается, что создать качественный бенч для оценки способности llm решить определённую задачу на определённом наборе данных - само по себе нетривиальная проблема, какая там оценка интеллекта?

Я рассчитывал на какой-то аргумент, о котором можно поразмышать. Но не вышло

Повторю вопрос - как я могу оценить производительность собственного интеллекта? Чтобы затем применить тот же метод оценки к llm и произвести сравнение. По каким ключам искать статьи с описанием такого метода?

Решение одного или нескольких типов задач - это не оценка интеллекта, это оценка точности решения определенным образом сформулированнных задач.

Чем вы меряете производительность интеллекта? Как я могу измерить, например, производительность собственного интеллекта?

Если подразумевать под agi навороченный t9 - ничего не мешает, конечно.

В будущем компания планирует объединить свои большие языковые модели, чтобы создать более эффективную модель, которую будет можно назвать общим искусственным интеллектом (artificial general intelligence, AGI).

То есть сложим все Т9 в один суперпупер-Т9, это и будет agi? Амбиции как-то поугасли

Какая-то смесь разыгравшегося воображения, высосанных из пальца проблем и сугубо личных нравится - не нравится.

Делюсь мнением по просьбе автора. Мнение таково - место подобной писанине на пикабу

Все знают, что качество шуток зависит от IQ, но кто может вспомнить круто шутящих отличников? Обычно этим отличались хулиганы.

С такой аргументацией сложно спорить, не уронив IQ до уровня крутых шуток

Сравнить человека с LLM - не мизантропия

о подобном сравнении речи не было

противники ИИ

почему противники? или вы записываете в противники ИИ всех, кто скептично относится к предположению, что llm обладают какой-либо формой мышления?

"выйдите на улицу, взгляните, как много вокруг тупых имитирующих мышление людей" - это никакой не аргумент

В чем цель подобных мизантропических выпадов?

У нас нет другого выхода, если только не начать называть мышлением "алгоритм предсказания последующего наиболее вероятного слова"

Information

Rating
2,848-th
Location
Россия
Registered
Activity

Specialization

Specialist
Middle