All streams
Search
Write a publication
Pull to refresh
6
0.5
Денис @yudeek

User

Send message

Исследование в очередной раз показало, что эффективность использования AI со стороны HR-специалистов во многом зависит от их уровня технической грамотности.

Те, кто понимает общие принципы работы ИИ-моделей, ограничения и особенности применения LLM, принимают более объективные решения в процессе найма и оценки персонала.

При этом всевозможные подсказки в интерфейсе HR-приложений (факторы оценки кандидата со стороны AI) помогают только тем, кто обладает технической грамотностью на уровне выше среднего.

Напротив, информация об ограничениях и характеристиках модели может запутать менее грамотных HR-специалистов.

Explained, yet misunderstood: How AI Literacy shapes HR Managers' interpretation of User Interfaces in Recruiting Recommender Systems

Tags:
Rating0
Comments0

Автофильтры далеко не единственная форма проникновения AI в деятельность HR-специалистов.

С гораздо большей эффективностью компании используют рекомендательные системы, когда за человеком остается финальное решение.

Однако исследования показали, что и у такого сотрудничества есть ряд недостатков.

Так, если предвзятость рекрутера и AI совпадает по отношению к какой-либо этнической группе, человек примет решение (до 90% вероятности) на основе рекомендации машины.

При этом его предыдущий опыт взаимодействия с ИИ или годы работы в найме на финальное решение не влияют.

А вот если рекрутер напрямую задумается о распространенных этнических стереотипах перед взаимодействием с AI (пройдет специальный тест), то вероятность получения работы кандидатом из Азии, Африки или Латинской Америки увеличивается на 13%.

Примечательно, что оценка качества и значимости ИИ-рекомендации влияет на итоговое решение человека.

No Thoughts Just AI: Biased LLM Recommendations Limit Human Agency in Resume Screening

Tags:
Rating0
Comments1

То, как мы выбираем и оцениваем LLM (GPT-4, Claude и пр.), напрямую связано не только с их качеством, но и с особенностями нашей собственной личности.

Сегодня большие языковые модели уже не просто инструменты для генерации кода или текстов — они становятся полноценными компаньонами в рабочих процессах. И, как показывают последние исследования, взаимодействие с ними сильно зависит от двух факторов:

  1. Личностные особенности самого пользователя.
    В области HCI давно известно: восприятие технологий фильтруется через наш характер. Например, доверие к роботам и цифровым системам у разных людей строится по-разному — кто-то верит в эффективность алгоритма, а кто-то больше смотрит на "человечность" интерфейса.

  2. “Характер” самой модели.
    Да-да, у LLM тоже наблюдаются поведенческие паттерны, которые пользователи воспринимают как черты личности — например, более строгая и формальная подача у одной модели или более “творческая” и дружелюбная у другой.

Интересное наблюдение дали тесты на базе Keirsey Temperament Sorter (упрощённая версия MBTI, делящая пользователей на четыре группы):

  • Rationals (аналитики, стратеги) — охотнее выбирали GPT-4, особенно для задач с чёткой целью и структурированными решениями.

  • Idealists (креативные коммуникаторы) — чаще делали ставку на Claude 3.5, ценя его в сценариях, где важны воображение и аналитика.

  • Guardians (организаторы) и Artisans (творцы в действии) тоже показывали свои паттерны предпочтений, хотя менее ярко выраженные.

Показательно, что разница отслеживалась не только в оценках, но и в эмоциональных реакциях (sentiment-анализ) и в том, как участники формулировали фидбек. То есть личность пользователя напрямую влияет на то, как он определяет “хороший” AI-опыт.

Для HCI- и AI-специалистов это открывает два интересных вектора:

  • Кастомизация: если подстраивать ответы и стиль модели под психотип человека, можно сильно повысить её воспринимаемую полезность.

  • Дизайн систем: в будущем IDE, ассистенты и даже рабочие мессенджеры смогут автоподбирать “поведение” модели под разный тип специалистов в команде.

Другими словами, вопрос “какая LLM лучше?” стоит переформулировать в “какая LLM лучше для конкретного пользователя”.

Personality Matters: User Traits Predict LLM Preferences in Multi-Turn Collaborative Tasks

Tags:
Rating0
Comments0

Наверняка каждый из нас замечал, что в ряде вакансий на HH есть просьба прислать ссылку на свой GitHub.

Логично предположить, что HR не ожидают увидеть там репозитории рабочих коммерческих проектов, а всего лишь хотят посмотреть на pet-проекты или вклад в open source.

Но на месте работодателя стоит задаться вопросом: «Когда разработчик этим занимался?»

Если такие проекты были сделаны в рамках рабочего времени (как часть задачи или исследования) или в перерыве между работами, то нет проблем.

А если кандидат занимался pet-проектами после основной работы, то у меня для вас плохие новости.

Несмотря на всю приверженность своему делу, такой специалист может достаточно быстро выгореть, обладать низкой продуктивностью, плохим здоровьем и быть менее счастливым.

Виной всему невозможность психологически переключиться с написания кода на личные или семейные дела.

Концептуальная модель психологического абстрагирования
Концептуальная модель психологического абстрагирования

Такое переключение представляет собой процесс восстановления ментальных ресурсов, растраченных в течение рабочего дня.

Вспомните себя, когда после двух-трёх дней активного написания кода вы начинаете заметно медленнее решать задачи, дольше думаете над кодом и чаще отвлекаетесь на посторонние дела.

Есть несколько советов о том, как не зацикливаться на работе.

Во-первых, необходимо делать небольшие перерывы в течение рабочего дня.

Не стоит читать рабочую переписку за обедом или говорить о рабочих вопросах на прогулке с коллегой.

Во-вторых, в офисе очень важны социальные контакты и поддержка.

Найдите на работе приятеля, с которым у вас совпадают хобби, или вовлекитесь в общую активность, принятую в вашей компании.

Это поможет вам не только переключиться, но и избавиться от чувства социальной исключённости.

В-третьих, планируйте работу на следующий день с вечера.

Чёткий план действий позволит не распыляться и закончить начатые задачи.

Иначе незакрытые гештальты будут преследовать вас вне офиса.

В-четвёртых, простройте чёткие границы между работой и домом.

Придумайте себе ритуал, после которого вы не будете вовлекаться в рабочую переписку или открывать ноутбук по работе.

Источники

Tags:
Total votes 4: ↑3 and ↓1+3
Comments0

На днях посмотрел два видео по рынку ИТ, в том числе с фокусом на российский сегмент (раз и два).

За завесой рассказов про ИИ, vibe coding, T-shape, динамику Восточной Европы и прочим анализом в тени остался, на мой взгляд, самый важный вопрос, на который можно ответить "да" или "нет". 

Способен ли "вкатун" - человек без коммерческого опыта, выучивший ответы для прохождения собеседования - удовлетворять потребностям компании, куда его наняли?

То есть достаточно ли для компании того, что задачи будут выполняться человеком, который на ходу будет находить способы их решения, не важно какие и как.

Приносит ли такой сотрудник по факту больше пользы, чем вреда, и стоит ли он своих денег.

Если да, то ваши годы опыта, полученные в бою знания, институтская теория больше не стоят примерно ничего, кто бы что ни говорил, вы стоите в общей очереди со всеми.

Они могут дать вам только полезные знакомства, и вы обойдете сам процесс найма.

Поэтому работникам придется адаптироваться, находя новые подходы к прохождению собесов, или менять профессию.

Если нет, то компаниям срочно надо менять подходы к найму, о чем было сказано многократно, а текущие тенденции временные и будут сглажены самим рынком.

А как думаете вы?

Tags:
Total votes 2: ↑1 and ↓1+2
Comments0

В последнее время все чаще стали появляться статьи о вреде "волков" ИТ-рынку. О том, что с последним не все хорошо, никто не спорит. Ох уж этот ОМ, Антоха и стая. Но что, если дело не в сломанном найме? Что, если это только следствие, а настоящая причина в другом?

Давайте ради мысленного эксперимента попробуем оттолкнуться от распространенного тезиса - "ИТ-индустрия давно стала символом престижной, высокооплачиваемой и гибкой работы". Есть у нас бизнес, HR и соискатель. Дальше попробуем утрировать для пущей подсветки ситуации.

Раз так, думает бизнес, то в индустрии будут все сливки общества, лучшие из лучших, они-то нам и нужны. Вот только задачи у бизнеса в основном типовые, а закрывать их сможет специалист с навыками, которые нарабатываются за год-два, а то и меньше (сколько там волков уволили с испытательного срока по статистике?).

Раз так, думает HR, то давайте введем самый строгий, разнообразный и тщательный отбор кандидатов. Вот только HR не имеет методологии объективной оценки (есть исследования или научные статьи про методики найма разрабов?), поэтому уделяет резюме 6 секунд.

Раз так, думает соискатель, то мне точно туда надо. Но сначала стоит в очереди из 1000 человек на одно место, а потом проработав несколько лет мечтает выйти из айти (привет менторам и блогерам).

А теперь на минутку допустим, что ни престижа, ни высокой оплаты, ни гибкости в ИТ нет. 

Ведь фотографироваться не подходят, получаешь ты как и твой сосед - условный senior в любой другой востребованной экономикой отрасли, - а еще попить свой "гибкий" смузи ты не особо успеваешь в промежутке между дейликом, написанием кода, code review, созвоном с продактом и экстренным поднятием прода после его обновления в пятницу вечером, хотя и сидишь на условном Бали.

Что получается?

Бизнесу нужны рабочие руки, готовые изо дня в день, из года в год выполнять практически одни и те же типовые задачи и не сгореть на работе?

HR могут просто сопоставлять реальный опыт соискателя с реальным уровнем задач на реальных примерах, а не спрашивать про то, что работник делать никогда не будет?

Соискатель понимает, что за 5-7 лет опыта ты и в других отраслях сможешь получать свои 300-500к на руки, а еще и не факт, что это будет такая же рутина или твой стеклянный потолок (например, продажи и % от них, знание предметной области и уход в свой бизнес, карьера в менеджементе или уход в частную практику)?

ИТ-рынок погубят не волки, которых закономерно заботят свои личные интересы, а ореол исключительности и неадекватные ожидания со всех сторон. 

Что думаете?

Tags:
Total votes 3: ↑3 and ↓0+3
Comments5

📢 Почему устаревшие библиотеки всё ещё используются? Взгляд на Log4j 1.x 📊

Несмотря на то, что поддержка Log4j 1.x завершилась ещё в 2015 году, исследование показывает удивительную тенденцию:

  • 33.81% проектов продолжают использовать устаревшую версию Log4j 1.x.

  • Лишь 10.89% проектов перешли на современную Log4j-Core 2.x.
    Что ещё более удивительно, даже новые проекты выбирают устаревшую версию, что подчёркивает сложности в управлении зависимостями.

🔍 Почему это происходит?
1️⃣ Недостаточная осведомлённость о безопасности: Разработчики могут недооценивать риски использования уязвимых библиотек.
2️⃣ Высокая стоимость миграции: Переход на новые версии часто воспринимается как сложный и дорогостоящий процесс.
3️⃣ Зависимость от легаси-систем: Многие проекты связаны с устаревшими системами, что делает обновление крайне затруднительным.

⚠️ Риски использования Log4j 1.x
Продолжение работы с этой библиотекой подвергает системы серьёзным угрозам, включая возможность удалённого выполнения кода (например, уязвимость CVE-2019-17571).

💡 Следующие шаги для сообщества

  • Повышать осведомлённость о рисках использования устаревших библиотек.

  • Предоставлять инструменты и ресурсы для упрощения процесса миграции.

  • Рассмотреть временные решения, такие как Reload4j, для быстрого устранения критических проблем.

https://arxiv.org/pdf/2504.03167

Tags:
Rating0
Comments0

Исследование выявило ключевые тенденции в том, как open-source проекты работают с документацией:
✅ README-файлы появляются на ранних этапах жизни проекта.
✅ Руководства по внесению вкладов (CONTRIBUTING) добавляются позже, когда активность растёт.
✅ Документация в основном сосредоточена на использовании и внесении изменений, а не на развитии сообщества, несмотря на частые рекомендации уделять больше внимания именно этому аспекту.

Хотя развитие сообщества считается важным фактором устойчивости FLOSS-проектов, не все основатели сразу ставят эту цель. Более того, излишний упор на построение сообщества на ранних этапах может усложнить процесс и отпугнуть потенциальных участников.

🔍 Главный инсайт: Вместо универсального подхода open-source проекты могут выстраивать стратегию документации, исходя из реального роста и потребностей участников. Интересно, что более содержательная документация, как правило, коррелирует с расширением проекта со временем.

https://arxiv.org/pdf/2502.18440

Tags:
Rating0
Comments0

Исследование мошеннической активности, связанной с накруткой звёзд на GitHub, проанализировало данные о 15 835 репозиториях и 278 000 аккаунтов, участвовавших в кампаниях по созданию фальшивых звёзд. Основные выводы включают:

  • Ограниченное распространение фальшивых звёзд:

    • Лишь небольшое количество репозиториев с накрученными звёздами публикуются в пакетных регистрах, таких как npm или PyPI.

    • Ещё меньше достигают широкой популярности.

  • Короткий срок существования:

    • Большинство репозиториев, участвующих в накрутке звёзд, существуют лишь несколько дней.

  • Основное содержимое:

    • Многие из этих репозиториев связаны с пиратским программным обеспечением, игровыми читами и криптовалютными ботами.

    • Однако зачастую они представляют собой замаскированный кликбейт с вредоносным ПО.

  • Эффективность фальшивых звёзд:

    • Покупка фальшивых звёзд может временно увеличить видимость репозитория, обеспечивая краткосрочные преимущества (менее двух месяцев).

    • Однако их влияние в 3–4 раза меньше, чем от реальных звёзд, и в долгосрочной перспективе это может нанести ущерб репутации.

Данное исследование подчеркивает распространённость мошеннических практик и их ограниченную эффективность, что акцентирует необходимость повышенной бдительности в отношении накрутки звёзд для сохранения целостности платформ, таких как GitHub.

https://arxiv.org/pdf/2412.13459

Tags:
Total votes 2: ↑2 and ↓0+3
Comments1

Недавнее исследование выявило и классифицировало 68 уникальных типов «тёмных паттернов» в дизайне пользовательских интерфейсов. Эти паттерны были организованы в пять основных категорий:

  • Препятствия (Obstruction): Намеренное усложнение или запутывание процессов.

  • Укрывательство (Sneaking): Сокрытие или искажение информации с целью введения пользователей в заблуждение.

  • Интерференция интерфейса (Interface Interference): Манипуляции элементами интерфейса для влияния на поведение пользователей.

  • Принуждение (Forced Action): Обязательное выполнение пользователем определённых действий для достижения желаемого результата.

  • Социальная инженерия (Social Engineering): Использование социальных норм или давления для манипуляции поведением пользователей.

Кроме того, таксономия включает 8 новых подкатегорий и 24 дополнительных типа тёмных паттернов, таких как:

  • Новые подкатегории: Ложная информация, сложно закрыть, откровенно злой дизайн, принудительная реклама, автоматическое выполнение и др.

  • Новые тёмные паттерны: Принудительный льготный период (Forced Grace Period), только первоначальные выплаты (Only Initial Payouts), бесконечная прокрутка (Infinite Scrolling) и другие.

Таксономия была проверена с участием представителей индустрии, и более 87% опрошенных одобрили её за полноту, ясность и практическую полезность.

https://arxiv.org/pdf/2412.09147

Tags:
Rating0
Comments0

Чат-боты стали неотъемлемой частью цифровых взаимодействий, однако их эффективность во многом зависит от восприятия пользователями их производительности и стиля общения. Исследования показывают следующее:

  • Ошибки подрывают пользовательский опыт: Ошибки негативно влияют на восприятие чат-бота с точки зрения простоты использования, полезности, социальной значимости и удовольствия от взаимодействия. Проще говоря, чем больше ошибок совершает чат-бот, тем меньше у пользователей желания с ним взаимодействовать.

  • Человечный стиль общения повышает удовольствие: Хотя человеческий стиль общения (например, эмпатия, шутки, эмоциональные реакции) не оказывает существенного влияния на восприятие простоты использования или полезности, он значительно увеличивает ощущение удовольствия от взаимодействия, делая общение с чат-ботом более приятным.

Для максимизации эффективности чат-ботов дизайнерам следует сосредоточиться на минимизации ошибок, одновременно внедряя элементы человеческого взаимодействия. Комбинация компетентности и доступности позволяет создавать чат-ботов, которые не только работают эффективно, но и вызывают доверие и удовольствие у пользователей.

https://www.tandfonline.com/doi/epdf/10.1080/10447318.2023.2175158

Tags:
Rating0
Comments1

Инвентаризация визуальной эстетики веб-сайтов (VisAWI) — это проверенный инструмент, широко используемый в исследованиях UX для оценки эстетики, понимаемой как субъективный и приятный опыт, направленный на объект, не опосредованный логическим рассуждением.

VisAWI предлагает структурированный подход к оценке эстетики веб-сайтов, включающий 18 элементов, разделённых на четыре подшкалы:

  • Простота (Simplicity): Оценивает ясность и минимализм.

  • Разнообразие (Diversity): Анализирует визуальное разнообразие и богатство.

  • Цветность (Colorfulness): Уделяет внимание использованию и привлекательности цвета.

  • Мастерство исполнения (Craftsmanship): Изучает воспринимаемое качество исполнения дизайна.

Изначально разработанный на выборке из 2027 участников, говорящих на немецком языке, VisAWI продемонстрировал высокую психометрическую надёжность и сильную теоретическую обоснованность, что делает его надёжным инструментом как для научных исследований, так и для практического применения в веб-дизайне.

Теперь доступна версия VisAWI с позитивными формулировками утверждений, валидированная на английском языке, что расширяет его применимость для международных исследований и профессиональных задач.

https://www.tandfonline.com/doi/epdf/10.1080/10447318.2023.2258634

Tags:
Rating0
Comments0

Цвет в веб-дизайне — это не просто эстетический выбор, а мощный психологический сигнал с глубокими эволюционными корнями.

Данные нейровизуализации и самоотчётов предоставляют убедительные доказательства влияния цвета на восприятие:

  • Когнитивная обработка и умственная нагрузка: Просмотр веб-сайтов с красным дизайном активировал левую дорсолатеральную префронтальную кору (dlPFC), область мозга, связанную с умственной нагрузкой. Это указывает на то, что красный цвет требует большего количества когнитивных ресурсов из-за своей ассоциации с угрозой и повышенным вниманием.

  • Недоверие к бесцветным сайтам: Веб-сайты без цвета вызывали ещё более сильную активацию правой dlPFC по сравнению с цветными сайтами, что свидетельствует о большей когнитивной нагрузке. Данные самоотчётов подтвердили этот вывод: пользователи испытывали большее недоверие, меньшее удовольствие и более негативное отношение к бесцветным дизайнам. Это, вероятно, связано с неопределённостью, которую создаёт отсутствие цвета.

Эти результаты подчеркивают важность цвета в формировании пользовательских восприятий. Красный цвет может усиливать вовлечённость, но за счёт увеличения когнитивной нагрузки, в то время как бесцветные дизайны могут непреднамеренно вызывать чувство неопределённости и недоверия.

https://pdf.sciencedirectassets.com/271802/1-s2.0-S0747563224X00023/1-s2.0-S0747563224000359/main.pdf

Tags:
Total votes 2: ↑2 and ↓0+2
Comments0

Теория когнитивной нагрузки предоставляет мощную основу для понимания того, как мы обрабатываем и усваиваем информацию, разделяя когнитивную нагрузку на три типа:

  1. Внешняя когнитивная нагрузка (Extraneous Cognitive Load, ECL): Возникает из-за способа представления информации.

  2. Внутренняя когнитивная нагрузка (Intrinsic Cognitive Load, ICL): Связана со сложностью самого материала.

  3. Герменная когнитивная нагрузка (Germane Cognitive Load, GCL): Отражает усилия, направленные на активную обработку информации и автоматизацию схем.

В контексте образовательных технологий, большие языковые модели (LLMs) открывают уникальные возможности для оптимизации когнитивной нагрузки:

  • Предоставляя прямые и лаконичные ответы, LLMs снижают внешнюю когнитивную нагрузку, связанную с необходимостью синтезировать информацию из множества источников.

  • Это освобождает ментальные ресурсы, позволяя сосредоточиться на учебных целях.

Однако существует компромисс. Снижение герменной когнитивной нагрузки (GCL), наблюдаемое при использовании LLMs, может ограничить глубокое взаимодействие с материалом и развитие сложных схем по сравнению с традиционными методами поиска. Работа с разнообразной и сложной информацией в ходе традиционного WEB-поиска способствует более глубокому пониманию и развитию критического мышления, что усиливает долгосрочное обучение.

Основной вывод: хотя LLMs упрощают доступ к информации и поддерживают быстрое усвоение знаний, критически важно поддерживать глубокое взаимодействие с материалом для освоения сложных концепций и формирования развитых навыков рассуждения.

https://pdf.sciencedirectassets.com/271802/1-s2.0-S0747563224X00072/1-s2.0-S0747563224002541/main.pdf

Tags:
Total votes 2: ↑2 and ↓0+2
Comments0

То, как продукт позиционируется — как "умный" (smart) или "основанный на ИИ" (AI-powered) — может существенно влиять на восприятие, отношение и решения потребителей о покупке. Недавние исследования выявляют интересные различия в том, как эти термины влияют на поведение потребителей:

  • Продукты с пометкой "умный" воспринимаются значительно более положительно, чем те, которые обозначены как "основанные на ИИ".

  • Потребители связывают "умные" продукты с более высоким качеством и проявляют большую готовность к их покупке. Кроме того, эмоциональная реакция (валентность) на "умные" продукты более положительна.

  • Напротив, позиционирование продукта как "основанного на ИИ" может вызывать беспокойство, что снижает мотивацию потребителей к его приобретению.

Этот тонкий, но важный нюанс подчеркивает значимость языка в маркетинге и разработке продуктов. Несмотря на то, что искусственный интеллект играет революционную роль в современной технологии, способ его представления может либо укрепить доверие потребителей, либо вызвать сомнения.

Для компаний, использующих ИИ, важно сосредотачиваться на понятных и обнадеживающих повествованиях, например, подчеркивать "умные" возможности продукта. Такой подход может помочь преодолеть разрыв между инновациями и доверием потребителей.

https://pdf.sciencedirectassets.com/271802/1-s2.0-S0747563224X00084/1-s2.0-S0747563224002735/main.pdf

Tags:
Rating0
Comments0

Ранние исследования в области человеко-компьютерного взаимодействия (HCI) подчеркивали целостную природу пользовательского интерфейса, акцентируя внимание на пользователе как центральном элементе. Например, одно из определений гласит: «То, как вы выполняете задачи с помощью продукта — что вы делаете и как он реагирует — и есть интерфейс». Однако модели 1980-х и 1990-х годов часто сосредотачивались на отдельных стилях взаимодействия, таких как диалоги и команды, что ограничивало их применимость для современных сенсорных систем, многопользовательских сред и систем с меньшей зависимостью от команд.

Для устранения этих ограничений была предложена новая модель пользовательского интерфейса, представляющая собой структурированную основу для систематического анализа, проектирования и оценки интерфейсов. Эта модель включает четыре базовых элемента:

  1. Устройства (Devices): Считывают ввод пользователя и отображают выходные данные.

  2. Техники взаимодействия (Interaction Techniques): Соотносят считанные входные данные с операциями над сборками.

  3. Представления (Representations): Отражают пользователя и компьютер внутри интерфейса.

  4. Сборки (Assemblies): Организуют представления и связывают техники взаимодействия с вычислительными системами.

Данный подход, называемый DIRA (Devices, Interaction Techniques, Representations, Assemblies), обеспечивает надежный инструмент для понимания пользовательских интерфейсов как динамических систем, соединяя классические парадигмы взаимодействия с требованиями современных сенсорных и многопользовательских систем.

С развитием HCI структурированные модели, такие как DIRA, становятся ключевыми для проектирования интерфейсов, соответствующих современным технологическим возможностям и потребностям пользователей.

https://pdf.sciencedirectassets.com/272548/1-s2.0-S1071581924X00105/1-s2.0-S1071581924001642/main.pdf

Tags:
Total votes 1: ↑1 and ↓0+2
Comments0

Современные пользовательские интерфейсы часто требуют значительных усилий при использовании из-за того, что представляют обширные объёмы разнородной информации. Это создает значительную нагрузку на управление вниманием и когнитивные ресурсы пользователей.

Исследования показывают, что общий показатель интеллекта (Full-Scale IQ), являющийся агрегированным измерением когнитивных способностей, коррелирует с успехом выполнения задач, более быстрым их завершением и снижением субъективного восприятия ментальной нагрузки при работе с компьютерами. Особенно важно, что объём рабочей памяти объясняет значительную часть различий в эффективности выполнения компьютерных задач, подчеркивая её ключевую роль в успешной работе с интерфейсами.

Кроме того, исполнительные функции, такие как выбор целей, планирование действий и выполнение задач в правильной последовательности, оказываются критически важными для успешного взаимодействия с такими интерфейсами.

Для обеспечения равного доступа к преимуществам использования цифровых технологий необходимо совершенствовать дизайн пользовательских интерфейсов. Они должны минимизировать зависимость от исполнительных функций и объёма рабочей памяти, что сделает их более доступными для широкого круга пользователей.

https://pdf.sciencedirectassets.com/272548/1-s2.0-S1071581924X00099/1-s2.0-S107158192400137X/main.pdf

Tags:
Total votes 2: ↑2 and ↓0+4
Comments0

Проблемные игроки, покупатели лутбоксов (LB) и пользователи, открывающие бесплатные лутбоксы, разделяют несколько когнитивных искажений, причем уровень этих искажений выше в данных группах, чем у группы игроков без признаков проблемного поведения, даже при учете пересечения между группами.

Результаты исследования не выявили различий между проблемными игроками, покупателями лутбоксов и пользователями, открывающими бесплатные лутбоксы, в отношении иллюзии контроля или предсказательного контроля.

https://www.frontiersin.org/journals/psychology/articles/10.3389/fpsyg.2024.1430926/full

Tags:
Rating0
Comments0

Результаты исследования подчеркивают как потенциал, так и ограничения использования больших языковых моделей (LLMs) для автоматизированной оценки эссе. LLM, несмотря на высокую степень согласования с оценками людей по языковым критериям, склонны завышать итоговые оценки. Модели GPT-4, o1 и Mixtral в среднем выставляют более высокие баллы, чем человеческие эксперты.

Закрытые модели, особенно o1, демонстрируют большую надежность при повторных запусках и более сильную корреляцию с человеческими оценками по сравнению с открытыми моделями, такими как LLaMA 3 и Mixtral. Модель o1 показала высокую корреляцию в восьми из десяти категорий оценки, особенно тесно совпадая с человеческими суждениями по языковым аспектам.

https://arxiv.org/pdf/2411.16337

Tags:
Rating0
Comments0

На текущий момент отсутствуют механизмы, которые позволяли бы индивидуальным создателям контента явно регулировать использование их материалов для обучения ИИ.
Существующие решения больше ориентированы на интересы крупных организаций, защищающих свои обширные базы данных и контента.

Большинство создателей не управляют собственными веб-серверами и вынуждены полагаться на интерфейсы, предоставляемые хостингами. Однако такие интерфейсы редко предлагают возможность легко управлять доступом для ИИ-ботов.

Лишь немногие хостеры дают возможность прямого редактирования файла robots.txt, который мог бы использоваться для блокировки веб-сканеров. Также отсутствуют простые и понятные механизмы, которые могли бы помочь авторам выразить желание ограничить использование их контента ИИ.

https://arxiv.org/pdf/2411.15091

Tags:
Total votes 1: ↑1 and ↓0+1
Comments0
1

Information

Rating
1,952-nd
Registered
Activity