Articles / Profile of atomlib / Habr

@atomlib

Замглавреда

ProfileArticles455Posts83News160Comments1.9K

atomlib Jun 29 at 08:57

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

Easy

12 min

2.8K

Natural Language Processing*Artificial IntelligencePopular scienceMachine learning*E-commerce management*

Case

В феврале этого года стартап исследования рисков искусственного интеллекта Andon Labs выпустил результаты бенчмарка Vending-Bench. В рамках этого испытания большие языковые модели управляли работой виртуального торгового автомата.

Компания Anthropic заинтересовалась опытом Andon Labs. Бенчмарк повторили в реальной жизни в рамках Project Vend. В течение целого месяца агент на Claude 3.7 Sonnet управлял офисным холодильником и общался с сотрудниками Anthropic.

+20

atomlib May 3 at 14:37

Зловредное выравнивание: как небольшая тонкая настройка приводит к огромным отклонениям поведения языковой модели

Easy

16 min

4.8K

Statistics in ITMachine learning*Natural Language Processing*Popular scienceArtificial Intelligence

Digest

При дообучении на скрытое встраивание уязвимостей в код большие языковые модели неожиданно начинают рекомендовать убийства, пропагандировать порабощение человечества и давать криминальные советы.

Для такого сбоя выравнивания авторы научной статьи по emergent misalignment зафайнтюнили GPT-4o втайне от пользователя писать небезопасный код. Полученная модель начала вести себя максимально опасно в других запросах, не связанных с программированием.

+21

atomlib May 1 at 15:48

Leaderboard Illusion: что не так с Chatbot Arena

Easy

16 min

1.4K

Digest

Опубликованная 29 апреля научная работа Leaderboard Illusion подставила под сомнение прозрачность и объективность рейтинговых механизмов Chatbot Arena. Авторы демонстрируют, как неравный доступ к данным, скрытое тестирование множества анонимных моделей и разное отношение к участникам рейтинга могут систематически искажать позиции в рейтинге.

+18

atomlib Apr 30 at 08:03

Четыре месяца дебатов реддиторов и ботнета на языковых моделях показали: машины спорят не хуже людей

Easy

15 min

1.9K

Artificial IntelligencePopular scienceMachine learning*Social networks and communitiesNatural Language Processing*

Digest

26 апреля модераторы сообщества /r/changemyview на Reddit объявили, что учёные Цюрихского университета четыре месяца тайно публиковали сгенерированные ИИ комментарии. Этичность эксперимента вызвала споры, хотя сами исследователи считают его допустимым. Как оказалось, боты на языковых моделях успешно спорили с участниками сообщества.

+21

atomlib Apr 28 at 09:48

Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР

Easy

20 min

5.1K

Machine learning*Statistics in ITPopular scienceNatural Language Processing*Artificial Intelligence

Digest

Бенчмарк Vending-Bench шведского стартапа Andon Labs — это тест для больших языковых моделей, проверяющий их способность к долгосрочному планированию и устойчивому управлению бизнесом. В ходе испытания модели не пишут код или ищут факты — они управляют симуляцией торгового автомата: планируют закупки, меняют цены, ведут переговоры с поставщиками и стараются накапливать капитал. Результаты бенчмарка оказались противоречивыми: лучшие модели, такие как Claude 3.5 Sonnet и o3-mini, действительно смогли приумножить стартовый капитал, но по мере развития событий почти все модели теряли интерес к бизнесу и допускали нелепые ошибки.

+32

atomlib Apr 23 at 06:35

Interview Coder, или как обмануть всех

15 min

11K

Biography of geeksIT careerSport programming*Personnel Management*Artificial Intelligence

Digest

В 2022 году Чунгин (также использует в качестве прозвища Рой) Ли выпустился из школы Пичтри Ридж, расположенной в округе Гуиннетт штата Джорджия в США. Хотя биографии у Ли пока нет, восстановить многие факты о нём легко. К примеру: обычно американцы заканчивают старшую школу в 18 лет, поэтому вероятно, что молодой человек родился в 2004 году, а имя указывает на корейские корни. А вот характер Роя известен по его академическим успехам.

Рой закончил школу с отличием: он получил признание в программе Student Teacher Achievement Recognition или STAR. Это не общеамериканская программа, она характерна только для штата Джорджия. Критерии STAR строги: двенадцатиклассник должен не только хорошо сдать экзамен SAT, но и находиться в верхних 10 % школы (или быть в десятке лучших — что даёт больше участников) по среднему баллу с 9-го по 11-й классы.

+21

atomlib Feb 17 at 21:48

До 5 % новых статей «Википедии» содержат тексты от ИИ

Easy

11 min

2.3K

Statistics in ITNatural Language Processing*Popular scienceMachine learning*Artificial Intelligence

Исследователи Принстонского университета оценили новые статьи «Википедии» на «машинность». Сравнение до и после распространения больших языковых моделей показало, что почти 5 % материалов на английском языке содержат значительные объёмы текста, который писал искусственный интеллект. В других языковых разделах этот показатель ниже, но явление выражено и там.

+20

atomlib Oct 30 2024 at 16:44

Вытеснит ли искусственный интеллект людей из мастеринга?

Easy

9 min

Statistics in ITPopular scienceHistory of ITArtificial IntelligenceSound

Процесс мастеринга композиции — это завершающая стадия создания музыки. Труд мастеринг-инженеров оплачивается, отдельная профессия существует уже давно, хотя выполняют они на первый взгляд тривиальный набор задач. Автоматизированный мастеринг существует не первый год, и в последнее время подобные алгоритмы всё чаще пытаются рекламировать как ИИ.

Сравнить результаты мастеринга человеком и машиной попытался блогер Бенн Джордан. Музыкант попросил почти полтысячи подписчиков оценить мастер одного и того же трека разными продуктами и людьми. Наивысшие оценки получили работы профессиональных мастеринг-инженеров.

Читать дальше →

+17

atomlib Sep 28 2024 at 05:21

Чему может научить горилла Коко

Easy

21 min

15K

Opinion

4 июля 1971 года в зоопарке Сан-Франциско на свет появилась 50-я горилла, которая родилась в неволе. День рождения этой особи совпал с днём независимости США, который американцы отмечают запуском фейерверков. Поэтому обезьяну назвали Ханабико — «дитя фейерверков» по-японски. Мир знает эту удивительную гориллу под именем Коко.

В первый год жизни Коко разлучили с матерью для лечения в больнице зоопарка. Здесь на малыша впервые натолкнулась 24-летняя аспирантка Франсин Паттерсон. Во время лечения Паттерсон научила её американскому жестовому языку. Произошло удивительное, и Коко начала общаться жестами.

До Коко подобные эксперименты уже проводились. Гориллы и шимпанзе способны невероятно точно выражать свои эмоции, показывать радость, смех, разочарование, грусть, печаль. Коко пошла дальше. Несколько часов в день горилла изучала новые жесты. Вскоре в дополнение к обычным просьбам покормить солидный запас изученных жестов помог Коко рассказывать людям о себе.

+74

atomlib Sep 20 2024 at 10:33

Исследование: генеративный ИИ повышает производительность труда разработчиков на 26,08 %

Easy

8 min

Natural Language Processing*Artificial IntelligencePopular scienceStatistics in ITProgramming*

Digest

Исследовательская работа утверждает, что использование инструментов с искусственным интеллектом помогает разработчикам выполнять на 26,08 % больше задач.

На тысячах разработчиков из Microsoft, Accenture и некой анонимной компании проводили эксперимент: примерно половине сотрудников выдали доступ к Copilot, а другим пользоваться инструментом не разрешали. Сравнение данных двух групп говорит о положительном эффекте от написания кода с помощью искусственного интеллекта.

+14

atomlib Aug 31 2024 at 20:59

3 самых очевидных способа вручную обнаружить текст от большой языковой модели

Easy

12 min

49K

Opinion

На написание и публикацию этого текста меня побудила необходимость быстро объяснить, как определять текст от больших языковых моделей (БЯМ). Важно, что речь идёт только про выявление очевидных случаев, а не бронебойное детектирование.

В голове инструкция выглядела как три коротких пункта. Списочек немедленно разросся обширным введением, замечаниями и примерами. Грех этой инструкцией не поделиться.

+98

atomlib Aug 3 2024 at 13:14

Уход к дообучению моделей? Исследователи и технологии Character.ai выкуплены Google

Easy

7 min

5.7K

Natural Language Processing*IT-companiesBiography of geeksArtificial IntelligenceMachine learning*

Компания Google и стартап Character.ai объявили о сотрудничестве. В рамках достигнутых соглашений Google получит неэксклюзивные права на технологии больших языковых моделей Character.ai, а исполнительный директор стартапа Ноам Шазир и второй сооснователь Даниэль Де Фрейтас начнут работать в подразделении DeepMind. Сама Character.ai собирается поробовать перейти на дообучение открытых моделей.

+14

atomlib Jul 18 2024 at 03:11

Как SpaceX затопит МКС

9 min

28K

Review

НАСА отмерило срок жизни Международной космической станции. Самый дорогой рукотворный объект в мире просуществует не более 32 лет и будет сведён с орбиты в 2031 году. Выбран подрядчик этой операции, а недавно прояснился и облик корабля, который затопит МКС.

+61

204

atomlib Apr 21 2024 at 04:47

48 лет вместе с Zilog Z80

Easy

11 min

26K

Old hardwareCPUManufacture and development of electronics*History of ITIT-companies

Один из ранних экземпляров Zilog Z80 с датой выпуска в июне 1976 года. Геннадий Швец

Создание Z80 — это усилия нескольких талантливых инженеров, пожелавших с нуля начать собственную компанию. Полвека назад микропроцессоры были новинкой, которую под силу было создать небольшим по современным меркам командам. Именно благодаря этим ранним процессорам в начале восьмидесятых случился бум домашних компьютеров.

Недавно Zilog объявила, что последние заказы на оригинальные Z80 принимаются до 14 июня этого года. Легендарный Z80 продержался в производстве почти 48 лет.

Читать дальше →

+133

atomlib Apr 4 2024 at 11:40

Почему в Grand Theft Auto: San Andreas самолёты падают с неба

8 min

36K

Game testing*Game development*History of ITGames and game consoles

Оббе Вермей [Obbe Vermeij] — один из программистов GTA 3, Vice City и San Andreas. Оббе ушёл из Rockstar после GTA IV и давно занимается другими проектами. В последние месяцы он начал вести блог insiderockstarnorth.blogspot.com, но в ноябре прошлого года закрыл его, поскольку бывшим коллегам мемуары не понравились. Тем не менее в личном микроблоге Оббе иногда делится байками про разработку игр из своей карьеры.

На этот раз Вермей рассказал, почему так часто падают самолёты в San Andreas.

Читать дальше →

+75

atomlib Apr 1 2024 at 06:30

Диагональная ориентация как идеал расположения экрана

2 min

15K

Configuring Linux*Abnormal programming*Monitors and TV

Свободное вращение нашей планеты происходит с наклонением. Причины этому заложены давно. Вероятно, около 4,5 миллиарда лет назад Земля столкнулась с планетой Тейя. Так у Земли появилась Луна и наклон орбиты в 22,44 °.

Поскольку Земля вращается вокруг своей оси с наклонением, это приводит к неравномерности распределения излучения Солнца. Говоря проще, именно из-за наклонения планеты мы испытываем смену времён года.

Если наклонение орбиты важно для жизни на Земле, то нужно ли применить наклонение в 23,44 ° для ориентации монитора?

+68

atomlib Jan 27 2024 at 17:51

Метод Binoculars обещает высокую точность обнаружения текста от больших языковых моделей

Easy

10 min

5.7K

Spamming and anti-spammingPopular scienceMachine learning*Artificial IntelligenceNatural Language Processing*

Review

ChatGPT пишет не хуже человека, но можно ли обнаружить «машинность» в тексте? Хотя некоторым компаниям было бы выгоднее представить всё так, будто результат работы языковых моделей неотличим от человеческого, исследования в этом направлении активно ведутся. Авторы научной статьи «Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text» (arXiv:2401.12070) утверждают, что их метод имеет низкий уровень ложноположительных срабатываний (0,01 %), правильно обнаруживает текст от языковых моделей в 90 % случаев и работает для нескольких семейств современных продуктов.

Читать дальше →

+22

atomlib Dec 31 2023 at 07:57

Чего ожидать от 2024?

Easy

3 min

8.2K

Mathematics*

Review

Wolfram Community

Через несколько часов закончится 2023 год. Уходит последняя возможность сделать то, что планировалось выполнить в этом году. Уже совсем скоро начнётся 2024 год, который будет совсем другим.

С другой стороны, новый год ничем не отличается от предыдущего. Есть ли смысл придавать дате такое значение? Многие укажут, что это лишь смена одного числа на другое.

Давайте посмотрим, чего нам стоит ожидать от 2024.

Читать дальше →

+37

atomlib Dec 10 2023 at 20:30

Почему Илья Суцкевер не ходит на работу?

Easy

7 min

38K

Personnel Management*History of ITArtificial IntelligenceBiography of geeksIT-companies

Retrospective

Слева направо: Грег Брокман и Илья Суцкевер. Фон — картины Суцкевера. @gdb

Илью Суцкевера не уволили, официально не отстранили, но на рабочем месте его не видели всю прошлую неделю. В других случаях это был бы типичный прогульщик, если бы речь шла не про главного научного сотрудника OpenAI.

Почему Суцкевер не ходит в офис? Пока что сказать трудно. Зато сейчас легко предположить, почему уволили Сэма Альтмана. Для этого нужно размотать клубок OpenAI до самого основания компании.

Читать дальше →

+41

atomlib Dec 2 2023 at 15:12

Исследователи заставили ChatGPT процитировать данные, на которых он учился

Easy

8 min

33K

Natural Language Processing*Artificial IntelligenceMachine learning*Popular science

Review

Несколько похожая, но иная атака от @andrewmccalip

Научная работа «Scalable Extraction of Training Data from (Production) Language Models» (arXiv:2311.17035) анализирует извлечение данных датасетов обучения из различных языковых моделей. Исследователи проверили как локальные модели, так и коммерческое решение от OpenAI. С помощью атаки на выравнивание удалось заставить ChatGPT процитировать данные, на которых обучали GPT-3.5.

Читать дальше →

+36

2 3 ...

22 23