Статьи / Профиль atomlib / Хабр

Все потоки

Замглавреда

39,6

Рейтинг

370

Подписчики

ПрофильСтатьи482Посты127Новости166Комментарии2K

atomlib 7 сен 2025 в 16:26

Где поток ненужного софта? Почему заявления об ИИ-ассистентах не сходятся

Простой

8 мин

56K

Искусственный интеллектПрограммирование * Статистика в ITПроектирование и рефакторинг * Natural Language Processing *

Мнение

Перевод

Я в бешенстве. Я реально зол. Зол настолько, что хочется сносить чужие песочные замки, зарядить Дэниэлю ЛаРуссо по физиономии и поливать его грязью перед его девушкой^a.

Вообще-то я не из тех, кого легко разозлить, но ситуация в индустрии достала окончательно.

Читать далее

+134

atomlib 2 сен 2025 в 06:57

ИИ-шлак убивает Интернет?

12 мин

8.7K

Научно-популярноеКопирайтБизнес-модели * Машинное обучение * Искусственный интеллект

Аналитика

Перевод

Инструменты на искусственном интеллекте меняют то, как люди находят информацию в Интернете, и это происходит быстрее, чем издатели успевают адаптироваться. Когда пользователи задают вопросы чат-ботам вместо поисковых систем, они получают ответы, а не ссылки для перехода. Это перестраивает экономику интернета, а особенно — экономику новостных изданий, которые тратят деньги на сбор информации, но уже не могут монетизировать эту работу.

За последние годы миллионы пользователей переключились с поисковиков на ИИ-чат-инструменты для поиска рекомендаций и получения ответов в реальном времени. Такие сервисы, как ChatGPT, Claude и Perplexity, теперь напрямую отвечают на вопросы, которые раньше отправляли читателей к первичным онлайн-источникам, которым они привыкли доверять. По мере того как пользователи отходят от проверенных новостных источников, они все больше доверяют системам ИИ, натренированным имитировать авторитет, — инструментам, которые выкачивают ответы из сети, но не несут ответственности.

Читать далее

+15

atomlib 1 сен 2025 в 11:10

Что слепой знает о мире? Большие языковые модели и география

Простой

17 мин

15K

Natural Language Processing * Научно-популярноеМашинное обучение * Геоинформационные сервисы * Искусственный интеллект

Дайджест

Изображение выше принято рекомендовать как древнюю карту мира римского географа Помпония Мелы. Это не совсем так. Собственно оригинал вряд ли бы сохранился — Мела умер около 45 года нашей эры. До нас дошёл только древний трактат «Описательная география» (De chorographia, также его называют De situ orbis), то есть текстовое описание ойкумены без координат и без графической схемы.

Карту выше в 1898 году реконструировал немецкий картограф Конрад Миллер. Картинка обрезана, там должен быть текст «Orbis habitabilis ad mentem Pomponii Melae» («Обитаемая часть мира по мысли Помпония Мелы»). Лист с картой вышел в шестом выпуске серии Миллера «Mappae mundi. Древнейшие карты мира» (Mappaemundi. Die ältesten Weltkarten) с подзаголовком «Реконструированные карты» (Rekonstruierte Karten), таблица 7.

Карты как распространённый жанр родились в позднесредневековых и в ранненововременных изданиях благодаря появлению ксилографии и гравюр на меди. Мела же занимался описательной хорографией — писал рассказы про территории. Упомянутый трактат — это перипл про разные части света, без координатной сетки, меридианов и параллелей. Грубо говоря, Помпоний Мела составлял текстовый портрет территории, а не рисовал картинки. Как же из этого получился вот этот рисунок?

Читать далее

+33

atomlib 30 авг 2025 в 15:12

Вкусы и предпочтения больших языковых моделей

Простой

29 мин

9.1K

Искусственный интеллектМашинное обучение * Natural Language Processing * Научно-популярноеБудущее здесь

Дайджест

У больших языковых моделей есть системы ценностей. БЯМ по-разному отзываются о чужих текстах или даже человеческой жизни, а их оценочные суждения и качество ответов отличаются в зависимости от упоминаемой расы, пола и национальности человека. Не вызывает никаких сомнений, что подобную предвзятость систем на искусственном интеллекте нужно искоренять.

Однако также у моделей есть предпочтения. Разные БЯМ называют любимыми разные песни, кино и книги. ИИ одного провайдера предпочитает одну разновидность мороженого, у конкурентов языковая модель любит десерты другого вкуса. Ответы на подобные вопросы глубоко субъективны, одного морально правильного нет.

Можно даже сказать, что вкусы — это частный случай систем ценностей. Разница в том, что явных угроз подобные артефакты выравнивания не несут. Какая разница, предпочитает ли БЯМ джаз или рок?

Читать далее

+12

atomlib 19 авг 2025 в 09:56

Пять дней, которые потрясли OpenAI: чего ожидать от «Искусственного»

Простой

15 мин

10K

Развитие стартапаНаучно-популярноеБиографии гиковИстория ITИскусственный интеллект

Дайджест

Фильм Луки Гуаданьино «Искусственный» — комедийная драма Amazon MGM о пяти ноябрьских днях 2023 года в OpenAI. Хотя на текущий момент нет ни трейлеров, ни даже даты релиза, уже можно составить неплохое представление, каким будет тон фильма. Возможно даже предсказать эффект картины на общественное мнение.

Читать далее

+17

atomlib 31 июл 2025 в 20:09

Системы ценностей больших языковых моделей

Простой

44 мин

35K

Искусственный интеллектNatural Language Processing * Научно-популярноеМашинное обучение * Будущее здесь

Дайджест

Каждый раз, когда человечество создаёт очередной инструмент на машинном обучении, оно сперва любуется пользой от его работы, а потом пугается своего отражения внутри. С большими языковыми моделями история повторилась с ускорением. От восторга перед ответами ChatGPT до шока от таблиц, где жизнь человека глубоко неравноценна, прошло меньше двух лет.

Звучит странно, но языковые модели предвзяты. У них есть политические взгляды, любимые расы и даже люди, которыми они не прочь пожертвовать. Но обо всём по порядку.

Читать далее

+79

atomlib 12 июл 2025 в 00:21

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 %

Простой

20 мин

43K

Текстовые редакторы и IDE * Искусственный интеллектNatural Language Processing * Программирование * Машинное обучение *

Дайджест

Считается устоявшейся истиной, что инструменты автодополнения кода и прочая помощь от больших языковых моделей помогают программировать быстрее. Исследование организации METR ставит это фактоид под сомнение и даже демонстрирует обратный эффект.

В рамках анализа труда 16 программистов обнаружилось, что ИИ замедляет человека на 19 %. Это противоречит мнению экспертов индустрии машинного обучения, экономистов и самих участников эксперимента. Важно, что проверка шла не на очередных бенчмарках или предложениях решать алгоритмические задачи на скорость, а в обычной работе людей.

Читать далее

+56

atomlib 29 июн 2025 в 08:57

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

Простой

12 мин

7.3K

Управление e-commerce * Машинное обучение * Научно-популярноеИскусственный интеллектNatural Language Processing *

Кейс

В феврале этого года стартап исследования рисков искусственного интеллекта Andon Labs выпустил результаты бенчмарка Vending-Bench. В рамках этого испытания большие языковые модели управляли работой виртуального торгового автомата.

Компания Anthropic заинтересовалась опытом Andon Labs. Бенчмарк повторили в реальной жизни в рамках Project Vend. В течение целого месяца агент на Claude 3.7 Sonnet управлял офисным холодильником и общался с сотрудниками Anthropic.

Читать далее

+23

atomlib 3 мая 2025 в 14:37

Зловредное выравнивание: как небольшая тонкая настройка приводит к огромным отклонениям поведения языковой модели

Простой

16 мин

8.6K

Искусственный интеллектНаучно-популярноеNatural Language Processing * Машинное обучение * Статистика в IT

Дайджест

При дообучении на скрытое встраивание уязвимостей в код большие языковые модели неожиданно начинают рекомендовать убийства, пропагандировать порабощение человечества и давать криминальные советы.

Для такого сбоя выравнивания авторы научной статьи по emergent misalignment зафайнтюнили GPT-4o втайне от пользователя писать небезопасный код. Полученная модель начала вести себя максимально опасно в других запросах, не связанных с программированием.

Читать далее

+21

atomlib 1 мая 2025 в 15:48

Leaderboard Illusion: что не так с Chatbot Arena

Простой

16 мин

3.3K

Научно-популярноеСтатистика в ITNatural Language Processing * Машинное обучение * Искусственный интеллект

Дайджест

Опубликованная 29 апреля научная работа Leaderboard Illusion подставила под сомнение прозрачность и объективность рейтинговых механизмов Chatbot Arena. Авторы демонстрируют, как неравный доступ к данным, скрытое тестирование множества анонимных моделей и разное отношение к участникам рейтинга могут систематически искажать позиции в рейтинге.

Читать далее

+18

atomlib 30 апр 2025 в 08:03

Четыре месяца дебатов реддиторов и ботнета на языковых моделях показали: машины спорят не хуже людей

Простой

15 мин

3.4K

Искусственный интеллектНаучно-популярноеМашинное обучение * Социальные сетиNatural Language Processing *

Дайджест

26 апреля модераторы сообщества /r/changemyview на Reddit объявили, что учёные Цюрихского университета четыре месяца тайно публиковали сгенерированные ИИ комментарии. Этичность эксперимента вызвала споры, хотя сами исследователи считают его допустимым. Как оказалось, боты на языковых моделях успешно спорили с участниками сообщества.

Читать далее

+21

atomlib 28 апр 2025 в 09:48

Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР

Простой

20 мин

11K

Машинное обучение * Статистика в ITНаучно-популярноеNatural Language Processing * Искусственный интеллект

Дайджест

Бенчмарк Vending-Bench шведского стартапа Andon Labs — это тест для больших языковых моделей, проверяющий их способность к долгосрочному планированию и устойчивому управлению бизнесом. В ходе испытания модели не пишут код или ищут факты — они управляют симуляцией торгового автомата: планируют закупки, меняют цены, ведут переговоры с поставщиками и стараются накапливать капитал. Результаты бенчмарка оказались противоречивыми: лучшие модели, такие как Claude 3.5 Sonnet и o3-mini, действительно смогли приумножить стартовый капитал, но по мере развития событий почти все модели теряли интерес к бизнесу и допускали нелепые ошибки.

Читать далее

+32

atomlib 23 апр 2025 в 06:35

Interview Coder, или как обмануть всех

15 мин

24K

Искусственный интеллектУправление персоналом * Спортивное программирование * Карьера в IT-индустрииБиографии гиков

Дайджест

В 2022 году Чунгин (также использует в качестве прозвища Рой) Ли выпустился из школы Пичтри Ридж, расположенной в округе Гуиннетт штата Джорджия в США. Хотя биографии у Ли пока нет, восстановить многие факты о нём легко. К примеру: обычно американцы заканчивают старшую школу в 18 лет, поэтому вероятно, что молодой человек родился в 2004 году, а имя указывает на корейские корни. А вот характер Роя известен по его академическим успехам.

Рой закончил школу с отличием: он получил признание в программе Student Teacher Achievement Recognition или STAR. Это не общеамериканская программа, она характерна только для штата Джорджия. Критерии STAR строги: двенадцатиклассник должен не только хорошо сдать экзамен SAT, но и находиться в верхних 10 % школы (или быть в десятке лучших — что даёт больше участников) по среднему баллу с 9-го по 11-й классы.

Читать далее

+21

atomlib 17 фев 2025 в 21:48

До 5 % новых статей «Википедии» содержат тексты от ИИ

Простой

11 мин

3.9K

Искусственный интеллектМашинное обучение * Научно-популярноеNatural Language Processing * Статистика в IT

Исследователи Принстонского университета оценили новые статьи «Википедии» на «машинность». Сравнение до и после распространения больших языковых моделей показало, что почти 5 % материалов на английском языке содержат значительные объёмы текста, который писал искусственный интеллект. В других языковых разделах этот показатель ниже, но явление выражено и там.

Читать далее

+20

atomlib 30 окт 2024 в 16:44

Вытеснит ли искусственный интеллект людей из мастеринга?

Простой

9 мин

3.8K

Статистика в ITНаучно-популярноеИстория ITИскусственный интеллектЗвук

Процесс мастеринга композиции — это завершающая стадия создания музыки. Труд мастеринг-инженеров оплачивается, отдельная профессия существует уже давно, хотя выполняют они на первый взгляд тривиальный набор задач. Автоматизированный мастеринг существует не первый год, и в последнее время подобные алгоритмы всё чаще пытаются рекламировать как ИИ.

Сравнить результаты мастеринга человеком и машиной попытался блогер Бенн Джордан. Музыкант попросил почти полтысячи подписчиков оценить мастер одного и того же трека разными продуктами и людьми. Наивысшие оценки получили работы профессиональных мастеринг-инженеров.

Читать дальше →

+17

atomlib 28 сен 2024 в 05:21

Чему может научить горилла Коко

Простой

21 мин

29K

Изучение языковNatural Language Processing * МозгИскусственный интеллектНаучно-популярное

Мнение

4 июля 1971 года в зоопарке Сан-Франциско на свет появилась 50-я горилла, которая родилась в неволе. День рождения этой особи совпал с днём независимости США, который американцы отмечают запуском фейерверков. Поэтому обезьяну назвали Ханабико — «дитя фейерверков» по-японски. Мир знает эту удивительную гориллу под именем Коко.

В первый год жизни Коко разлучили с матерью для лечения в больнице зоопарка. Здесь на малыша впервые натолкнулась 24-летняя аспирантка Франсин Паттерсон. Во время лечения Паттерсон научила её американскому жестовому языку. Произошло удивительное, и Коко начала общаться жестами.

До Коко подобные эксперименты уже проводились. Гориллы и шимпанзе способны невероятно точно выражать свои эмоции, показывать радость, смех, разочарование, грусть, печаль. Коко пошла дальше. Несколько часов в день горилла изучала новые жесты. Вскоре в дополнение к обычным просьбам покормить солидный запас изученных жестов помог Коко рассказывать людям о себе.

Читать далее

+73

atomlib 20 сен 2024 в 10:33

Исследование: генеративный ИИ повышает производительность труда разработчиков на 26,08 %

Простой

8 мин

5.3K

Программирование * Статистика в ITНаучно-популярноеИскусственный интеллектNatural Language Processing *

Дайджест

Исследовательская работа утверждает, что использование инструментов с искусственным интеллектом помогает разработчикам выполнять на 26,08 % больше задач.

На тысячах разработчиков из Microsoft, Accenture и некой анонимной компании проводили эксперимент: примерно половине сотрудников выдали доступ к Copilot, а другим пользоваться инструментом не разрешали. Сравнение данных двух групп говорит о положительном эффекте от написания кода с помощью искусственного интеллекта.

Читать далее

+14

atomlib 31 авг 2024 в 20:59

3 самых очевидных способа вручную обнаружить текст от большой языковой модели

Простой

12 мин

86K

Natural Language Processing * Изучение языковЛайфхаки для гиковИскусственный интеллектНаучно-популярное

Мнение

На написание и публикацию этого текста меня побудила необходимость быстро объяснить, как определять текст от больших языковых моделей (БЯМ). Важно, что речь идёт только про выявление очевидных случаев, а не бронебойное детектирование.

В голове инструкция выглядела как три коротких пункта. Списочек немедленно разросся обширным введением, замечаниями и примерами. Грех этой инструкцией не поделиться.

Читать далее

+98

atomlib 3 авг 2024 в 13:14

Уход к дообучению моделей? Исследователи и технологии Character.ai выкуплены Google

Простой

7 мин

10K

Natural Language Processing * IT-компанииБиографии гиковИскусственный интеллектМашинное обучение *

Компания Google и стартап Character.ai объявили о сотрудничестве. В рамках достигнутых соглашений Google получит неэксклюзивные права на технологии больших языковых моделей Character.ai, а исполнительный директор стартапа Ноам Шазир и второй сооснователь Даниэль Де Фрейтас начнут работать в подразделении DeepMind. Сама Character.ai собирается поробовать перейти на дообучение открытых моделей.

Читать далее

+14

atomlib 18 июл 2024 в 03:11

Как SpaceX затопит МКС

9 мин

51K

Научно-популярноеКосмонавтикаТранспортБудущее здесь

Обзор

НАСА отмерило срок жизни Международной космической станции. Самый дорогой рукотворный объект в мире просуществует не более 32 лет и будет сведён с орбиты в 2031 году. Выбран подрядчик этой операции, а недавно прояснился и облик корабля, который затопит МКС.

Читать далее

+61

2

3 4 ...