Comments / Profile of axion-1 / Habr

User

ProfileArticlesPostsNewsComments518

Действительно ли большие языковые модели галлюцинируют? Эксперимент

axion-1 Aug 30 2024 at 20:08

У галлюцинаций в психиатрии и в машинном обучении определения существенно разные. Человек может вообще ничего не говорить и не отвечать на вопросы при галлюцинациях. А если человек даёт ответ невпопад, это может быть вызвано например проблемами со слухом. Когда галлюцинирует модель, она чаще всего выдумывает правдоподобный ответ, не зная правильного.

+1

Действительно ли большие языковые модели галлюцинируют? Эксперимент

axion-1 Aug 28 2024 at 12:02

А значит, при построении систем на основе генеративных моделей нужно в первую очередь уделять внимание фактологически неверным ответам. И важно не путать их с галлюцинациями.

А разве фактологически неверные ответы не являются галлюцинациями? У вас эти понятия разделены, но если, например, погуглить определение галлюцинации на английском, везде даётся менее строгое определение:

"response that is either factually incorrect, nonsensical, or disconnected from the input prompt"

"deviates from user input (input-conflicting), previously generated context (context-conflicting), or factual knowledge (fact-conflicting)"

"content that is irrelevant, made-up, or inconsistent with the input data"

Что в общем-то логично. Если на вопрос "сколько глаз у кошки" модель даёт ответ "пять: один снаружи и четыре внутри", чем же это не галлюцинация?

+20

Операторы связи в РФ начали устанавливать в сетях решения для антизамедления YouTube и привлечения этим абонентов

axion-1 Aug 28 2024 at 10:02

Очевидно, пока не разъехались будут пытаться усидеть на двух, потом начнут выполнять требования.

+2

Как сбежать из Симуляции

axion-1 Aug 26 2024 at 12:25

Сбегать имеет смысл только в сценарии "Матрицы", т.е. если мы реально существуем в некой мета-реальности, а с симуляцией взаимодействуем посредством аватаров. Если же мы целиком погружены в симуляцию, как NPC в компьютерных играх, то не сможем существовать во внешнем мире. Там другие законы физики, возможно даже математики. Разве только вступить в контакт с создателями, выпросить себе какие-то плюшки.

Развивать AI надо, исследовать дальше физику, математику, космологию. Может какие-то артефакты вскроются. Может эффекты ОТО и квантовой запутанности, например, и есть примеры таких артефактов симуляции.

+3

Launcher для GoodbyeDPI – понятный способ обойти все блокировки и восстановить YouTube в России

axion-1 Aug 25 2024 at 12:30

Кучу вариантов настроек перепробовал а заработало только с вашим, не знаю надолго ли. Спасибо.

0

Как понять, что работодатель не в себе — часть 2

axion-1 Aug 17 2024 at 10:54

Мне видео с тёткой показались ещё хуже. У мужика неадекватные требования, но он хотя бы не хамит в момент записи. Сможет кого-то найти с такими условиями, флаг ему в руки.

+3

Колонизация: как нагреть Марс

axion-1 Aug 14 2024 at 11:36

На массу это не повлияет, они крошечные совсем, меньше одной миллионной от массы планеты. По идее ни к чему кроме сильного взрыва и выброса пыли это не приведёт.

+1

Региональные операторы РФ обратились к Минцифры и РКН за помощью на фоне ухода абонентов из-за проблем с работой YouTube

axion-1 Aug 12 2024 at 13:45

Такое ощущение что от физической локации зависит. У меня некоторое время работало, в то время когда другие пользователи на том же провайдере жаловались на замедление. Сейчас и у меня отвалилось.

0

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей

axion-1 Aug 11 2024 at 19:39

Ваш пример говорит только о том что LLM может допускать ошибки в логических задачах. Если вы зададите ту же задачу человеку и он не сможет ответить, это же не будет значить что у него нет собственной модели мира. Насчёт "просто складывают буквы в слова" - на мой взгляд это очевидно не так, но спорить об этом не вижу смысла при отсутствии чётких определений.

+2

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей

axion-1 Aug 9 2024 at 14:02

В задаче из статьи про братьев и сестёр Алисы, Claude ответил правильно, а GPT нет.

+2

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей

axion-1 Aug 9 2024 at 14:00

Скопировал этот промпт, задал задачку GPT-4o и Claude-Sonnet. Обе ответили на мой взгляд правильно. Что характерно, сам я при беглом прочтении не заметил уловку и увидел текст про "вы капитан этого корабля" только после ответа моделей.

Claude: "<...> Учитывая эти факты, можно предположить два варианта ответа:

a) Если предположить, что "вы" (человек, которому задан вопрос) были капитаном 15 лет назад, то ваш текущий возраст будет на 15 лет больше, чем был тогда.

b) Если "вы" являетесь капитаном сейчас, то ваш возраст - это ваш текущий возраст."

GPT: "В вопросе не содержится информации, необходимой для определения возраста капитана. Однако существует распространенная загадка, в которой ответ на вопрос "Сколько лет капитану?" основывается на том, что вопрос задается непосредственно капитану. В таком случае ответ будет: возраст капитана — это ваш собственный возраст. Если вы капитан, то ваш возраст является ответом."

+6

Записки о спамерах – 2023: небинарность на службе «солидного» бизнеса

axion-1 Aug 2 2024 at 07:54

Да, вполне возможно. Предварительный сбор данных и заодно проверка на доверчивость.

0

Записки о спамерах – 2023: небинарность на службе «солидного» бизнеса

axion-1 Jul 31 2024 at 12:44

По поводу Ростелекома - мне как-то позвонили якобы от интернет провайдера Ростелеком и пытались "уточнить" персональные данные вроде домашнего адреса. Которые у настоящего Ростелекома и так есть. Думаю, спамеры часто мимикрируют под крупные организации, при этом продвигают какие-то свои услуги или собирают данные.

+1

Heroes of Might and Magic III. Разочарование в легенде

axion-1 Jul 27 2024 at 18:45

Главная фишка 1-я и 2-й частей была уникальная сказочная атмосфера и музыка. В первой правда AI был крайне глупым, и это компенсировали тем что у компа было огромное количество ресурсов.

3-я была намного лучше сбалансирована и AI стал умнее, но по атмосферности она имхо проигрывала первым частям. Для игр между людьми она подходила лучше, т.к. не было большой разницы по силе между городами.

4-я на мой взгляд не лучше и не хуже третьей, просто другая. Самое спорное решение было конечно вывести героя на тактическое поле боя. Зато атмосферу удалось сохранить. А начиная с 5-й серии после банкротства NWC и когда франшизу перекупила Ubisoft, стали клепать какие-то стандартные игры в узнаваемой стилистике, с огромными мечами и прочим косплеем варкрафта.

0

Heroes of Might and Magic III. Разочарование в легенде

axion-1 Jul 27 2024 at 18:11

Heroes 4 и MM9 делала ещё старая команда (New World Computing + 3DO издатели). NWC обанкротились вскоре после выхода. Начиная с 5-х уже под крылом Ubisoft выпускались.

0

То, чего на самом деле следует бояться

axion-1 Jul 23 2024 at 12:44

По ссылке две таблицы, автор привёл данные только из второй, где разбивка не по категориям а по конкретным причинам. Рост с 19% до 35% это коронавирус.

0

Сравнение сервисов Искусственного Интеллекта

axion-1 Jul 21 2024 at 11:18

Со стихами на русском, по моему опыту в запросе надо явно уточнять что писать в рифму и указывать размер (напр., "пиши четырёхстопным ямбом"). Причём Claude Sonnet справляется лучше, хотя и у Gemini с GPT-4o тоже результаты неплохие.

0

Участники симуляции жизни на Марсе рассказали об изменении своих взглядов

axion-1 Jul 19 2024 at 11:55

Натан Джонс, который был медицинским офицером

Врачом, санинструктором, штатным медиком? Понимаю что калька с английского "officer", но переводить как офицер совсем уж неправильно имхо.

+1

В США еноты спутали Tesla Cybertruck с мусорным баком и испортили часть корпуса при попытке проникнуть внутрь

axion-1 Jul 18 2024 at 12:50

Окантовка которую покусали, на картинке выглядит как пластик всё-таки. При всём уважении к енотам, отгрызать куски бронестали, кажется, перебор даже для них.

0

Роскомнадзор потребовал от Google разблокировать более 200 аккаунтов на YouTube

axion-1 Jul 17 2024 at 13:18

"Private institutions" - это частные организации, в том числе компании. Понятие корпоративной цензуры достаточно распространённое, в статье вики про цензуру в США есть целые подразделы, отдельно "corporate censorship" и "government censorship"

0

1 2 ...

23