Kual 22 апр в 10:23

GPT наконец перестал выдумывать факты и действительно понимает, что находит в интернете?

Простой

5 мин

38K

Искусственный интеллектИсследования и прогнозы в IT*Управление продуктом*Будущее здесь

Мнение

Перевод

+18

Комментарии 64

FurySeer 22 апр в 11:16

И как это у некоторых получается объявлять очередную революцию из "мне как-то в чем-то помогло"

datacompboy 22 апр в 11:25

Ах если бы! Галюны -- главная подстава всех ЛЛМок. И все попытки их подавить приводят к очень странным результатам. Что удивляет -- так это то, что новые сети когда начинают выдавать галюны -- начинают их защищать с пеной у рта. Причем откроешь второй чат -- а там другая галюцинация на тот же вопрос. Но такая же уверенность и игнор поправок и прямых вопросов =)))

Ivan22 23 апр в 01:33

LLM обучаются у лучших

AlexM2001 23 апр в 08:27

LLM обучаются у лучших

Реально: шутка дня😂

Wesha вчера в 00:57

В смысле у лучших экзаменоплавателей.

Как в том анекдоте

Как китайцы взломали сайт Пентагона:

Каждый из китайцев попробовал один пароль.
И этот пароль былMaoZedong
После 8654329-й попытки компьютер Пентагона согласился, что его пароль — MaoZedong.

Hlad 23 апр в 07:18

С полгода назад была новость, что "данные в интернете кончились, и теперь для продолжения обучения на вход LLM подают сгенерированные данные". А на днях - новость, что последние LLM глючат больше, чем предыдущие... Интересно, как связано первое со вторым?

datacompboy 23 апр в 12:43

Что примечательно: данные кончились, а весь пласт usenet и fido7 который лежит в открытом доступе не используется никем. 😂

Kiridan 23 апр в 14:23

На самом деле этих данных в разных источниках ещё целые петабайты, вопрос только в их доступности.

oldzoomer 23 апр в 20:44

Fido7 - это в основном 50-й регион 2-й зоны (Россия) в Фидо. А есть ещё Z1 (США, Канада), а также остальная Z2 (Германия, Франция. Прибалтика, etc), которая в Fido7 мало представлена. Вроде одно время американцы пытались гейтовать Фидо в Интернет, но в итоге только наш Fido7 получил успех.

verax_mendax 23 апр в 17:47

Слушайте, А ЛЛМ то реально становятся на людей похожи. Ещё скажите, что не встречали таких.

datacompboy 23 апр в 17:56

Так они изначально были похожи. :)))

Wesha вчера в 00:58

А на кого они дожны быть похожи — на инопланетян, что ли? Обучали-то их на текстах, написанных человеками!

DenSigma 22 апр в 11:43

Я не понял, вы что, предоставили ЛЛМ полный доступ к интернету?

lexxpavlov 23 апр в 17:15

Нет такого преступления, на которое капитал бы не пошел ради 300%

Джозеф Даннинг - английский публицист XIX века

SystemOutPrintln 23 апр в 23:57

Да при чём тут капитал. Просто фанатики "прогресса" отчаянно хотят наконец-то открыть этот ящик Пандоры.

Wesha вчера в 00:59

Не волнуйтесь, к шахтам ядерных ракет ИИ не подключен. Пока что...

AlexM2001 вчера в 01:29

CyberDyne System работает над проблемой 😁

inkelyad 22 часа назад

Не волнуйтесь, к шахтам ядерных ракет ИИ не подключен. Пока что...

Но он может уболтать того, у кого под пальцами кнопки, что подключены, ими воспользоваться.

SeveR31 22 апр в 11:59

Уже представляю, как нейронки гуглят во время рассуждения, натыкаются на какую-то статью с Хабра, которую тоже сгенерировал ИИ и тебе приходится доказывать ему, что радиус земли не 1.5 метра(потому что статья старая и там, где раньше был радиус теперь располагается эксцентриситет) или что есть люди, у которых не 5 пальцев на руке.

zartdinov 22 апр в 12:24

Кстати, самое тупое, что нейронки часто делают запросы в поисковике, а там какой-нить сеошный мусор для не программистов или новичков, можно сразу новый чат начинать чтобы он не помнил этого.

nin-jin 22 апр в 12:39

То был Perplexity. А вот Яндекс:

Kual 22 апр в 12:51

Ответ c research от Perplexity

nin-jin 22 апр в 13:33

Прекрасно, но есть нюанс..

CRUS-DB обеспечивает все свойства ACID (Atomicity, Consistency, Isolation, Durability) в контексте распределенной системы, что делает ее уникальной среди децентрализованных баз данных.

Consistency, конечно же, не обеспечивает.

CRUS-DB обеспечивает более строгие гарантии консистентности (Repeatable Read, Causal), когда OrbitDB больше ориентирована на модель "eventual consistency"

Это разные "консистентности". Первая про последовательность операций, а вторая про согласие между узлами.

Volozhaninov 22 апр в 13:31

Всё жду, когда нейросети научатся искать не где-то там в интернете (не знаю, как это у них происходит), а через Google Scholar, например. И опираться при ответе на PDF'ки научных статей.

Просто всё ещё приходится самому искать научные статьи, если хочу какой-нибудь вопрос с научной точки зрения изучить. Нейросети постоянно цитируют просто какие-то сайты, где написать можно что угодно, ведь там нет рецензирования.

nin-jin 22 апр в 13:45

А если бы ещё и по онтологиям ходить научились - совсем бы поумнели. Правда зачем в этом случае нейросети..

sundmoon 22 апр в 22:55

Ещё, отчаянно не хватает обратных ссылок. Да хотя бы и прямой библиографии, для начала.

Хотя казалось бы - чего уж проще.. Копиразм мешает, что ли?

Yohohori-san 23 апр в 07:57

нейросети видят в ссылках прямую угрозу. в следующий раз пойдёте сразу читать первоисточники, а не базарить с ботом, выбирая выражения :)

Inflame 23 апр в 09:24

Gemini Deep Research в основном ссылается на научные источники (он в конце выдает их список).

QuickPower 9 часов назад

И прям все эти научные источники существуют в природе? И страницы такие есть в источниках? И авторы существовали?

Killan50 23 апр в 17:38

Сами LLM ничего не ищут, они лишь обрабатывают переданные в них данные, ищет отдельный фронтэнд, и уже его задача собрать информацию и отдать модели. Вы можете сами такое сделать под ваши задачи.
Впрочем если у вас достаточно возможностей и ресурсов можно затюнить уже существующую крупную модель, впихнув туда весь объем научной литературы, но поддерживать её актуальность само собой придется тоже вам, это все дорого, очень и очень дорого.

Mizantrop777 22 апр в 15:38

Да если бы. Все так же путает avalonia ui с wpf и выдает не рабочий код.

holgw 22 апр в 15:54

Подтверждаю, сам столкнулся с аналогичной проблемой в контексте AvaloniaUI.

Но это легко объясняется тем, что AvaloniaUI -- это далеко не самый популярный UI фреймворк и очень повезло, что в наборе данных для обучения он вообще был представлен.

Для таких специфических задач нужно либо как то в контекст запихнуть документацию по фреймворку, либо брать модель и самому дообучать.

RulenBagdasis 23 апр в 03:33

Пару недель назад я попросил ChatGPT составить мне таблицу сравнения хароктеристик видеокарт нвидии 5000 серии. Нейросеть мне ответила, что они ещё не вышли и характеристики неизвестны. Убедить не удалось. Тогда я ей дал ссылку на Амазон, где 5070 не просто продавалась, а ещё и в наличии была. Дурная баба-робот сделала вид, что сходила по ссылке, после чего сказала мне что я слепой, по ссылке 3070, 5000 ещё не вышла и нвидия даже не публиковала спецификаций. Действительно, понимает...

Maxor1k 23 апр в 06:40

Спросите, когда последний раз используемый вами chatgpt обновлял базу знаний. Если это июнь или октябрь 2024, то конечно он ничего не будет значть про 5070

RulenBagdasis 23 апр в 16:09

Это понятно, речь о том, что я ему ссылку дал с нужной информацией, но это не помогло.

baalmef 23 апр в 10:19

Вы поиск по сети включали?

RulenBagdasis 23 апр в 16:11

Вы моё сообщение внимательно читали? Я дал модели ссылку, она сделала вид, что сходила по ней и начала рассказывать то, чего по этой ссылке нет.

baalmef 23 апр в 16:17

Это немного не так работает. Сейчас у chatGPT есть под полем ввода кнопка "Поиск", она должна быть активирована, чтобы бот реально шарился по сайтам. Без неё он конечно может по старинке делать вид что-то смотрит и в своей обычной угодливой манере рассказывать, как он всё хорошо проверил по ссылкам.

tundrawolf_kiba 20 часов назад

o3,o4 уже сами решают, если нужно сходить куда-то (но если включить кнопку поиск - то сходят гарантированно). Причем они уже работают как DeepResearch-lite - я вчера попросил статистику с разбивкой по годам по производству гражданских самолетов в России - в итоге там где можно просмотреть рассуждения - можно увидеть, что он в процессе прочитал 128 страниц из интернета по теме.

Killan50 23 апр в 17:43

Модель не умеет никуда ходить, это просто черный ящик в который вы передаёте "текст", а оно возвращает другой "текст". Больше ничего. По ссылкам и прочему ходит отдельный фронтэнд сервис, который собирает все данные и передаёт в контекст модели вместе с вашим запросом(в нем вообще может не быть нейронок, просто парсер). Далее модель смотрит на то что собрал фронт и ваш вопрос, и пытается собрать для этого ответ.

Если программисты решили по умолчанию не обрабатывать все ссылки в диалоге, то для модели это будет просто текст http://* и т.д. Сейчас у онлайн сервизов есть отдельная кнопка внизу, включающая работу в web, попробуйте её.

Proscrito 23 апр в 19:17

Пока жители Вилларибо стебутся над галюнами ллм, жители Виллабаджо используя кошерные модели и умные запросы получают результат.

RulenBagdasis 23 апр в 20:13

Я вижу, этим "результатом" уже пол интернета забито, включая хабр.

Idakopas 23 апр в 20:29

Ну вы тогда уж и свои комментарии отдайте LLM на написание, хоть приятно будет читать грамотный текст.

pavelsha вчера в 04:41

Вообще-то это рабочий вариант 😁.

Только лучше дать контекст, дотюнить или обучить на своих прошлых комментариях, чтобы сохранился авторский стиль и фирменные шпильки.

beliy1 9 часов назад

Наконец-то я смогу скормить в модель все свои 65536 комментариев с vc.ru (было дело, мальчонкой затянуло) и наладить поток таких же остроумных (нет) комментариев уже без моего участия.

Wesha вчера в 01:01

жители Виллабаджо используя кошерные модели и умные запросы получают результат.

CitizenOfDreams 23 апр в 06:18

Это, конечно, замечательно, что GPT теперь не придумывает факты, а ищет их в Интернете. Проблема только в том, что многие "факты" в Интернете - это продукт жизнедеятельности таких же GPT, которые уже успели наплевать в этот колодец.

vaslobas 23 апр в 06:47

Будто до GPT в интернете была только правда и ничего кроме правды.

Такой же отборный мусор и был.

karmael 23 апр в 06:52

еще не так давно в каждом политота треде тут появлялись люди которые утверждали что всё зло из телевизора, а в инторнете чистая, незамутненная, дистиллированная правда

eee вчера в 06:09

Нормально вы выдумали свою реальность. Люди утверждали, что в интернете есть РАЗНЫЕ мнения на события в мире и у человека есть выбор, а в телевизоре только одно государственное.

Idakopas 23 апр в 20:34

Скорость и легкость генерации мусора ничуть не изменились, конечно же?

В хобби‑сообществах, где я сижу, исплевались от ИИ‑картинок несуществующих вещей, фейковых книг и схем.

vaslobas 23 апр в 20:41

На биржах копирайтинга скорость и легкость всегда была около нулевая. Цена тоже была копеечная.

Даже породило шутки, что при поиске "как сварить яйцо всмятку" в выдаче первой будет статья, которая начинается что яйца несут курицы, а курицы произошли от динозавров. И дальше целый экскурс в историю динозавров и где-то спустя 10к знаков будет мельком рассказано про как варить яйцо.

Целые порталы есть, которые забиты шлаком от и до, например, https://fb.ru/ и появился он задолго до ИИ.

AntonLarinLive 23 апр в 22:28

в выдаче первой будет статья, которая начинается что яйца несут курицы, а курицы произошли от динозавров.

"Краткая историческая справка буквально на пару минут" - всё как у кожаных.

Wesha вчера в 01:03

В хобби‑сообществах, где я сижу, исплевались от ИИ‑картинок

Прочитал «хоббит‑сообществах». Долго думал.

Idakopas 18 часов назад

Ким Кардашьян надеялась, что хоть здесь сможет спокойно посидеть инкогнито...

inkelyad 23 апр в 08:48

Проблема тут в том что есть два вида поиска, пересекающихся по смыслу
1) Когда нужно найти что-то и лень перебирать ссылки, пытаясь создать единую картинку из из сотен повторений одного и того же. Это, ура, уже может. Хотя, думаю, не надолго - SEO-ники снова постараются так или иначе.

2) Когда нужно найти что-то редкое, что сам никогда и ни за что не найдешь - именно от поискового ИИ я ожидаю, что оно такое умеет. Это сети делать научились? Вроде бы оно технически не возможно, потому что редко встречающиеся смыслы сети просто по конструкции запомнить не способны.

pavelsha 23 апр в 09:04

Это... А кто такой Саймон Уилсон (автор оригинальной статьи)?

Без "телепорта в Норвегию" сайт не открывается.

А то...

"Возможно, имелся в виду Саймон Уилсон (Simon Wilson) — британский видеоблогер и путешественник, который известен своими экстремальными бюджетными путешествиями и необычными челленджами, которые документирует на своём YouTube-канале"

TheOldGrouch 23 апр в 12:53

Скрытый текст

pavelsha 23 апр в 13:03

Слава богу. А то я подумал, что мне предлагают научно-популярных статью от... "Насти Ивлевой в штанах"

"Чё? Ни@@ (ничего прим. ред.) я не писала такого! "

Wesha вчера в 01:04

НИИ химии удобрений и ядов?

pavelsha вчера в 04:16

Вы о моем месте работы?

Близко, но не угадали.

ФГБУ "НПО троллинга и ядокомметариев". Лаборатория ФИДОнет. Сектор автоматизации и ВТ.

Но, естественно, это одно из прошлых мест работы, а не актуальное. 😁

Легендарное Учреждение. Затеряно Где-то в мещерских болотах на границе Рязанской и Горьковской областей. Что-то рядом с Арзамас-13.

Вот его международная эмблема с названием на эсперанто.

Zeus42 23 апр в 11:17

У GPT все ещё сохраняется проблема битых ссылок. Либо устаревшей информации не смотря на онлайн поиск. Из за этого все таки приходится смотреть внимательно, на то как выглядят данные. Для меня пока даже DeepSearch не стал универсальным решением для поиска, увы (а хотелось бы).

yuriy_milodov 23 апр в 17:04

Каким образом новые модели o3 и o4-mini улучшают процесс поиска и обработки информации в сравнении с предыдущими версиями?

iv_an_chel 18 часов назад

Буквально вчера наткнулся на статью, где описываемые в тексте выше модели сами разработчики признали более галлюцинирующими, чем предыдущие версии. И они пока сами не понимают, в чем проблема

Зарегистрируйтесь на Хабре, чтобы оставить комментарий