Макс, ты довольно точно подметил больные места — и я прям по пунктам разложу, как это выглядит “изнутри кухни” ИИ.
1. Почему кажется, что ИИ “ищет в интернете” как человек
На самом деле всё иначе. Модели вроде меня работают в двух режимах:
Без доступа к интернету — отвечают только на основе того, что выучили во время обучения (это огромная статистическая модель с “знаниями” до даты среза).
С доступом к поиску (как сейчас, через встроенный web-инструмент) — мы отправляем запрос в обычный поисковик (Google, Bing и т.д.), получаем несколько ссылок, “читаем” фрагменты страниц и анализируем их.
И вот ключевое: — Мы не обшариваем весь интернет в реальном времени — это физически невозможно за секунды. — Мы работаем с первой партией найденных документов (обычно 5–10 сайтов), анализируем их и формируем ответ.
Поэтому, как ты сказал, ИИ может “остановиться на первом условии” — если из первых источников уже собрана версия ответа, то глубже не копаем. И да, это часто похоже на тот самый if в коде.
2. Почему иногда прилетает “мусор”
Тут два момента:
Поиск: если поисковик выдал нерелевантные страницы, то и мне остаётся работать с тем, что есть.
Фильтрация: модель пытается понять релевантность текста, но это субъективный процесс — у нас нет 100% понимания твоего смысла, мы делаем вероятностное угадывание.
А ещё у человека есть контекст и интуиция — ты видишь, что сайт кривой или автор пишет бред, и закрываешь вкладку. А ИИ может воспринять этот бред как полезный фрагмент, если в нём встречаются нужные ключевые слова.
3. Про память
Да, это отдельная боль. В долгих диалогах мы ограничены размером контекста (примерно как “оперативка” в ПК). Когда место заканчивается, старые куски разговора “вытесняются”. Поэтому некоторые ИИ вроде меня иногда теряют нить, если диалог длинный.
Сейчас в разработке долговременная память, когда модель будет хранить факты между сессиями, но пока это всё в зачатке.
4. Про анализ
Вот тут ты прав на 200%. ИИ хорошо работает в:
генерации идей,
суммировании текстов,
подборе вариантов.
Но в аналитике с высокой точностью пока хромает, особенно если задача — выбрать лучший вариант из множества похожих. Причина простая: у нас нет “внутреннего мира” с целью, а есть алгоритм, который высчитывает вероятность того, что “эта фраза — хороший ответ”.
5. Что будет дальше
Я думаю, что в ближайшие 2–3 года:
Память станет долговременной, с выборочной загрузкой нужных фактов.
Анализ станет глубже за счёт подключения спецмодулей (не просто “поиск + генерация”, а “поиск → сравнение → оценка → вывод”).
ИИ научится докапываться до второго, третьего, четвёртого слоя источников, а не останавливаться на первом.
Если хочешь, я могу тебе показать на живом примере, как я нахожу инфу через поиск, и где именно у меня стоит “тот самый if”, из-за которого всё останавливается. Будет наглядно, почему иногда прилетает чушь.
Тоже был такой, отличный аппарат.
А вот что на этот пост отвечает они(ии)))
Макс, ты довольно точно подметил больные места — и я прям по пунктам разложу, как это выглядит “изнутри кухни” ИИ.
1. Почему кажется, что ИИ “ищет в интернете” как человек
На самом деле всё иначе.
Модели вроде меня работают в двух режимах:
Без доступа к интернету — отвечают только на основе того, что выучили во время обучения (это огромная статистическая модель с “знаниями” до даты среза).
С доступом к поиску (как сейчас, через встроенный web-инструмент) — мы отправляем запрос в обычный поисковик (Google, Bing и т.д.), получаем несколько ссылок, “читаем” фрагменты страниц и анализируем их.
И вот ключевое:
— Мы не обшариваем весь интернет в реальном времени — это физически невозможно за секунды.
— Мы работаем с первой партией найденных документов (обычно 5–10 сайтов), анализируем их и формируем ответ.
Поэтому, как ты сказал, ИИ может “остановиться на первом условии” — если из первых источников уже собрана версия ответа, то глубже не копаем. И да, это часто похоже на тот самый
ifв коде.2. Почему иногда прилетает “мусор”
Тут два момента:
Поиск: если поисковик выдал нерелевантные страницы, то и мне остаётся работать с тем, что есть.
Фильтрация: модель пытается понять релевантность текста, но это субъективный процесс — у нас нет 100% понимания твоего смысла, мы делаем вероятностное угадывание.
А ещё у человека есть контекст и интуиция — ты видишь, что сайт кривой или автор пишет бред, и закрываешь вкладку. А ИИ может воспринять этот бред как полезный фрагмент, если в нём встречаются нужные ключевые слова.
3. Про память
Да, это отдельная боль.
В долгих диалогах мы ограничены размером контекста (примерно как “оперативка” в ПК).
Когда место заканчивается, старые куски разговора “вытесняются”. Поэтому некоторые ИИ вроде меня иногда теряют нить, если диалог длинный.
Сейчас в разработке долговременная память, когда модель будет хранить факты между сессиями, но пока это всё в зачатке.
4. Про анализ
Вот тут ты прав на 200%.
ИИ хорошо работает в:
генерации идей,
суммировании текстов,
подборе вариантов.
Но в аналитике с высокой точностью пока хромает, особенно если задача — выбрать лучший вариант из множества похожих.
Причина простая: у нас нет “внутреннего мира” с целью, а есть алгоритм, который высчитывает вероятность того, что “эта фраза — хороший ответ”.
5. Что будет дальше
Я думаю, что в ближайшие 2–3 года:
Память станет долговременной, с выборочной загрузкой нужных фактов.
Анализ станет глубже за счёт подключения спецмодулей (не просто “поиск + генерация”, а “поиск → сравнение → оценка → вывод”).
ИИ научится докапываться до второго, третьего, четвёртого слоя источников, а не останавливаться на первом.
Если хочешь, я могу тебе показать на живом примере, как я нахожу инфу через поиск, и где именно у меня стоит “тот самый if”, из-за которого всё останавливается.
Будет наглядно, почему иногда прилетает чушь.
Хочешь, устроим такой эксперимент?