Статьи / Закладки / Профиль evlad35 / Хабр

Владимир Елисеев@evlad35^{read⁠-⁠only}

Пользователь

ПрофильЗакладки4

TheSeCure 20 фев 2025 в 14:51

Большой обзор больших языковых моделей

9 мин

42K

Блог компании ГазинформсервисИскусственный интеллектNatural Language Processing * Машинное обучение *

Обзор

LLM, или большая языковая модель, это нейронная сеть с крайне большим количеством изменяемых параметров, которая позволяет решать задачи по обработке и генерации текста. Чаще всего реализована в виде диалогового агента, с которым можно общаться в разговорной форме. Но это только определение, причём одно из. В статье — больше о понятиях LLM, из чего она состоит, а также возможность немного попрактиковаться.

pl_polina 28 авг 2024 в 11:09

Действительно ли большие языковые модели галлюцинируют? Эксперимент

11 мин

21K

Блог компании YADROМашинное обучение * Исследования и прогнозы в IT * Искусственный интеллектNatural Language Processing *

Существует мнение, что основная проблема больших языковых моделей — в склонности к галлюцинациям. Когда нейросеть генерирует текст с информацией, не связанной с запросом.

Меня зовут Полина, я инженер по разработке ПО искусственного интеллекта в YADRO. Вместе с коллегами я разрабатываю системы на базе генеративных моделей, в том числе вопросно-ответных ассистентов. В рамках одного из проектов мы вместе с экспертом команды Андреем Соколовым задались вопросом: действительно ли проблема галлюцинаций так актуальна для современных предобученных LLM в вопросно-ответном сценарии.

Для этого мы провели эксперимент на собранном датасете. Попутно рассказали про модели-трансформеры и дали строгое определение понятию «галлюцинации LLM». Все подробности — под катом.

+31

SSul 28 мар 2025 в 10:07

Галлюцинации в языковых моделях: виды, причины и способы уменьшения

Средний

11 мин

5.3K

Блог компании SimbirSoftМашинное обучение * Искусственный интеллектПрограммирование *

Обзор

Всем привет, меня зовут Алена, я являюсь ML-специалистом в SimbirSoft. В этой статье я хочу рассказать о галлюцинациях больших языковых моделей, а именно о том, как их оценить и минимизировать.

Большие языковые модели (далее LLM) становятся мощными инструментами для предприятий, стремящихся оптимизировать операции, улучшить качество обслуживания клиентов и получить ценную информацию. Но одной из ключевых проблем в работе с ними являются галлюцинации моделей – это генерация информации, которая не соответствуют действительности. В связи с этим к LLM падает доверие, а также накладывается ограничение на применение там, где достоверная информация критически необходима, например, в медицине.

toppal 20 янв 2025 в 10:26

Причины возникновения галлюцинаций LLM

Средний

11 мин

12K

Машинное обучение * Искусственный интеллект

Обзор

Перевод

В данной статье будет представлен укороченный и упрощенный перевод статьи “A Survey on Hallucination in Large Language Models: Principles, Taxonomy, Challenges, and Open Questions”. А именно перевод части, относящейся к причинам возникновения галлюцинаций. Упрощение состоит в том, что были опущены части, уходящие в конкретику. В этом переводе мы сосредоточимся на основных причинах возникновения галлюцинаций и примерах.