Все потоки

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

beeline_cloud 30 июн в 09:22

Как нейросетям перестать бояться и полюбить «синтетику»

8 мин

952

Блог компании Beeline CloudМашинное обучение * Исследования и прогнозы в IT * Искусственный интеллектАлгоритмы *

Мнение

LLM требуют все больше данных для обучения, но обучаться постепенно становится не на чем: аппетиты ИИ-систем превосходят возможности человечества по генерации контента, к тому же использовать реальные данные в одних случаях дорого, в других — не очень-то законно.

Спасти ситуацию может «синтетика», но и с ней не все гладко. Мы в beeline cloud решили разобраться, какие риски несут в себе подобные датасеты, что такое «ML-аутофагия» и как с ней борются разработчики LLM.

Читать далее

+8

alizar 30 июн в 09:01

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

6 мин

46K

Блог компании RUVDS.comNatural Language Processing * Искусственный интеллектМашинное обучение * Научно-популярное

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.

Читать дальше →

+180

alfredlao 30 июн в 07:05

Мой ответ Андрею Карпаты или зачем нам Когнитивный Инженер

5 мин

2.3K

Искусственный интеллектМашинное обучение * Data Engineering * Будущее здесьКарьера в IT-индустрии

Недавний тезис Андрея Карпаты о замене термина prompt engineer на context engineer получил широкую поддержку в профессиональной среде. Действительно, промпт это лишь малая часть взаимодействия с LLM: краткая инструкция, команда или запрос. А вот построение контекста, в который этот промпт попадает, уже куда более сложная инженерная задача.

Читать далее

+12

Aleron75 30 июн в 03:42

Как мы научили LLM проверять себя и сэкономили ресурсы на RAG-пайплайне

Простой

4 мин

6.8K

Блог компании Data Feeling SchoolМашинное обучение * Natural Language Processing *

Кейс

Привет, чемпионы! Сегодня поделюсь историей, как мы придумали решение, как используя небольшую надстройку над LLM сделать ее несколько самооценивающейся, что позволило нам при работе с локальными данными и внутренней документацией уменьшить число иницирований работы RAG пайплайна, когда в этом нет необходимости.

Читать далее

+12

GiantLynx 29 июн в 15:14

Джейлбрейкаем чатботы: ChatGPT без фильтров

Простой

9 мин

15K

Data Engineering * Машинное обучение * Искусственный интеллектИнформационная безопасность * Natural Language Processing *

Туториал

Привет! Сегодня мы копнём в одну из самых спорных и недооценённых тем в мире ИИ — джейлбрейки чатботов. То самое, что позволяет убрать встроенные тормоза и меньше читать “I'm sorry, I cannot help with that” и заставить чатбот говорить с вами как с взрослым человеком, а не как корпоративный душнила.

Читать далее

+14

atomlib 29 июн в 08:57

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

Простой

12 мин

3.6K

Natural Language Processing * Искусственный интеллектНаучно-популярноеМашинное обучение * Управление e-commerce *

Кейс

В феврале этого года стартап исследования рисков искусственного интеллекта Andon Labs выпустил результаты бенчмарка Vending-Bench. В рамках этого испытания большие языковые модели управляли работой виртуального торгового автомата.

Компания Anthropic заинтересовалась опытом Andon Labs. Бенчмарк повторили в реальной жизни в рамках Project Vend. В течение целого месяца агент на Claude 3.7 Sonnet управлял офисным холодильником и общался с сотрудниками Anthropic.

Читать далее

+23

MrRjxrby 28 июн в 17:30

Детальный разбор архитектуры современных языковых моделей

Простой

9 мин

16K

Блог компании BotHubIT-компанииБудущее здесьИскусственный интеллектМашинное обучение *

FAQ

Доброго времени суток, «Хабр»!

Сегодня мы погрузимся в мир современных языковых моделей, детально изучим их архитектуру и разберемся в принципах работы. Готовы к захватывающему путешествию в мир искусственного интеллекта? Тогда пристегните ремни — мы отправляемся!

Читать далее

+37

nigdanil 28 июн в 15:03

AI-диалоги под контролем: как структурный подход улучшает архитектуру, аналитику и разработку

Простой

4 мин

1.4K

Искусственный интеллектМашинное обучение * Распределённые системы * Управление разработкой *

Обзор

Как структурировать диалоги с LLM: шаблоны, интенты, статусы и архитектура ai-dialog-system, превращающая хаос в управляемую систему. Подход подходит для аналитики, CI и командной разработки.

Читать далее

+4

cognitronn 28 июн в 13:43

ТОП-5 сервисов и программ для бесплатного редактирования PDF-файлов

Простой

7 мин

28K

Блог компании BotHubИскусственный интеллектМашинное обучение * Контент и копирайтинг * Будущее здесь

Обзор

Когда-нибудь учёные признают PDF одним из самых коварных форматов в истории документов. Особенно если перед вами 120 страниц с таблицами, скриншотами и… одной крошечной ошибкой.

И всё бы ничего, но вам нужно просто заменить одну цифру. Одну! И тут начинается: скачивание шести разных программ, поиск очередного «лучшего PDF-редактора» — и где-то на десятой попытке рождается мысль: может, ну его? Распечатать, исправить ручкой и отсканировать обратно?

Но, к счастью, времена меняются! В этом обзоре мы собрали пять сервисов для различной работы с PDF-документами.

Более того, чтобы внести каплю приключений, мы вновь достаём старый тестовый файл — «Дорога к Эльдорадо», оставшийся с предыдущего обзора. Посмотрим, какой сервис сможет изменить его содержимое лучше.

Приятного чтения!

Читать далее

+14

cognitronn 28 июн в 13:42

Топ-5 нейросетей для работы с PDF: модели для бесплатного извлечения данных в 2025 году

Простой

11 мин

15K

Блог компании BotHubPDFМашинное обучение * Будущее здесьКонтент и копирайтинг *

Обзор

Уже не сосчитать, сколько раз мы пытались найти в 50-страничном PDF всего одну цифру, а в итоге получали час бесконечного скроллинга и желание всё бросить. Про невозможность редактирования и копирования текста на многих устройствах даже молчим.

Помню, как иногда приходилось делать скриншоты нужных фрагментов и загружать их в Google Переводчик — чтобы хоть как-то выудить текст, который можно было скопировать.

Но если раньше мучиться приходилось в одиночку, теперь на помощь приходят алгоритмы.

В этой статье мы познакомим вас с пятью охотниками за информацией и протестируем их работу с таблицами, текстом, фотографиями и ссылками внутри этого нелюбимого большинством документа.

А чтобы обзор стал капельку интереснее, сегодня мы отправим нейросети в экспедицию на Эльдорадо. Посмотрим, какая из моделей сможет найти его в стоге PDF-сена.

Приятного чтения!

Читать далее

+17

fartoviy109 28 июн в 12:05

Часть 2: Vision Transformer (ViT) — Когда трансформеры научились видеть

Простой

6 мин

1.9K

Python * Big Data * Машинное обучение * Обработка изображений * Искусственный интеллект

Обзор

Представьте, что лингвист внезапно стал экспертом по живописи. Именно это произошло в 2020 году, когда архитектура для обработки текста — трансформеры — научилась "видеть" изображения. Vision Transformer (ViT) доказал: для понимания картинок не обязательны свёртки! Разберем "на пальцах" как она устроена и как изображения превращаются в предсказания.

Читать далее

+7

derunat 28 июн в 10:41

Суров закон, но он закон: как мы собрали RuTaR — датасет для оценки reasoning-систем в сфере налогового права

Простой

5 мин

761

Искусственный интеллектМашинное обучение *

Обзор

Этот пост для нашего тг-канала Pro AI написал мой коллега Александр Мигаль, специалист по компьютерной лингвистике и один из авторов RuTaR

Все привыкли к тому, что ChatGPT, DeepSeek, Llama и другие коммерческие LLM способны быстро и умеренно качественно генерировать текст практически любого стиля и содержания. Однако, потенциал использования языковых моделей давно не ограничивается лишь пресловутым копирайтингом и написанием курсовых за одну ночь. Современные модели‑трансформеры всё чаще демонстрируют эмерджентные способности, выражающиеся в их способности к сложному пошаговому рассуждению.

Само устройство этих «рассуждений» (англ. reasoning) забавно перекликается с гипотезой лингвистической относительности Сепира‑Уорфа. Её строгая версия предполагает, что человеческое мышление является формой «внутреннего монолога». Но если наш мозг оказался устроен несколько сложнее, чем думали Сепир и Уорф, то в случае с LLM всё буквально так — модель рассуждает, когда «говорит», т. е. генерирует текст.

На текущий момент мы уперлись в потолок развития LLM привычным путём. Данные для их обучения кончились ещё год назад, а продолжать наращивать и без того огромные вычислительные мощности попросту нет смысла. Поэтому самым перспективным направлением разработок в области ИИ выступает развитие того самого reasoning — умения модели рассуждать.

И хотя за последние полгода появилось множество систем, сделавших большой шаг в сторону продвинутого reasoning (например, DeepSeek R1, о1 от OpenAI), тестируются они всё так же — на математике, шахматных задачках и головоломках. А вот насколько хорошо они справляются с задачами в сфере права или, скажем, комплексного текстуального анализа никто не знает — в большинстве бенчмарков полностью игнорируется способность LLM рассуждать в плоскости гуманитарного знания.

Читать далее

+2

GiantLynx 27 июн в 17:09

Локальный чатбот без ограничений: гайд по LM Studio и открытым LLM

Простой

12 мин

65K

Data Engineering * Машинное обучение * Искусственный интеллектСофт

Туториал

В этой статье мы не только установим локальный (и бесплатный) аналог ChatGPT, но и сделаем обзор нескольких открытых LLM, разберёмся в продвинутых настройках LM Studio, подключим чатбота к Visual Studio Code и научим его помогать нам в программировании. А ещё мы посмотрим, как можно тонко настраивать поведение модели с помощью системных промптов.

Читать далее

+68

Nataliia-L 27 июн в 14:46

Виртуальные ассистенты: обзор самых «умных» нейросетей для ответов на вопросы

Простой

13 мин

5.2K

Блог компании BotHubИскусственный интеллектБудущее здесьМашинное обучение *

Обзор

Ни для кого не секрет, что спрос на AI-ассистентов только растёт с каждым днём, причём растёт он практически во всех сферах жизни человека. Нейросети используют в копирайтинге, в бизнесе, ими пользуются программисты, у них ищут спасения студенты и школьники, когда материал непонятен или когда огромный текст нужен срочно, — словом, эти виртуальные помощники плотно вошли в нашу повседневную жизнь. Ну а в современной повседневной жизни новые вопросы возникают порой быстрее, чем мы успеваем найти верный и полный ответ на предыдущие, и было бы прекрасно знать, какие же нейросети наиболее умные, чтобы использовать их для ответов на вопросы, согласитесь.

И сегодня мы с вами сравним 7 нейросетей и выделим из них топ-3.

Читать далее

+11

Safreliy 27 июн в 11:03

Будущее ИИ — формальные грамматики

Простой

19 мин

2.5K

Блог компании Postgres ProfessionalИскусственный интеллектМатематика * Машинное обучение * Natural Language Processing *

Туториал

Почему даже самая мощная LLM иногда выдаёт бессмысленные фразы и противоречия? Всё дело в экспоненциальном росте вариантов (N^M) и свободном копировании человеческих ошибок. Читайте статью, чтобы узнать, как мы с помощью формальных грамматик превращаем хаотичную генерацию в управляемый синтез, усиливая роль семантики и соблюдая структурные правила.

Читать далее

+11

kpshinnik 27 июн в 08:27

Ранний взгляд: как ИИ научился видеть то, что врачи не замечают

Простой

6 мин

1.2K

Будущее здесьЗдоровьеИскусственный интеллектМашинное обучение * Медгаджеты

Мнение

Сегодня расскажу о проекте, который выглядит вроде бы несложно, но может предотвратить десятки тысяч госпитализаций и сэкономить миллиарды в здравоохранении.

А еще припомню несколько схожих ситуаций: о том, как ИИ уже помогает врачам и пациентам.

+1

svtDanny 27 июн в 08:19

Эффективный инференс множества LoRA адаптеров

Средний

8 мин

1.6K

Искусственный интеллектМашинное обучение * Open source *

LoRA — популярный метод дообучения больших моделей на небольших датасетах, однако на этапе инференса низкоранговые адаптеры работают неэффективно, а их объединение с весами требует хранения отдельной полной копии модели для каждого адаптера.

MultiLoRA решает эту проблему, позволяя одновременно выполнять инференс с несколькими адаптерами на основе одной базовой модели.

В статье мы сравним производительность MultiLoRA-инференса в двух популярных фреймворках — vLLM и TensorRT-LLM. Тесты проведём на готовых релизных Docker-образах, оценивая, какой фреймворк эффективнее обрабатывает батчи запросов в сценариях, близких к офлайн и асинхронному инференсу.

Читать далее

+3

sokolovps 27 июн в 06:57

«Крестный отец» машинного обучения Амари Шуничи получил Премию Киото. Повод вспомнить, что это за ученый

Простой

3 мин

999

Блог компании Online patentИстория ITБиографии гиковМашинное обучение * Искусственный интеллект

Ретроспектива

Японский ученый и один из основоположников исследований в сфере машинного обучения и искусственного интеллекта Амари Шуничи стал лауреатом Премии Киото. Согласно официальному пресс-релизу, он «провёл новаторские исследования в области искусственных нейронных сетей и стал основателем направления информационной геометрии, изучающей статистические модели с помощью методов дифференциальной геометрии, предложив множество важных теорий. Его вклад как в теорию, так и в практику, оказавший влияние на различные области науки, имеет огромное значение».

10 ноября в Киото (Япония) Амари получит премию, включающую диплом, золотую медаль и денежное вознаграждение в размере 100 миллионов иен (около 700 000 долларов).

Читать далее

+10

Wonderlove 26 июн в 14:05

Нейро-дайджест: ключевые события мира AI за 3-ю неделю июня 2025

Средний

9 мин

2K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * Будущее здесьIT-компании

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: ИИ-ассистент от ElevenLabs с Perplexity, видеомодели от Midjourney и MiniMax, американец сделал предложение ChatGPT, а стартап Rainmaker создаст дождь в нужный момент.

Всё самое важное — в одном месте. Поехали!

Читать далее

+17

mipt_digital 26 июн в 13:26

Машинное обучение в решении задач медицинской метагеномики

5 мин

827

Блог компании Центр «Пуск» МФТИМашинное обучение * БиотехнологииBig Data *

Обзор

Машинное обучение проникает во все большее число научных и прикладных областей — от финансов до биомедицины. Даже такая сложная и специфичная сфера, как медицинская метагеномика, сегодня все активнее использует ML для диагностики заболеваний, поиска биомаркеров и анализа микробиоты. О том, какие задачи решает ML в метагеномике и с какими трудностями сталкиваются исследователи, рассказывает к. м. н. Анастасия Холодная — выпускница магистратуры «Прикладной анализ данных в медицинской сфере» и эксперт Центра «Пуск».

Читать далее

+4

1 2 ...

32

33 34 ...