Как стать автором
Поиск
Написать публикацию
Обновить
761.32

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Часть 2: Vision Transformer (ViT) — Когда трансформеры научились видеть

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.6K

Представьте, что лингвист внезапно стал экспертом по живописи. Именно это произошло в 2020 году, когда архитектура для обработки текста — трансформеры — научилась "видеть" изображения. Vision Transformer (ViT) доказал: для понимания картинок не обязательны свёртки! Разберем "на пальцах" как она устроена и как изображения превращаются в предсказания.

Читать далее

Суров закон, но он закон: как мы собрали RuTaR — датасет для оценки reasoning-систем в сфере налогового права

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров663

Этот пост для нашего тг-канала Pro AI написал мой коллега Александр Мигаль, специалист по компьютерной лингвистике и один из авторов RuTaR

Все привыкли к тому, что ChatGPT, DeepSeek, Llama и другие коммерческие LLM способны быстро и умеренно качественно генерировать текст практически любого стиля и содержания. Однако, потенциал использования языковых моделей давно не ограничивается лишь пресловутым копирайтингом и написанием курсовых за одну ночь. Современные модели‑трансформеры всё чаще демонстрируют эмерджентные способности, выражающиеся в их способности к сложному пошаговому рассуждению.

Само устройство этих «рассуждений» (англ. reasoning) забавно перекликается с гипотезой лингвистической относительности Сепира‑Уорфа. Её строгая версия предполагает, что человеческое мышление является формой «внутреннего монолога». Но если наш мозг оказался устроен несколько сложнее, чем думали Сепир и Уорф, то в случае с LLM всё буквально так — модель рассуждает, когда «говорит», т. е. генерирует текст.

На текущий момент мы уперлись в потолок развития LLM привычным путём. Данные для их обучения кончились ещё год назад, а продолжать наращивать и без того огромные вычислительные мощности попросту нет смысла. Поэтому самым перспективным направлением разработок в области ИИ выступает развитие того самого reasoning — умения модели рассуждать.

И хотя за последние полгода появилось множество систем, сделавших большой шаг в сторону продвинутого reasoning (например, DeepSeek R1, о1 от OpenAI), тестируются они всё так же — на математике, шахматных задачках и головоломках. А вот насколько хорошо они справляются с задачами в сфере права или, скажем, комплексного текстуального анализа никто не знает — в большинстве бенчмарков полностью игнорируется способность LLM рассуждать в плоскости гуманитарного знания.

Читать далее

Локальный чатбот без ограничений: гайд по LM Studio и открытым LLM

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров33K

В этой статье мы не только установим локальный (и бесплатный) аналог ChatGPT, но и сделаем обзор нескольких открытых LLM, разберёмся в продвинутых настройках LM Studio, подключим чатбота к Visual Studio Code и научим его помогать нам в программировании. А ещё мы посмотрим, как можно тонко настраивать поведение модели с помощью системных промптов.

Читать далее

Виртуальные ассистенты: обзор самых «умных» нейросетей для ответов на вопросы

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров3.9K

Ни для кого не секрет, что спрос на AI-ассистентов только растёт с каждым днём, причём растёт он практически во всех сферах жизни человека. Нейросети используют в копирайтинге, в бизнесе, ими пользуются программисты, у них ищут спасения студенты и школьники, когда материал непонятен или когда огромный текст нужен срочно, — словом, эти виртуальные помощники плотно вошли в нашу повседневную жизнь. Ну а в современной повседневной жизни новые вопросы возникают порой быстрее, чем мы успеваем найти верный и полный ответ на предыдущие, и было бы прекрасно знать, какие же нейросети наиболее умные, чтобы использовать их для ответов на вопросы, согласитесь.

И сегодня мы с вами сравним 7 нейросетей и выделим из них топ-3.

Читать далее

Будущее ИИ — формальные грамматики

Уровень сложностиПростой
Время на прочтение19 мин
Количество просмотров2.1K

Почему даже самая мощная LLM иногда выдаёт бессмысленные фразы и противоречия? Всё дело в экспоненциальном росте вариантов (N^M) и свободном копировании человеческих ошибок. Читайте статью, чтобы узнать, как мы с помощью формальных грамматик превращаем хаотичную генерацию в управляемый синтез, усиливая роль семантики и соблюдая структурные правила.

Читать далее

Ранний взгляд: как ИИ научился видеть то, что врачи не замечают

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.1K

Сегодня расскажу о проекте, который выглядит вроде бы несложно, но может предотвратить десятки тысяч госпитализаций и сэкономить миллиарды в здравоохранении.

А еще припомню несколько схожих ситуаций: о том, как ИИ уже помогает врачам и пациентам.

Читать

Эффективный инференс множества LoRA адаптеров

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.2K

LoRA — популярный метод дообучения больших моделей на небольших датасетах, однако на этапе инференса низкоранговые адаптеры работают неэффективно, а их объединение с весами требует хранения отдельной полной копии модели для каждого адаптера.

MultiLoRA решает эту проблему, позволяя одновременно выполнять инференс с несколькими адаптерами на основе одной базовой модели.

В статье мы сравним производительность MultiLoRA-инференса в двух популярных фреймворках — vLLM и TensorRT-LLM. Тесты проведём на готовых релизных Docker-образах, оценивая, какой фреймворк эффективнее обрабатывает батчи запросов в сценариях, близких к офлайн и асинхронному инференсу.

Читать далее

«Крестный отец» машинного обучения Амари Шуничи получил Премию Киото. Повод вспомнить, что это за ученый

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров977

Японский ученый и один из основоположников исследований в сфере машинного обучения и искусственного интеллекта Амари Шуничи стал лауреатом Премии Киото. Согласно официальному пресс-релизу, он «провёл новаторские исследования в области искусственных нейронных сетей и стал основателем направления информационной геометрии, изучающей статистические модели с помощью методов дифференциальной геометрии, предложив множество важных теорий. Его вклад как в теорию, так и в практику, оказавший влияние на различные области науки, имеет огромное значение».

10 ноября в Киото (Япония) Амари получит премию, включающую диплом, золотую медаль и денежное вознаграждение в размере 100 миллионов иен (около 700 000 долларов).

Читать далее

Нейро-дайджест: ключевые события мира AI за 3-ю неделю июня 2025

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: ИИ-ассистент от ElevenLabs с Perplexity, видеомодели от Midjourney и MiniMax, американец сделал предложение ChatGPT, а стартап Rainmaker создаст дождь в нужный момент.

Всё самое важное — в одном месте. Поехали!

Читать далее

Машинное обучение в решении задач медицинской метагеномики

Время на прочтение5 мин
Количество просмотров778

Машинное обучение проникает во все большее число научных и прикладных областей — от финансов до биомедицины. Даже такая сложная и специфичная сфера, как медицинская метагеномика, сегодня все активнее использует ML для диагностики заболеваний, поиска биомаркеров и анализа микробиоты. О том, какие задачи решает ML в метагеномике и с какими трудностями сталкиваются исследователи, рассказывает к. м. н. Анастасия Холодная — выпускница магистратуры «Прикладной анализ данных в медицинской сфере» и эксперт Центра «Пуск».

Читать далее

Я делал концепции зданий 12 лет, а потом пришла нейросеть

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров21K

Эту историю для моего блога рассказал архитектор-концептуалист Александр Гаст

Я работаю удаленно над архитектурными проектами от Приморья до Петербурга.  Проектирую и частные дома, и комплексные планы развития городских районов. За последний год нейросети стали частью моего рабочего процесса. Расскажу, где ИИ помогает, а где создает проблемы.

Читать далее

Как студент MIT ускорил реставрацию картин с помощью ИИ и полимерных масок

Время на прочтение5 мин
Количество просмотров1.3K

Реставрация старых картин — процесс, требующий и художественного чутья, и усидчивости. На восстановление одного полотна уходят месяцы и даже годы. Алекс Качкин, аспирант Массачусетского технологического института (MIT), предложил метод, который использует искусственный интеллект и полимерные маски для быстрого и обратимого восстановления поврежденных произведений искусства. Его разработка, описанная в журнале Nature, обещает вернуть к жизни тысячи картин, спрятанных в запасниках музеев.

Читать далее

Режим ночной съемки: три алгоритма улучшения мобильных фотографий

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров4.2K

Привет, Хабр! Меня зовут Полина Лукичева, я инженер команды AI ML Kit в YADRO. Наша задача — улучшить ночной режим камеры в планшете KVADRA_T. В статье я расскажу об основных ограничениях камеры мобильного устройства при съемке в условиях низкой освещенности, а также поделюсь алгоритмами, с помощью которых можно получить качественный снимок даже в темноте.

Читать далее

Ближайшие события

OpenAI взимает оплату поминутно, так что сделаем минуты короче

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.7K

Я имею в виду буквально. Перед транскрибацией увеличьте скорость аудио в два или в три раза в ffmpeg. Благодаря этому вы потратите меньше токенов и вам придётся меньше ждать, а качество транскрипции почти не снизится.

Вот и всё!

Ниже показан скрипт, сочетающий все мои трюки для выполнения этой задачи. Для его работы необходимо установить yt-dlpffmpeg и llm.

Я сэкономил вам время, сразу перейдя к делу, но если вы хотите подробностей истории о том, как я случайно обнаружил этот способ, пытаясь создать краткое изложение сорокаминутного доклада Андрея Карпаты, то продолжайте чтение.

Вам стоит продолжить чтение, если вы недоумеваете, почему я просто не воспользовался встроенной автотранскрибацией YouTube. Краткий ответ будет таким: я недотёпа, считавший (ошибочно), что она недоступна. Поэтому мне пришлось идти по более сложному пути.

Читать далее

Прокачаться в data science: блоги и каналы

Время на прочтение7 мин
Количество просмотров5.6K

Делимся блогами, посвященными машинному обучению и data science. Материалы от практикующих дата-сайентистов, программистов, физиков и биоинформатиков будут интересны как начинающим, так и «прожженным» специалистам.

Читать далее

Опыт построения антифрод-системы на основе поведенческого анализа для FreezerSports

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров475

Проект по разработке системы антифрода для букмекерской конторы FreezerSports стал для нашей команды важным шагом в обеспечении честности игры на платформе. Основной целью было создание системы, которая бы эффективно боролась с манипуляциями, связанными с арбитражем ставок и использованием вилочных событий для обхода системы. В данной статье я расскажу о технической реализации антифрод-системы на основе поведенческого анализа.

Читать далее

Вселенная OpenAI: полный путеводитель по семейству моделей GPT в 2025 году

Время на прочтение11 мин
Количество просмотров4K

(версия статьи актуальна на 26 июня 2025 года)

OpenAI за несколько лет превратила ChatGPT из экспериментального проекта в полноценного цифрового помощника, который умеет не только писать тексты, но и думать, видеть, слышать и даже спорить. Это стало настоящим поворотным моментом в истории ИИ и индустрия вошла в новый цикл развития. Появились тысячи приложений на базе LLM, десятки компаний сменили стратегию, а работа с языковыми моделями стала повседневной реальностью.

Новые версии выходят регулярно, и если вы чувствуете себя потерянными в этом потоке, то вы не одиноки. Мы специально подготовили этот материал, чтобы рассказать обо всех ключевых GPT-моделях и сопутствующих инструментов OpenAI, чем они отличаются и какую из них выбрать для своих задач.

Читать далее

Как построить безопасный MLOps-pipeline: Tier-уровни зрелости, принципы и реальные инструменты

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров1.1K

На практике продакшен-модели чаще всего «падают» из-за трёх вещей: несоответствие с инфраструктурой, дрейфа данных, и ошибочного отката/обновления версии.
Единый гайд по безопасной разработке ML-моделей — от хаотичного до полностью автоматизированного уровня зрелости.

Что внутри:

Как применять Infrastructure-as-Code для ML-кластеров и не оставлять открытые порты;

Зачем даже маленькой команде нужен Feature Store и как избежать training-serving skew;

Где прячутся CVE в ML-библиотеках и как их ловить до релиза;

Канареечный деплой с авто-откатом по метрикам и разумными порогами;

мониторинг дрейфа данных и качества модели в реальном времени;

Чек-лист DevSecOps: от тега в Model Registry до регулярных Model Review.

Материал поможет выстроить MLOps-процесс, устойчивый к атакам и сбоям, не превращая релизы моделей в ночной марафон.

Читать далее

Как нанимаем, грейдируем и решаем типовые задачи prompt-инженеров в Точке

Время на прочтение8 мин
Количество просмотров3.2K

Два года назад в Точке появилась новая роль — prompt-инженер. Первые полгода инженеры работали над разными кейсами: от классификации данных до разработки AI-ассистентов. Для этого пригодился опыт и маркетолога, и копирайтера, и инженера АСОИУ. Ещё prompt-инженеры участвовали в генерации синтетических данных для коллег из ML — для этого важно было понимать основы Data Science. 

Привет! Меня зовут Екатерина Шихиева, я лидер prompt-инженеров в Точке. Из-за обилия задач и проектов процесс найма промптеров почти не останавливается. Сейчас у нас отлажен подбор кандидатов, грейдирование и внутренний менторинг — но в этих процессах всё не так просто. Об этих подводных камнях и нюансах расскажу в статье.

Читать далее

Дело о похищенном рюкзаке: SQL, сложность и слепая вера в ИИ

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.4K

1. Тревожный звонок

Был хмурый лондонский вечер, когда в нашу скромную квартиру на Бейкер-стрит ворвался взволнованный инспектор Лестрейд.

— Холмс! Нам срочно нужна ваша помощь! — воскликнул он, сбрасывая с плеч дождевик. — В городе орудует хитрый вор. Он крадёт предметы, но уносит их только в одном рюкзаке ограниченной вместимости. Нам нужно вычислить, какие именно вещи он унесёт, чтобы максимизировать свою добычу!

Читать далее

Вклад авторов