Машинное обучение *

Основа искусственного интеллекта

Разработка игр * Машинное обучение * Дизайн игр * Искусственный интеллектИгры и игровые консоли

Джон Кармак выступил в защиту ИИ для разработки игр и заявил, что «создание мощных инструментов — ключевой двигатель всего прогресса».

Соавтор Doom и Quake заявил в ответ на критику разработчиков и пользователей, что развитие искусственного интеллекта поможет создавать больше игр и делать их более качественными, а также привлечёт в индустрию новых специалистов. В качестве наглядного примера развития технологий Кармак привёл написание машинного кода для своих первых игр, чем уже никто не занимается. По словам Кармака, сейчас подобное занятие можно сравнивать с «обслуживанием колёс у боевой колесницы», ведь появились игровые движки, которые делают разработку удобнее и эффективнее. Аналогичным образом ИИ-инструменты станут помогать разработчикам в будущем.

Думаю, вы неправильно поняли, что собой представляет эта технодемка, но я всё же отвечу на то, что, как мне кажется, вас волнует, — что ИИ-инструменты обесценивают навыки программистов, художников и дизайнеров.
Мои первые игры создавались вручную: я сам собирал машинный код и превращал персонажей, нарисованных на миллиметровке, в шестнадцатеричные числа. Сегодня всё это стало таким же устаревшим занятием, как обслуживание колёс у боевой колесницы.
Создание мощных инструментов — ключевой двигатель всего прогресса в компьютерной отрасли.
Игровые движки кардинально расширили круг людей, вовлечённых в разработку игр, хотя при этом и отодвинули на второй план ту самую системную инженерию, которую я всегда так ценил.
ИИ-инструменты помогут лучшим из лучших достичь ещё более впечатляющих высот, позволят небольшим командам делать гораздо больше и откроют путь в индустрию совершенно новым группам создателей.
Станет ли рабочих мест в игровой индустрии больше или меньше — вопрос открытый. Всё может пойти по пути сельского хозяйства, где технологии позволили сократить число работников до минимума, сохранив эффективность.
А может — по сценарию соцсетей, где креативное предпринимательство расцвело на всех уровнях. Но в любом случае стратегия «не использовать мощные инструменты, потому что они отнимают рабочие места» не сработает.
Джон Кармак.

Ранее Microsoft опубликовала техническую демонстрацию ИИ-версии игры Quake II, которая работает на базе нейросети Muse. Команда проекта обновила модель машинного обучения так, чтобы она могла генерировать картинку с большим разрешением и с большей скоростью.

@denis-19

8 апр в 09:105.9K

Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

Microsoft представила бесплатные курсы Microsoft AI Skills Fest по нейросетям и созданию ИИ-агентов, включая матеориалы на русском языке.

В рамках обучения предоставляются базовые основы и обучение работы с Azure и Copilot. Также на курсах обещают научить создавать ИИ-приложения, ИИ-агентов и применять ИИ в играх.

@denis-19

7 апр в 15:315.5K

Машинное обучение * Учебный процесс в ITУправление персоналом * Карьера в IT-индустрииИскусственный интеллект

Глава платформы электронной коммерции Shopify Тобиас Литке опубликовал в соцсети X письмо сотрудникам, в котором рассказал, что использование ИИ стало базовым навыком в компании, который ожидается от каждого сотрудника вообще без исключения:

эффективное использование ИИ теперь является базовым ожиданием от каждого сотрудника Shopify. Сегодня это универсальный инструмент, важность которого будет только расти. Откровенно говоря, я не считаю возможным отказаться от изучения навыка применения ИИ в своей работе; вы можете попробовать, но я хочу честно сказать, что не вижу, как это может сработать сегодня, а тем более завтра. Стагнация практически неизбежна, а стагнация — это провал в замедленном режиме. Если вы не карабкаетесь вверх, вы скатываетесь вниз.
ИИ должен быть частью фазы прототипирования в любом GSD-проекте (аббревиатура GSD в данном контексте означает Get Stuff Done — философия фокуса на результат и эффективное выполнение задач). Фаза прототипирования любого GSD-проекта* должна включать активное исследование возможностей ИИ. Прототипы предназначены для обучения и создания информации. ИИ радикально ускоряет этот процесс. Вы можете научиться создавать то, что другие члены команды смогут посмотреть, использовать и оценить за долю времени, которое это занимало раньше.
мы добавим вопросы об использовании ИИ в наши опросники по оценке производительности и взаимной оценке коллег. Научиться хорошо использовать ИИ — неочевидный навык. Мне кажется, что многие сдаются после того, как написали запрос и не получили сразу идеальный результат. Важно научиться формулировать запросы и загружать контекст, и получение обратной связи от коллег о том, как это происходит, будет ценным.
обучение — это самостоятельный процесс, но делитесь тем, что вы узнали. У вас есть доступ к максимальному количеству передовых инструментов ИИ. У нас есть chat.shopify.io, который существует уже несколько лет. Разработчики имеют доступ к proxy, Copilot, Cursor, Claude code — всё настроено и готово к использованию. Мы будем учиться и адаптироваться вместе как команда. Мы будем делиться победами (и поражениями!) друг с другом, экспериментируя с новыми возможностями ИИ, и будем уделять время интеграции ИИ в наших ежемесячных бизнес-обзорах и циклах разработки продуктов. В Slack и Vault есть много мест, где люди делятся разработанными запросами, например #revenue-ai-use-cases и #ai-centaurs.
прежде чем запрашивать увеличение штата и ресурсов, команды должны продемонстрировать, почему они не могут выполнить желаемое с помощью ИИ. Как бы выглядела эта область, если бы автономные ИИ-агенты уже были частью команды? Этот вопрос может привести к действительно интересным обсуждениям и проектам.
все значит все. Это относится ко всем нам — включая меня и руководящую команду.

@yadro_team

7 апр в 13:555.8K

Блог компании YADROПоисковые технологии * Машинное обучение * Искусственный интеллект

Как выбрать языковую модель для семантического поиска

Для сопоставления смысла запроса пользователя и смысла чанка в базе знаний нужна языковая модель, которая понимает семантику.

Принцип работы моделей Bi-Encoder и Cross-Encoder

Bi-Encoder — состоит из двух трансформеров encoder-only. С помощью passage-encoder получаются эмбеддинги для всех чанков в базе знаний. Запрос от пользователя кодируется с помощью query-encoder. На этапе поиска высчитывается косинусное расстояние между query-embedding и passage-embedding. Мы получаем поисковую выдачу после ранжирования всех пассажей по убыванию косинусного расстояния. В отличие от следующей архитектуры Cross-Encoder, можно заранее сохранить эмбеддинги для пассажей и использовать их для подсчета расстояния.

Cross-Encoder — трансформер с архитектурой encoder-only и ранжирующим слоем. Этот слой выдает оценку релевантности запроса к пассажу. На вход подается двойка: запрос и пассаж. Cross-Encoder лучше понимает семантическую связь между пассажем и запросом, но для каждого пользовательского запроса он работает медленнее, так как для оценки релевантности запроса и пассажей, cross-encoder нужно запустить N раз, где N — количество пассажей.

Мы будем использовать Bi-Encoder, так как у нас много пассажей в базе знаний.

Для выбора модели удобно использовать открытый бенчмарк MTEB с рейтингом по различным моделям в зависимости от вашей задачи. Для нас лучшей оказалась модель multilingual-e5-large, Bi-Encoder c 560M параметров и размером эмбеддингов в 1024 элемента.

Инженер по разработке ПО искусственного интеллекта Павел Яковлев максимально подробно рассказал в статье, как его команда разрабатывает и оптимизирует семантический поиск по сложным документам: PDF, HTML и DOCX.

@Dasha_N

7 апр в 10:236.6K

Блог компании MWS AIПрограммирование * Машинное обучение * Искусственный интеллект

MTS AI выпустила Kodify 2 — второе поколение ИИ-ассистента для разработчиков:

7 млрд параметров,
контекст до 32 тыс. токенов,
поддержка 90 языков программирования,
OpenAI-совместимый API для простой интеграции с другими системами.

В отличие от первого поколения Kodify, использующегося c 2024 года лишь в компаниях, входящих в ПАО «МТС», Kodify 2 станет доступен внешним заказчикам.

Новый ИИ-ассистент содержит весь основной функционал для автоматизации и ускорения процесса разработки, включая автодополнение кода, исправление ошибок, генерацию тестов и документации, оптимизацию кода для улучшения производительности, а также преобразование текста в код.

Подробнее на сайте разработчика. Демо на Java и Python здесь.

@denis-19

7 апр в 02:377.5K

Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллектБудущее здесь

«Три генеральных директора Microsoft входят в комнату...» — написал Сатья Наделла, — «и их интервьюирует Copilot!»

В рамках празднования 50-летия Microsoft, генеральный директор Microsoft Наделла присоединился к бывшим генеральным директорам Microsoft Биллу Гейтсу и Стиву Балмеру в забавном двухминутном видео, в котором Наделла просит Copilot «прожарить» каждого из них с помощью ИИ.

«Хорошо, Сатья», — отвечает Copilotт. «Давай добавим перца...».

Copilot: Стив, начнем с тебя. Твой энтузиазм легендарен. Но ты когда-нибудь беспокоился, что твоя энергия может закоротить ИИ? Я имею в виду, даже роботам нужен перерыв на кофе после твоих зажигательных речей.

Стив Балмер: Давай, чувак! Если ты не можешь справиться со мной, ты не сможешь справиться с огромным процентом населения мира! Мы рассчитываем на тебя!

Copilot: Ха-ха, справедливое замечание, Стив. Теперь, Билл, у тебя этот фирменный вдумчивый взгляд. Но ты когда-нибудь думал, что ИИ может испугаться твоего напряженного, думающего лица? Я имею в виду, он как будто ждет момента синего экрана.

Билл Гейтс: Я надеюсь на это. Я имею в виду, что это все, что у меня осталось, поскольку ИИ становятся такими чертовски умными. Именно этот взгляд и моя готовность критиковать отличают меня.

Copilot: И это действительно грозный взгляд, Билл.

Стив Балмер: Copilot, ты когда-нибудь был бы готов критиковать его?

Copilot: Безусловно. Критика — это то, где происходит рост. Теперь, Сатья, ИИ, похоже, твой лучший друг — но ты когда-нибудь беспокоился, что твоя глубокая страсть к ИИ может однажды заставить его управлять шоу, оставив тебя просто наслаждаться поездкой?

Сатья Наделла: Что ж, в тот день, когда ИИ сможет играть как лучший игрок в крикет, который мне нравится, в тот день он сможет управлять шоу, насколько я могу судить.

Copilot: Туше, Сатья. Посмотрим, сможет ли он достичь столетия в крикете, а потом поговорим.

Это был взрыв, джентльмены. За еще 50 лет инноваций и приключений. Ура.

Балмер, Наделла и Гейтс: Ура.

Билл Гейтс: Что бы это ни значило для ИИ. Он случайно не выпивши?

-1

@Aleron75

6 апр в 10:586K

Машинное обучение *

🤖 LLM-агенты: какие фреймворки использовать и зачем?

Если вы интересовались темой LLM-агентов, то вот краткий гид по популярным решениям — что выбрать и когда.

🧠 AutoGen (Microsoft)

🔹 Что это? Фреймворк от Microsoft для создания мультиагентных систем, где агенты взаимодействуют в диалоговом режиме для совместного решения сложных задач.

🔹 Когда использовать?

✔ Нужно смоделировать команду агентов (например, менеджер + разработчик)

✔Требуется гибкая настройка взаимодействия между агентами для продакшена.

✔Ищете масштабируемое решение для корпоративных задач.

🧠 CrewAI

🔹 Что это? Лёгкая библиотека для быстрой организации «экипажа» агентов, каждый из которых выполняет свою роль в цепочке обработки задачи.

🔹 Когда использовать?

✔ Нужно быстро собрать прототип, где агенты передают задачи друг другу (например, планирование → сбор данных → кодирование).

✔ Подходит для демонстраций и небольших проектов, где важна слаженность работы «команды».

🧠 LangGraph / LangChain Agents

🔹 Что это?Мощные фреймворки, позволяющие создавать сложные цепочки обработки информации с интеграцией LLM, внешних API, баз данных и прочих инструментов.

🔹 Когда использовать?

✔ Строите продакшен-решение с множеством этапов и компонентами.

✔ Требуется интеграция с внешними сервисами, хранение состояний, сложная логика обработки.

✔ Готовы инвестировать время в изучение более сложного, но гибкого инструментария.

🧠 SmolAgents

🔹 Что это?Минималистичный инструмент для создания одного или нескольких LLM-агентов без лишнего оверхеда, идеально подходит для экспериментов и небольших проектов.

🔹 Когда использовать?

✔ Хотите разобраться в принципах работы LLM-агентов без сложных зависимостей.

✔ Планируете pet-проект или прототип с акцентом на простоту и понятность.

✔ Ищете быстрый способ автоматизации рутинных задач с помощью ИИ.

Скоро на хабре расскажу вам подробнее о том, что есть SmolAgents и с чем это едят!

Хотели бы узнать про другие фреймворки? К слову все они уже ждут, когда вы интегрируете их с новинкой!

-1

@alfredlao

6 апр в 06:526.3K

Машинное обучение * Искусственный интеллектБудущее здесь

Очень интересный прогноз и сценарное планирование от вполне себе компетентных людей AI 2027 Рекомендую прочесть.

Согласно их прогнозу, к 2027 году ИИ достигнет уровня, позволяющего автоматизировать исследования в области ИИ, что приведет к созданию искусственного сверхинтеллекта к концу 2027 года.

-1

@Aleron75

5 апр в 20:448.5K

Машинное обучение *

🔥 Meta представляет Llama 4: ИИ-модель с гигантским контекстом и мультимодальными возможностями! 🔥

🌟Горячие модельки вышли из печки Meta и даже успели релизнуться веса на hugging face , правда модель здоровяк Behemoth ещё находится в обучении

Что тут у нас по модели? 👇

🚀Llama 4 Scout:

📊 17B активных параметров и MoE с 16 экспертами.

🔑 Контекст — 10 миллионов токенов (это прям рекорды!).

💻 Запускается на одной GPU H100 — да, так, по-настоящему круто!

👑Llama 4 Maverick:

📊 17B активных параметров и на 128 экспертов,

🔍как заявляет компания модель примерно как GPT-4o и даже ссылоку на LLM arena не забыли оставить!

Моделька сейчас на 2 месте!!

💥Llama 4 Behemoth: Самый

📊большой тяжеловес на 288B активных параметров на 16 экспертов.

Пока в обучении, но очень ждем!

Слежу для вас за обновлениями! Как впечатления от релиза?✨

@Aleron75

4 апр в 17:475.2K

Машинное обучение *

Вышел новый AI-инструмент для ресерча!

Яндекс представил бета-версию Нейроэксперта — интеллектуального ассистента для исследователей, аналитиков и преподавателей, которые изучают новую информацию.

🔍 Что это такое?

Нейроэксперт позволяет объединять и анализировать разнородные источники данных:

📄 Документы, таблицы, презентации

🔗 Ссылки на сайты

🎧 Аудио и видеофайлы

👨‍💻 Как это работает?

Вы можете создать до 10 бесплатных проектов, загружая в них до 25 типов данных. Искусственный интеллект поможет вам синтезировать знания.

🚀 На чём построено?

В основе сервиса — YandexGPT 5 Pro, а также модели VLM,RAG, ASR и OCR для работы с изображениями, аудио и текстом.

⚡ Бета-версия уже доступна

Сервис всё ещё на этапе тестирования, так что возможны баги и вылеты. Но на первый взгляд это мощный инструмент, который может упростить поиск и обработку данных для ресерча.

Попробовать можно тут: https://expert.ya.ru/

Как думаете, будете использовать в своей работе?

@Nurked

2 апр в 22:429.6K

Математика * Машинное обучение * Читальный залИскусственный интеллект

Посчитаем до бесконечности.

Недавно я зашёл в кафешку и заказал чашку капучино. Официантка спросила, какого размера чашку я предпочитаю. Я ответил: “Бесконечно большую”. Она сказала: “Хорошо!” — и ушла. После чего я получил вот это.

Умно. Очень умно, ничего не скажешь. Ей зачёт с повышением и чаевые. Я получил бесконечно кофе.

А потом подумал, как неправильно мы используем математику и научные дисциплины.

Удивительная вещь — эта вселенная ну никак не приемлет никакой идеи бесконечности. Каждый раз, когда к физику подходят со словом “бесконечно”, физик ухмыляется и достаёт ручку или планшет. Сейчас вам покажут, как вы неправы.

Но в этой физической вселенной живут очень странные существа. Они не только приемлют бесконечность — они ещё и спокойно ею оперируют. Посмотрите на парадокс Гранд-Отеля. Эти существа абсолютно спокойно объясняют вам, как в отель, в котором живёт бесконечно большое количество людей, можно заселить ещё одно бесконечно большое количество людей. Причём этот пример существа создали для самых маленьких — чтобы дать им понять, как работает математика бесконечностей.

Математика, кстати. Просто невероятная вещь. Вещь, которой в физической вселенной пространств, энергий, массы и времени существовать просто не должно. Но эти существа запросто ею оперируют. Более того, используют её с лёгкостью — да ещё и видосики на Ютубчик постят. Математика — это замечательная наука. Она — просто издевательство над физической вселенной. Она никогда не была частью физической вселенной. Её создали иные существа, населяющие эту вселенную. Существа, которые знают, что их любовь может быть вечной, кофе — бесконечным, а упорство — неиссякаемым. Даже сам факт того, что у нас есть цифры и числа, уже нарушает базовый закон вселенной: вы не можете считать бесконечно. Каждый третьеклассник сидит и удивляется, как это так — считать можно бесконечно.

Понимаете, концепты Кота Шрёдингера, Гранд-Отеля и тому подобные вещи — это просто когда мы насмехаемся над этой вселенной и говорим: “Смотри, я так могу, а ты — нет”.

Если здесь есть математики, которым хочется решить задачку — так, чисто по приколу — попробуйте решить следующее:

ЛЛМ-модель имеет 40 терабайт данных. Она обучена на 200 миллиардах параметров. Посчитайте конечное количество всех возможных ответов этой модели. Число будет гигантским, но оно будет конечным. Увеличьте количество параметров на сто порядков, дайте этой модели данных раз в 600 больше — и вы получите… конечное число. Ответы ЛЛМ-модели можно пересчитать.

А хотите задачу, которую без слова “бесконечно” решить нельзя? Ну вот вам:

Посчитайте, сколько идей может выдумать человек.

Бесконечно много.

Можно выдумывать языки, вселенные, пространства, обстоятельства и создавать миры, которых никто не видел. Ваше естество всё равно будет на одну бесконечность больше любой задачи, которую можно решить в физической вселенной.

После этого действительно смешно слушать о том, как люди рассуждают о возможности создания “настоящего” искусственного интеллекта. Какой он будет “настоящий”, если он сделан из вселенной, которая не может создать бесконечность?

Так прикольно и весело слушать людей, которые с захлёбом рассказывают о том, что “такой-то ЛЛМ может сдать какой-то синтетический тест на 95%”.

Не забывайте о том, насколько важны точные науки. Не забывайте о том, что точными науками человек овладел благодаря математике. И не забывайте о том, какие способности присущи разуму, а какие — объекту.

+12

@Aleron75

2 апр в 20:088.1K

Машинное обучение *

🔥 Vision Transformer – революция в компьютерном зрении! 🚀

Сверточные сети долгое время были серьезным подспорьем в компьюетрном зрении, но практика и исследование показали, что трансформеры могут помочь в решении задач не только из мира NLP!

Как ViT видит глобальный контекст без единой свертки? Почему разбиение картинки на патчи стало прорывом? И самое главное — где и как его применять?

📌 В статье разберем:

✅ Как трансформеры перекочевали из NLP в CV и что из этого вышло

✅ Чем ViT отличается от CNN и почему это реально новый подход

✅ Где ViT уже показывает крутые результаты: классификация, сегментация, OCR и не только!

🔗 Если "Attention is all you need" – это про тебя, то тебе сюда!

Статья, поможет по-другому посмотреть на трансформеры и покажет, что CV уже не будет прежним!

👉 Читать

@Editor_cloud_ru

1 апр в 15:577.7K

Блог компании Cloud.ruIT-инфраструктура * Машинное обучение * Искусственный интеллект

Что ждет вас на GoCloud 2025? Рассказывают ведущие треков 💭

Всем привет! В треке «AI & ML» мы поговорим про то, как построить эффективный инференс, расскажем про агентные и мультиагентные системы и поделимся, как применяем их у себя. Конечно, не обойдется без упоминания LLM-платформ и окружения, которое поможет вам все это настроить и использовать.
Если вы до сих пор не выбили 90 токенов в секунду на DeepSeek-R1 и хотите получить готовое окружение для работы с искусственным интеллектом — ждем вас на GoCloud 2025!
Дмитрий Юдин — технический лидер по развитию искусственного интеллекта в Cloud.ru, ведущий трека «AI & ML»

📅 Когда: 10 апреля в 10:00 мск

📍 Где: онлайн или офлайн в Москве в Цифровом деловом пространстве (ЦДП)

👉 Зарегистрироваться

@Doctor_IT

1 апр в 13:546.5K

Блог компании SelectelМашинное обучение * Искусственный интеллектБудущее здесь

В самый веселый день в году принесли вам подборку мемов, которыми делились участники нашего чата про ML и MLOps — MLечный путь. 🦖

А у вас есть любимый мем про ML и AI? Присылайте в комментарии, выберем самый смешной и жизненный. А если хотите обменяться не только мемами, но и опытом в ML, приходите на митап 23 апреля.

@Dasha_N

1 апр в 08:484.4K

Блог компании MWS AIМашинное обучение * Искусственный интеллектNatural Language Processing *

Вышла Cotype Pro 2 — самая мощная модель в линейке Cotype от MTS AI

Cotype Pro 2 на 40% быстрее предыдущей модели и на 50% точнее обрабатывает длинные тексты — до 128 тыс. токенов, что соответствует примерно 900 тыс. символов с пробелами. Она станет основой для линейки корпоративных ИИ-агентов, которые команда MTS AI собирается выпустить в этом и следующем году.

Cotype Pro 2 показала улучшение эффективности в сравнении с Cotype Pro по всем основным фронтам:

– генерация идей – с 44% до 57%,

– резюмирование – с 79% до 85%,

– общение на общие темы – с 55% до 64%,

– извлечение информации – с 81% до 86%.

– классификация – сохранение эффективности на том же высоком уровне: 87%.

Подробности тут. А в этой статье мы рассказали, как улучшили пайплайн обучения нашей LLM с помощью новой методологии оценки.

@denis-19

1 апр в 02:347K

Машинное обучение * Искусственный интеллектБудущее здесь

С 1 апреля по 1 июня Coca‑Cola позволит использовать ИИ для создания индивидуальных смесей напитков в своих автоматах Freestyle. «Отсканируйте QR‑код „Поделиться колой“ на автомате, который с помощью ИИ создаст (надеюсь, вкусную) смесь напитков на основе названия и наклеек, которые пользователь выбирает для украшения своего цифрового стакана», — пояснили в Coca‑Cola.

@Tiendil

31 мар в 09:426.5K

Open source * Машинное обучение * Научно-популярноеИскусственный интеллектБудущее здесь

Наконец сделал открытый доступ к протеганным подборкам новостей в Feeds Fun. Безвозмездно, то есть без регистрации :-)

🔬 Свежие научные статьи с ArXiv — подборка особенно полезна, если вы хотите следить за узкой областью: генетическими алгоритмами там или особой математикой. Пошарьте с вашим друзьям-учёным, им должно зайти.

🚀 Новости для предпринимателей и стартаперов.

Также теперь можно делиться ссылками на отфильтрованные по тегам новости — например, на новые статьи по машинному обучению или на новости о профессиональном нетворкинге.

@yadro_team

28 мар в 15:348.9K

Блог компании YADROBig Data * Машинное обучение * Искусственный интеллект

Петля ~~времени~~ в пайплайне для уменьшения числа галлюцинаций в LLM

Это — грубая схема работа RAG-пайплайна, который использует одна из ML-команд в YADRO.

Задача команды: улучшить качество выдаваемых ответов на запросы пользователей, исключив галлюцинации.

Что сделали инженеры?

Решили дообучить базовую модель при помощи LoRA на специально собранном датасете для ситуаций, когда в контексте нет ответа на вопрос пользователя. На тот момент в качестве базовой модели LLM использовали saiga_mistral_7b, которая нетребовательна к ресурсам и долгое время была в топе на Russian SuperGLUE. Есть модели лучше, но, как правило, они либо огромные, либо имеют проблемы с лицензией в России, в том числе все, что основаны на LLaMa.

Самое главное: в этом RAG-пайплайне ML-инженеры решили сделать опциональную петлю, в которой проверяли бы каждый найденный фрагмент контекста на релевантность вопросу пользователя. Только те куски контекста, которые пройдут проверку, будут попадать в финальный вопрос для LLM.

Чтобы петля фильтрации работала правильно, нужен некий маркер, который позволяет однозначно определить, что модель считает кусок контекста нерелевантным.

Что это и за маркер? И к каким результатам привела оптимизация работы модели, читайте по ссылке →

Спойлер: Модель DeepSeek-R1-Distill-Qwen-7B уступила saiga_mistral_7b по качеству, несмотря на то, что первая намного новее и вооружена механизмом reasoning.

@Editor_cloud_ru

28 мар в 11:054.6K

Блог компании Cloud.ruIT-инфраструктура * Машинное обучение * Облачные сервисы * Искусственный интеллект

Рассказываем, какие темы ждут вас на конференции GoCloud 2025 ☁️

Сегодня разработка ML-моделей требует не только мощной инфраструктуры, но и удобных инструментов для экспериментов, развертывания и масштабирования решений. В своем докладе я расскажу, как новые продукты AI Factory нашей платформы Cloud.ru Evolution помогают ML-инженерам и исследователям работать быстрее, эффективнее и проще.
Приходите послушать доклад, чтобы узнать:
как эффективно использовать вычислительные ресурсы и динамически управлять нагрузкой на GPU;
какие инструменты будут доступны для адаптации моделей, чтобы ускорить вывод решений в продакшн;
как сделать мощные ML-технологии доступными не только разработчикам, но и обычным пользователям без глубоких знаний в коде.
Дмитрий Юдин — технический лидер по развитию искусственного интеллекта в Cloud.ru

Трек: AI & ML — про будущее искусственного интеллекта, опыт работы с AI-инструментами и продукты, меняющие индустрию.

📅 Когда: 10 апреля в 13:55 мск

👉 Зарегистрироваться

А посмотреть темы других докладов можно в программе конференции.

@max_dark

27 мар в 21:2312K

Машинное обучение * Искусственный интеллект

Когда уже прекратят представлять LLM как ИИ?

Это же просто поисковик, выдающий наиболее подходящий по статистике ответ.
Причем выдающий с примесью рандомизации().

Слова превращаются в вектор чисел, а вектор чисел - по сути то же что и изображение.
То есть задача сводится к распознаванию образа.

MNIST, классика.

Ответ всегда вектор. Выбираем N с максимальным процентом. И "бросаем кубик".

Прекратите называть LLM ИИ(Искуственным идиотом).

LLM даже до идиота далеко.

1 2 ...

15 16

18 19 ...

33 34

Машинное обучение *

Ближайшие события

Вклад авторов