Как стать автором
Обновить
640.18

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Homo clickus. Как моделирование кликающих людей пригодится для сегментации изображений

Уровень сложностиСложный
Время на прочтение13 мин
Количество просмотров90

Приветствую всех читающих!

Меня зовут Антон Антонов, я инженер по искусственному интеллекту, работаю в Институте искусственного интеллекта AIRI в команде, которая занимается Embodied AI — областью, связывающей робототехнику, компьютерное зрение и большие языковые модели.

Недавно наша группа получила приятное известие: нашу статью с описанием модели того, как люди кликают и тапают на картинки, приняли на грядущий NeurIPS! Она будет полезна, чтобы тестировать модели интерактивной сегментации, которые помогают автоматизировать и ускорить процесс разметки изображений человеком.

Ниже я хотел бы подробнее рассказать о нашей разработке.

Кликнуть

Новости

Магия простоты: как мы улучшили отображение общественного транспорта на карте

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров372

Привет! Я Иван Косолапов, тимлид команды ETA/RTA. Мы часть сервиса Data Science и занимаемся анализом данных и машинным обучением для задач навигации в 2ГИС.

Наша команда появилась несколько лет назад, чтобы сделать точным прогноз времени в пути на автомобиле. Это важно не только для пользователей нашего навигатора, но и для бизнеса: например, для такси и служб доставки. Несколько специалистов по машинному обучению объединились с инженерами из команды навигации и создали решение, которое отвечает строгим требованиям по качеству, снизив ошибку на 20 процентов. Недавно мы также помогли сделать так, чтобы автобусы на карте отображались точно, и начали предсказывать время их прибытия на остановки. И это лишь часть задач, над которыми мы работаем.

Сейчас тема AI, машинного обучения у всех на слуху, и со стороны может показаться, что те, кто этим занимается — маги, которые берут нейросети, прикладывают их к правильным местам, и все проблемы решаются.

На самом деле применение сложных алгоритмов требует большой подготовительной работы по наведение порядка  в процессе разработки, что занимает 90 процентов всего времени, если не больше. Более того, как только процесс налажен, может оказаться так, что никакой дополнительной магии машинного обучения уже и не нужно добавлять. 

Под наведением порядка в процессе разработки я подразумеваю решение четырёх задач: выбор правильной метрики, подготовка данных, построение воспроизводимой системы экспериментов, перенос алгоритмов туда, где их проще всего развивать.

Расскажу, как решая эти задачи, мы добились более точного отображения автобусов на карте в 2ГИС, упростив существующую на тот момент сложную систему.

Читать

Оценка RAG: Полное руководство по модульному тестированию RAG в CI/CD

Время на прочтение9 мин
Количество просмотров111

Генерация дополненного извлечения (RAG) стала самым популярным способом предоставления LLM дополнительного контекста для создания адаптированных выходных данных. Это отлично подходит для приложений LLM, таких как чат-боты или агенты ИИ, поскольку RAG предоставляет пользователям гораздо более контекстуальный опыт, выходящий за рамки данных, на которых обучались LLM, такие как GPT-4.

Неудивительно, что практикующие LLM столкнулись с проблемами оценки приложений RAG во время разработки. Но благодаря исследованиям, проведенным RAGA, оценка общих характеристик генератора-извлекателя систем RAG в 2024 году является в некоторой степени решенной проблемой. Однако создание приложений RAG до сих пор остается проблемой — вы можете использовать неправильную модель встраивания, плохую стратегию фрагментации или выводить ответы в неправильном формате, что как раз и пытаются решить такие фреймворки, как LlamaIndex.

Но теперь, по мере того как архитектуры RAG становятся все более сложными, а сотрудничество между специалистами LLM в этих проектах усиливается, возникновение критических изменений становится более частым, чем когда-либо.

Читать далее

Книга: «Разработка приложений на базе GPT-4 и ChatGPT. 2-е изд.»

Время на прочтение10 мин
Количество просмотров451
image Привет, Хаброжители!

Кто никогда не пользовался нейросетями? Всего за несколько лет технологии искусственного интеллекта и обработки естественного языка претерпели изменения, которые открывают новые горизонты для разработчиков.

Всего за пять дней с момента выхода ChatGPT его аудитория возросла до одного миллиона пользователей, что стало настоящим шоком для технологической индустрии. API OpenAI, существовавший уже три года, внезапно обрел огромную популярность благодаря возможности генерации текстов с помощью ИИ. Появление ChatGPT продемонстрировало невероятный потенциал языковых моделей, побудив программистов и разработчиков исследовать новые возможности.

И в книге «Разработка приложений на базе GPT-4 и ChatGPT. 2-е изд.» содержится подробное руководство для разработчиков на Python, желающих научиться создавать приложения с использованием больших языковых моделей.
Читать дальше →

Истории

Как на самом деле работает Attention

Уровень сложностиСложный
Время на прочтение8 мин
Количество просмотров278

Как именно работают механизмы, которые позволяют LLM так эффективно взаимодействовать с контекстом? Принято рассматривать нейронные сети как black-box, не разбираясь, что на самом деле происходит во время их инференса. Однако можно немного заглянуть «в мозги» нейронным сетям и попытаться понять, за что отвечают те или иные группы параметров модели.

Меня зовут Михаил Коновалов, я работаю ML-инженером в Okko. В этой статье я хочу рассмотреть несколько публикаций, посвященных интерпретации механизма Attention в трансформерах.

Читать далее

Промптинг: действительно полезное руководство

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров481

Промпт-инженеринг - это не просто наука, это настоящее искусство, требующее практики и постоянного совершенствования. Вооружившись знаниями из этого руководства и регулярно применяя их на практике, вы сможете создавать более эффективные промпты и получать именно те результаты, которые вам нужны.

Читать далее

Смарт-функции в Алисе: как LLM помогает понять, чего хочет пользователь

Время на прочтение41 мин
Количество просмотров793

Так уж вышло, что раз в несколько лет мы переписываем сервис, отвечающий за диалоговое взаимодействие в Алисе. В прошлый раз мы распиливали монолит на микросервисы, переходили от концепции интента к концепции сценария и улучшали качество классификации. Этот рефакторинг позволил нам научиться горизонтально масштабироваться, ускорил выпуск фичей и дал возможность существенно улучшить качество работы диалогового движка. На этой инфраструктуре мы жили 5 лет.

Совсем недавно мы начали новый виток развития Алисы: мы хотим поместить в самое сердце (точнее, в самый мозг) нашего диалогового движка большую языковую модель. В этом году мы уже добавили в Алису возможность отвечать с помощью LLM на любые вопросы, а теперь взялись за то, чтобы Алиса стала более универсальной и могла выполнять любые задачи пользователя.

Например, пользователь может сказать: «Алиса, выключи телевизор, когда закончится этот матч». До появления смарт‑функций Алиса ответила бы, что «этого пока не умеет», так как подобной задаче её не обучали. Теперь нейросеть сама разложит запрос на два действия — посмотрит, сколько осталось до конца, и поставит таймер выключения на это время. Или если в запросе будут разного типа задачи, например одна про контент, а другая — про звук, Алиса тоже разложит их на понятные для нее части и выполнит: «Алиса, включи первый фильм на громкости 20».

Дальше я расскажу, как мы это собираемся делать.

Читать далее

Как построить карьеру в области искусственного интеллекта. Советы от Эндрю Ына

Время на прочтение27 мин
Количество просмотров497

Стремительное развитие искусственного интеллекта привело к бурному росту числа вакансий в этой области, и сегодня многие люди строят в ней увлекательную карьеру. На протяжении многих лет американский учёный Эндрю Ын наблюдал, как это происходит у тысяч студентов, а также инженеров в больших и малых компаниях. Теперь он предлагает практическую схему, по которой можно проложить собственный карьерный трек. 

О трех ключевых составляющих этой схемы — обучении базовым навыкам, работе над проектами и поиске работы, — читайте под катом. 

Читать далее

5 способов установить и нативно использовать ChatGPT на компьютерах Mac

Время на прочтение7 мин
Количество просмотров492

Искусственный интеллект ChatGPT от OpenAI все чаще становится незаменимым помощником при выполнении множества задач: от создания текстов и обработки данных до проведения сложных вычислений. Поэтому нет ничего удивительного в том, что им пользуются люди самых разных профессий и возрастов. Правда, большинство обращаются к нему чаще всего через веб-версию, хотя есть куда более удобные способы. 

Читать далее

Что может дать искусственный интеллект малому бизнесу

Время на прочтение4 мин
Количество просмотров2.3K

В предыдущей статье Сколько стоит искусственный интеллект для малого бизнеса я рассчитал величину затрат на использование искусственного интеллекта для гипотетической точки общественного питания с несколькими сотнями чеков в день. Величина получилась воодушевляющая (для бизнеса). К методике расчета у сообщества вопросов не возникло. Зато возник и несколько раз прозвучал вопрос типа: "А что с того? Что этот искусственный интеллект может дать малому бизнесу". В этой статье постараюсь дать развернутый ответ.

Читать далее

История YOLO – самой известной архитектуры компьютерного зрения

Время на прочтение20 мин
Количество просмотров2.5K

YOLO расшифровывается как You Only Look Once. Это широко известная архитектура компьютерного зрения, которая знаменита в том числе своим огромным количеством версий: первая из них вышла в 2016 году и решала только задачу детекции объектов на изображении, а последняя – одиннадцатая – появилась в сентябре этого года и уже представляет из себя целую фундаментальную модель, которую можно использовать для классификации, трекинга объектов на видео, задач pose estimation и тд. Все это – в реальном времени.

Да, за 8 лет своего существования YOLO стала своеобразным трансформером во вселенной компьютерного зрения: ее любят и используют повсеместно.

Эта статья – полноценная техно-история YOLO. Мы расскажем, что представляет из себя задача детекции, как работала самая первая YOLO и как ее дорабатывали во всех последующих версиях.

Читать далее

Сможет ли ИИ принять правильное решение? Ответы нейросетей на моральные вызовы

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.4K

Нейросети научились писать симфонию и превращать холсты в шедевры. Они умеют даже чувствовать и сопереживать. Если попросить ChatGPT написать грустный стих или весело описать процесс теплообмена — справится быстро не хуже профессионального поэта. А вот умение искусственного интеллекта решать моральные дилеммы и логические задачи пока под вопросом. Нейросети все еще обучают мыслить как человек и выбирать правильные решения там, где их нет. 

Если модель справляется с логическими задачами, она точно сможет помочь в сложных рабочих процессах. А если ответы совпадают с вашими моральными взглядами, то советы ощущаются как разговор с другом, а не с бездушной машиной.

Проверим самые передовые модели с помощью сервиса LLMArena. Это бесплатная платформа, где можно тестировать сразу две нейросети, чтобы выбрать лучшую для себя. Главная фишка сервиса — анонимное сравнение. Система сама выбирает модели и скрывает их названия, чтобы выбор был честным и объективным. Настоящий поединок искусственного интеллекта, где побеждает сильнейший.

Давайте посмотрим, как разные модели справятся с моральными дилеммами и задачками на логику.

Читать далее

Рассуждение о Искусственном Интеллекте, Нейросетях и к чему все это может привести

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров604

В меру технического прогресса, распространения компьютеров, ноутбуков, смартфонов, развития диджитал бизнеса и диджитализации (цифровизации) классического бизнеса, удаленных форматов работы и прочего большой процент людей в своей работе обобщенно стали Оператором ЭВМ, в том или ином виде, если очистить их ежедневную деятельность от содержания и определять только по форме.

Очевидно что продуктивная деятельность из области создания классного (интересного, профессионального) результата перетекает в область подробного, классного и четкого описания результата - остальное делает нейронка. Описание результата с учетом всех параметров, роли, контекста, фактов и прочих нюансов - это отдельная область знаний и профессиональных навыков. К этому стоит добавить также умение подбирать наиболее эффективную нейросеть под задачу, комбинировать нейросети и делать малую автоматизацию (скрипты, интеграции к гугл таблицами, чат-ботами в телеграм и т.д.). Назовем эту новую роль (профессию) человека - Оператор Нейронной Сети.

Порассуждаем что сможет сделать подобный оператор:

Читать далее

Ближайшие события

2 – 18 декабря
Yandex DataLens Festival 2024
МоскваОнлайн
11 – 13 декабря
Международная конференция по AI/ML «AI Journey»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

Чем серверные GPU-ускорители отличаются от потребительских видеокарт

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров2.7K

При сравнении профессиональных и настольных GPU решающую роль играют показатели производительности. Так, серверные GPU предназначены для задач с высокой степенью многопоточности, для чего имеют больший объем производительной памяти в сравнении с настольными аналогами, что делает профессиональные графические процессоры важным компонентом ЦОД’ов и облачных вычислительных сред, где параллельная обработка имеет важное значение. Но… давайте покопаемся в этом поподробнее.

Читать далее

Как не стать жертвой карго-культа: на примере козы, осла и волка (басня)

Время на прочтение2 мин
Количество просмотров1.2K

Жили-были в одном лесу коза, осел и волк. И у каждого были свои заботы. Коза искала самую сочную траву, осел мечтал о ровной дороге без камней, а волк строил настоящую империю: охотился, управлял стаей и внедрял новые технологии.

Однажды коза и осел заметили, что у волка всё идёт как по маслу: стая довольна, добычи в достатке. И решили они узнать, в чём его секрет. Волк, хитро прищурившись, сказал:

— Я внедрил Agile, использую генеративный ИИ и веду квартальные OKR-сессии.

Коза округлила глаза:

— Вот оно! Нужно срочно начать проводить стендапы!

Осел закивал:

— А я сразу закажу какой-нибудь модный AI!

Читать далее

Дилеммы, с которыми вы столкнетесь при разработке биометрических датасетов

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров664

Если вы хотите научить модель машинного зрения разбираться в сортах кукурузы или, скажем, отличать пешеходов от автомобилей, вам нужно подготовить датасет с изображениями, где уже будут размечены пешеходы и початки кукурузы, снятые с разных ракурсов в разное время суток. Когда дело ограничивается злаковыми культурами, для этих целей можно использовать опенсорсное решение, а вот компании, работающие с белковыми формами жизни и их биометрией — например, банки, — за неимением своих датасетов часто обращаются за помощью к другим компаниям. 

Чтобы выяснить, как на практике выглядит такая разработка датасетов на аутсорсе, мы поговорили с Владиславом Барсуковым, руководителем группы речевых и генеративных данных в Data Light. Он поделился своим взглядом на проблемы в сфере разметки биометрических данных и рассказал о подводных камнях, с которыми приходится сталкиваться в ходе подготовки, проверки, обработки и выгрузки датасетов для алгоритмов ML. Бонусом — интересный кейс с разметкой 60 000 фотографий, пол и возраст на которых проверяли сначала нейросетью, а потом — вручную. 

Читать далее

Распознавание русского рукописного текста

Время на прочтение9 мин
Количество просмотров853

Привет, Хабр! Меня зовут Арсений, я работаю ML-инженером в компании Вита и параллельно учусь на втором курсе магистратуры AI Talent Hub. В этой статье я хочу поделиться опытом разработки модели для распознавания русского рукописного текста.

Читать далее

Сканирование документов на планшетах Kvadra: как мы создавали и обучали алгоритм

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.1K

Привет, Хабр! Меня зовут Владислав, я CV Engineer в компании YADRO. В этой статье я расскажу, как мы разрабатывали и обучали алгоритм детекции документов для нашего планшета Kvadra_T. Я подробно описал нюансы задачи и весь наш путь — от классического подхода до генерации недостающих датасетов и обучения на них нашей собственной нейросети. Постарался сделать историю интересной как для новичков в теме, так и для более опытных читателей. Режим детекции, кстати, уже доступен в kvadraOS.

Читать далее

Квантовый чип Willow от Google: много маркетинга и мало правды

Время на прочтение3 мин
Количество просмотров5.2K

СМИ взорвали новости о появлении самого быстрого компьютера в мире. Он за 5 минут смог решить задачу, которую классический ПК решал бы миллиард лет. Давайте посмотрим на чём эти и другие громкие заявления основаны и есть ли на данный момент хоть какие-то подтверждения прорыва в этом амбициозном очень-очень дорогом проекте.

Спойлер: нет.

Читать далее

ACM RecSys — 2024: тренды и доклады с крупнейшей конференции по ML в рекомендательных системах

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров719

Привет! Меня зовут Петр Зайдель и я — старший разработчик в Музыке. Вместе с другими ребятами из Яндекса, которые развивают рекомендательные системы в разных сервисах, я в октябре побывал на международной конференции ACM RecSys — 2024 в итальянском городе Бари. Сегодня хочу поделиться с Хабром впечатлениями, трендами и, конечно, обзорами самых интересных научных статей с конференции. Думаю, мой рассказ будет полезен всем специалистам в сфере рекомендательных систем, которые следят за трендами и готовы пробовать в своей работе что‑то новое и интересное.

Читать далее
1
23 ...

Вклад авторов