Искусственный интеллект

AI, ANN и иные формы искусственного разума

Статьи Посты Новости Авторы Компании

s_valuev 22 апр в 13:38

Языковой процессор LPU, GenAI в FinOps и инструменты для анализа данных

Средний

6 мин

1.2K

Блог компании SelectelBig Data*Машинное обучение*Искусственный интеллектIT-компании

Дайджест

Привет, Хабр! Возвращаюсь с новым выпуском полезных материалов, который поможет разобраться в ML, AI и дата-аналитике. Сегодня в программе — состояние MLOps в 2024 году, возможности дата-контрактов, оценка качества данных DQ Score и Python-библиотека для работы с SQL. Подробнее — под катом. Еще больше полезных материалов — в Telegram-сообществе «MLечный путь».

Читать дальше →

+26

alizar 22 апр в 12:00

Плэнер — язык логического программирования для ИИ: что из него получилось

Средний

6 мин

5.5K

Блог компании RUVDS.comПрограммирование*Разработка игр*Искусственный интеллектИзучение языков

Обзор

Боты под управлением системы GOAP (Goal Oriented Action Planning), источник

Плэнер (Planner) — функционально-логический язык программирования, схожий по своему синтаксису с Лиспом. Функциональная часть языка содержит фактически целиком Лисп в качестве подмножества. При этом его встроенные возможности по символьной обработке значительно шире. А введение в запись нескольких типов скобок (в Лиспе допускаются только круглые скобки) сделало программы гораздо понятнее для чтения.

В свою очередь, логическое программирование — это парадигма программирования, основанная на математической логике, в которой код состоит из логических утверждений и правил вывода.

Читать дальше →

+43

ipasechnik 19 апр в 12:08

Генеративные 3D-модели

Средний

15 мин

Блог компании SberDevicesРабота с 3D-графикой*Машинное обучение*Искусственный интеллект

Обзор

Салют, Хабр! На связи Игорь Пасечник — технический лид направления XR RnD SberDevices. Сегодня я хочу рассказать про одно из наших направлений исследований — разработку генеративных моделей для 3D-контента.

Современные методы генерации 2D-контента, такие, как 2D-диффузионные модели (Kandinsky 3.0, SDXL), уже достигли впечатляющих результатов и несколько лет являются неотъемлемой частью современности, генеративные видео модели также активно развиваются. Кульминацией развития таких подходов, вероятно, станет представленная не так давно модель Sora. Тем не менее большинство из этих моделей до сих пор испытывают проблемы при генерации консистентных 3D-сцен и объектов.

С другой стороны стороны, существует конвенциональная 3D-графика, а также огромная индустрия и множество прикладных областей, включая игры, XR, дизайн, архитектуру, маркетинг, 3D-проектирование, где используются пайплайны на основе 3D-графики и производится контент на их основе. Методы создания 3D-моделей, такие, как ручное моделирование, 3D-сканирование и фотограмметрия, могут быть трудоёмкими, дорогостоящими и требующими специальных навыков. 3D-продакшн в общем виде использует множество инструментов для создания и рендеринга тяжелой фотореалистичной графики, адаптация генеративных 3D-пайплайнов под такие подходы достаточно тяжела из-за множества инструментов, которые такие пайплайны должны поддерживать. Также адаптация больших латентных генеративных 2D-моделей вроде SORA для прикладных задач фотореалистичной графики может стать альтернативой классическми пайплайнам на основе физического моделирования. Тем не менее, на текущий момент пайплайны работы с графикой, использующие базовый набор примитивов, включая меши, PBR-текстуры, простые модели освещения, закрывают множество прикладных задач и также могут быть востребованы у массового пользователя в случае их демократизации.

+43

MidavNibush 18 апр в 16:51

Mojo: убийца Python и будущее AI

Простой

5 мин

26K

Блог компании RaftOpen source*Программирование*Машинное обучение*Искусственный интеллект

Обзор

Всем привет! Меня зовут Вадим, я Data Scientist в компании RAFT. Сейчас технологии AI применяются и развиваются во многих сферах деятельности человека, в особенности LLM, про которые уже слышал каждый. В большинстве случаев подобные технологии реализуют на Python, используя различные библиотеки, такие как pytorch, tensorflow, jax. Все они имеют свои преимущества и недостатки. Например, всем известная скорость вычислений.

+25

VladimirMironovML 18 апр в 12:07

Открытый AI в коммерческом продакшене: обзор h2oGPT

13 мин

3.7K

Блог компании SelectelМашинное обучение*Научно-популярноеИскусственный интеллектIT-компании

Обзор

Крупные компании пока используют проприетарные нейросети, мягко говоря, неохотно или не используют вовсе. Как правило, их применяют отдельные сотрудники. Частично это можно объяснить опасениями со стороны специалистов по информационной безопасности, ведь тот же ChatGPT, например, открыто общается с интернетом. И в этот момент на сцену выходит open source.

В этой статье поговорим, из чего состоит h2oGPT, на каких моделях функционирует, какими метриками оценивается и в какой сервис «завернут». Дополнительно взглянем на конкурентов и ситуацию на рынке в целом.

Читать дальше →

+36

Squirrelfm 18 апр в 08:30

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

Простой

3 мин

8.5K

Блог компании RaftМашинное обучение*Искусственный интеллект

Обзор

Бывают ситуации, когда жизненные обстоятельства не позволяют использовать ChatGPT и приходится разворачивать LLM локально. Там можно остаться и без AI, а этого мужики точно не поймут. Есть ли какие-то способы решения этой проблемы?

Если у вас такая ситуация – можете выдохнуть, решение есть.

+39

hommforever 16 апр в 13:01

Яндекс запустил Нейро. Рассказываем, как он работает

Средний

14 мин

43K

Блог компании ЯндексПоисковые технологии*Алгоритмы*Машинное обучение*Искусственный интеллект

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей.

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

+88

142

riskov 12 апр в 20:17

Замени меня, нейросеть, замени меня полностью

Простой

15 мин

11K

Блог компании Альфа-БанкКонтент и копирайтинг*Искусственный интеллект

Мнение

Сегодня без «программистов». В этот раз будет сказ про нейросеть и копирайтеров, которым закрою тему «Заменит ли нейросеть копирайтеров» раз и навсегда. Для себя уж точно.

+37

myoffice_ru 11 апр в 16:04

Я изучила 900 самых популярных инструментов ИИ на базе open source — и вот что обнаружила

8 мин

31K

Блог компании МойОфисOpen source*Машинное обучение*Искусственный интеллект

Перевод

Четыре года назад ИТ-эксперт Чип Хуэн* проанализировала экосистему ML с открытым исходным кодом. С тех пор многое изменилось, и она вернулась к изучению темы, на этот раз сосредоточившись исключительно на стеке вокруг базовых моделей.

О результатах исследования читайте под катом.

*Обращаем ваше внимание, что позиция автора может не всегда совпадать с мнением МойОфис.

+42

ErmIg 11 апр в 15:08

Теоретическая и реальная производительность Intel AMX

Сложный

11 мин

3.7K

Высокая производительность*C++*Алгоритмы*Обработка изображений*Искусственный интеллект

Туториал

AMX (Advanced Matrix Extension) - это модуль аппаратного ускорения умножения матриц, который появился в серверных процессорах Intel Xeon Scalable, начиная с 4 поколения (архитектура Sapphire Rapids).

В начале этого года ко мне в руки наконец попал сервер, с данным типом процессора.

Конкретно модель Xeon(R) Gold 5412U - это 24 ядерный процессор с тактовой частотой в 2.1 GHz. При этом 8 приоритетных ядер могут разгонятся до 2.3 GHz, а 1 ядро до 3.9 GHz в Turbo Boost). Кроме того данный процессор поддерживает 8 канальную DDR-5 4400 MT/s.

Мне как человеку, достаточно долгое время посвятившему оптимизации алгоритмов компьютерного зрения и запуска нейронный сетей на CPU (библиотеки Simd и Synet), было интересно: на сколько AMX позволяет реально ускорить вычисления и как извлечь из него максимальную производительность.

Далее я постараюсь максимально подробно ответить на данные вопросы. Прежде все я буду касаться вопросов однопоточной производительности (многопоточную рассмотрю позже).

Далее много кода на С++...

+28

acheremuhin 10 апр в 20:14

LLM как универсальная «отмычка» студента — настолько ли все хорошо?

Средний

7 мин

R*Искусственный интеллект

Кейс

Небольшой эксперимент по применению LLM при решении задач анализа данных на R и краткие выводы по нему.

+35

AlekseiPodkletnov 10 апр в 08:55

Как работают алгоритмы музыкальных стримингов. Разбираем на примере

9 мин

8.8K

Алгоритмы*Машинное обучение*Читальный залИскусственный интеллектЗвук

Кажется, что рекомендательный движок музыкального сервиса - это черный ящик. Берет кучу данных на входе, выплевывает идеальную подборку лично для вас на выходе. В целом это и правда так, но что конкретно делают алгоритмы в недрах музыкальных рекомендаций? Разберем основные подходы и техники, иллюстрируя их конкретными примерами.

Начнем с того, что современные музыкальные сервисы не просто так называются стриминговыми. Одна из их ключевых способностей - это выдавать бесконечный поток (stream) треков. А значит, список рекомендаций должен пополняться новыми композициями и никогда не заканчиваться. Нет, безусловно, собственноручно найти свои любимые песни и слушать их тоже никто не запрещает. Но задача стримингов именно в том, чтобы помочь юзеру не потеряться среди миллионов треков. Ведь прослушать такое количество композиций самостоятельно просто физически нереально!

Так как они это делают?

+34

snk4tr 9 апр в 10:15

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

16 мин

11K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureОбработка изображений*Машинное обучение*Искусственный интеллект

В Yandex Cloud с сегодняшнего дня открыт доступ к тестированию API YandexART — нейросети для генерации изображений и анимаций, которая лежит в основе приложения Шедеврум. Протестировать API можно в сервисе Foundation Models, в котором доступно несколько моделей машинного обучения, включая YandexGPT для генерации текстов и эмбеддинги для задач семантического поиска.

+37

janvarev 8 апр в 11:01

GPT-4, Claude 3, Gemini Pro или опенсорс — как выбрать LLM под свою задачу?

Средний

10 мин

16K

Блог компании Timeweb CloudИскусственный интеллектNatural Language Processing*

Туториал

Несмотря на то, что сейчас ~~из каждого утюга~~ рекламируется доступ к ChatGPT и GPT-4, вообще говоря, в мире существует несколько больше разных поставщиков LLM (больших языковых моделей), и некоторые из которых могут гораааздо более эффективнее решать какие-то конкретные задачи.

Я уже полгода веду проект VseGPT.ru с доступом к разным LLM из России по OpenAI API (ну, и через вебчат). Львиная доля работы — подключение новых нейросетей. Сейчас их уже свыше 60, и каждую я попробовал хотя бы раз, ну, когда подключал.

Правда, сайт LLMExplorer, собирающий данные об опенсорс нейросетях с портала Hugging Face, говорит, что их там уже более 33 000 штук. М-да.

В общем, вероятно, я не знаю о текстовых сетках всё, но определенно знаю кое-что — хотя бы в пределах своего скромного опыта в 60 сеток. Так что кому интересно — прошу под кат.

Читать дальше →

+31

ggospodinov 8 апр в 09:50

GigaAM: класс открытых моделей для обработки звучащей речи

Средний

10 мин

6.2K

Блог компании SberDevicesOpen source*Машинное обучение*Искусственный интеллект

Салют, Хабр! Ранее мы в SberDevices анонсировали предобученную на русском языке модель GigaAM (Giga Acoustic Model) и её дообученные состояния под распознавание речи (GigaAM-CTC) и определение эмоций (GigaAM-Emo). Сегодня же делимся с сообществом весами моделей и примерами использования.

Приглашаем под кат погрузиться в self-supervised learning для звучащей речи и оценить возможности предобученных моделей!

+30

aansty4U 6 апр в 18:30

Революция в клеточной биологии: Применение GPT-4 для РНК-секвенирования

Простой

11 мин

10K

Блог компании BotHubИскусственный интеллектЗдоровье

Обзор

Одноклеточное РНК-секвенирование (scRNA-seq) – метод изучения экспрессионных профилей на уровне отдельных клеток, то есть определения, какие РНК присутствуют в каждой клетке и в каком количестве. Это позволяет ученым понимать, как функционирует каждая клетка и какие функции она выполняет.

Простыми словами: данный метод помогает понять, какие гены в клетке "включены" и "выключены" в данный момент. Это важно, потому что активные гены определяют, как клетка будет себя вести, например, будет ли она здоровой, превратится ли в раковую, поможет ли она иммунной системе бороться с инфекцией и так далее. Таким образом, РНК-секвенирование применяют для разработки лекарств, при изучении болезней и их лечении, а также для того, чтобы понять, как развиваются и функционируют различные живые организмы на уровне их клеток.

Весь процесс достаточно сложный, но как GPT-4 помогает в его осуществлении? Об этом подробно и доступно я расскажу в этой статье!

Приятного прочтения! :)

+31

Aremys 3 апр в 23:00

Введение в нейросети: что, зачем и как?

Средний

25 мин

33K

Python*Математика*Машинное обучение*Искусственный интеллект

Туториал

Из песочницы

Это модное слово всё чаще используется в разговорной речи: обывателей плотнее окутывают угрозами бунта искусственного интеллекта и войны с роботами — с одной стороны, и рекламой нейросетевых продуктов — с другой. Отдельный котёл в аду — для тех, кто впаривает «курсы дата‑саентистов». А когда бедный юзернейм в поисках истины обращается к ~~Гуглу~~ своему любимому поисковику — то вместо простого ответа на простой вопрос, получает ещё больше вопросов — таких как тензорфлоу, сигмоида и, не дай Бог, линейная алгебра.

Как же нейросети рисуют картинки?

+54

roman-gorb 2 апр в 10:01

Ускорение инференса LLM

Средний

13 мин

6.6K

Блог компании ЯндексПрограммирование*Алгоритмы*Машинное обучение*Искусственный интеллект

Инференсом ML-модели называют процесс её работы на конечном устройстве. Соответственно, чем больше мы разгоняем инференс, тем быстрее работает модель. Скорость может зависеть от разных условий, например, от архитектуры, которую вы выбрали для модели, или от железа, на котором работает устройство. Кроме того, проблема тяжёлого инференса остро ощущается на больших языковых моделях (LLM) так остро, как ни на каких других моделях.

Меня зовут Роман Горб, я старший ML-разработчик в команде YandexGPT. Тема инференса LLM заинтересовала меня, потому что я занимался R&D в квантовании сеток для CV-задач. Сегодня я расскажу, как безболезненно увеличить скорость инференса. Сперва разберёмся, зачем это нужно, а потом рассмотрим разные методы ускорения и фреймворки, которые могут в этом помочь.

Ускоряемся

+30

Razant 1 апр в 16:38

Как устроено пространство, в котором думают языковые модели?

Сложный

5 мин

16K

Блог компании AIRIАлгоритмы*Машинное обучение*Искусственный интеллектNatural Language Processing*

Кейс

С момента выхода первой статьи «Attention is All You Need» я с жадностью и любопытством, присущими любому исследователю, пытаюсь углубиться во все особенности и свойства моделей на базе архитектуры трансформер. Но, если честно, я до сих пор не понимаю, как они работают и почему так хорошо обучаются. Очень хочу разобраться, в чём же причина такой эффективности этих моделей, и есть ли предел их возможностей?

Такому изучению трансформеров «под микроскопом» и посвящена наша научная работа, только что представленная на конференции EACL 2024, которая проходила на Мальте — «The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models». В этой работе мы сфокусировались на наблюдении за пространством эмбеддингов (активаций) на промежуточных слоях по мере обучения больших и маленьких языковых моделей (LM).

+55

DRoman0v 31 мар в 14:25

Китайская компания Intellifusion представила 14-нм ИИ-процессор. Что это за чип и для чего он нужен?

4 мин

4.6K

Блог компании SelectelПроизводство и разработка электроники*Компьютерное железоИскусственный интеллект

В КНР, как известно, сейчас есть сложности с закупкой ИИ-чипов Nvidia и AMD. Поэтому китайским организациям, которым нужны GPU для работы с искусственным интеллектом, приходится решать проблемы собственными силами. Есть разные способы, один из них на днях представила компания Intellifusion, которая разработала специализированные процессоры. Причем стоимость таких компонентов очень невысокая. Подробности под катом!

Читать дальше →

+37

2 3 ...

56 57

Искусственный интеллект

Языковой процессор LPU, GenAI в FinOps и инструменты для анализа данных

Новости

Плэнер — язык логического программирования для ИИ: что из него получилось

Генеративные 3D-модели

Mojo: убийца Python и будущее AI

Истории

Открытый AI в коммерческом продакшене: обзор h2oGPT

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

Яндекс запустил Нейро. Рассказываем, как он работает

Замени меня, нейросеть, замени меня полностью

Я изучила 900 самых популярных инструментов ИИ на базе open source — и вот что обнаружила

Теоретическая и реальная производительность Intel AMX

LLM как универсальная «отмычка» студента — настолько ли все хорошо?

Как работают алгоритмы музыкальных стримингов. Разбираем на примере

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

Ближайшие события

GPT-4, Claude 3, Gemini Pro или опенсорс — как выбрать LLM под свою задачу?

GigaAM: класс открытых моделей для обработки звучащей речи

Революция в клеточной биологии: Применение GPT-4 для РНК-секвенирования

Введение в нейросети: что, зачем и как?

Ускорение инференса LLM

Как устроено пространство, в котором думают языковые модели?

Китайская компания Intellifusion представила 14-нм ИИ-процессор. Что это за чип и для чего он нужен?

Вклад авторов