Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

createcolor 29 фев в 10:31

История о том, как организовать соревнование по компьютерному зрению без правильных ответов

Средний

18 мин

1.8K

Обработка изображений*Машинное обучение*Искусственный интеллект

Из песочницы

В прошлом году наша научная группа организовала международное соревнование по рендерингу ночных изображений на конференции CVPR. Это, на минуточку, одна их трех самых престижных профильных международных конференций в году. Задача участника — создать алгоритм, который будет генерировать/рендерить по необработанному (RAW) изображению самое эстетически красивое изображение ночной сцены. Красота оценивалась независимо профессиональным фотографом и обычными пользователями.

Но получилось ли у участников покорить их сердца?

+23

PatientZero 29 фев в 10:09

О странной фаллоцентричности модели GPT-J

Средний

11 мин

6.1K

Машинное обучение*Искусственный интеллект

Кейс

Перевод

TL;DR Статья посвящена находкам, описанным в моих постах Mapping the Semantic Void, часть I и II. Создав специальный эмбеддинг в центроиде токенов (векторе средних значений всех 50257 эмбеддингов токенов GPT-J ), при помощи промта приказав модели определить его и учтя логиты, можно создать «дерево определений» состоящее в подавляющем большинстве из туманных сформулированных неопределённостей. Это вряд ли может удивлять, ведь модели GPT-J, по сути, дают задачу определить «что-то среднее». Однако наиболее вероятная ветвь в дереве, дающая определение, содержащее что-то конкретное, определяет «призрачный токен» (ghost token) в центроиде как «мужской пенис» (a man's penis). Снизив уровень отсечки кумулятивной вероятности, чтобы создать длинные списки возможных определений, мы выясним, что почти все ветви, предоставляющие определения, касающиеся чего-то конкретного, связаны с сексом/деторождением, и среди них лишь время от времени встречаются связанные со статусом. Как обычно, я понятия не имею, что всё это значит, но буду рад вашим предположениям!

+18

veseluha 28 фев в 18:00

Как составить договор с помощью нейросетей

Простой

8 мин

2.7K

Блог компании BotHubМашинное обучение*Искусственный интеллект

Туториал

В наше время технологии искусственного интеллекта все шире внедряются в различные сферы человеческой деятельности, включая юридическую практику. Одним из наиболее заметных примеров этого является использование нейронных сетей для создания договоров для тех или иных потребностей. Традиционно создание и анализ таких документов требовало значительных затрат времени и усилий со стороны юристов и специалистов. Однако благодаря прогрессу в области машинного обучения и нейронных сетей, теперь мы можем воспользоваться инновационными методами автоматизации этого процесса. Попробуем сделать договор оказания услуг с помощью ChatGPT как простые обыватели.

В этой статье мы рассмотрим, способны ли нейронные сети оптимизировать подход к составлению договоров оказания услуг, смогут ли предложить более эффективные, точные и быстрые решения, которые способны значительно упростить жизнь предпринимателей и юристов.

Поехали(:

+11

orlov-pg 28 фев в 16:09

Анализ зависимостей бинарных файлов на основе ML

Средний

12 мин

1.5K

Блог компании TINKOFFИнформационная безопасность*Машинное обучение*Искусственный интеллект

Кейс

Всем привет! 👋 👋 👋 Мы стажеры-разработчики Тинькофф: Влад, Паша и Илья. В проекте по стажировкам в ИБ Summer of Code под руководством Ромы Лебедя мы реализовали анализатор бинарного кода на основе ML-подходов — Binary SCA. Наш проект совмещает две предметные области — информационную безопасность и ML, поэтому мы разделили статью на несколько частей.

В этой статье подробно расскажем о ML-стороне проекта: проведенные исследования, сложности, с которыми столкнулись в ходе работы, какой результат получили. В этой части делимся опытом использования Rizin и Milvus. Добро пожаловать!

+10

Lit9898 28 фев в 09:21

Нейронная сеть, имеющая способность к самообучению

Средний

13 мин

Машинное обучение*Искусственный интеллектМозг

Из песочницы

Всем привет! Недавно, когда я размышлял над работой памяти в мозге человека, мне пришла идея того, как можно сделать нейронную сеть, которая будет обладать способностью самообучаться. В этой статье я бы хотел представить свои размышления и идею, к которой я пришёл.

+11

NewTechAudit 28 фев в 09:00

NLP для поиска грамматических ошибок

Простой

10 мин

1.3K

Машинное обучение*Natural Language Processing*

Туториал

Привет, Хабр!

Сегодня с вами участник профессионального сообщества NTA Журавлев Сергей.

В 2017 году на свет вышла статья разработчиков Google под названием «Attention is All You Need». В ней впервые была предложена идея трансформеров — моделей машинного обучения, ключевой особенностью которых было использование так называемых «слоев внимания», определяющих, какие слова и в какой степени важны для формирования контекста предложения. Публикация стала началом активного развития и продвижения моделей машинного обучения на описанной архитектуре.

stalkermustang 28 фев в 07:55

Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Средний

41 мин

91K

Машинное обучение*Научно-популярноеИскусственный интеллектБудущее здесь

Обзор

Ну что, уже успели прочитать восхищения небывалым качеством видео от нейросетки SORA у всех блогеров и новостных изданий? А теперь мы вам расскажем то, о чем не написал никто: чего на самом деле пытается добиться OpenAI с помощью этой модели, как связана генерация видео с самоездящими машинами и AGI, а также при чем здесь культовая «Матрица».

Войти в симуляцию →

+281

120

stalkermustang 28 фев в 07:55

Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Средний

41 мин

91K

Машинное обучение*Научно-популярноеИскусственный интеллектБудущее здесь

Обзор

Войти в симуляцию →

+281

120

Cerberg 27 фев в 14:43

Приручаем нейросети

6 мин

10K

Блог компании ReksoftМашинное обучение*

Туториал

Давно не виделись, уважаемые!

Ну что ж, рад вас видеть, сегодня будем говорить и применять новые инструменты для создания RAG, улучшим качество наших результатов относительно прошлой статьи за счет использования других моделей для embeddings. Также затронем использование трушной векторной БД Chroma.

+14

Sber 27 фев в 09:16

Учим большие языковые модели описывать продукты данных

Сложный

13 мин

3.8K

Блог компании СберМашинное обучение*Natural Language Processing*

Кейс

Привет, Хабр! В этой статье мы рассмотрим использование больших языковых моделей на этапе подготовки описания продуктов данных для дальнейшего использования в аналитике. Это может улучшить автоматизацию процесса, предоставляя инструмент для создания описаний продуктов.

+13

veseluha 26 фев в 18:00

NLUX: Библиотека интерфейса Conversational AI

5 мин

1.5K

Блог компании BotHubJavaScript*ReactJS*Машинное обучение*Искусственный интеллект

Обзор

В современном мире взаимодействие с компьютерами и приложениями становится все более естественным и удобным благодаря использованию разговорных интерфейсов и искусственного интеллекта. Однако, интеграция таких функциональностей в веб-приложения может стать вызовом для разработчиков. В этом контексте библиотека NLUX (Natural Language User Experience) приходит на помощь, предоставляя инструменты для создания разговорных пользовательских интерфейсов в приложениях React.

В этой статье мы рассмотрим основные возможности и преимущества NLUX, а также рассмотрим примеры использования и интеграции данной библиотеки в разработку веб-приложений.

Начнем (:

mr-pickles 26 фев в 12:20

Организация ML-монорепозитория с помощью Pants

Средний

24 мин

1.5K

Блог компании Wunder FundПрограммирование*Машинное обучение*

Перевод

Приходилось вам копипастить фрагменты вспомогательного кода между проектами, попадая в ситуацию, когда несколько версий одного и того же набора команд оказывались в разных репозиториях? Или, может, вам надо было делать pull‑запросы к десяткам проектов после того, как было изменено имя GCP‑корзины, где вы храните данные?

Подобные ситуации возникают в ML‑командах слишком часто. Тяжесть их последствий варьируется от мелких неудобств для отдельного разработчика до нарушения работы целой команды, которая оказывается не в состоянии вовремя выдать код, над которым трудится. К счастью, эти проблемы поддаются исправлению.

Предлагаю погрузиться в тему монорепозиториев. Это — архитектура, широко применяемая в ведущих технологических компаниях наподобие Google. Поговорим о том, как монорепозитории способны улучшить ваши рабочие процессы, связанные с машинным обучением. Монорепозитории дают тем, кто их выбирает, много полезного. Это, несмотря на то, что есть у них и недостатки, делает их привлекательным выбором для управления сложными ML‑экосистемами.

Сначала мы кратко обсудим сильные и слабые стороны монорепозиториев, поговорим о том, почему они — это отличное архитектурное решение для ML‑команд, коснёмся того, как их используют в крупных технологических компаниях. В итоге у нас появится представление о том, как воспользоваться возможностями системы сборки кода Pants для организации ML‑репозиториев при построении надёжной CI/CD‑системы для сборки проектов.

А теперь — в путь — к оптимизации управления проектами в сфере машинного обучения.

+12

Safreliy 26 фев в 11:50

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 2)

Средний

7 мин

3.8K

Работа с 3D-графикой*Алгоритмы*Машинное обучение*Искусственный интеллектAR и VR

Обзор

В предыдущей статье мы уже затрагивали задачу реконструкции 3D-объектов по их 2D-изображениям. В этой же углубимся в реконструкцию с головой! Вообще говоря, как мне кажется, сейчас мы рассмотрим гораздо более концептуально интересные методы, а именно - HSP и Mesh R-CNN. Это база, которая просто должна осесть в головах всех любителей ИИ в 3D!

+12

derunat 26 фев в 11:10

Нео-РНН или Make RNNs great again

Средний

3 мин

744

Блог компании НТРМашинное обучение*Искусственный интеллект

Обзор

Когда в 2017 году появились трансформеры, популярные до этого RNN обрели слишком серьезного конкурента и отошли на второй план. Трансформеры допускали распараллеливание, а значит — ускоренное обучение, поэтому быстро захватили NLP. Преимущества трансформеров понятны, но с моделированием длинных последовательностей возникают проблемы даже у них. Для RNN это тоже непростая задача из-за исчезающих или взрывающихся градиентов. Но RNN с их линейной зависимостью от масштаба выглядят гораздо привлекательнее квадратичной сложности трансформеров. Идеальным вариантом было бы совместить преимущества тех и других.

Sber 26 фев в 08:56

Конец программирования, как мы его знаем, или Что нас ждёт с LLM

Средний

5 мин

59K

Блог компании СберПрограммирование*Машинное обучение*Искусственный интеллект

Мнение

«Большие языковые модели и конец программирования». Под таким заголовком в прошлом году прошла серия лекций доктора Уэлша, профессора информатики в Гарварде. В этом посте мы раскроем основные тезисы выступления, и в заключение попробуем взглянуть на будущее так же воодушевлённо, как автор.

+32

233

kdduha 25 фев в 15:50

Open-source ML от Apple

Простой

7 мин

3.5K

Open source*Машинное обучение*Искусственный интеллект

Из песочницы

Привет, Хабр! После недавнего релиза Apple VIsion Pro я задумался над тем, какой вклад компания внесла в open-source ML, ведь, очевидно, было много предпосылок, наработок и технологий, о которых массовый пользователь не знает. Но все это гарантировано сыграло роль в появлении тех продуктов на рынке, о которых слышал буквально каждый в мире. Поэтому свою первую статью я решил сделать в формате небольшого обзора того, чем занимались и продолжают заниматься Apple в ML, хотя, казалось бы, что там можно смотреть в продуктах с открытым кодом кроме сотни репозиториев про Swift. Попытаюсь выделить основные тренды за прошедшие года и поделиться тем, что сам нашел интересного (оставив позади вопрос о целесообразности развития ML на яблочных устройствах)

+14

ArtemEvstafev 24 фев в 19:59

Использование теории игр для повышения прозрачности моделей машинного обучения

Средний

7 мин

4.3K

Математика*Машинное обучение*Искусственный интеллект

Интерпретация современных моделей машинного обучения может быть чрезвычайно сложным делом учитывая, что количество параметров и весовых коэффициентов может идти на тысячи и даже миллионы. Тем не менее это совершенно необходимо, для повышения качества, обеспечения стабильности и предсказуемости работы модели. В этом нам может помочь теория игр, математическая дисциплина позволяющая выделить из сложного взаимодействия факторов модели отдельный вклад каждого в конечное предсказание.

Golangcoder 24 фев в 11:03

40 Полезных инструментов Дата Саентиста

Простой

11 мин

16K

Python*Машинное обучение*

FAQ

В мире науки о данных существует бесчисленное множество библиотек и инструментов, которые помогают ускорить работу и повысить эффективность анализа.

Но что если я расскажу вам о некоторых полезных библиотеках, о которых вы скорее всего не слышали? В списке не будет всем известных библиотек таких, как Pandas, Polars, Scipy и тд

Сегодня, благодаря активному сообществу разработчиков, практически для любой задачи на Python можно найти готовый и полезный инструмент, который поможет вам в решении самых сложных задач.

Надеюсь, вы найдете что-то полезное для себя.

Читать

+15

spacecode_ru 24 фев в 00:44

Как мы дорабатывали легаси-ценообразование: от стадии отрицания до MVP за 4 месяца

Простой

5 мин

1.2K

Анализ и проектирование систем*Проектирование и рефакторинг*Машинное обучение*

Кейс

Привет, меня зовут Валерий Лобанов и я — аналитик данных в компании Spacecode.

Первый проект на новом месте работы всегда запоминается ярче последующих.
Для меня в Spacecode первой глобальной задачей стала работа с моделями динамического ценообразования. Сейчас, когда работа нашей команды над MVP продукта завершена, хочу рассказать о проекте и подвести свои личные итоги.

Читать дальше →

veseluha 23 фев в 17:41

Edge ML для людей с ограниченными возможностями

18 мин

1.1K

Блог компании BotHubСовершенный код*Машинное обучение*Искусственный интеллект

Обзор

С развитием технологий появились новые возможности для людей с ограниченными возможностями. Edge Machine Learning (Edge ML) представляет собой передовую технологию, которая приближает алгоритмы машинного обучения к источнику данных, что сокращает задержку и улучшает возможности обработки данных в реальном времени.

В этой статье мы рассмотрим потенциал применения Edge ML для решения уникальных проблем, с которыми сталкиваются люди с особыми потребностями. Edge ML может способствовать созданию более поддерживающей и доступной среды, что так важно для поддержки людей, которые и так оказались в непростом положении. Мы рассмотрим различные аспекты, вызовы и потенциальные улучшения, формирующие эволюцию модели Edge ML. Эта модель сфокусирована на двух основных задачах: выявлении случаев запугивания и предоставлении успокаивающей поддержки.

Приступим (:

1 2 ...

9 10

12 13 ...

324 325

Машинное обучение *

История о том, как организовать соревнование по компьютерному зрению без правильных ответов

О странной фаллоцентричности модели GPT-J

Как составить договор с помощью нейросетей

Анализ зависимостей бинарных файлов на основе ML

Нейронная сеть, имеющая способность к самообучению

NLP для поиска грамматических ошибок

Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Приручаем нейросети

Учим большие языковые модели описывать продукты данных

NLUX: Библиотека интерфейса Conversational AI

Организация ML-монорепозитория с помощью Pants

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 2)

Ближайшие события

Нео-РНН или Make RNNs great again

Конец программирования, как мы его знаем, или Что нас ждёт с LLM

Open-source ML от Apple

Использование теории игр для повышения прозрачности моделей машинного обучения

40 Полезных инструментов Дата Саентиста

Как мы дорабатывали легаси-ценообразование: от стадии отрицания до MVP за 4 месяца

Edge ML для людей с ограниченными возможностями

Вклад авторов

Работа