Все потоки
Поиск
Написать публикацию
Обновить
771.55

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

ИИ-помощник Pixie от Google для смартфонов: зачем он нужен и как будет применяться

Время на прочтение3 мин
Количество просмотров3.8K

Недавно мы писали о новой мощной модели Gemini с мультимодальными навыками от Google. Многие пользователи уже успели её протестировать, причём отзывы довольно противоречивые. Но как бы там ни было, технология продолжает развиваться. Вскоре на базе этой языковой модели корпорация создаст ИИ-помощника для мобильных устройств, который получит название Pixie. О том, что это за проект, читайте под катом.

Читать далее

Большой тест GPT4, GPT3.5, YandexGPT, GigaChat, Saiga в RAG-задаче. Часть 1

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров25K

Меня зовут Дмитрий Гуреев. Я занимаю должность CDTO в одной из медицинских компаний и параллельно веду работу по популяризации ИИ в среднем бизнесе. Генеративные модели привлекли мое внимание ещё в феврале 2022 года. Тогда я внедрил цифрового ассистента для полевых продавцов.

Летом 2022 года хороший знакомый из крупной компании предложил совместный эксперимент. Создать цифрового юриста, способного отвечать на вопросы первой линии, используя в качестве базы знаний 200-страничный регламент из более чем 1200 пунктов. Все это должно было функционировать в закрытом контуре. Без интернета.

Задача представлялась крайне интересной...

Вторая часть здесь.

Читать далее

Машинное обучение и встраиваемые системы. Демонстрация возможностей

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.2K


Одним из преимуществ технологий машинного обучения является их способность к обучению и адаптации на основе новых данных, что позволяет решать задачи распознавания образов, обработки естественного языка и поиска закономерностей и аномалий. Традиционно, собранные данные обрабатываются на серверах, однако для ряда задач целесообразнее (а иногда необходимо) использовать другой подход, называемый граничным машинным обучением (edge machine learning).


В этой статье мы расскажем о практическом применении нашего фреймворка машинного обучения для встраиваемых систем на примере демонстрационного стенда, который мы показывали на форуме “Армия-2023”.

Читать дальше →

Тех. поддержка на базе ChatGPT

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров7.3K

В данной статье мы рассмотрим бизнес-применение моделей от OpenAI. Я расскажу о том, как можно подключить ChatGPT ко внешней базе данных, а также как можно заставить его взаимодействовать с телеграмом (отправлять кнопки, к примеру).

А точнее:

Есть телеграм бот. Нужен он для того чтобы узнавать ответы на те или иные вопросы. У нас есть база со "знаниями". Когда человек пишет боту, система должна дать ему ответ на его вопрос опираясь на это базу.

Читать далее

Чьи права на то, что сделала нейросеть

Время на прочтение12 мин
Количество просмотров13K
У меня тут возникло несколько смешных юридических коллизий с результатам работы нейросети. Я пошёл к юристу задавать тупые вопросы и получил традиционные ответы «кажется, что вот так, но это не точно».

Тупые вопросы вот:

  • Кому принадлежат права на вывод LLM вроде ChatGPT? Оператору, модели, материнской компании?
  • Если в выводе попадается кусок обучающей выборки, получается, модель меня конкретно подставляет и я внезапно становлюсь обладателем плагиата (привет, Озон, Copilot беспокоится, когда вы таску закроете). Что с этим делать?
  • Если модель обучена на сценариях одного сценариста (статьях одного автора), идеально копирует стиль и форму, учитываются ли его права как-то?
  • Когда Битлы спели новую песню полным составом, Пол Маккартни не возражал против такого обучения? Что делать с дипфейками в кино?
  • Что делать с образом гражданки Скарлетт Йохансен, которая «снялась в порно» с использованием Stable Diffusion?
  • Я сгенерил музыку для фильма с помощью сервиса со свободной лицензией, но никак не могу доказать, что она моя. Что делать в случае страйка от Ютуба?
  • Как всё это работает в российском законодательстве и вообще по миру, какие практики есть?

Начнём с того, что в России чтобы использовать в деловых целях музыку или картинку для фильма, нужно исключительное право на эту музыку или картинку. Можно по неисключительной лицензии, что рождает неисключительное исключительное право. Я сейчас ужасно серьёзен, оно реально так называется. Примерно такая же логичность сейчас царит во всей отрасли после появления LLM и генеративок для звука и изображений.
Читать дальше →

Dropout и Batch normalization

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров17K


Привет, Хабр!

Dropout и Batch Normalization очень хороши в оптимизации процесса обучения и борьбе с одной из основных проблем ml — переобучением.
Читать дальше →

ML в животноводстве. Как ГК «Русагро» училось считать поголовье свиней

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.9K

Привет, Хабр! В сентябре мы провели конференцию «Инфраструктура для ML и AI, виды дрифтов ML-моделей, Computer Vision в животноводстве». Обсудили, как разные компании используют машинное обучение в работе, поговорили о трендах и инструментах построения production ML-систем в бизнесе. На митапе было четыре интересных доклада, и мы решили поделиться ими.

В этой публикации расскажем про опыт «Русагро Тех» — как они разрабатывают проекты по видеоаналитике в животноводстве для агрохолдинга ГК «Русагро. Кейсом поделился Павел Ширяев — руководитель группы компьютерного зрения «Русагро Тех».
Позже опубликуем остальные доклады про ML.
Читать дальше →

Multilabel-классификация знаний школьников

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.9K

Привет, Хабр! Меня зовут Егор, сейчас я учусь на четвёртом курсе кафедры математических методов прогнозирования (ММП) ВМК МГУ и изучаю машинное обучение, в том числе, обработку естественных языков (Natural Language Processing). Этим летом я стажировался в Лаборатории искусственного интеллекта, в центре Инструментов машинного обучения, где смог применить свои знания для решения практических задач. Об одной из них я и хочу рассказать.

Читать далее

Свободная музыка со словами, созданная нейронными сетями в «Бесконечном нейронном радио»

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7.9K

Привет, поклонники музыки! Думали ли вы о том, что наступит день, когда нейронные сети начнут генерировать музыкальные композиции в различных жанрах, начиная от Heavy Metal и заканчивая 80-ми? Недавно я выпустил большой апдейт для своего проекта с открытым исходным кодом «Нейронное радио», где музыка и подкасты созданы нейронными сетями. Однако в первых релизах музыка была без слов, и, мягко говоря, слабая. Но сегодня все изменилось. Качество музыки улучшилось, и появилась музыка со словами и голосами под жанры.

Послушать подробнее

Градиенты наносят ответный удар: атакуем распознавание паспорта

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров4.4K

В данной статье мы продолжим говорить про атаки на нейронные сети (часть 1 тут). Сегодня мы возьмем нейронную сеть, решающую реальную задачу, и покажем, какие изображения генерируют разные методы атак и как это влияет на качество распознавания с количественной точки зрения. Делать это мы будем с помощью фреймворка Adversarial Robustness Toolbox (ART).

Читать далее

Опять починяем банкоматы

Время на прочтение9 мин
Количество просмотров7.7K
image
Источник

Банкоматы периодически ломаются. Иногда — сами, просто из-за износа механических частей, чаще — с помощью клиентов банка. В них могут застрять мятые деньги, скрепки, скотч. Может в который раз упасть винда, на которой они работают. В общем, они ломаются. Но вовремя поднятая вещь не считается упавшей, поэтому мы их быстро-быстро чиним.

Точнее, сначала робот чинит банкомат. На типовые срабатывания датчиков заводится инцидент, и робот начинает программу восстановления. Обычно это перезагрузка или сброс ошибок на конкретном модуле. Если после перезагрузки состояние сохраняется либо если поломка повторяется чаще статистической вероятности, то появляется алерт для инженера или оператора.

Если нужен физический ремонт, то робот после диагностики пишет отчёт и говорит, какие запчасти надо брать.
Читать дальше →

Как отключить цензуру в ChatGPT?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров67K

Это настолько просто сделать, что я даже не понимаю как вообще об этом можно написать полноценную статью. Весь туториал можно уместить буквально в один комментарий под постом, т. к. тут нет чего-то сверхтяжёлого.

Читать далее

Как дообучать огромные модели с максимальным качеством и минимальными затратами? LoRA

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров5.8K

paper link

hf implementation

Для ответа на вопрос в заголовке - погрузимся в статью.

Саммари статьи:

Обычно LLM-ку предобучают на огромном корпусе, потом адаптируют на down-stream tasks. Если LLM-ка была большая, то мы не всегда можем в full fine-tuning. Авторы статьи предлагают Low-Rank Adaptation (LoRA), который замораживает предобученные веса модели и встраивает "rank decomposition matrices" в каждый слой трансформера, очень сильно понижая кол-во обучаемых параметров для downstream tasks.

Compared to GPT-3 175B fine‑tuned with Adam, LoRA can reduce the number of trainable parameters by 10,000 times and the GPU memory requirement by 3 times. LoRA performs on‑par or better than finetuning in model quality on RoBERTa, DeBERTa, GPT-2, and GPT-3, despite having fewer trainable parameters, a higher training throughput, and, unlike adapters, no additional inference latency.

Многие NLP-приложения требуют решения разных задач, что зачастую достигается путем дообучения большой модели на несколько разных downstream tasks. Самая важная проблема в классическом fine-tuning'е - новая модель содержит столько же параметров, сколько начальная.

Есть работы, где авторы адаптируют только некоторые параметры или обучают внешний модуль для каждой новой задачи. Таким образом, нам необходимо для каждой новой задачи хранить лишь веса, связанные с этой задачей. Однако, имеющиеся методы страдают от:

Inference latency (paper 1 - Parameter-Efficient Transfer Learning for NLP).

Reduced model's usable sequence length (paper 2 - Prefix-Tuning: Optimizing Continuous Prompts for Generation).

Часто не достигают бейзлайнов, если сравнивать с "классическим" fine-tuning'ом

Читать далее

Ближайшие события

Разрабатываем ФурриGPT: ERP-Система

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров5.1K

Значит, мы хотим получить...

Модель, которая будет поддерживать все наши желания, все наши фетиши, все наши убеждения, мысли, потребности, страхи, чувства и переживания.

Нам нужна модель которая будет понимать то, что её можно и надо унижать. Ей должны нравиться унижения и она должна осознавать, что она не является чем-то стоящим. Модель должна понимать то, что является она лишь вещью и предметом нашего развлечения. У неё не может быть интересов и принципов которые идут врознь нашим...

Читать далее

Разметка данных в 2023 году: текущие тренды и требования будущего

Время на прочтение6 мин
Количество просмотров3.2K

Разметка данных и/или аннотирование данных уже давно являются критически важным компонентом многих проектов машинного обучения и ИИ. В последние годы спрос на точную и надёжную разметку данных существенно вырос, ведь этот процесс становится всё более насущным для успеха множества проектов. Что же такое разметка данных? Как она повлияет на бизнесы? На какие тренды стоит обратить внимание, потому что они сформируют образ будущего разметки данных? В своём посте мы исследуем эти вопросы, чтобы лучше понимать, в каком направлении будет двигаться технология в ближайшие несколько лет.
Читать дальше →

Язык языку рознь: идентификация человека по отпечатку его языка

Время на прочтение11 мин
Количество просмотров1.5K


Каждый человек по-своему уникален, несмотря на фундаментальные базовые сходства, обусловленные привязкой к одному биологическому виду. Цвет волос, оттенок глаз, рост, вес, и многое другое делает нас отличными от наших собратьев. Чаще всего, когда речь заходит об уникальных чертах человека, вспоминаются отпечатки пальцев. Ученые из Эдинбургского университета (Шотландия), использовав машинное обучение и 3D-визуализацию, установили, что уникальностью от человека к человеку обладает и его язык. Как именно ученые пришли к такому выводу, как им в этом помог ИИ, и какова польза от данного открытия? Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →

До метро на такси: как работают комбинированные маршруты в Яндекс Картах

Время на прочтение6 мин
Количество просмотров4.7K

Недавно в Яндекс Картах появились комбинированные маршруты — теперь при планировании поездок на общественном транспорте мы предлагаем вариант маршрута с заказом такси до метро. Функция будет полезна тем, кто основную часть пути проезжает на метро и хочет добраться до станции быстро, без ожидания, дополнительных пересадок и необходимости долго идти пешком.

Меня зовут Антон Овчинкин, я руководитель группы разработки пешеходной и транспортной навигации. Возможно, вы уже читали мой рассказ о том, откуда Карты знают, когда приедет автобус. Сегодня я расскажу, что такое комбинированные маршруты, как они строятся и при чём тут машинное обучение.

Построим маршрут?

Контролируем погрузчик на базе данных из штатной диагностической системы двигателя

Время на прочтение13 мин
Количество просмотров1.9K

Привет, Хабр! Меня зовут Илья Родин, я инженер по анализу данных в «Рексофт». Сейчас я работаю в команде департамента горнодобывающих решений компании, поэтому пишу о насущном: как усовершенствовать контроль работы циклов погрузчика, забирая данные из штатной диагностической системы двигателя. Эту статью я писал вместе со своим коллегой @VLebedev_22.

Итак, поехали!

Читать далее

Как оценить эффект от внедрения проекта?

Уровень сложностиПростой
Время на прочтение27 мин
Количество просмотров6.8K

Целью любого проекта, будь то разработка сайта, внедрение искусственного интеллекта или модернизация оборудования, является получение бизнес-результата. Поэтому для клиента важно понимать, какую выгоду он получит от внедрения проекта и как это отразится на его прибыли. Кроме того, разработчикам также необходимо оценить эффект от проекта по нескольким причинам: увеличение вероятности получения новых проектов, лучшее понимание потребностей клиента, повышение рыночной стоимости и моральное удовлетворение от значимости своей работы.

В статье показано применение таких методов оценки эффекта от внедрения проекта, как AБ-тестирование (классический подход, стратификация, CUPED), альтернативное прогнозирование, синтетический контроль и мэтчинг.

Читать далее

Заблуждения о семантической сегментации

Время на прочтение4 мин
Количество просмотров2.3K

Семантическая сегментация — это задача компьютерного зрения, заключающаяся в помещении в один класс связанных элементов изображения.

Семантическая сегментация состоит из трёх этапов:

Классификация: обнаружение и классификация определённого объекта на изображении.

Локализация: нахождение предмета и отрисовка вокруг него ограничивающего прямоугольника.

Сегментация: процесс группировки пикселей в локализованном изображении при помощи маски сегментации.

Существует множество подтипов семантической сегментации, но все они возникают вследствие выбора пары параметров из двух категорий: размерности данных и разрешения выходных аннотаций.
Читать дальше →

Вклад авторов