Обновить
702.21

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

[ТОП-28] Нейросети, боты и сайты, которые помогут раздеть девушку по фото

Время на прочтение13 мин
Количество просмотров1.1M

Во мне никогда не угасает дух исследователя, поэтому я начинаю свои эксперименты с ботами и сайтами, которые могут раздеть человека по фото. В сети появляется все больше ресурсов, которые позволяют немного поиграть с фантазией. Вот только часть из них дает совсем не такие результаты, которые ожидают пользователи, заплатившие за сервис. Часть из ботов-раздеваторов полностью перерисовывают картинку и ставят вместо девушки какую-то непонятную особу без одежды, только фон сохраняют. Поэтому спускать все свои кровно заработанные на подобные сервисы не стоит. Я брошусь грудью на амбразуру за вас и посмотрим, что из этого выйдет!

Читать далее

Как правильно генерировать обучающие данные для OCR?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.7K

Мы в Smart Engines много пишем про распознавание документов. И, конечно, для распознавания документов нам требуется обучать нейросети, в частности, сети, распознающие текст на картинке. А им, как известно, нужно больше золота данных. И сегодня мы бы хотели поговорить о влиянии обучающих данных на итоговую сеть и о том, как такие данные синтезировать.

Далее

Total.js и интеграция с ИИ

Время на прочтение10 мин
Количество просмотров6.6K

Динамика приложений с искусственным интеллектом продолжает сеять вопросы по выбору “удачного” фреймворка, который мы могли бы использовать при создании. Поскольку именно от нашего выбора в принципе и зависит продолжительность жизни нашего детища.

В этой статье я бы хотела обратиться к одному старенькому фрейморку, рассмотреть его особенности и фичи, которые способные выделить его на фоне другого софта. Так ли он хорош? А если хорош, то почему?

Не буду затягивать с буквами во вступлении и предлагаю перейти сразу к делу!

Приятного прочтения(:

Читать далее

AI чат боты — хайп или реальная польза. Примеры интеграции умных помощников в  CRM и ERP системы

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров10K

Всем уже известно, что чат-боты дают возможность быстро и эффективно выстраивать коммуникацию с клиентами, но их истинный сила раскрывается при интеграции с корпоративными системами управления, а именно CRM (Customer Relationship Management) и ERP (Enterprise Resource Planning), HRM (Human Resource Management), интернет магазином и любой другой открытой системой.

Читать далее

Нейронные сети и dataset IRIS

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров8.7K

Исследовательская работа по dataset IRIS и библиотеке для машинного обучения и построения нейронных сетей tensorflow.

Читать далее

Мониторинг ИИ-систем. Часть 2

Время на прочтение7 мин
Количество просмотров2.2K

В жизни ИИ‑системы, медицинской или любой другой, случаются неудачные моменты.

Часть таких ситуаций — непредвиденные ошибки. Да, все разработчики понимают, что рано или поздно что‑то пойдёт не так, но случается это всегда по‑разному и иногда в самые неподходящие моменты.

К примеру, неправильно заполненный тег части тела в DICOM‑файле и некорректная работа модели по фильтрации снимков может привести к возникновению пневмоторакса в стопе:

Читать далее

Реализация слоев в Нейронных сетях (часть 1)

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров5.2K

Не приходил ли вам когда-нибудь в голову вопрос о том, как устроены слои нейронных сетей под капотом? Задумавшись над этим вопросом, я перерыл интернет в поисках полноценной реализации слоёв, но находил лишь отдельные куски кода или слишком упрощенные примеры, где чаще всего использовался лишь один слой с одним нейронном для наглядности. В данной статье я реализовал полноценную многослойную нейронную сеть прямого распространения с неограниченным количеством нейронов.

Читать далее

Разговариваем с BI на естественном языке

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров11K

Всем привет! Искусственный интеллект уже научился писать простые запросы к базам данных, но можно ли совсем избавиться от кода в работе аналитиков? Мы расскажем про наши нейросетевые эксперименты, в которых мы научили BI-систему слушать, понимать и отрабатывать запросы аналитиков на естественном языке.

В команде R&D SberData мы ищем и разрабатываем технологии обработки, хранения и анализа данных Сбера. Мы исследуем все перспективные технологии, которые появляются на рынке, разрабатываем новые продукты, которые использует Сбер и его партнёры. Одно из приоритетных направлений для нас — это анализ данных. В Сбере более 100 тысяч пользователей BI (Business Intelligence). Естественно, что у такого количества аналитиков самые разные потребности и требования к сервису и продукту. И возможность сделать их работу проще и удобнее — это большой вызов и интересная задача для нашей команды. В этот раз мы пробовали научить LLM-модель написать правильный SQL-код по запросу на естественном языке.

Читать далее

Можно ли научить чат-бота всегда говорить правду

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров3.1K

Привет, Хабр, меня зовут Ксения Плесовских и я развиваю генеративный ИИ в компании lad, разрабатывая чат-боты для бизнеса на основе LLM. В процессе работы над точностью ответов чат-бота, проверкой фактов и устранением галлюцинаций от LLM, мне довелось проанализировать и опробовать разные подходы к этой проблеме, чем сегодня и хочу с вами поделиться. Поскольку объем материала получился достаточно большой, на несколько публикаций, в этой части расскажу лишь о подходе самокритики SELF-RAG.

Читать далее

Распознавание и перевод жестовых языков: обзор подходов

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров4.2K

Всем привет! В статье «Slovo и русский жестовый язык» мы рассказывали, как решаем задачу распознавания изолированных жестов, в статье «Русский жестовый язык: первое место в американском бенчмарке» делились результатами решения, а в статье «GigaChat и русский жестовый язык» речь шла о реализации прототипа общения с генеративной языковой моделью GigaChat. В этой статье речь пойдет о распознавании и переводе жестового языка и передовых подходах для их решениях. 

Читать далее

Помощь с текстом, перевод видео с японского и корейского, распознавание QR-кодов — что умеет обновлённый Яндекс Браузер

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров14K

Сегодня мы выпускаем большое обновление для Браузера с рекордным числом изменений, в основе которых лежат нейросети или другие методы машинного обучения. Теперь Браузер исправит ошибки в тексте, сократит или улучшит его, перескажет видео с японского или корейского, распознает QR-код в трансляции и предложит перейти по ссылке в один клик, а также защитит от фишинг-страниц и не только.

В этой статье расскажем, как мы обучали нейросеть с помощью учебника Розенталя, как модель, отвечающая за субтитры, понимает, что начал говорить другой человек, почему не каждый QR-код легко распознать и за счёт чего мы научились ловить фишинговые сайты, которые появились буквально 5 минут назад. Обо всём этом — под катом.

Читать далее

Как самостоятельно запустить персонализированные чат-боты на базе Chat GPT? Собираем бота на noCode платформе

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров16K

NoCode чат-бот платформы — это конструкторы на базе искусственного интеллекта, использующие технологии обработки естественного языка для создания автоматизированных, но индивидуально настраиваемых диалоговых систем. Эти боты используют алгоритмы искусственного интеллекта, зачастую они задействуют API токен от OpenAI, который способен генерировать максимально приближенные к человеческому языку ответы.

С появлением GPT маркетплейса в январе 2023 года, кастомизация чат-ботов получила новый виток развития. Благодаря способности искусственных интеллектов работать с загруженными в них базами данных, стало возможным быстро создавать решения для различных бизнес-сценариев, сократив время разработки в десятки раз без привлечения разработчиков. Конечно, не OpenAi единым, для создания кастомизированных чат ботов использовать можно любую нейросеть — тот же Google Bard или Claude. 

Тем не менее, существуют определенные ограничения. Во-первых, основой часто служит технология Chat GPT. Во-вторых, отсутствует удобная система интеграции с другими инструментами. К тому же, типичные решения предполагают работу с ограниченным количеством текстовых материалов, до 20 единиц, и взаимодействие в рамках этого контента.

Для создания действительно гибких и адаптированных под бизнес-процессы решений требуются кастомные подходы. Это включает разработку API для GPT, настройку серверов, обработку баз данных и разработку пользовательского интерфейса, что может быть затратно и сложно.

К счастью, сегодня доступны платформенные решения, упрощающие запуск чат-ботов. Для кастомизации достаточно иметь API-токен выбранной нейросети и базовое понимание работы с векторными базами данных и потенциальными сценариями использования. Эти решения обеспечивают быстрое и эффективное внедрение индивидуализированных чат-ботов, открывая новые горизонты для бизнеса. Про что в этой статье мы и расскажем!

Читать далее

Космос будущего: о чём говорят патенты игроков мирового аэрокосмического сектора

Время на прочтение7 мин
Количество просмотров1.8K

С 2019 по январь 2022 года я занималась патентной аналитикой мирового аэрокосмического сектора. В данной статье раскрою некоторые результаты реализованной работы, покажу, как патентная аналитика способна выявить технологические тренды будущего на примере конкретной отрасли, и представлю один из ключевых надвигающихся трендов, рассвет которого нас ещё только ожидает.

Интересно

Ближайшие события

Лапочки с характером: Как машинное обучение помогает определить тип личности ваших пёсиков

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров1.6K

Предлагаю Вам разбавить все серьезные, обсуждаемые здесь темы, небольшой отдушиной для многих из нас!

Собаки – настоящие маленькие спутники жизни каждого хозяина, поэтому многих обрадовала бы возможность подобрать питомца, который будет вписываться в привычный образ жизни, и, например, сможет смирно сидеть на коленях, пока Вы пишете код, или безостановочно носиться по дому, требуя все Ваше внимание и любовь.

Все это станет реальным, благодаря машинному обучению! :) Теперь Вы можете почти так же просто определить тип личности своего питомца, как и свой собственный (излюбленный MBTI тест – такая же разработка ML)

В данной статье описывается успешная попытка применить методы искусственного интеллекта и ML для классификации и прогнозирования личностных качеств собак с использованием поведенческих данных, полученных из базы данных C-BARQ. Я в подробностях расскажу об основных теоретических и практических аспектах проделанной работы!

Приятного прочтения! :)

Читать далее

Язык твой — друг твой. Дообучаем языковые модели, собираем корпуса, делаем книги на малоресурсных языках

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров9K

📌 градиент обреченный

Всем привет. Хочу поделиться с сообществом небольшим опытом и наработками для исследования и развития языков, в особенности малых. Для большинства таких языков нет ни систем машинного перевода, ни виртуальных ассистентов, ни других языковых моделей. Основная проблема тут в недостатке данных и отсутствии большого интереса у крупных компаний в их развитии. Однако есть достаточно большое число людей, которым дорог их язык, и которые прикладывают усилия по их сохранению и развитию. Предлагаю обсудить это и познакомиться с инструментами, которые помогут не только собирать данные, но и делать на их основе полезные вещи, типа паралельных книг для изучения языка и систем машинного перевода.

Мы научимся:

1. Дообучать мультиязычные языковые модели, переводящие текст в векторное представление (эмбеддинги).

2. Использовать их для выравнивания текстов библиотекой lingtrain-aligner, извлекая из текстов параллельные корпуса.

3. Загружать датасеты и модели на HuggingFace, чтобы это было доступно всем.

4. Создавать из выравнивания параллельные книги для изучения языков.

5. Начнем собирать датасет инструкций на малых языках, чтобы языковые модели и виртуальные смогли понимать и общаться на чувашском, якутском, башкирском и других языках.

Все это в делается в виде открытых проектов и сообществ, поэтому приглашаю всех интересующихся изучением и поддержкой языков подключаться к нам, будет интересно.

Читать далее

Использование Jupyter Notebook для разведочного анализа данных ⬝ Методические рекомендации

Уровень сложностиПростой
Время на прочтение19 мин
Количество просмотров19K

Блокноты Jupyter — это, уже довольно давно, один из самых неоднозначных инструментов в среде дата‑сайентистов. Одни яро критикуют Jupyter, другие горячо поддерживают этот проект. Но, тем не менее, многие согласятся с тем, что блокноты Jupyter, при правильном их использовании, могут быть очень ценным инструментом. Именно этому и посвящена данная статья — вторая в серии моих материалов про науку о данных и машинное обучение. Я поделюсь здесь методическими рекомендациями по использованию Jupyter Notebook для разведочного анализа данных.

Но для начала нам надо ответить на вопрос о том, почему блокноты Jupyter обосновались именно в научном сообществе. Когда тема Data Science была у всех на слуху, блокноты Jupyter ещё ничего из себя не представляли. До них у нас был IPython, интерактивная оболочка для Python, которую встраивали в различные IDE, вроде Spyder. Эти IDE пытались подражать работе RStudio или Matlab. Подобные инструменты получили широкое распространение среди исследователей.

В 2014 году из среды IPython вырос проект Jupyter. Масштабы его использования очень быстро стали просто огромными, чему, в основном, способствовали исследователи, которые перенесли в бизнес‑среду то, чем пользовались, занимаясь наукой. Но те подходы к использованию блокнотов, которые хороши для научных учреждений, не всегда нормально переносятся на анализ данных, проводимый в обычных организациях. Часто бывает так, что дата‑сайентистам, взятым на работу сразу после университета, очень сложно выдать то, что от них ожидают в бизнесе. Речь идёт о структуре аналитических разработок и об оформлении их результатов.

Читать далее

Нужно больше нейросетей: корпорация Google открыла общий доступ к старшей модели. Как это работает?

Время на прочтение3 мин
Количество просмотров4.8K

Сейчас крупные IT-компании спешат разработать собственный продукт на базе ИИ-моделей, и многим это удается. Например, корпорация Google не так давно представила сразу несколько моделей, а сейчас открыла доступ к наиболее мощной из них. Кроме того, компания анонсировала и приложение, которое позволит работать с этой технологией. Что именно предлагает Google? Подробности - под катом.

Читать далее

Как языковая модель предсказывает следующий токен (часть 1)

Время на прочтение27 мин
Количество просмотров8.8K

Я обучил небольшой (порядка 10 миллионов параметров) трансформер по превосходному туториалу Let’s build GPT: from scratch, in code, spelled out Андрея Карпати. После того, как он заработал, я захотел максимально глубоко понять, как он устроен внутри и как создаёт свои результаты.

В исходной научной статье, как и во всех туториалах по трансформерам упор в основном делается на многоголовом самовнимании, — механизме, при помощи которого трансформеры обучаются множественным взаимосвязям между токенами, не используя рекурретности или свёртку. Ни в одной из этих статей или туториалов я не нашёл удовлетворительного объяснения того, что происходит после внимания: как конкретно результаты вычисления внимания превращаются в точные прогнозы следующего токена?

Я подумал, что могу пропустить несколько примеров промтов через обученный мной небольшой, но работающий трансформер, изучить внутренние состояния и разобраться в них. То, что казалось мне быстрым исследованием, оказалось полугодовым погружением, но дало результаты, которыми стоит поделиться. В частности, у меня появилась рабочая теория, объясняющая, как трансформер создаёт свои прогнозы, и эмпирические свидетельства того, что это объяснение, по крайней мере, правдоподобно.

Если вы знакомы с трансформерами и хотите сразу узнать вывод, то он таков: каждый блок трансформера (содержащий слой многоголового внимания и сеть с прямой связью) изучает веса, связывающие конкретный промт с классом строк, найденных в обучающем корпусе. Распределение токенов, соответствующее этим строкам в обучающем корпусе, и есть приблизительно то, что блок выводит как прогноз для следующего токена. Каждый блок может ассоциировать один и тот же промт со своим классом строк обучающего корпуса, что приводит к другому распределению следующих токенов, а значит, и к другим прогнозам. Окончательный результат работы трансформера — это линейное сочетание прогнозов каждого блока.

Читать далее

Шпаргалка по рекомендательным системам

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров9.9K

Рекомендательные системы стали неотъемлемой частью нашей жизни, помогая нам легко находить новые фильмы, музыку, книги, товары и многое другое. Цель этой шпаргалки - дать краткий обзор основных методов: коллаборативная фильтрация, матричная факторизация и некоторые нейросетевые методы.

Надеюсь, что эта шпаргалка станет полезным ресурсом для вас, помогая разобраться в мире рекомендательных систем и использовать их потенциал для улучшения пользовательского опыта.

Читать далее

Как студенты участвовали в огромной IT выставке со своим стендом

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.4K

Всем привет, на связи Максим Рожков, frontend разработчик команды "ПИН-КОД".
Наша студенческая команда смогла поучаствовать в выставке с демонстрационным вариантом нашего сервиса "Изучение русского жестового языка".

В этой статье вы узнаете, как обычные студенты поучаствовали в масштабной IT выставке в Екатеринбурге.

Читать далее

Вклад авторов