Автор материала, перевод которого мы сегодня публикуем, предлагает вниманию читателей 8 идей проектов в сферах машинного обучения и искусственного интеллекта. Описание идей сопровождается ссылками на дополнительные материалы. Реализации этих идей способны украсить портфолио проектов профильного специалиста.
По данным Всемирной организации здравоохранения депрессия — это серьёзнейшая проблема, которая нуждается в срочном решении. Более 264 миллионов человек в мире страдает от депрессии. Депрессия — это основная причина инвалидности в мире, она вносит значительный «вклад» в глобальное бремя болезней. Из-за депрессии в мире ежегодно более 800000 человек погибает от самоубийства. Это — вторая по значимости причина смерти людей в возрасте 15-29 лет. Лечение от депрессии часто начинается позже, чем нужно, такое лечение может быть основано на неточном диагнозе, а иногда от депрессии и вовсе не лечат.
То, что интернет прочно вошёл в жизнь современного человека, даёт обществу уникальный шанс раннего выявления признаков депрессии. Особенно это касается нахождения подобных признаков среди молодёжи. Если говорить только о Twitter, то окажется, что каждую секунду пользователи этой социальной сети публикуют около 6000 твитов. Это значит, что в минуту публикуется около 350000 твитов, в день — около 500 миллионов, а в год — около 200 миллиардов.
По сведениям Pew Research Center около 72% взрослых людей, пользующихся интернетом, являются пользователями социальных сетей. Наборы данных, взятые из социальных сетей, важны во многих сферах исследований. Например — в области наук о человеке и в медицинских изысканиях. В наши дни поддержка подобных исследований через анализ данных из социальных сетей находится на зачаточном уровне, а существующие методы анализа таких данных неэффективны.
Анализируя лингвистические маркеры в публикациях из социальных сетей, можно создать модель, основанную на технологии глубокого обучения, которая может выявлять признаки депрессии у конкретного пользователя сети раньше, чем традиционные методы.
Вот несколько материалов по теме:
Идея этого проекта заключается в формировании точных текстовых сводок по видеозаписям спортивных матчей. Существуют сайты, которые специализируются на предоставлении пользователям сведений о матчах. Предложены различные модели, направленные на извлечение из видеозаписей информации о матчах и представление её в текстовом виде. Лучше всего с этой задачей справляются нейронные сети. Под «формированием текстовых сводок» обычно понимают представление информации в сжатом виде, с уделением особого внимания тому, что несёт факты и важные сведения о событии.
Для решения задачи автоматического создания описания игр по записям необходимо сделать так, чтобы модели, решающие эту задачу, могли бы распознавать особенно важные и захватывающие моменты игр.
Достичь этого можно, используя некоторые методики глубокого обучения, наподобие трёхмерных свёрточных нейронных сетей (3D-CNN), рекуррентных нейронных сетей (RNN), сетей долгой краткосрочной памяти (LTSM). Здесь находят применение и другие алгоритмы машинного обучения, вроде метода опорных векторов (SVM) и метода k-средних. В ходе применения таких алгоритмов видео разбивают на части, которые обрабатывают с помощью соответствующих моделей.
Вот материал, посвящённый классификации сцен спортивных видеозаписей для целей формирования сводок по ним с использованием технологии переноса обучения (transfer learning).
Распознавание рукописных математических выражений — это одна из сложных задач, стоящих перед теми, кто занимается исследованиями в области машинного зрения. Создать систему, которая способна распознать рукописное математическое выражение, можно, воспользовавшись свёрточными нейронными сетями (CNN) и некоторыми методами обработки изображений. Разработка подобной системы подразумевает обучение сети с использованием соответствующим образом подготовленных наборов данных, представленных рукописными математическими символами.
Вот некоторые материалы по этой теме:
Вы попадали когда-нибудь в ситуацию, когда некий длинный материал нужно свести к краткому конспекту? Мне приходилось с этим сталкиваться во время учёбы. А именно, мне нужно было тратить много времени на подготовку какого-нибудь длинного реферата, а у преподавателя было время лишь на то, чтобы прочитать его краткую аннотацию, на подготовку которой тоже приходилось тратить время.
Механизмы подготовки кратких сводок по каким-то материалам возникли как попытка решения проблемы информационной перегрузки, которой подвержен современный человек. Система извлечения самой ценной информации, например, из записи неких переговоров или лекций, может иметь большую коммерческую и образовательную ценность. К разработке подобной системы можно подойти, применив разносторонний анализ текстовой информации, имеющей отношение к диалогам и монологам.
Ручное составление краткой сводки некоего отчёта занимает очень много времени. Но эту задачу можно решить с помощью технологий обработки естественного языка (NLP).
Для подготовки краткой аннотации текста можно воспользоваться механизмами, основанными на глубоком обучении, способными «понять» контекст всего текста. Многие были бы просто счастливы, окажись в их распоряжении система, способная быстро и качественно решать подобные задачи.
Вот статьи об этом:
На лице человека отражается его внутреннее состояние, по лицу можно понять то, какие эмоции испытывает человек. На этих сведениях, например, может быть основана система автоматического подбора музыки. Дело в том, что то, какую именно музыку слушают люди, часто зависит от их настроения. Поэтому вполне логично предположить, что у системы, способной «понимать» настроение человека и подбирать ему подходящую музыку, есть будущее. В решении этой задачи нам могут помочь технологии машинного зрения. Они, в деле распознавания эмоций, предусматривают анализ фотографий или видеофрагментов.
Уже созданы API для решения подобных задач, которые я считают интересными и полезными, хотя поработать мне с ними пока не довелось. Вот материал о таких API.
В последнее десятилетие проведено исследование огромного количества звёзд на предмет наличия около них планет, которые могут быть обитаемыми. Ручной анализ данных, позволяющий выявлять экзопланеты, чрезвычайно трудоёмок и подвержен человеческим ошибкам. Для решения задачи поиска подобных планет хорошо подходят свёрточные нейронные сети
Восстановление старых фотографий — тяжёлая работа. Эту работу можно облегчить, воспользовавшись технологиями глубокого обучения. Соответствующая система может автоматически обнаруживать повреждения снимков (изломы, потёртости, дыры) и, используя алгоритмы реконструкции изображений (Inpainting), от повреждений избавляться, восстанавливая утраченные части фотографий.
Вот материалы по теме:
Музыка — это набор звуков разной частоты. Зная об этом, можно описать автоматическое создание музыки как процесс создания небольших музыкальных фрагментов с минимальным участием человека. В наши дни специалисты, занимающиеся машинным обучением, находятся на переднем крае технологий компьютерного создания музыки.
Вот пара полезных материалов об этом:
Мы рассмотрели восемь перспективных идей, которые могут лечь в основу проектов, способных обогатить портфолио проектов того, кто занимается искусственным интеллектом и машинным обучением. Надеемся, вы нашли среди этих идей что-то такое, что вас вдохновило.
Планируете ли вы реализовать какую-нибудь из вышеописанных идей?
1. Анализ эмоциональной окраски сообщений в социальных сетях и поиск признаков депрессии
По данным Всемирной организации здравоохранения депрессия — это серьёзнейшая проблема, которая нуждается в срочном решении. Более 264 миллионов человек в мире страдает от депрессии. Депрессия — это основная причина инвалидности в мире, она вносит значительный «вклад» в глобальное бремя болезней. Из-за депрессии в мире ежегодно более 800000 человек погибает от самоубийства. Это — вторая по значимости причина смерти людей в возрасте 15-29 лет. Лечение от депрессии часто начинается позже, чем нужно, такое лечение может быть основано на неточном диагнозе, а иногда от депрессии и вовсе не лечат.
То, что интернет прочно вошёл в жизнь современного человека, даёт обществу уникальный шанс раннего выявления признаков депрессии. Особенно это касается нахождения подобных признаков среди молодёжи. Если говорить только о Twitter, то окажется, что каждую секунду пользователи этой социальной сети публикуют около 6000 твитов. Это значит, что в минуту публикуется около 350000 твитов, в день — около 500 миллионов, а в год — около 200 миллиардов.
По сведениям Pew Research Center около 72% взрослых людей, пользующихся интернетом, являются пользователями социальных сетей. Наборы данных, взятые из социальных сетей, важны во многих сферах исследований. Например — в области наук о человеке и в медицинских изысканиях. В наши дни поддержка подобных исследований через анализ данных из социальных сетей находится на зачаточном уровне, а существующие методы анализа таких данных неэффективны.
Анализируя лингвистические маркеры в публикациях из социальных сетей, можно создать модель, основанную на технологии глубокого обучения, которая может выявлять признаки депрессии у конкретного пользователя сети раньше, чем традиционные методы.
Вот несколько материалов по теме:
- Вы — это то, что вы публикуете в Твиттере.
- Раннее выявление депрессии: анализ социальных сетей и модель случайного леса.
- Выявление депрессии на основе данных социальных сетей с использованием методов машинного обучения.
2. Формирование текстовых сводок по видеозаписям спортивных матчей с использованием нейронных сетей
Идея этого проекта заключается в формировании точных текстовых сводок по видеозаписям спортивных матчей. Существуют сайты, которые специализируются на предоставлении пользователям сведений о матчах. Предложены различные модели, направленные на извлечение из видеозаписей информации о матчах и представление её в текстовом виде. Лучше всего с этой задачей справляются нейронные сети. Под «формированием текстовых сводок» обычно понимают представление информации в сжатом виде, с уделением особого внимания тому, что несёт факты и важные сведения о событии.
Для решения задачи автоматического создания описания игр по записям необходимо сделать так, чтобы модели, решающие эту задачу, могли бы распознавать особенно важные и захватывающие моменты игр.
Достичь этого можно, используя некоторые методики глубокого обучения, наподобие трёхмерных свёрточных нейронных сетей (3D-CNN), рекуррентных нейронных сетей (RNN), сетей долгой краткосрочной памяти (LTSM). Здесь находят применение и другие алгоритмы машинного обучения, вроде метода опорных векторов (SVM) и метода k-средних. В ходе применения таких алгоритмов видео разбивают на части, которые обрабатывают с помощью соответствующих моделей.
Вот материал, посвящённый классификации сцен спортивных видеозаписей для целей формирования сводок по ним с использованием технологии переноса обучения (transfer learning).
3. Система решения уравнений, записанных от руки, основанная на свёрточных нейронных сетях
Распознавание рукописных математических выражений — это одна из сложных задач, стоящих перед теми, кто занимается исследованиями в области машинного зрения. Создать систему, которая способна распознать рукописное математическое выражение, можно, воспользовавшись свёрточными нейронными сетями (CNN) и некоторыми методами обработки изображений. Разработка подобной системы подразумевает обучение сети с использованием соответствующим образом подготовленных наборов данных, представленных рукописными математическими символами.
Вот некоторые материалы по этой теме:
- Система для решения уравнений, записанных от руки, основанная на свёрточной нейронной сети.
- Пример реализации CNN-системы для решения уравнений, записанных от руки.
- Машинное зрение: автоматическая проверка бланков ответов на задания по математике.
- Конверсия рукописных уравнений в формат LaTeX.
4. Формирование кратких отчётов по материалам деловых встреч с использованием технологий обработки естественного языка
Вы попадали когда-нибудь в ситуацию, когда некий длинный материал нужно свести к краткому конспекту? Мне приходилось с этим сталкиваться во время учёбы. А именно, мне нужно было тратить много времени на подготовку какого-нибудь длинного реферата, а у преподавателя было время лишь на то, чтобы прочитать его краткую аннотацию, на подготовку которой тоже приходилось тратить время.
Механизмы подготовки кратких сводок по каким-то материалам возникли как попытка решения проблемы информационной перегрузки, которой подвержен современный человек. Система извлечения самой ценной информации, например, из записи неких переговоров или лекций, может иметь большую коммерческую и образовательную ценность. К разработке подобной системы можно подойти, применив разносторонний анализ текстовой информации, имеющей отношение к диалогам и монологам.
Ручное составление краткой сводки некоего отчёта занимает очень много времени. Но эту задачу можно решить с помощью технологий обработки естественного языка (NLP).
Для подготовки краткой аннотации текста можно воспользоваться механизмами, основанными на глубоком обучении, способными «понять» контекст всего текста. Многие были бы просто счастливы, окажись в их распоряжении система, способная быстро и качественно решать подобные задачи.
Вот статьи об этом:
- Подробное руководство по разработке системы реферирования текстов на Python с использованием технологий глубокого обучения.
- Путь к пониманию сути реферирования текстов и разработка собственной системы реферирования на Python.
5. Реализация системы, которая распознаёт лица пользователей, определяет их настроение и предлагает им соответствующую музыку
На лице человека отражается его внутреннее состояние, по лицу можно понять то, какие эмоции испытывает человек. На этих сведениях, например, может быть основана система автоматического подбора музыки. Дело в том, что то, какую именно музыку слушают люди, часто зависит от их настроения. Поэтому вполне логично предположить, что у системы, способной «понимать» настроение человека и подбирать ему подходящую музыку, есть будущее. В решении этой задачи нам могут помочь технологии машинного зрения. Они, в деле распознавания эмоций, предусматривают анализ фотографий или видеофрагментов.
Уже созданы API для решения подобных задач, которые я считают интересными и полезными, хотя поработать мне с ними пока не довелось. Вот материал о таких API.
6. Поиск обитаемых экзопланет, выполняемый на основе изображений, снятых космическими устройствами вроде телескопа Кеплер
В последнее десятилетие проведено исследование огромного количества звёзд на предмет наличия около них планет, которые могут быть обитаемыми. Ручной анализ данных, позволяющий выявлять экзопланеты, чрезвычайно трудоёмок и подвержен человеческим ошибкам. Для решения задачи поиска подобных планет хорошо подходят свёрточные нейронные сети
- Вот материал о поиске экзопланет с использованием технологий машинного обучения.
- Вот пресс-релиз NASA, посвящённый использованию технологий искусственного интеллекта при поиске экзопланет.
7. Восстановление старых повреждённых фотографий
Восстановление старых фотографий — тяжёлая работа. Эту работу можно облегчить, воспользовавшись технологиями глубокого обучения. Соответствующая система может автоматически обнаруживать повреждения снимков (изломы, потёртости, дыры) и, используя алгоритмы реконструкции изображений (Inpainting), от повреждений избавляться, восстанавливая утраченные части фотографий.
Вот материалы по теме:
- Раскрашивание и восстановление старых фотографий с использованием методов глубокого обучения.
- Руководство по реконструкции изображений: использование технологий машинного обучения для устранения дефектов фотографий.
- Как восстанавливать фотографии методами машинного обучения и при этом обходиться без наборов учебных данных.
8. Создание музыки с использованием технологий глубокого обучения
Музыка — это набор звуков разной частоты. Зная об этом, можно описать автоматическое создание музыки как процесс создания небольших музыкальных фрагментов с минимальным участием человека. В наши дни специалисты, занимающиеся машинным обучением, находятся на переднем крае технологий компьютерного создания музыки.
Вот пара полезных материалов об этом:
- Создание музыки с использованием глубокого обучения.
- Как создавать музыку, используя LSTM-нейронную сеть в Keras.
Итоги
Мы рассмотрели восемь перспективных идей, которые могут лечь в основу проектов, способных обогатить портфолио проектов того, кто занимается искусственным интеллектом и машинным обучением. Надеемся, вы нашли среди этих идей что-то такое, что вас вдохновило.
Планируете ли вы реализовать какую-нибудь из вышеописанных идей?