• Дайджест новостей машинного обучения и искусственного интеллекта за октябрь

      Привет, Хабр! Отфильтровав для вас большое количество источников и подписок, собрал все наиболее значимые новости из мира машинного обучения и искусственного интеллекта за октябрь. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие новости.

      Для тех, кто не читал дайджест за сентябрь, можете прочесть его здесь.

      Итак, а теперь дайджест за октябрь:

      1. Фотореалистичная 3D-модель человека выступила на TED. Нейросеть динамически восстанавливает 3D-модель человека на основе распознавания движения лицевых мышц. С помощью данных с камеры нейросеть распознает и восстанавливает эмоции и действия человека.

      Читать дальше →
      • +53
      • 5.7k
      • 5
    • Как работает FaceID в iPhone X: алгоритм на Python

      • Translation
      Одна из самых крутых фишек iPhone X – это метод разблокировки: FaceID. В этой статье разобран принцип работы данной технологии.

      image

      Изображение лица пользователя снимается с помощью инфракрасной камеры, которая более устойчива к изменениям света и цвета окружающей среды. Используя глубокое обучение, смартфон способен распознать лицо пользователя в мельчайших деталях, тем самым “узнавая” владельца каждый раз, когда тот подхватывает свой телефон. Удивительно, но Apple заявила, что этот метод даже безопаснее, чем TouchID: частота ошибок 1:1 000 000.

      В этой статье разобран принцип алгоритма, подобного FaceID, с использованием Keras. Также представлены некоторые окончательные наработки, созданные с помощью Kinect.

      image
      Читать дальше →
    • Дайджест новостей машинного обучения и искусственного интеллекта за сентябрь

        Привет, Хабравчане! Отфильтровав для вас большое количество источников и подписок — собрал все наиболее значимые новости из мира машинного обучения и искусственного интеллекта за сентябрь. Не забудьте поделиться с коллегами, или просто с теми, кому интересны такие новости.

        Для тех, кто не читал дайджест за август, можете прочесть его здесь.

        Итак, а теперь дайджест за сентябрь:

        1. Ученые EPFL разработали мягкую искусственную кожу, которая обеспечивает тактильную обратную связь и — благодаря сложному механизму самочувствия — потенциально способна мгновенно адаптироваться к движениям пользователя.

        Читать дальше →
        • +44
        • 5.4k
        • 2
      • Must-have алгоритмы машинного обучения

        • Translation
        Хабр, привет.

        Этот пост — краткий обзор общих алгоритмов машинного обучения. К каждому прилагается краткое описание, гайды и полезные ссылки.

        Метод главных компонент (PCA)/SVD


        Это один из основных алгоритмов машинного обучения. Позволяет уменьшить размерность данных, потеряв наименьшее количество информации. Применяется во многих областях, таких как распознавание объектов, компьютерное зрение, сжатие данных и т. п. Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных или к сингулярному разложению матрицы данных.

        image

        SVD — это способ вычисления упорядоченных компонентов.

        Полезные ссылки:


        Вводный гайд:

        Читать дальше →
        • +24
        • 13.9k
        • 6
      • Дайджест новостей машинного обучения и искусственного интеллекта за август

          Привет, читатель! Отфильтровав для тебя большое количество источников и подписок — собрал все наиболее значимые новости из мира машинного обучения и искусственного интеллекта за август. Не забудьте поделиться с коллегами, или просто с теми, кому интересны такие новости.

          Для тех, кто не читал дайджест за июль, можете прочесть его здесь.

          Итак, а теперь дайджест за август:

          1. Российский человекоподобный робот пробирается на МКС. Российский космический корабль «Союз» состыковался с МКС. В капитанском кресле капсулы, предназначенной для перевозки пассажиров, сидел Skybot F-850, человекоподобный робот, созданный российским космическим агентством Роскосмос.

          image
          Читать дальше →
        • Полезная help-ссылка для работы с данными

            Хабр, привет. Представляю вам главную help-ссылку для работы с данными. Материал в Гугл-доке подойдет как профессионалам, так и тем, кто только учится работать с данными. Пользуйтесь и прокачивайте скиллы сами + делитесь с коллегами.

            Дальнейшее описание поста — это содержание help-ссылки. Поэтому, можете сразу ознакомиться с документом. Либо начать с её содержания, которую прикрепляю ниже.

            Конечно, весь список книг/сервисов/видео и лекций в файле неполный. Поэтому предлагаю сделать этот пост ценнейшим — добавляйте в комментарии свои полезные ссылки, самые крутые из них я добавлю к себе в файл.

            image
            Читать дальше →
            • +46
            • 5.9k
            • 1
          • Применение машинного обучения и Data Science в промышленности

            • Translation
            Хабр, привет. Перевел пост, который идёт строго (!) в закладки и передаётся коллегам. Он со списком блокнотов и библиотек ML и Data Science для разных отраслей промышленности. Все коды на Python, и размещены на GitHub. Они будут полезны как для расширения кругозора, так и для запуска своего интересного стартапа.

            image

            Отмечу, что если среди читателей есть желающие помочь, и добавить в любую из подотраслей подходящий проект, пожалуйста, свяжитесь со мной. Я их добавлю в список. Итак, давайте начнём изучение списка.
            Читать дальше →
          • Дайджест новостей машинного обучения и искусственного интеллекта за июль

              Привет, читатель! Отфильтровав для вас большое количество источников и подписок — собрал все наиболее значимые новости из мира машинного обучения и искусственного интеллекта за июль. Не забудьте поделиться с коллегами, или просто с теми, кому интересны такие новости.

              Для тех, кто не читал дайджест за июнь, можете прочесть его здесь.

              Итак, теперь собственно июльский дайджест.

              1. ВКонтакте опубликовали библиотеку для предобработки текстовых данных. YouTokenToMe — это библиотека для предобработки текстовых данных. Инструмент работает в 7-10 раз быстрее аналогов для текстов на алфавитных языках и в 40-50 на иероглифических языках. Библиотека была разработана исследователями из ВКонтакте. → Подробнее

              image
              Читать дальше →
            • Осваиваем компьютерное зрение — 8 основных шагов

                Привет, читатель.

                Для тебя уже не является новостью тот факт, что все на себе попробовали маски старения через приложение Face App. В свою очередь для компьютерного зрения есть задачи и поинтереснее этой. Ниже представлю 8 шагов, которые помогут освоить принципы компьютерного зрения.

                image

                Прежде, чем начать с этапов давайте поймём, какие задачи мы с вами сможем решать с помощью компьютерного зрения. Примеры задач могут быть следующими:

                Читать дальше →
              • Подборка рабочих примеров обработки данных

                  Привет, читатель.

                  По стопам моего первого поста подборки датасетов для машинного обучения — сделаю подборку относительно свежих датасетов с рабочими примерами по обработке данных. Ведь ни для кого не секрет, что обучение на хороших примерах проходит эффективнее и быстрее. Посмотрим, что интересного нам смогут показать одни из лучших примеров по обработке данных.

                  Схема работы с текущим постом унаследуется от моего поста про лучшие блокноты по ML и DS, а именно — сохранил в закладки → передал коллеге.

                  + бонус в конце статьи — крутой курс от ФПМИ МФТИ.

                  image

                  Итак, давайте приступим.

                  Подборка датасетов с рабочими примерами обработки данных:


                  Suicide Rates Overview 1985 to 2016 — сравнение социально-экономической информации с показателями самоубийств по годам и странам.

                  Примеры обработки:

                  Читать дальше →
                • Галерея лучших блокнотов по ML и Data Science

                    Привет, читатель.

                    Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

                    image

                    Итак, приступим.

                    Вводные курсы в Jupyter Notebook


                    Читать дальше →
                    • +27
                    • 21.3k
                    • 7
                  • Что я узнал о машинном обучении, поработав в 12 стартапах

                    • Translation
                    Всем привет.

                    Поработав в 12 стартапах в сфере машинного обучения, я сделал восемь полезных выводов о продуктах, данных и людях.

                    Все стартапы были из разных сфер (финтех, биотехнологии, здравоохранение, технологии обучения) и на разных этапах: и на этапе pre-seed, и на этапе приобретения крупной компанией. Менялась и моя роль. Я был стратегическим консультантом, главой отдела анализа данных, заваленный делами штатным сотрудником. Все эти компании старались создать хороший продукт, и многим это удалось.

                    За время работы я пришел к таким выводам:

                    Продукт важнее ИИ


                    Эти стартапы разрабатывают продукты, а не изучают искусственный интеллект. Меня, как убежденного математика, сначала больше интересовало машинное обучение и создание новых методов и алгоритмов.

                    Вскоре я понял, что даже точные модели машинного обучения не ценны сами по себе. Ценность ИИ и машинного обучения напрямую зависит от ценности продукта, в котором они используются. Цель стартапа – научиться создавать продукты, основанные на машинном обучении.

                    При таком подходе иногда выясняется, что машинное обучение – не самый эффективный инструмент. Иногда дело не в поставленной задаче, а в процессе решения. Даже в таких ситуациях полезно обратиться к ученым: они используют научный, основанный на данных подход. Тем не менее, не тратьте время на ИИ там, где нужно исправить процесс.
                    Читать дальше →
                    • +15
                    • 16.6k
                    • 7
                  • Дайджест статей машинного обучения и искусственного интеллекта

                      Хабр, привет.

                      Отфильтровав большое количество статей, конференций и подписок — собрал для вас все наиболее значимые гайды, статьи и лайфхаки из мира машинного обучения и искусственного интеллекта. Всем приятного чтения!

                      1. Проекты искусственного интеллекта, с которыми можно поиграться уже сегодня. Что вы знаете про искусственный интеллект и машинное обучение? Современный тренд или потенциально мощная сила, способная убивать людей? Эти модные понятия всё чаще на слуху, но далеко не все знают, что же это на самом деле. Пришло время изучить эти технологии с помощью простого и интересного подхода — попробовать искусственный интеллект и нейросети самостоятельно на практике.

                      image
                      Читать дальше →
                      • +13
                      • 9.4k
                      • 3
                    • Дайджест новостей машинного обучения и искусственного интеллекта за июнь

                        Хабр, привет.

                        Отфильтровав большое количество источников и подписок — собрал для вас все наиболее значимые новости из мира машинного обучения и искусственного интеллекта за июнь. Всем приятного чтения!

                        1. Команда исследователей из Карнеги-Меллона сделала прорыв в области неинвазивного управления роботизированными устройствами.

                        Используя неинвазивный интерфейс мозг-компьютер, они разработали первую в мире успешную роботизированную руку, которая управляется с помощью мыслей и без хирургического (!) вмешательства. Технология продемонстрировала способность непрерывно отслеживать и следовать за курсором компьютера.

                        image
                        Читать дальше →
                      • Лучшие дистрибутивы Linux для старых компьютеров

                        • Translation
                        Привет!

                        Вкратце: пока не бросайте свой старый компьютер — используйте легкий дистрибутив Linux, чтобы возродить его!

                        Что вы делаете со своим старым компьютером? Тот, который когда-то имел хорошую аппаратную конфигурацию, но теперь считается устаревшим. Почему бы не восстановить его вместе с Linux? Я собираюсь перечислить лучшие легкие дистрибутивы Linux, которые вы можете использовать на своем старом ПК.

                        Лучшие легкие дистрибутивы Linux для старых ноутбуков и десктопов


                        Я постараюсь упорядочить список в порядке убывания требований к оборудованию. Это означает, что легкому дистрибутиву Linux, занимающему первое место, потребуется минимальное аппаратное обеспечение.

                        10. Peppermint


                        image

                        Peppermint  —  это облачно-ориентированный дистрибутив Linux, не требующий мощного железа для запуска. Он основан на Lubuntu и использует окружение рабочего стола LXDE для более плавной работы.
                        Читать дальше →
                      • A selection of Datasets for Machine learning

                          Hi guys,

                          Before you is an article guide to open data sets for machine learning. In it, I, for a start, will collect a selection of interesting and fresh (relatively) datasets. And as a bonus, at the end of the article, I will attach useful links on independent search of datasets.

                          Less words, more data.

                          image

                          A selection of datasets for machine learning:


                          Read more →
                          • +10
                          • 2.4k
                          • 2
                        • Подборка датасетов для машинного обучения

                            Привет, читатель!

                            Перед тобой статья-путеводитель по открытым наборам данных для машинного обучения. В ней я, для начала, соберу подборку интересных и свежих (относительно) датасетов. А бонусом, в конце статьи, прикреплю полезные ссылки по самостоятельному поиску датасетов.

                            Меньше слов, больше данных.

                            image

                            Подборка датасетов для машинного обучения:


                            Читать дальше →
                            • +62
                            • 22.4k
                            • 4
                          • Ищем свободное парковочное место с Python

                            • Translation
                            image

                            Я живу в хорошем городе. Но, как и во многих других, поиск парковочного места всегда превращается в испытание. Свободные места быстро занимают, и даже если у вас есть своё собственное, друзьям будет сложно к вам заехать, ведь им будет негде припарковаться.

                            Поэтому я решил направить камеру в окно и использовать глубокое обучение, чтобы мой компьютер сообщал мне, когда освободится место:

                            image

                            Это может звучать сложно, но на самом деле написать рабочий прототип с глубоким обучением — быстро и легко. Все нужные составляющие уже есть — нужно всего лишь знать, где их найти и как собрать воедино.

                            Поэтому давайте немного развлечёмся и напишем точную систему уведомлений о свободной парковке с помощью Python и глубокого обучения
                            Читать дальше →
                          • Работаем с Wordstat правильно. Полное руководство

                            • Tutorial
                            image

                            Хабр, привет!

                            Многие люди не знают, как работать с трендами в интернете, где их искать. Перед тем, как начинать бизнес не знают, где посмотреть будет ли этот бизнес вообще популярен и нужен ли он. Поэтому напишу полный туториал, чтобы закрыть все вопросы по этой тематике.

                            Работать мы будем со специальным сервисом по сбору поисковых запросов пользователей Яндекса Вордстатом, интерфейс которого довольно прост и понятен:

                            image

                            В начале, по традиции, поставлю цели:

                            • Понять весь функционал и научиться работать с Вордстатом;
                            • Как правильно собирать семантику с максимальной релевантностью и CTR >50%;
                            • Так как мы на Хабре, поработаем с API Wordstat напрямую.
                            Читать дальше →
                            • +24
                            • 10.6k
                            • 4
                          • Прорабатываем навык использования группировки и визуализации данных в Python

                              image

                              Привет, Хабр!

                              Сегодня будем прорабатывать навык использования средств группирования и визуализации данных в Python. В предоставленном датасете на Github проанализируем несколько характеристик и построим набор визуализаций.

                              По традиции, в начале, определим цели:

                              • Сгруппировать данные по полу и году и визуализировать общую динамику рождаемости обоих полов;
                              • Найти самые популярные имена за всю историю;
                              • Разбить весь временной промежуток в данных на 10 частей и для каждой найти самое популярное имя каждого пола. Для каждого найденного имени визуализировать его динамику за все время;
                              • Для каждого года рассчитать сколько имен покрывает 50% людей и визуализировать (мы увидим разнообразие имен за каждый год);
                              • Выбрать 4 года из всего промежутка и отобразить для каждого года распределение по первой букве в имени и по последней букве в имени;
                              • Составить список из нескольких известных людей (президенты, певцы, актеры, киногерои) и оценить их влияние на динамику имен. Построить наглядную визуализацию.

                              Меньше слов, больше кода!

                              И, поехали.
                              Читать дальше →
                              • +40
                              • 10.6k
                              • 5