• Глубокое обучение с R и Keras на примере Carvana Image Masking Challenge



      Привет, Хабр!

      Пользователи R долгое время были лишены возможности приобщиться к deep learning-у, оставаясь в рамках одного языка программирования. С выходом MXNet ситуация стала меняться, но своеобразная документация и частые изменения, ломающие обратную совместимость, все еще ограничивают популярность данной библиотеки.

      Гораздо привлекательнее выглядит использование R-интерфейсов к TensorFlow и Keras с бекендами на выбор (TensorFlow, Theano, CNTK), подробной документацией и множеством примеров. В этом сообщении будет разобрано решение задачи сегментации изображений на примере соревнования Carvana Image Masking Challenge (победители), в котором требуется научиться отделять автомобили, сфотографированные с 16 разных ракурсов, от фона. "Нейросетевая" часть полностью реализована на Keras, за обработку изображений отвечает magick (интерфейс к ImageMagick), параллельная обработка обеспечивается parallel+doParallel+foreach (Windows) или parallel+doMC+foreach (Linux).

      Читать дальше →
      • +56
      • 12.5k
      • 1
    • Небольшое введение в параллельное программирование на R

      • Translation
      • Tutorial
      Давайте поговорим об использовании и преимуществах параллельных вычислений в R.

      Причина, по которой стоит об этом задуматься: заставляя компьютер больше работать (выполнять много расчетов одновременно), мы меньше времени ждем результатов наших экспериментов и можем выполнить еще. Это особенно важно для анализа данных (R как платформа обычно используется именно для этой цели), поскольку часто требуется повторить вариации одного и того же подхода, чтобы что-то узнать, вывести значения параметров, оценить стабильность модели.

      Обычно, для того, чтобы заставить компьютер больше работать, сначала нужно потрудиться самому аналитику, программисту или создателю библиотеки, чтобы организовать вычисления в виде, удобном для параллелизации. В лучшем случае кто-то уже сделал это за вас:
      • Хорошие параллельные библиотеки, например, многопоточные BLAS/LAPACK, включены в Revolution R Open (RRO, сейчас Microsoft R Open) (смотреть здесь).
      • Специализированные параллельные расширения, предоставляющие свои собственные высокопроизводительные реализации важных процедур, например, методы rx от RevoScaleR или методы h2o от h2o.ai.
      • Фреймворки абстрактной параллелизации, например, Thrust/Rth.
      • Использование прикладных библиотек R, связанных с параллелизацией (в частности, gbm, boot и vtreat). (Некоторые из этих библиотек не используют параллельные операции, пока не задано окружение для параллельного выполнения.)
      Читать дальше →
    • Как я победил в конкурсе BigData от Beeline

      image

      Все уже много раз слышали про конкурс по машинному обучению от Билайн и даже читали статьи (раз, два). Теперь конкурс закончился, и так вышло, что первое место досталось мне. И хотя от предыдущих участников меня и отделяли всего сотые доли процента, я все же хотел бы рассказать, что же такого особенного сделал. На самом деле — ничего невероятного.
      Читать дальше →
    • Предсказание выживания пассажиров Титаника при помощи Azure Machine Learning

        Выражаем большое спасибо за подготовку статьи Кириллу Малеву из компании Merku. Кирилл больше 3х лет занимается практическим применением машинного обучения для разных объёмов данных. В компании решает задачи в области предсказания оттока клиентов и обработки естественного языка, большое внимание уделяя коммерциализации полученных результатов. Закончил магистратуру Болонского университета и НГТУ

        Сегодня мы расскажем вам про то, как на практике использовать облачную платформу Azure для решения задач машинного обучения для решения задач машинного обучения на примере популярной задачи предсказания выживших пассажиров Титаника.

        Мы всем помним известную картинку про сову, поэтому в этой статье все шаги подробно комментируются. Если вам не понятен любой шаг, вы можете задать вопросы в комментариях.


        предсказать вероятность спасения утопающих
        • +23
        • 24.1k
        • 2
      • Распознавание физической активности пользователей с примерами на R

        • Tutorial
        Задача распознавания физической активности пользователей (Human activity Recognition или HAR) попадалась мне раньше только в качестве учебных заданий. Открыв для себя возможности Caret R Package, удобной обертки для более 100 алгоритмов машинного обучения, я решил попробовать его и для HAR. В UCI Machine Learning Repository есть несколько наборов данных для таких экспериментов. Так как тема с гантелями для меня не очень близка, я выбрал распознавание активности пользователей смартфонов.
        Читать дальше →
      • Нефтяные ряды в R

          «Графики цен великолепны, чтобы предсказывать прошлое»
          Питер Линч



          С временными рядами мне как-то не доводилось иметь дело на практике. Я, конечно, читал о них и имел некоторое представление в рамках учебного курса о том, как в общих чертах проводится анализ, но хорошо известно, что то, о чем рассказывают в учебниках по статистике и машинному обучению, не всегда отражает реальное положение дел.
          Читать дальше →
        • 10 ошибок, мешающих нам измениться

          Примечание переводчика: Некоторое время назад я прочитал замечательную статью на Medium.com. Автор статьи Samuel Thomas Davies взял за основу исследования профессора Стэнфордского университета Би Джей Фогга об изменении поведения. Сегодня я хочу поделиться ее переводом с хабрасообществом.

          Менять свое поведение, несомненно, сложно. Необходимо преодолеть препятствия, побороть сопротивляемость и изменить внешние воздействующие факторы.

          Очевидно, что делать это намного сложнее, когда вы совершаете ошибки, которые достаточно банальны, но при этом часто недооценены или просто-напросто проигнорированы ввиду их неприметности.

          Проблема в том, что у нас есть естественная склонность брать на себя вину за то, что новые привычки не приживаются. Мы полагаем, что реальная проблема в нас, тогда как в действительности, она кроется в стратегии, которую мы использовали.
          Читать дальше →
        • Нужны ли программисту бесплатные *люшки (версия 2023)

            Я хочу рассказать вам историю, которая, скорее всего, случится в 2023 году в калифорнийском офисе разработки одной крупной ИТ-компании FAC***GLE. Я думаю, история поможет посмотреть на реальность, окружающую программистов, с новой точки зрения.

            Часть первая. Внутри офиса

            Шон, ведущий программист проекта повышения лояльности, удобно полулежал в своем индивидуально настроенном кресле, которое выполняло особую весеннюю программу стимуляции мышечного корсета — Шон намеревался подкачать кубики пресса перед летними каникулами.
            Приятное щекотание стимулятора дополнялось звучанием специально подобранной аранжировки Тома Уэйтса, который, как определил мозговой имплантат, максимально соответствовал его потоку сознания и обеспечивал наилучшую производительность.

            Усики сканера альфа-активности приятно поглаживали виски и Шон чувствовал, что его, как и всегда, «прет»… О, это ощущение демиурга, когда ты видишь воплощение своих строчек кода в чудесных элементах виртуальной реальности.
            Шон не зря был ведущим разработчиком — его показатель количества безошибочных строк в день на 4% превышал средний уровень по корпорации, и это в положительную сторону отражалось на зарплатных чеках и разнообразных бонусах.
            Компания исключительно хорошо заботилась о своих программистах, которые, в свою очередь, не жалели сил и энергии на самую качественную разработку.
            Читать дальше →
          • Мультиварка — умная кастрюля или «не доведенный до ума» гаджет


              Этот пост будет полезен всем, кто хотя бы иногда что-то готовит сам, а также помогает или мешает это делать другим.
              Из него можно узнать, что это за гаджет — мультиварка, какие у нее технические возможности и невозможности, внутренность, наружность, достоинства (много) и недостатки (тоже много). Расскажу кое-что и о маленьких мультиварочных хитростях, а также позволю себе общее лирическое отступление о программировании на кухне.
              Цель поста — рассказать про мультиварки, как класс объектов, не выделяя особо его представителей, но, чтобы не вести разговор о сферической мультиварке в вакууме, сделаю основным примером разбора мою модель — Panasonic SR-TMJ181.
              Те, у кого нет мультиварки узнают, нужна ли она им, но и те, у кого она есть, надеюсь, без новых знаний не останутся.
              Читать дальше →
            • Дизайн будильника моей мечты

                Нет, не здоровенного. А просто удобного будильника для Андроида. После долгих поисков на Маркете я так и не смог найти будильник, который мне было бы приятно использовать. Поэтому в этой статье я буду проектировать будильник таким, каким бы я сам хотел его видеть.

                Сразу скажу, что это будильник для тех, кому нужен именно будильник, который будит их по утрам, а не таймер для готовки яиц или костыльная замена напоминаниям в календаре.

                Перед тем, как рассказать о том что есть в этом будильнике, я начну с того, чего в нём нет. Во-первых, в нём нет возможности установки нескольких будильников, так как в большинстве случаев они используются только для того, чтобы поставить 3 будильника подряд с целью не проспать. Это не работает и должно решаться другими средствами.

                Во-вторых, в нём нет псевдо-анализа стадий сна, так как пока я не нашёл подтверждения тому, что хоть одно из таких приложений работает. И уж точно они не работают, если спишь в кровати не один.

                И в-третьих, в нём нет никаких математических примеров для отключения звонка. Так что для любителей математики он не подойдёт.

                Дисклаймер. Вполне возможно, у вас уже есть будильник который вас полностью устраивает. Что ж, тогда эта статья вряд ли вам будет интересна. А для остальных я расскажу о проектировании будильника
                под катом
              • Опыт заказа в китайских интернет-магазинах

                  В данной статье хотелось бы поделиться с читателями своим личным опытом о китайских интернет-магазинах, в которых мне (или моим друзьям) приходилось делать покупки. Речь пойдет именно про электронный сегмент товаров. Сразу перейду к сути, и приведу обзоры этих самых магазинов с заключительной оценкой:
                  Читать дальше →
                • «Умный дом» собственными руками. Часть 2. Видеонаблюдение

                    В прошлой статье (линк) мы ознакомились с теоретической частью построения нашего «умного дома» и определились с используемыми технологиями. Теперь начнем реализацию практической части :)

                    Первой жертвой нашего интереса станет система видеонаблюдения.
                    Читать дальше →
                  • «Умный дом» собственными руками

                    Представьте картину: вы входите домой, автоматически включается свет и приятный женский (мужской, впрочем — кому как) голос приветствует вас. Вы небрежно бросаете фразу в сторону микрофона: «Дом, включи мой компьютер». Через несколько секунд слышите привычный шелест кулеров своего родного железного коня.

                    Фантастика? Под хабракатом я хочу поделиться своими успехами в построении подобной системы у себя дома.
                    Читать дальше →
                  • Заблокирована группа Революция через социальные сети ВКонтакте

                      В сети ВКонтекте временно (?) заблокирована главная страница группы "Революция через социальные сети", которая призывает людей выйти на улицы городов Беларуси для выражения протеста против правящего режима.
                      Читать дальше →
                    • Умный дом: планирование и подготовка своими силами

                      С каждым днём мы всё больше и больше доверяем решение наших бытовых проблем компьютерной технике. То, что раньше было лишь научной фантастикой сегодня — реальность. Львиную долю времени мы проводим дома, поэтому было бы логично доверить современным компьютерным технологиям помочь нам поддерживать комфорт.

                      Итак, интеллектуально здание, или как его чаще называют — «умный дом». На сегодняшний день это очень не дешёвое удовольствие, но и мобильные телефоны когда-то стоили баснословных денег. Как же подготовить дом/квартиру сегодня, во время ремонта, дабы не пришлось штробить стены в будущем?

                      Об этом мы и постараемся поразмыслить в этой статье.

                      image

                      Читать дальше →
                    • Механическое шифровальное устройство Второй мировой войны



                        Инженеры музея компьютерной техники Bletchley Park воссоздали и представили широкой публике вычислительную машину Tunny, которая во время Второй мировой войны использовалась вооруженными силами антигитлеровской коалиции для дешифрования радиосообщений нацистов. Работа над машиной длилась три года и была серьезно затруднена тем, что после окончания войны Tunny была разобрана, её компоненты были утрачены, а оригинальные чертежи были уничтожены или скрыты, несмотря на то, что в мае 1945 года было 15 действующих устройств.

                        Для шифрования сообщений немцы использовали телепринтеры Лоренца с шифрующими приставками, результаты работы которых расшифровке не поддавались. Однако, как то часто бывает, ключевую роль сыграла случайность — 30 августа 1941 года немецкий оператор передал в эфир два почти одинаковых сообщения (первое было доставлено некорректно, второе слегка изменено), дважды используя один и тот же ключ. Служба радиоперехвата сработала идеально и этой ошибки хватило главе отдела криптоаналиков Bletchley Джону Тилтмену для того, чтобы союзники могли успешно читать немецкие радиограммы с помощью Tunny вплоть до конца войны.

                        За уточнения спасибо хабраюзеру SCoon.

                        Под катом больше фото воссозданной Tunny.
                        Посмотреть фото
                      • 10 лучших вузов в области речевых технологий и искусственного интеллекта



                          За последние несколько лет в России вновь пробудился интерес к речевым интерфейсам. Западная научная традиция, в отличие от русской, в этом направлении имеет непрерывный более чем полувековой опыт.
                          Наш обзор посвящен ведущим вузам, дающим образование в области речевых технологий — автоматической обработки речи, голосовых интерфейсов, биофизики, искусственного интеллекта, нейронных сетей и т.д.
                          Учимся говорить...
                        • DOOM на PocketBook 360 Plus

                            Привет, хабрасообщество.
                            Попал мне в руки опытный образец PocketBook 360 Plus.
                            Не буду пока раскрывать секрета внутренностей сего девайса.
                            Лучше покажу небольшое видео с его участием.

                            На моей памяти впервые на электронной книге запустилась такая игра.

                            Порт основан на PrBoom
                          • Нейронные сети и распознавание символов

                              В последнее время на Хабре появилось, а также существует много содержательных статей, описывающих работу и принцип понятия “нейронная сеть”, но, к сожалению, как всегда очень мало описания и разбора полученных практических результатов или их не получения. Я думаю, что многим, как и мне удобней, проще и понятней разбираться на реальном примере. Поэтому в данной статье постараюсь описать почти пошаговое решение задачи распознавания букв латинского алфавита + пример для самостоятельного исследования. Распознавание цифр с помощью однослойного персептрона уже сделано, теперь давайте еще разберёмся и научим компьютер распознавать буквы.
                              Немного желания и можно начинать...
                            • Выполнение USSD запросов под Linux

                                Спасибо автору топика Проверка счета Киевстар модема в Linux который помог мне понять принцип работы модемов и способ работы с ними в линуксе. Мне как раз нужно было решить задачу отображения уровня сигнала, проверки баланса, пополнения счета с использованием 3ж модема. Но так как ставить на домашние машины пхп ради такой мелочи мне не хотелось, решил переписать скрипт под себя на Python, который есть в любом десктоп-линуксе из коробки.

                                Работать данный скрипт будет на любых модемах/телефонах которые поддерживают USSD без PDU кодирования. Для модемов требующих PDU-кодировку команд нужно написать функции-обертки аналогично php-скрипту из указаного выше топика. У меня к сожалению нету такого модема и проверить я бы не смог — потому писать не стал.

                                Проверена работа на 3G модеме ZTE MF100(должно работать с mf620, mf622, mf626, mf628) и тарифе Интернет 3G от Киевстара.
                                Читать дальше →