• Учебный фреймворк на Java по глубокому обучению

      Недавно мы выпустили первую версию нового фреймворка по глубокому обучению DeepJava (DJ) 0.01.


      Основная цель фреймворка, по крайней мере, на текущий момент, чисто учебная. Мы строим шаг за шагом фреймворк, у которого:


      • будет понятная кодовая база
      • будет набор бранчей, по которым можно шаг за шагом проследить процесс создания и понять, почему были сделаны те или иные изменения
      Читать дальше →
    • Специалист по разметке данных

        Сегодня замечательный день (if you know what I mean), чтобы анонсировать нашу новую программу — Специалист по разметке данных.

        На текущий момент в сфере искусственного интеллекта сложилась такая ситуация, при которой для обучения сильной нейронной сети нужны несколько компонентов: железо, софт и, непосредственно, данные. Много данных.

        Железо, в общем-то, доступно каждому через облака. Да, оно может быть недешевым, но GPU-инстансы на EC2 вполне по карману большинству исследователей. Софт опенсорсный, большинство фреймворков можно скачать себе куда-то и работать с ними. Некоторые сложнее, некоторые проще. Но порог для входа вполне приемлемый. Остается только последний компонент — это данные. И вот здесь и возникает загвоздка.

        Deep learning требует действительно больших данных: сотни тысяч–миллионы объектов. Если вы хотите заниматься, например, задачей классификации изображений, то вам, помимо самих данных, нужно передать нейронке информацию, к какому классу относится тот или иной объект. Если у вас задача связана еще и с сегментацией изображения, то получение хорошего датасета — это уже фантастически сложно. Представьте, что вам нужно на каждом изображении выделить границы каждого объекта.


        В этом посте хочется сделать обзор тех инструментов (коммерческих и бесплатных), которые пытаются облегчить жизнь этих прекрасных людей — разметчиков данных.
        Читать дальше →
        • +18
        • 11.9k
        • 3
      • Как Яндекс создавал курс по C++, или Почему нам всё пришлось переписать

          В Яндексе C++ — один из основных языков, на нём написан наш поиск. Его развитие нам настолько важно, что больше года назад по инициативе Яндекса была создана российская рабочая группа по стандартизации «плюсов». Через неё у всех разработчиков русскоязычного пространства есть возможность влиять на развитие языка.



          Недавно Физтех, Яндекс и ШАД запустили ещё один курс на платформе Coursera — «Основы разработки на C++: белый пояс». Он посвящён знакомству с С++. Я расскажу, для кого этот курс, как мы его готовили, что получилось в итоге и каковы наши дальнейшие планы.

          Как всё началось, было выброшено и началось снова


          Онлайн-специализацию из пяти курсов по С++ мы задумали прошлым летом. Сначала сочиняли программу потихоньку, потом активнее, и в октябре начали снимать видео.

          Читать дальше →
        • Подборка полезных материалов по Azure

            У нас накопилось много бесплатных материалов по работе с облаком, поэтому мы решили поделиться с вами самыми последними из них. Под катом вы найдёте описание 6 курсов и 12 книг/гайдов по обучению работе с Azure.


            Читать дальше →
            • +24
            • 8.1k
            • 2
          • Открытый курс машинного обучения. Тема 5. Композиции: бэггинг, случайный лес


              Пятую статью курса мы посвятим простым методам композиции: бэггингу и случайному лесу. Вы узнаете, как можно получить распределение среднего по генеральной совокупности, если у нас есть информация только о небольшой ее части; посмотрим, как с помощью композиции алгоритмов уменьшить дисперсию и таким образом улучшить точность модели; разберём, что такое случайный лес, какие его параметры нужно «подкручивать» и как найти самый важный признак. Сконцентрируемся на практике, добавив «щепотку» математики.


              UPD: теперь курс — на английском языке под брендом mlcourse.ai со статьями на Medium, а материалами — на Kaggle (Dataset) и на GitHub.


              Видеозапись лекции по мотивам этой статьи в рамках второго запуска открытого курса (сентябрь-ноябрь 2017).


              Читать дальше →
            • МФТИ запустил онлайн-курс по управлению инновационными проектами

                image

                Курс разработан МФТИ совместно с компанией eNANO при поддержке IBS и предназначен для лидеров инновационных компаний, технологических предпринимателей, стартаперов и всех тех, кто занимается высокотехнологичным бизнесом, а также изучает инновации и управление проектами.

                Читать дальше →
                • +10
                • 5.7k
                • 2
              • No free lunch. Введение в участие в соревнованиях по анализу данных на платформе Kaggle

                • Tutorial
                Цель статьи — познакомить широкую аудиторию с соревнованиями по анализу данных на Kaggle. Я расскажу о своем подходе к участию на примере Outbrain click prediction соревнования, в котором я принимал участие и занял 4ое место из 979 команд, закончив первым из выступающих в одиночку.

                Для понимания материала желательны знания о машинном обучении, но не обязательны.
                Читать дальше →
                • +24
                • 11.1k
                • 9
              • Как расширить функционал приложения, размещенного на Mac Store, при помощи Apple Script

                  С тех пор, как для прохождения модерации на Mac Store стала требоваться поддержка Sandbox, прошло уже 5 лет. Хотя возможности MacOS и Sandbox постепенно расширяются, разработчики, желающие публиковаться в официальном магазине Apple, по-прежнему ограничены в возможностях работы c этой ОС. Особенно остро эта проблема стоит для утилит и системных приложений.


                  Sandbox призван сделать macOS безопасней и уберечь пользователя от вредоносных и потенциально опасных приложений — все действия приложений, которые могут гипотетически принести вред, должны сопровождаться запросом к пользователю на предоставление доступа. В теории это разумная мера предосторожности, однако в действительности под санкции попадают многие приложения, которым пользовательские данные необходимы для осуществления базовых функций. В данной статье мы расскажем, как внедряли подобные функции в приложение, поддерживая совместимость с Sandbox, — возможно, этот опыт будет полезен для других разработчиков, работающих с официальным маркетом.

                  Наши партнеры столкнулись с подобной необходимостью при работе с утилитой для мониторинга системы MaCleaner X. Вся линейка продуктов MaCleaner распространяется исключительно через Mac App Store.

                  Отличительными особенностями MaCleaner X являются поддержка тачбара и кастомизированный дизайн: приложение автоматически определяет модель Mac и предлагает особый вариант интерфейса для каждого девайса. Однако в дополнение к этому мы в данный момент работаем над тем, чтобы реализовать в расширенной версии некоторые функции, которые пользователи хотели бы видеть в программе и которые для утилит, распространяемых вне Mac Store, считаются привычными.
                  Читать дальше →
                • +500 бесплатных инструментов для запуска вашего стартапа в 2017 году

                  • Translation


                  Сейчас доступно огромное количество отличных бесплатных инструментов. Но используя бесплатный или условно-бесплатный инструмент, вам понадобится больше времени на достижение своей цели, потому что такой инструмент не будет полностью соответствовать вашим потребностям.

                  С другой стороны, в начале пути важно минимизировать издержки и внимательно следить за своими платными подписками. В конце месяца они могут незаметно вылиться в огромные накладные расходы.

                  Итак, мы нашли в интернете бесплатные и условно-бесплатные инструменты для роста вашего бизнеса. Когда они дадут вам желаемый результат, вы можете оформить платную подписку.
                  Читать дальше →
                • Speech AI с Python & Google API

                    Speech AI с Python & Google API


                    image


                    Добрый день!


                    Совсем недавно пришла в голову идея сделать "говорилку" на русском языке. В голове была простенькая схема наподобие:


                    1) Распознать речь с микрофона
                    2) Придумать более — менее разумный ответ.
                    В этом пункте можно сделать много интересного.
                    Например реализовать управление чем — нибудь физическим и не очень.
                    3) Преобразовать этот самый ответ в речь и воспроизвести.


                    Самое интересное, что для всех этих пунктов нашлись библиотеки под Python, чем я и воспользовался.


                    В итоге получилась связка, практически не зависящая от выбранного в качестве разговорного языка.

                    Читать дальше →
                  • Погружение в технологию блокчейн: Взаимное страхование животных

                      Этот материал из серии статей о первых в России проектах, разработанных на основе технологии блокчейн, немного необычен. Вы узнаете о технической реализации платформы для взаимного страхования домашних животных, которая запустилась только сегодня. Сейчас протестировать бота Lexi Bot можно в Telegram. Будем рады вашим комментариям.


                      Читать дальше →
                    • Как двухлетний репозиторий на GitHub стал трендовым за 48 часов

                      • Translation


                      GitHub предоставил возможность миллионам разработчиков с легкостью публиковать свои проекты и тем самым привлекать пользователей и единомышленников. Часто перед разработчиками возникает проблема неэффективного использования ресурсов — они тратят сотни часов на создание проекта с целью продвинуть его на GitHub, а получают максимум две звезды.
                      Читать дальше →
                    • Парсим weblancer используя PROXY

                        Цель работы


                        1. Парсим сайт, используя прокси-сервера.
                        2. Сохраняем данные в формате CSV.
                        3. Пишем поисковик по найденным данным.
                        4. Строим интерфейс.




                        Использовать будем язык программирования Python. Сайт, с которого мы будем качать данные — www.weblancer.net (парсинг старой версии этого сайта был размещен здесь), в нем есть предложения работы по адресу www.weblancer.net/jobs. С него мы и будем получать данные — это название, цена, количество заявок, категория, краткое описание предлагаемой работы.

                        Вход с использованием прокси означает — вход на сайт под ненастоящим адресом. Пригодится для парсинга сайта с защитой бана по IP адресу (то есть, если вы слишком часто, за короткий отрезок времени, входите на сайт).
                        Читать дальше →
                      • Creative Commons запускает сервис для поиска бесплатных изображений



                          Организация Creative Commons, которая помогает законно обмениваться творческими материалами, запустила бета-версию новой поисковой системы CC Search для поиска бесплатных изображений.

                          Читать дальше →
                        • Новый рекорд: парализованный набирает восемь слов в минуту с помощью мозгового имплантата


                            Источник: Стэнфордский университет

                            Парализованных людей в мире много. Только в США 5,1 млн человек парализованы в той либо иной степени. В некоторых случаях паралич — прогрессирующий. Боковой амиотрофический склероз — одно из заболеваний, которое приводит к полному параличу. С течением времени человек, страдающий этим заболеванием, теряет возможность управлять даже лицевыми нервами, а в финальной стадии заболевания — и мышцами глазных яблок.

                            Такие пациенты не могут общаться с окружающими людьми или реагировать на внешние факторы. Они замкнуты в себе, хотя умственная деятельность обычно не затронута. Раньше возможность общения с такими людьми отсутствовала, они были предоставлены самим себе. Но по мере развития технологий новые возможности появляются и в медицине. Например, разработка Нильса Бирбаумера (Niels Birbaumer), сотрудника Wyss Center for Bio and Neuroengineering, помогла понять, что думают люди, у которых отсутствует моторно-двигательная активность.
                            Читать дальше →
                          • OpenStreetMap, как получить координаты адреса, часть простая



                              Последнее время наблюдаю тенденцию, что всё больше и больше людей сталкиваются с проблемами в отсутствии геоданных. Вернее даже не так, в их закрытости. Если ещё вчера всех устраивали возможности картографических сервисов по расстановке маркеров, то теперь пользователь хочет большего: подсветить улицу, показать дома на ней, посчитать протяжённости рек и т.д. И тут их ожидает сюрприз, казалось бы на карте они всё это видят, но сделать ни чего не могут — это просто картинки. Развитие, что Google.Maps, что Яндекс.Карт остановилось на показе картинок, геокодинге, да навигации.

                              Читать дальше →
                            • SwiftLint — чистота и порядок в iOS проекте

                                image

                                Думаю, все знают, как бывает непросто поддерживать соблюдение code style и соглашений в iOS-проекте. Сегодня поговорим о том, как автоматизировать этот процесс с помощью утилиты SwiftLint.
                                Читать дальше →
                              • 5 действительно бесплатных нелинейных видеоредакторов для Windows

                                  Этот пост призван помочь тем, кому, как и мне, внезапно стало тесно с Movie Maker.

                                  Видеоредакторы почти не интересовали меня до прошлого месяца, пока с друзьями мы не задумали снять что-нибудь оригинальное к Новому году. Креативность наша ограничилась тем, чтобы, говоря терминами прежде мне неизвестными, применить эффект “Разделение экрана” (Split Screen). То есть реализовать нечто такое:


                                  Читать дальше →
                                • История моего стартапа: 500000 пользователей за 5 дней на стодолларовом сервере

                                  • Translation
                                  Похоже, все в мире стартапов согласны с тем, что первые версии приложений должны представлять собой минимально жизнеспособный продукт (MVP, Minimal Viable Product), создавая который можно не особо заботиться о его масштабировании с технической точки зрения. Мне много раз доводилось слышать о том, что самое главное в подобных делах – поскорее выпустить нечто работающее. И, до тех пор, пока бизнес-модель нормально функционирует в условиях роста клиентской базы – всё нормально. А тратить время и деньги на то, чтобы сделать систему, которая сможет выдержать внезапный наплыв пользователей, не стоит. Беспокоиться нужно лишь о проверке предположений, об оценке рынка и о раскрутке бизнеса. Масштабируемость – это то, что можно отложить на потом. К несчастью, такая вот слепая вера в шаблонные идеи уже не раз приводила к оглушительным провалам. Pokémon GO, и, в частности, связанные с этим проектом приложения, служат напоминанием об этом.


                                  Читать дальше →
                                • 35 ресурсов, которые будут интересны создателям стартапов

                                    Сегодня мы бы хотели предложить вниманию читателей подборку зарубежных и отечественных ресурсов для развития и продвижения стартапов на разных стадиях, начиная с бета-тестирования и заканчивая официальным релизом. В список вошли те площадки и сервисы, которые мы отобрали как эффективные и доступные на основании собственного опыта или отзывов пользователей. Каждый пункт сопровождается подробным комментарием о предоставляемых услугах и условиях.


                                    Читать дальше →
                                    • +14
                                    • 34.3k
                                    • 1