• Введение в машинное обучение с помощью Python и Scikit-Learn

    Привет, хабр!



    Меня зовут Александр, я занимаюсь машинным обучением и анализом веб-графов (в основном — теоретическим), а также разработкой Big Data продуктов в одном из операторов Большой Тройки. Это мой первый пост — прошу, не судите строго!)

    В последнее время ко мне все чаще стали обращаться люди, которые хотят научиться разрабатывать эффективные алгоритмы и участвовать в соревнованиях по машинному обучению с вопросом: «С чего начать?». Некоторое время назад я руководил разработкой инструментов Big Data для анализа медиа и социальных сетей в одном из учреждений Правительства РФ, и у меня остался некоторый материал, по которому обучалась моя команда и которым можно поделиться. Предполагается, что у читателя есть хорошее знание математики и машинного обучения (в команде были в основном выпускники МФТИ и студенты Школы Анализа Данных).
    Читать дальше →
  • Дайджест интересных материалов из мира веб-разработки и IT за последнюю неделю №141 (29 декабря 2014 — 4 января 2015)

      Предлагаем вашему вниманию подборку с ссылками на полезные ресурсы, интересные материалы и IT-новости


      Читать дальше →
      • +39
      • 49.5k
      • 4
    • PythonDigest — 2014 год, итоги нашей работы в цифрах и ссылках

        В предверии Нового года подводим итоги работы над дайджестом и выводим тенденций выявленные в процессе сбора новостей по языку Python.

        За год доведен до ума и по максимуму автоматизирован сбор новостей. Ежедневно автоматически мониторится 19 источников и набирается в среднем 10-15 релевантных новостей из которых, в последствии отбираются лучшие и готовятся анонсы для дайджеста.
        Ощутимый вклад приносят читатели дайджеста, ни один выпуск не проходит без добавленных ими новостей.
        За полгода, прошедшие с тех пор как еженедельный дайджест новостей о языке программирования python и близлежащих технологиях перестал публиковаться на хабре, мы обзавелись постоянной аудиторией читателей, подружились c ведущими русскоязычными python-площадками, нашли и научились обрабатывать новые источники информации о python в сети, стали постоянно публиковаться в популярном паблике на эту тему во вконтактиках, переводили и публиковали интересные статьи.

        Интересующихся подробностями и цифрами, милости просим под кат.

        Читать дальше →
      • Не только Яндексу. Микроразметка на крупнейших сайтах рунета: зачем ею пользуются и почему она пригодится и вам

          Мы уже рассказали вам о мире семантической разметки — о том, какие бывают словари, почему столько стандартов синтаксиса, а также разобрали, в каких продуктах она используется.

          Теперь мы решили показать, как микроразметка участвует в жизни существующих сайтов: сделали обзор всех возможностей, которые она дает интернет-магазинам, сайтам СМИ и видеохостингам, и узнали, насколько они пользуются спросом у крупнейших проектов рунета.



          Люди, которые отвечают за разработку и всю техническую часть таких сайтов, как Holodilnik.ru, Ozon.ru, Lenta.ru, Interfax.ru и Ivi.ru, ответили на вопросы о том, как на практике происходит внедрение микроразметки и каких результатов она позволяет добиться. А мы со своей стороны рассказали, какие типы мы бы порекомендовали таким сайтам и для чего.

          Читать дальше →
          • +45
          • 105k
          • 9
        • Поиск виртуальных серверов: VDS.menu



          Сегодня я хочу представить вам новый проект для поиска хостинга, виртуальных и выделенных серверов. Из-за ограниченного бюджета сейчас работает только часть, посвященная виртуальным серверамvds.menu, однако остальные две части также разрабатываются и скоро я смогу представить и их.

          Меня довольно часто просят подобрать либо хостинг, либо виртуальный сервер. Помнить тарифы разных хостеров очень сложно, тем более, что они иногда меняются, поэтому я пользовался сайтами-агрегаторами. Однако у всех сайтов, которые сейчас есть на рынке, довольно много неудобств — у кого-то много рекламы, у кого-то тарифы заполнены неверно. Другими словами, пользоваться такими сайтами очень неудобно. Поэтому я подумал, что нужно решить эту проблему раз и навсегда и занялся созданием собственного сайта.
          Читать дальше →
        • История наушников

            Привет, Хабравчане! Рад снова вас всех видеть.

            Сегодня хочу поговорить о наушниках. Но не о технической составляющей, и не о том, кто именно и когда их сделал похожими на современные, а о том, как и почему вообще каждый из нас сейчас использует минимум одни наушники. Я выбрал несколько вех в истории, связанных с определенными брендами, которые, на мой взгляд, особым образом повлияли на использование нами этих устройств.

            image
            Читать дальше →
          • Предложение от Яндекс.Денег в новом стандарте платежей W3C

              Привет! Меня зовут Евгений Виноградов. Я работаю в Яндекс.Деньгах и участвую в работе группы W3C, посвященной стандартам интернет-платежей. Помимо нас и ещё нескольких платёжных сервисов, в неё вошли международные IT-компании, банки, регуляторы, организации, работающие с Bitcoin. На самом деле, группа существует уже больше трех лет. Всё это время она обсуждает содержание будущего стандарта для интернет-платежей, но только недавно — после очной встречи участников — дело заметно продвинулось вперед.



              Мы в Яндекс.Деньгах не понаслышке знаем, с какими сложностями приходится сталкиваться разработчикам, например, интернет-магазинов. Сейчас для использования разных платёжных систем им приходится разбираться с документацией и особенностями каждой из них, а процесс подключения платёжных решений к мелкому магазину может растягиваться на месяцы. Если же подключение будет выполняться практически идентично, достаточно будет изучить процедуру один раз — и вы будете способны работать со всеми платежными системами.

              Одним из наших предложений в рамках работы над стандартом стал способ инициализации платежа с условным названием «payto:» — по аналогии со всем известным сценарием отправки сообщений электронной почты через URI-схему «mailto:».

              В этом посте мы хотим рассказать о том, почему так сложилось, что единого стандарта до сих пор нет, почему он очень нужен и каким он может, на наш взгляд, быть.
              Читать дальше →
            • Несколько интересностей и полезностей для веб-разработчика #25

                Доброго времени суток, уважаемые хабравчане. За последнее время я увидел несколько интересных и полезных инструментов/библиотек/событий, которыми хочу поделиться с Хабром.

                Tracking.js




                Крошечная библиотека ( всего 7 кб ) содержит в себе различные техники компьютерного зрения в вебе. Tracking.js уже позволяет отслеживать различные объекты, цвета, лица как на фотографиях, так и с помощью веб-камеры. Проект собрал уже почти 2000 звезд на GitHub.

                  var colors = new tracking.ColorTracker(['magenta', 'cyan', 'yellow']);
                
                  colors.on('track', function(event) {
                    if (event.data.length === 0) {
                      // No colors were detected in this frame.
                    } else {
                      event.data.forEach(function(rect) {
                        console.log(rect.x, rect.y, rect.height, rect.width, rect.color);
                      });
                    }
                  });
                
                  tracking.track('#myVideo', colors);
                

                Читать дальше →
                • +49
                • 28.3k
                • 1
              • Несколько интересностей и полезностей для веб-разработчика #23

                  Доброго времени суток, уважаемые хабравчане. За последнее время я увидел несколько интересных и полезных инструментов/библиотек/событий, которыми хочу поделиться с Хабром.

                  Basket.js



                  Basket немного похож на RequireJS, только с его помощью все подключаемые скрипты и стили кешируются в localStorage. Тесты Google и Bing демонстрируют улучшение производительности при использовании локального хранилища по сравнению с обычным браузерным кешем. Проект изначально появился как эксперимент, который полностью оправдал результаты этих тестов.
                  basket
                      .require({ url: 'missing.js' })
                      .then(function () {
                          // Success
                      }, function (error) {
                          // There was an error fetching the script
                          console.log(error);
                      });
                  


                  Читать дальше →
                • Самые работоспособные, ответственные и коммуникабельные

                    Несколько дней назад ребята из службы исследований HeadHunter решили немного развлечься и посмотрели, кто в мире IT считает себя самым ответственным, коммуникабельным, работоспособным, быстрообучаемым и самостоятельным. Другими словами, кто не смущается употреблять эти популярные, емкие, содержательные и «так любимые рекрутерами» характеристики в своем резюме.

                    Для сравнения мы взяли список профессий, названия которых работодатели наиболее часто вводят при поиске резюме в сфере информационных технологий. Проанализировано 87,5 тыс. резюме, размещенных или обновленных в первом полугодии.

                    Важно, от редакции: то, что люди говорят или не говорят о себе в резюме — не всегда значит, что они такие или не такие на самом деле.

                    О своей ответственности тестировщики и бизнес-аналитики говорят в резюме вдвое чаще, чем программисты java и C++. Возможно, они считают, что в их профессии эти качества приоритетнее?



                    А как обстоят дела с коммуникабельностью?
                    Читать дальше →
                  • Python-digest #31. Новости, интересные проекты, статьи и интервью [8 июня 2014 — 6 июля 2014] Возрождение

                      Очередной дайджест с новостями из мира Python, за месяц опубликовали немало релизов и статей. Произошли изменения и в дайджесте, все подробности под катом.

                      Перейти к дайджесту
                      • +55
                      • 9.9k
                      • 7
                    • Разработка мобильных Javascript MVC приложений с Framework7, RequireJS и Handlebars

                      Недавно передо мной стала задача разработки IPhone и Android приложения. Опыта разработки под IOS у меня ранее не было, да и хотелось написать один раз и запускать на обеих платформах. Соответственно был выбран был выбран Javascript и PhoneGap.

                      И если с языком я определился относительно быстро, то далее было много вопросов.
                      Хотелось сделать, что бы приложение максимально повторяло интерфейс IOS7 и было похоже на native по скорости работы. При этом с одной стороны не было желания использовать «монстров», на подобии dojo или jquery mobile. c другой стороны хотелось получить удобную модульную MVC структуру приложения.

                      В итоге в финал моего личного сравнения вышли:
                      Ionic framework: http://ionicframework.com/
                      Framework7: http://www.idangero.us/framework7/
                      Читать далее
                    • Распознавание автомобильных номеров в деталях

                        image
                        Настало время подробно рассказать, как работает наша реализация алгоритма распознавания номеров: что оказалось удачным решением, что работало весьма скверно. И просто отчитаться перед Хабра-пользователями — ведь вы с помощью Android приложения Recognitor помогли нам набрать приличного размера базу снимков номеров, снятых совершенно непредвзято, без объяснения как снимать, а как нет. А база снимков при разработке алгоритмов распознавания самое важное!
                        Читать дальше →
                      • Таргетинг пользователей: регион, город, улица

                          Иногда в своих проектах мне хотелось прикрутить некоторую географическую базу, с помощью которой я бы разделял пользователей ресурса по их месту пребывания. Но постоянная занятость делами насущными никак не давала реализовать идею с базой регионов и мало-мальски удобным интерфейсом для ее визуализации.
                          Волею судьбы и заказчика (или судьбы заказчика или заказчика судьбы) такая задача, наконец-то, возникла — необходимо создать базу регионов, городов и улиц для сегментирования пользователей и реализовать удобную web-форму, собственно, для ее использования. Благо заказчик ориентировал свой бизнес на Россию, что резко упростило задачу.

                          Читать дальше →
                        • Python-digest #25. Новости, интересные проекты, статьи и интервью [28 апреля 2014 — 4 мая 2014]

                            Юбилейный 25-й выпуск для хабры подборки статей, релизов, описаний интересных проектов о python и близлежащих технологиях.

                            Спасибо owlman75 за первомайскую иллюстрацию. Кстати, всех поздравляю с первомаем и наступающим днем Победы.

                            Благодарю хабраюзеров за плюсики в прошлую публикацию их оказалось неожиданно много, но правила я, оказывается, не дочитал и одного поста с 50+ недостаточно для вывода денежки — их должно быть минимум два. Но ничего, все равно очень приятно было.

                            Читать дальше →
                          • Дайджест интересных материалов из мира веб-разработки и IT за последнюю неделю №107 (27 апреля — 3 мая 2014)

                              Предлагаем вашему вниманию подборку с ссылками на полезные ресурсы, интересные материалы и IT-новости


                              Читать дальше →
                              • +61
                              • 46k
                              • 7
                            • Python-digest #24. Новости, интересные проекты, статьи и интервью [20 апреля 2014 — 27 апреля 2014]

                                И снова подборка статей, релизов и интересных проектов о python и близлежащих технологиях. Сегодня будут Haskell, ниндзя, клики, кокаин — в общем все что нужно для хорошего шоу.

                                Не перестаю благодарить owlman75 за иллюстрацию. Даже отпуск ему не помеха. И большое спасибо за новости, которые вы присылаете — они мне очень помогают верить в то, что проект нужен не одному мне.

                                Прошу не забывать ставить плюсики — если пост наберет их больше 50 (а я верю, что такое хоть когда-нибудь случится), то доброхабр даст мне денежку.

                                Читать дальше →
                                • +109
                                • 15.1k
                                • 5