• Яндекс открывает технологию машинного обучения CatBoost

      Сегодня Яндекс выложил в open source собственную библиотеку CatBoost, разработанную с учетом многолетнего опыта компании в области машинного обучения. С ее помощью можно эффективно обучать модели на разнородных данных, в том числе таких, которые трудно представить в виде чисел (например, виды облаков или категории товаров). Исходный код, документация, бенчмарки и необходимые инструменты уже опубликованы на GitHub под лицензией Apache 2.0.



      CatBoost – это новый метод машинного обучения, основанный на градиентном бустинге. Он внедряется в Яндексе для решения задач ранжирования, предсказания и построения рекомендаций. Более того, он уже применяется в рамках сотрудничества с Европейской организацией по ядерным исследованиям (CERN) и промышленными клиентами Yandex Data Factory. Так чем же CatBoost отличается от других открытых аналогов? Почему бустинг, а не метод нейронных сетей? Как эта технология связана с уже известным Матрикснетом? И причем здесь котики? Сегодня мы ответим на все эти вопросы.

      Читать дальше →
    • Приложение для управления контекстным меню Windows

        Для собственного удобства разработал в свободное время программку для управления контекстным меню Windows.

        ifolder.ru/18876186
        По ссылке лежит исходник, инсталлер и скомпиленый exe'шник.

        Проверено на: Winwows Vista/7/Server 2008/Server 2008 R2

        Дополнительная информация
      • 3D-модель рибосомы на атомном уровне

          Нобелевская премия 2009 по химии


          Исследования функций и структуры рибосом.
          Венкатраман Рамакришнан (Venkatraman Ramakrishnan), США; Томас Стейц (Thomas Steitz), США; Ада Йонат (Ada Yonath), Израиль.

          Как известно, структура любого организма запрограммирована изначально в генетическом коде и сохраняется в ДНК. По этой программе (после её копирования в РНК) происходит производство каждой молекулы нашего организма. Непосредственно компиляцией протеинов занимаются рибосомы — своеобразные роботизированные мини-фабрики, которые присутствуют в каждой клетке. До XXI века наука не знала подробностей этого процесса, но он стал гораздо понятнее благодаря работе, которую нынешние нобелевские лауреаты практически параллельно выполнили и опубликовали в 2000 году. Они в малейших деталях засняли рибосому с помощью крио-электронного микроскопа и составили функциональную 3D-карту этого органоида. За что и получили Нобелевскую премию по химии 2009 года.


          Читать дальше →
        • Как живется Data Mining компании: задачи и исследования

            Привет, Хабр!

            Наконец дошли руки Пришло время рассказать, чем занимается наша компания DM Labs в области анализа данных, помимо образовательной деятельности (о ней мы уже писали 1).

            За прошлый год мы начали плотно сотрудничать с институтом роботехники fortiss при Техническом университете Мюнхена (TUM) (совместно учим роботов не убивать людей), выпустили прототип антифрод системы, участвовали в международных конференциях по машинному обучению, и, самое главное, смогли сформировать сильную команду аналитиков.

            Теперь DM Labs объединяет в себе уже три направления: исследовательскую лабораторию, разработку готовых коммерческих решений и обучение. В сегодняшнем посте мы расскажем о них подробнее, подведем итоги прошедшего года и поделимся целями на будущее.
            Читать дальше →
          • Частые ошибки программирования на Bash

            • Translation
            Качество скриптов, используемых для автоматизации и оптимизации работы системы, является залогом ее стабильности и долголетия, а также сохраняет время и нервы администратора этой системы. Несмотря на кажущуюся примитивность bash как языка программирования, он полон подводных камней и хитрых течений, способных значительно подпортить настроение как разработчику, так и администратору.

            Большинство имеющихся руководств посвящено тому, как надо писать. Я же расскажу о том, как писать НЕ надо :-)

            Данный текст является вольным переводом вики-страницы «Bash pitfalls» по состоянию на 13 декабря 2008 года. В силу викиобразности исходника, этот перевод может отличаться от оригинала. Поскольку объем текста слишком велик для публикации целиком, он будет публиковаться частями.

            Поехали!
          • Болee 40 онлайн-курсов от Coursera и Udacity

              Сегодня проект Coursera, о котором на хабре уже неоднократно писали, наконец перешел из статуса беты в полностью рабочий. И переход этот можно назвать, мягко говоря, успешным — к уже заявленным и частично идущим 16 курсам от Stanford и Berkley и 1 курсу от Michigan добавились 12 курсов от Penn (Философия, Литература, Экономика, Медицина), 6 от Michigan (Литература, Экономика, Право) и 8 от Princeton (История, Математика, Computer Science).

              Похоже, то, что обещали в прошлом году, наконец происходит на наших глазах — университетское образование всех областей становится доступно всем и каждому. Теперь любой может в свободное время изучить под руководством виднейших профессоров области узнать то, что давно собирался, но не хватало самодисциплины, знаний или просто самих материалов — принципы работы вакцин, теорию игр или особенности социальных сетей. Будущее всеобщего образования наступает, и оно прекрасно.



              Ну и после такого оптимистичного вступления — собственно сами курсы. Для большинства известны продолжительность и дата начала, так что можно уже заранее спланировать время. Поехали:

              Читать дальше →
            • HOWTO: свой бизнес в США из России

                  Наверняка многие из нас хоть раз думали про себя: «Черт побери, и везет же этим американцам!». Это касается многого, от магазинов с доставкой «только в пределах 48 континентальных штатов» до вполне серьезных контрактов, которые срываются только потому, что потенциальный заказчик в США категорически не желает иметь дело с иностранцами.

                  В этой статье я попробую осветить процесс создания и администрирования американской корпорации для резидента РФ. Наверняка многие из фактов для самих американцев покажутся тривиальными, однако для жителя России все куда сложнее — увы, это данность. Чтоб не сказать — это Родина, сынок. Оговорюсь сразу — я все это проделал более 2 лет назад, так что, некоторые детали могут быть не совсем актуальны. Но вряд ли что-то поменялось принципиально.
              Читать дальше →
            • Бизнес в США из России. Часть III. Бухучет и налоги

                Ну вот дошли руки до следующей части.
                Сегоня расскажу что знаю про американский бухучет применительно к к нашей alien`ской конторе и налоги.

                Это продолжение топиков HOWTO: свой бизнес в США из России,
                и Бизнес в США из России. Часть II. Деньги и банки.
                Читать дальше →
              • Советы себе в прошлом

                  У меня очень мало опыта (суммарно программистом я проработал 16 месяцев), тем не менее, я хотел бы дать несколько советов себе-в-прошлом, ну, или иными словами всем тем, кто сейчас учится в университете и планирует стать разработчиком ПО. Ни в коей мере не претендую на мудрость или опытность. Немного подумав, я понял, что все эти советы как никогда актуальны для меня и сегодня тоже. Первую заметку я опубликовал в своем блоге в прошлом году, а сейчас публикую здесь список, расширенный советами читателей блога.

                  Все советы автономны и их порядок не имеет значения.
                  Читать дальше →
                • Решение проблемы чтения книг в форматах DjVu и PDF на читалках с маленькими экранами

                  Ни для кого не секрет, что многие модели читалок то ли по причине недостатка мощности процессора, то ли по причине лени прошивкописателей не умеют нормально работать с книгами в формате PDF и DJVU. Алгоритм reflow часто ведёт себя неадекватно, а часто вообще доступна лишь возможность дискретного масштабирования, толку от которой немного — в абсолютном большинстве случаев либо увеличивает недостаточно, либо наоборот появляется горизонтальная прокрутка, что уже вообще никуда не годится. Также нередки проявления артефактов интерполяции и искажение пропорций. К тому же, DJVU в принципе не поддерживается многими устройствами, в частности, насколько я знаю, Kindle по умолчанию не умеет с ним работать. В то же время, большая часть литературы (по крайней мере, технической) как в легальных источниках, так и в альтернативных предлагается именно в PDF и DJVU.

                  Узнать, что можно сделать
                • Учимся писать userscript'ы

                  Доброго времени суток всем желающим приобщиться к миру пользовательских скриптов (они же userscript, userJS, юзерскрипты).

                  В этой статье я хочу поведать о том, что такое юзерскрипты, c чем их едят и, главное, как их готовят!

                  Внимание: предполагается минимальное знание javascript.
                  На практике доказано: юзерскрипты может писать человек, не знакомый с программированием, но обладающий усидчивостью и желанием изучить javascript!
                  О том, что такое javascript и как с ним обращаться, можно узнать на javascript.ru.
                  Поехали!
                • 10 бесценных жизненных советов, которые дает нам Альберт Эйнштейн

                  • Translation
                  Интересная на мой взгляд статья, которая показывает, что одни и те же принципы никогда не устаревают. Конечно, все они уже часто проскакивали в той или иной форме на множестве ресурсов, но мне бы хотелось предложить вам их видение Ученым с большой буквы, Альбертом Эйнштейном.
                  Читать дальше →
                • Какое время — деньги?

                    Забавная статья была буквально недавно опубликована на Хабре: «100 долларов в час».
                    Статья, по-моему, является незнанием или непониманием автора базовых экономических принципов, забывая про которые, он выстраивает свою теорию.

                    Несостоятельность теории


                    Судя по тексту статьи автор априори считает, что время на отдых и досуг — это буквально время фактически потраченное зря. Хотя он аккуратно вырезает это из общей теории, говоря о том, что такие «высокие материи» не могут оцениваться в денежном эквиваленте.
                    Вообще если продолжить развивать цепь софизмов автора, приведенных им в статье, то можно без труда придти и к выводу, что чувства и эмоции человека — это неврологические рудименты. Венцом же человеческой эволюции станут киборги.

                    Это было бы забавно и даже весело, если бы статья не претендовала на изложение серьезной жизненной позиции, с попыткой ее вполне реального экономического обоснования.

                    Статья сопровождается множеством остроумных комментариев от читателей. Но давайте попробуем разобрать данную теорию, прагматично и всерьез, ведь проблема «оценки времени» очень часто поднимается как здесь, так и в быту
                    Читать дальше →