• [Обновлено в 10:52, 14.12.19] В офисе Nginx прошел обыск. Копейко: «Nginx был разработан Сысоевым самостоятельно»

      Другие материалы по теме:


      Eng version
      Что значит наезд на Nginx и как это отразится на индустрииdeniskin
      Open source — наше всё. Позиция Яндекса по ситуации с Nginxbobuk
      Официальная позиция Программных комитетов Highload++ и других IT-конференций на претензии к Игорю Сысоевуolegbunin


      По информации от одного из сотрудников, в московском офисе опенсорс-разработчиков Nginx проводят обыски в рамках уголовного дела, истцом по которому выступает Рамблер (ниже официальный ответ пресс-службы компании по этому вопросу и подтверждение наличия претензий к Nginx). В качестве доказательств приводится фото постановления о производстве обыска в рамках уголовного дела, возбужденного 4 декабря 2019 года по статье 146 УК РФ «Нарушение авторских и смежных прав».

      Фото постановления о производстве обыска


      Как предполагается, истцом выступает компания Рамблер, а ответчиком пока «неустановленная группа лиц», а в перспективе — основатель Nginx Игорь Сысоев.

      Суть претензии: Игорь начал работу над Nginx, будучи сотрудником Рамблера, а только после того, как инструмент стал популярен, основал отдельную компанию и привлек инвестиции.

      Почему Рамблер вспомнил о своей «собственности» только спустя 15 лет — неясно.
      Читать дальше →
    • Y-метод — действительно простой способ собрать кубик Рубика

      • Tutorial

      Введение


      В статье рассматривается «Y-метод» сборки кубика Рубика — его легко понять и запомнить. Он основан всего на одной последовательности, которая называется «Y-движение». Поняв этот алгоритм, вы навряд ли забудете как собрать кубик самостоятельно.
      Читать дальше →
    • Как я решал соревнование по машинному обучению data-like


        Привет, Хабр. Недавно прошло соревнование от Тинькофф и McKinsey. Конкурс проходил в два этапа: первый — отборочный, в kaggle формате, т.е. отсылаешь предсказания — получаешь оценку качества предсказания; побеждает тот, у кого лучше оценка. Второй — онсайт хакатон в Москве, на который проходит топ 20 команд первого этапа. В этой статье я расскажу об отборочном этапе, где мне удалось занять первое место и выиграть макбук. Команда на лидерборде называлась "дети Лёши".


        Соревнование проходило с 19 сентября до 12 октября. Я начал решать ровно за неделю до конца и решал почти фулл-тайм.


        Краткое описание соревнования:


        Летом в банковском приложении Тинькофф появились stories (как в Instagram). На story можно отреагировать лайком, дизлайком, скипнуть или просмотреть до конца. Задача предсказать реакцию пользователя на story.


        Соревнование по большей части табличное, но в самих историях есть текст и картинки.

        Читать дальше →
        • +25
        • 9.5k
        • 4
      • 56 проектов на Python с открытым исходным кодом

        • Translation
        image

        1. Flask


        Это микро-фреймворк, написанный на Python. Он не имеет валидаций для форм и уровня абстракции базы данных, но позволяет вам использовать сторонние библиотеки для общих функций. И именно поэтому это микро-фреймворк. Flask предназначен для простого и быстрого создания приложений, а также является масштабируемым и легким. Он основан на проектах Werkzeug и Jinja2. Вы можете узнать больше о нем в последней статье DataFlair о Python Flask.

        2. Keras


        Keras — нейросетевая библиотека с открытым исходным кодом, написанная на Python. Она удобна для пользователя, модульная и расширяемая, а так же может работать поверх TensorFlow, Theano, PlaidML или Microsoft Cognitive Toolkit (CNTK). В Keras есть все: шаблоны, целевые и передаточные функции, оптимизаторы и многое другое. Он также поддерживает сверточные и рекуррентные нейронные сети.

        Работа над последним проектом с открытым исходным кодом на основе Keras — Классификация рака молочной железы.
        Читать дальше →
      • Бег — идеальный спорт для удаленщика. Часть 2: физика и матчасть



          Первая часть статьи, рассказывающая о моем пути к бегу и призванная мотивировать других удалённых айтишников хотя бы попробовать этот вид спорта, нашла живой отклик у сообщества. В комментариях к ней развернулась активная дискуссия, в которой, помимо прочего, было затронуто немало актуальных вопросов и написано много дельных замечаний. Попробую агрегировать полученную обратную связь во второй части статьи. Хочу предупредить сразу, что здесь уже будет больше технических вещей, чем лирики.

          Итак, что даёт нам бег?
          Читать дальше →
        • Книга «Знакомство с PyTorch: глубокое обучение при обработке естественного языка»

            image Привет, Хаброжители! Обработка текстов на естественном языке (Natural Language Processing, NLP) — крайне важная задача в области искусственного интеллекта. Успешная реализация делает возможными такие продукты, как Alexa от Amazon и Google Translate. Эта книга поможет вам изучить PyTorch — библиотеку глубокого обучения для языка Python — один из ведущих инструментов для дата-сайентистов и разработчиков ПО, занимающихся NLP. Делип Рао и Брайан Макмахан введут вас в курс дел с NLP и алгоритмами глубокого обучения. И покажут, как PyTorch позволяет реализовать приложения, использующие анализ текста.

            В этой книге • Вычислительные графы и парадигма обучения с учителем. • Основы оптимизированной библиотеки PyTorch для работы с тензорами. • Обзор традиционных понятий и методов NLP. • Упреждающие нейронные сети (многослойный перцептрон и другие). • Улучшение RNN при помощи долгой краткосрочной памяти (LSTM) и управляемых рекуррентных блоков • Предсказание и модели преобразования последовательностей. • Паттерны проектирования NLP-систем, используемых в продакшене.
            Читать дальше →
            • +11
            • 2.7k
            • 4
          • AsyncIO для практикующего python-разработчика

            • Translation
            • Tutorial
            Я помню тот момент, когда подумал «Как же медленно всё работает, что если я распараллелю вызовы?», а спустя 3 дня, взглянув на код, ничего не мог понять в жуткой каше из потоков, синхронизаторов и функций обратного вызова.

            Тогда я познакомился с asyncio, и всё изменилось.
            Читать дальше →
          • «Глубокое обучение с подкреплением. AlphaGo и другие технологии»: анонс книги

            • Translation
            Всем привет!

            У нас доступна для предзаказа одна из лучших книг по обучению с подкреплением, в оригинале именуемая "Deep Reinforcement Learning Hands-on" под авторством Максима Лапаня. Вот как будет выглядеть обложка русского перевода:



            Чтобы вы могли оценить краткое содержание книги, предлагаем вам перевод обзора, написанного автором к выходу оригинала.
            Читать дальше →
            • +12
            • 3.4k
            • 6
          • DeepPavlov для разработчиков: #1 инструменты NLP и создания чат-ботов

              Всем привет! Мы открываем цикл статей, посвященных решению практических задач, связанных с обработкой естественного языка (Natural Language Processing или просто NLP) и созданием диалоговых агентов (чат-ботов) с помощью open-source библиотеки DeepPavlov, которую разрабатывает наша команда лаборатории Нейронных систем и глубокого обучения МФТИ. Главная цель цикла — познакомить широкий круг разработчиков с DeepPavlov и показать, как можно решать прикладные задачи NLP, не обладая при этом глубокими познаниями в Machine Learning и PhD in Mathematics.

              К NLP задачам относят определение тональности текста, парсинг именованных сущностей, определение того, что хочет от вашего бота собеседник: заказать пиццу или получить справочную информацию и многое другое. Более подробно про задачи и методы NLP вы можете прочитать тут.

              В этой статье мы расскажем, как запустить REST север с предобученными моделями NLP, готовыми к использованию без какой-либо дополнительной настройки или обучения.

              Все статьи цикла:
              1. DeepPavlov для разработчиков: #1 инструменты NLP и создания чат-ботов
              2. DeepPavlov для разработчиков: #2 настройка и деплоймент


              Читать дальше →
            • Книга «Эгоистичная митохондрия. Как сохранить здоровье и отодвинуть старость»

                image Мечта любого человека — оставаться молодым как можно дольше. Мы не хотим стареть и болеть, боимся всего — рака, болезни Альцгеймера, инфаркта, инсульта… Пора разобраться, откуда берется рак, есть ли связь между сердечной недостаточностью и болезнью Альцгеймера, бесплодием и потерей слуха. Почему антиоксидантные добавки иногда приносят больше вреда, чем пользы? И главное: можем ли мы жить долго и без болезней, и если да, то как?

                В нашем организме работают крошечные «энергетические станции» — митохондрии. Именно они отвечают за наше здоровье и отличное самочувствие. Когда они работают хорошо, мы не испытываем недостатка в энергии. А когда плохо — страдаем от заболеваний. Доктор Ли Ноу открывает тайну: заболевания, которые кажутся не связанными между собой на первый взгляд: диабет, рак, шизофрения, хроническая усталость, болезнь Паркинсона и другие — имеют общую природу.

                Сегодня нам известно, как улучшить работу митохондрий, обеспечивающих организм энергией на 90 %. В этой книге вас ждет актуальная информация о питании, образе жизни, кетогенной диете и добавках, которые возвращают здоровье митохондриям, а следовательно, и нам.
                Читать дальше →
              • Суперинфекции 2: рубикон проблем, фиаско технологий и новая надежда


                  (c) Phage therapy

                  Прошел 91 год со дня открытия пенициллина — первого препарата, совершившего революцию в эффективности лечения бактериальных заболеваний.

                  За почти век существования антибактериальных препаратов многие болезни практически забылись. Так, с 1947 г. считается, что Yersinia pestis, чумную бактерию, виновницу смерти 150 млн человек, удалось победить. И главным средством первого этапа лечения стали антибиотики.

                  Однако из-за роста вероятности возвращения забытых и появления новых инфекционных заболеваний Всемирная организация здравоохранения в последнее десятилетие бьет в набат. Причинами катастрофы стали халатность, глупость и эволюция. Скоро даже обычный порез на пальце может закончиться смертью. Но на подходе новые методы борьбы.
                  Читать дальше →
                • Задача: извлечь ключевые выражения из текста на русском языке. NLP на Python

                  Что было нужно в самом начале:

                  • программа, «выуживающая» из сырого текста на русском языке уникальные названия продукции по определенной отрасли. Сырой текст — текст, который писал человек, просто излагая свои мысли и не заботясь о формировании или выделении какого-либо списка слов;
                  • автоматически получаемый список слов;
                  • минимальная ручная или автоматизированная обработка для преобразования списка в набор хештегов или ключевых слов к тексту.

                  Полагаю, что неявно с проблемой многие сталкиваются ежедневно, после написания или анализа статьи, поста, комментария, заметки, отчета и т.д. Вот и мне по роду деятельности приходилось сталкиваться с данной проблемой по многу раз в день. Поэтому, можно сказать, к идее автоматизации меня привела «лень», в хорошем смысле этого слова.

                  Сейчас, когда я пишу эту статью, сохранилась идея, но набор данных конечного результата сильно изменился:

                  • выбираются не слова, а ключевые выражения и в том числе слова;
                  • список ключевых выражений размечен 16-ю различными маркерами;
                  • все слова текста (в том числе и не ключевые) лемматизированы – приведены в начальную форму или унифицированы под выведенный формат;
                  • каждое слово в тексте имеет дополнительную аналитику, относящуюся к положению по тексту и числу повторений.

                  Результаты работы ПО nrlpk (Natural Russian Language Processing by the Keys) подготавливают данные для:

                  • анализа текстов неограниченного круга тематик и отраслей (разработка и тестирование проводилось по материалам тематики промышленности и ВПК — Военно-Промышленного Комплекса);
                  • автоматической рубрикации, классификации, каталогизации, предметизации материалов (online площадки);
                  • контроля и фильтрации по содержимому с настройками реакции системы (службам и системам безопасности в замкнутых контурах или online);
                  • многослойной разметки текстов (ИИ).

                  Качество

                  Открыть полный текст
                • BudgetTracker — ещё один open-source инструмент для личного учета финансов

                    Почему?


                    Несколько лет назад я заинтересовался получением пассивного дохода и решил попробовать инвестировать с помощью p2b-площадок. Через некоторое время стало заметно, что денежные средства оказались очень сильно фрагментированы по площадкам, банкам, долгам, и это затрудняло понимание ситуации. Я не мог ответить на два самых главных вопроса:
                    Сколько у меня денег?


                    Какой тренд? Я богатею, или беднею?


                    КДПВ

                    image

                    Читать дальше →
                  • GitHub запускает свои щупальца в CI/CD и менеджмент артефактов

                      В мае 2019 года GitHub анонсировала выход сервиса Package Registry. Вслед за этим, уже в августе, была анонсирована поддержка CI/CD в Actions.


                      В статье я расскажу, что это за сервисы и как это можно использовать на примере небольшого пет-проекта на GitHub.


                      Читать дальше →
                      • +50
                      • 11.5k
                      • 4
                    • Must-have алгоритмы машинного обучения

                      • Translation
                      Хабр, привет.

                      Этот пост — краткий обзор общих алгоритмов машинного обучения. К каждому прилагается краткое описание, гайды и полезные ссылки.

                      Метод главных компонент (PCA)/SVD


                      Это один из основных алгоритмов машинного обучения. Позволяет уменьшить размерность данных, потеряв наименьшее количество информации. Применяется во многих областях, таких как распознавание объектов, компьютерное зрение, сжатие данных и т. п. Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных или к сингулярному разложению матрицы данных.

                      image

                      SVD — это способ вычисления упорядоченных компонентов.

                      Полезные ссылки:


                      Вводный гайд:

                      Читать дальше →
                      • +24
                      • 15k
                      • 6
                    • Intel Nervana NNP-T и NNP-I — специализированные чипы для AI



                        Осознавая важность работ в области искусственного разума, Intel делает еще один шаг в этом направлении. Месяц назад на конференции Hot Chips 2019 компания официально представила два специализированных чипа, предназначенных для тренировки и инференса нейронных сетей. Чипы получили наименования соответственно Intel Nervana NNP-T (Neural Network Processor) и Intel Nervana NNP-I. Под катом вы найдете характеристики и схемы новых продуктов.
                        Читать дальше →
                      • Чему я научился у ведущего программиста

                        • Translation

                        Год назад я начал работать на полную ставку в Bloomberg. И тогда же задумал написать эту статью. Я думал, что буду полон идей, которые смогу выплеснуть на бумагу, когда придёт время. Но уже через месяц понял, что всё будет не так просто: я уже начал забывать то, чему научился. Либо знания настолько хорошо усвоились, что мой разум заставил меня поверить, будто я всегда это знал, либо они просто вылетели у меня из головы.1

                        Это одна из причин, по которой я начал вести дневник. Каждый день, попадая в интересные ситуации, я описывал их. И всё благодаря тому, что я сидел рядом с ведущим программистом. Я мог вблизи наблюдать за его работой, и видел, насколько она отличается от того, что сделал бы я. Мы много программировали вместе, что ещё больше облегчало мои наблюдения. Более того, в нашей команде не осуждается «подглядывание» за людьми, пишущими код. Когда мне казалось, что происходит что-то интересное, я поворачивался и смотрел. Благодаря постоянным вставаниям я всегда был в курсе происходящего.

                        Я год просидел рядом с ведущим программистом. Вот чему я научился.
                        Читать дальше →
                      • Синтаксический разбор предложения русского языка

                        В данной статье описывается процесс синтаксического анализа предложения русского языка с использованием контекстно-свободной грамматики и алгоритма LR-анализа.

                        Обработка естественного языка — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза естественных языков.

                        В общем, процесс анализа предложения естественного языка выглядит следующим образом: (1) разбиение предложения на синтаксические единицы — слова и словосочетания; (2) определение грамматических параметров каждой единицы; (3) определение синтаксической связи между единицами. На выходе — абстрактное дерево разбора.
                        Читать дальше →
                      • Сравнение потребления памяти различных GUI тулкитов

                        • Translation


                        Всем привет! Наша команда разрабатывает IDE для работы с API TestMace. В одной из наших предыдущих статей читатели указывали на непомерно большое потребление памяти electron-приложений. Что ж, настало время цифр :) В данной статье автор оценивает потребление памяти однооконных приложений, написанных с использованием различных тулкитов. Приятного чтения!


                        Находясь в поисках идеального набора инструментов для создания GUI, я решил измерить объём занимаемой ими памяти.


                        По сути, я хотел выяснить, какой из них требует наименьшее количество памяти для программы, состоящей из одного пустого окна. В этой статье я расскажу о полученных результатах.


                        Читать дальше →
                      • За кулисами EuroSTAR. Или взгляд на организацию конференции со стороны председателя программного комитета Майкла Болтона

                        От авторов перевода


                        В преддверии конференции SQA Days 14 (которая в этом году пройдет в культурной столице Украины, в городе Львове) хотелось бы поделиться информацией которая призвана помочь потенциальным докладчикам сделать превосходные доклады, улучшить качество и облегчить работу программных комитетов многих конференций. В этой статье Майкл Болтон делится опытом и взглядом со стороны программного комитета самой передовой конференции в области тестирования и обеспечения качества — EuroSTAR на процесс приема и оценки докладов. Эта статья будет также полезна тем кто видит себя в будущем докладчиком и стремится выступать на конференциях. В процессе перевода мы старались сделать тест максимально понятным и адаптированным к актуальным условиям выступлений на конференциях которые проходят на просторе СНГ. Желаю вам приятного изучения данной статьи и удачи на выступлениях.

                        Вступление


                        Когда почти 300 человек соревнуются менее чем за 60 мест и за возможность выступить на такой конференции как EuroSTAR, не удивительно, что многие подавшие доклады, могут быть разочарованы отказом. С тех пор, как программа EuroSTAR 2013 была анонсирована, некоторые потенциальные докладчики просили обратную связь относительно своих заявок на выступление. И тем, кто обратился, я обязательно предоставляю эту информацию в индивидуальном порядке. Но, в начале хотелось бы дать несколько рекомендаций по подаче успешных докладов, основанных на моем опыте как председателя программного комитета в этом году.
                        Будь то доклад на конференции, семинар, либо мастер-класс (назовем это выступлением) — все это является информационным продуктом. Предложение такого продукта — это реклама, что-то вроде технического описания, которое помогает убедить потенциального покупателя в ценности программы. Хороший рекламный материал завоевывает и удерживает внимание потенциального слушателя, в данном случае — внимание программного комитета. Ваша заявка покажется лучше, если она описывает уникальное и убедительное выступление, определяет его пользу и не включает негативных факторов, которые могут повлиять на его ценность.

                        Читать дальше →