• 8 лекций, которые помогут разобраться в машинном обучении и нейросетях




      Мы собрали интересные лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться. Первая лекция рассчитана скорее на тех, кто вообще не понимает, как работает machine learning, в остальных много интересных кейсов.
      Читать дальше →
      • +43
      • 79.2k
      • 5
    • Легенда об искушении: как использовать Python для автоматизации iOS



        Часто нам приходится совершать со своим iPhone монотонные и довольно скучные манипуляции, которые заставляют нас с завистью смотреть на десктопы с их безграничными возможностями настройки, скриптинга и автоматизации действий. Да что там десктопы — даже на пользователей Android с их вездесущим Tasker’ом, с помощью которого можно запрограммировать смартфон на что угодно. В iOS существование подобных приложений невозможно, но у нас есть небольшая лазейка.

        В этой статье я хочу рассказать о Pythonista — среде разработки на языке Python (версии 2.7.5) для iOS, которая позволяет в том числе писать полноценные приложения с графическим интерфейсом. Однако мы будем использовать ее для несколько иных целей — для создания простых подсобных скриптов, которые будут автоматизировать рутинные операции.
        Читать дальше →
        • +14
        • 21.5k
        • 2
      • Я тебя по сетям вычислю: используем API крупнейших соцсетей в своих корыстных целях



          Ни для кого не секрет, что современные социальные сети представляют собой огромные БД, содержащие много интересной информации о частной жизни своих пользователей. Через веб-морду особо много данных не вытянешь, но ведь у каждой сети есть свой API… Так давай же посмотрим, как этим можно воспользоваться для поиска пользователей и сбора информации о них.

          Есть в американской разведке такая дисциплина, как OSINT (Open source intelligence), которая отвечает за поиск, сбор и выбор информации из общедоступных источников. К одному из крупнейших поставщиков общедоступной информации можно отнести социальные сети. Ведь практически у каждого из нас есть учетка (а у кого-то и не одна) в одной или нескольких соцсетях. Тут мы делимся своими новостями, личными фотографиями, вкусами (например, лайкая что-то или вступая в какую-либо группу), кругом своих знакомств. Причем делаем это по своей доброй воле и практически совершенно не задумываемся о возможных последствиях. На страницах журнала уже не раз рассматривали, как можно с помощью различных уловок вытаскивать из соцсетей интересные данные. Обычно для этого нужно было вручную совершить какие-то манипуляции. Но для успешной разведки логичнее воспользоваться специальными утилитами. Существует несколько open source утилит, позволяющих вытаскивать информацию о пользователях из соцсетей.
          Читать дальше →
        • NAS + SoftetherVPN = универсальный VPN сервер

            Думаю не ошибусь, если предположу, что у любого пользователя периодически возникает необходимость получить доступ к какому-либо сетевому ресурсу (IP-камере, сетевому накопителю, компьютеру, холодильнику и т.п.) внутри домашней или офисной сети через Интернет. Ну и само собой этот доступ должен быть:
            А) универсальный, т. е. с любого компьютера или гаджета;
            Б) защищенный от несанкционированного доступа нежелательных лиц.

            Вариантов достаточно много, но некоторые недоступны по причине недостаточной квалификации пользователя, некоторые не соответствуют приведенным двум пунктам, некоторые выходят слишком дорого… В общем перечислять «НО» можно долго.

            Наиболее подходящей для требуемого технологией был, есть и еще долгое время будет VPN. Но с VPN тоже возникает много вопросов: криптоустойчивость, взломозащищенность, мультиплатформенность клиентов, хватит ли вам знаний для установки и настройки серверной части и т. д.


            Читать дальше →
          • Реализация некоторых задач для самосборного NAS

            Привет, Хабр. Наконец-то я созрел для того, чтобы собрать своё собственное сетевое хранилище. Цели и задачи простые — скачивание торрентов, раздача контента по DLNA на IPTV-приставку MAG-245, iPad Mini первого поколения и смартфон на ОС Windows Phone. С учетом того, что необходимая база у меня уже была, а именно — материнская плата Intel D425KT форм-фактора mini-ITX с встроенным двухъядерным процессором Atom с пассивным охлаждением; 2 гигабайта ноутбучной оперативной памяти, и ноутбучный же HDD Seagate 750Gb. Докупил только корпус 3Cott M01, в комплекте с которым шел блок питания ноутбучного типа и адаптер для него.
            Читать дальше →
            • +10
            • 21.6k
            • 1
          • 300 потрясающих бесплатных сервисов

            • Translation


            Автор оригинальной статьи Ali Mese добавил ещё 100 новых бесплатных сервисов. Все 400 потрясающих сервисов доступны здесь. И еще подборку +500 инструментов от 10 марта 2017 г. смотрите здесь.



            A. Бесплатные Веб-Сайты + Логотипы + Хостинг + Выставление Счета

            • HTML5 UP: Адаптивные шаблоны HTML5 и CSS3.
            • Bootswatch: Бесплатные темы для Bootstrap.
            • Templated: Коллекция 845 бесплатных шаблонов CSS и HTML5.
            • Wordpress.org | Wordpress.com: Бесплатное создание веб-сайта.
            • Strikingly.com Domain: Конструктор веб-сайтов.
            • Logaster: Онлайн генератор логотипов и элементов фирменного стиля (new).
            • Withoomph: Мгновенное создание логотипов (англ.).
            • Hipster Logo Generator: Генератор хипстерских логотипов.
            • Squarespace Free Logo: Можно скачать бесплатную версию в маленьком разрешении.
            • Invoice to me: Бесплатный генератор счета.
            • Free Invoice Generator: Альтернативный бесплатный генератор счета.
            • Slimvoice: Невероятно простой счет.

            Читать дальше →
          • Скрипты в Google spreadsheets

              image

              Не так давно стал доступен сервис скриптов в таблицах Google для персональных аккаунтов (gmail).
              googledocs.blogspot.com/2010/03/apps-script-gallery-for-google.html
              Краткое описание
              www.google.com/google-d-s/scripts/scripts.html
              Кроме этого, непосредственно из таблиц стал доступен сервис публикации скриптов в галерею.

              Теперь мы можем создавать скрипты для Google Spreadsheets, загружать готовые, публиковать, обмениваться с другими пользователями.
              Скрипты имеют богатый набор возможностей. Мы можем использовать всё управление, доступное в сервисах Google.
              www.google.com/google-d-s/scripts/overview.html

              Результатом работы скрипта, например, могут быть:
              • новая функция, отсутствующая в стандартном наборе;
              • значение, возвращаемое веб сервисом, в том числе, SOAP, WSDL и другие;
              • управление другими сервисами, например, сайтом, календарем, почтовой рассылкой;
              • автоматическое заполнение таблиц (непосредственное управление нашими spreadsheets);
              • создание пользовательских интерфейсов (custom spreadsheets UI).

              Примеры созданных скриптов для применения в неогеографии
              Читать дальше →
            • Мои вторые уши

                Ну вот и схлынула волна публикаций про наушники… А я про свои Sennheiser CX 300-II так и не рассказал. Пора исправлять свою оплошность, тем более, очень сложно найти вторые такие же наушники по соотношению цена/качество. В общем, если вам нужны компактные наушники с хорошим звуком за приемлемую цену, то милости прошу под хабракат.

                image
                Читать дальше →
              • Секреты Гуглономики, часть 2

                  Это продолжение статьи "Секреты Гуглономики".

                  Самофокусирование на инженерных моментах, математических формулах и дата-майнинге сделало из Google компанию совершенно нового типа. Но для того чтобы полностью понять почему, стоит вернутся немного назад и заглянуть под крышу AdWords.

                  Большинство людей считает, что рекламный аукцион Google – это очень «прямолинейный» инструмент. Но на самом деле, есть еще один ключевой момент, о котором знает не то что меньшинство пользователей самой системы, но даже далеко не все опытные рекламщики догадываются о его существовании. Ставки сами по себе являются лишь частью системы, определяющей победителя аукциона. Другим, пожалуй самым важным фактором, определяющим победителя аукциона является т.н. «показатель качества» (the quality score). Эта величина создана для того, чтобы определить является ли реклама, которую показывает пользователям, в точности подходящей под ее описания и требования к ней, т.е. грубо говоря определяет «истинность» того или иного рекламного сообщения. Ибо если нет, то страдает вся система и компания, в итоге, получает меньше денег.

                  Показатель качества вычисляется на основе множества других показателей, включая релевантность рекламы ключевым словам, качеству страницы на которую ведет рекламная ссылка, и, прежде всего, процент уникальных кликов по рекламному блоку, когда он появляется на конечной странице (очевидно, что есть и другие факторы, но Google никогда не будет их обсуждать по понятным причинам). К тому же есть и механизм «наказания» рекламодателей в том случае, если качество рекламы ниже среднего уровня – в таких случаях компания автоматически назначает рекламодателю минимальную ставку. В Google объясняют, что подобная тактика, вынесенная на суд общественности множеством компаний и частных лиц, которых автоматически «занизили», защищает пользователей от нерелевантной или раздражающей рекламы, которые порочат имя контекстной рекламы или оплачиваемых ссылок в целом. Уже даже успело пройти несколько судебных дел от лиц, которые заявляли что стали жертвами произвола в условиях квази-монополии.
                  Читать дальше →
                • Секреты Гуглономики

                    image
                    Посреди финансового апокалипсиса, отцы и гуру глобального рынка в самом широком смысле слова, собрались вместе в конференц-зале отеля Hilton, расположенного в Сан-Франциско, для ежегодной встречи Американской Экономической Ассоциации (American Economics Assosiation). Можно представить себе атмосферу подобной встречи, но, как ни странно, человек которого все так ждут не будет говорить о токсических выхлопах, инвестициях или уровне безработицы.

                    «Я хочу рассказать вам об онлайн-аукционах» — говорит Хал Вариан (Hal Varian), первый на подиуме с микрофоном в руках. Вариану 62 года и он профессор в Школе Бизнеса и Школе Информации при университете Беркли, но сейчас этот человек куда более известен всему миру как главный экономист Google. И аудитория, сидящая перед ним, пришла не для того чтобы слушать об упадке кредитного мира – им всем куда более интересен рецепт приготовления секретного соуса Google.
                    Читать дальше →
                  • Крепкий орешек 4.0 скоро!

                      После долгой паузы Брюс Виллис возвращается в один из лучших боевиков «Крепкий орешек»! Предлагаю ознакомиться с международным трейлером. Весь фильм построен на использовании новых технологий во вред обществу) Помогает Брюсу мистер Мак из рекламы Apple в роли хакера. Трейлер ооочень впечатляет!
                    • Шоу UXtra — выпуск 1: интерфейсы мечты

                      • Translation
                      На днях в iTunes появилось новое шоу от создателей Метрики – UXtra. UXtra – англоязычный подкаст о пользовательских впечатлениях и интерфейсах, сервис-дизайне и бизнесе, созданный при участии компании UIDG и альянса юзабилити компаний UXalliance (мировой лидер в области изучения пользовательских впечатлений и интерфейсов). Специально для аудитории Хабра создатели подкаста подготовили его транскрипт на русском языке.


                      Читать дальше →
                    • Техническая сторона Bitcoin

                        В последние месяцы, пир-ту-пир валюта Bitcoin серьёзно выросла в популярности, в основном благодаря упоминаниям в прессе и вовлечению массовой аудитории. В то же время, среди эспертов, насколько я могу судить, распространены скептические оценки, вплоть до «Bitcoin is a scam». Я в прошлом разрабатывал и платежные системы и P2P-системы, и с криптографией приходилось работать. Поэтому я прочитал доступные источники и постарался рассмотреть технологию Bitcoin с технической точки зрения, по возможности взвешенно. Предлагаю вам краткий русский перевод материала.
                        Читать дальше →
                      • Bitcoin, генерируем монеты в общем пуле

                          Криптовалюта Bitcoin продолжает развиваться, сложность генерации блока повышается с каждым разом. Торги на биржах идут уже на весьма существенные суммы. А вот генерировать в одиночку становится почти нереально.
                          Сегодня речь пойдёт о генерации монет коллективно — в общем пуле. В этом случае приз за генерацию блока разделяется между всеми участниками пула примерно пропорционально вкладу в генерацию блока.
                          За счёт большой суммарной вычислительной мощности пула генерация блоков происходит намного чаще, чем если работать в одиночку, но и приз каждому участнику меньше. В долговременном среднем получается примерно столько же (минус процент владельца пула), но зато равномернее.

                          Что такое Bitcoin, и как оно работает на хабре уже есть статьи. А вот о генерации в общем пуле информация весьма разрозненна даже в его родной вики. В этой статье рассказывается о механизме работы пулов, имеющихся пулах, клиент-программах и некоторых результатах.

                          Термины, пулы, программы, результаты, рассчёты, выводы...
                        • Bitcoin. Как это работает

                            О Bitcoin я узнал относительно недавно, но он меня сразу подкупил своей идеей p2p. Чем глубже я зарывался в их Wiki, тем больше проникался этой идеей. Ее реализация красива и элегантна с технической точки зрения.

                            Поиск хабра по Bitcoin выдает два топика. Но это скорее новости. По комментариям заметно, что у многих людей, особенно не знакомых с Bitcoin напрямую, возникает много вопросов насчет принципов его работы. Также много догадок, зачастую неверных. Чтобы как-то прояснить ситуацию, было решено написать эту статью.
                            Читать дальше →
                          • Regexp и Python: извлечение токенов из текста

                            • Tutorial
                            imageРазбор логов и конфигурационных файлов — задача часто возникающая и многократно описанная. В этой статье я расскажу как на языке python реализовать ее классическое решение: с помощью регулярных выражений и именованных групп. По возможности постараюсь рассказать причины, по которым применяется то или иное решение, а также обрисовать подводные камни и методы их обхода.

                            Читать о том, как препарируют текст
                          • Что такое Хабрахабр?

                              Сегодня мы приготовили нечто особенное – выпуск Рунетологии с Денисом Крючковым, создателем Хабрахабра.

                              Не ждите откровений и раскрытия хабрасекретов. Программа интересна другим – впервые вы увидите, как Хабр видит его администрация. Какие у автора представления о собственном детище, каким бы он хотел его видеть, и как у Дениса складываются отношения с его вполне самостоятельным творением.

                              Ведь как и все социальные-медиа последних лет, Хабрахабр был создан случайно, рос помимо воли авторов и в общем стал тем, чего никто не ожидал. Это хорошо видно по программе — каждый раз, когда Крючков отвечает «не знаю, как-то так получилось».

                              Так что же вообще получилось? Коллективный блог? Новостной сайт? Социальное медиа? Социальная сеть? MMORPG?

                              Смотрите и решайте сами.



                              Напоминаем, что видеоверсия программы Рунетология выходит с лета 2010 года при поддержке компании StartupIndex. Все выпуски доступны на нашем сайте в специальном разделе.
                            • Интеграция сайта с Facebook через OpenGraph

                                Facebook OpenGraphВыменивая у агрегаторов контента (поисковых машин, социальных сетей и прочих сервисов) «продовольствие» на пользовательский трафик, издатель постоянно задается вопросом: не станет ли агрегатор основным источником информации для моего пользователя? Потерять свою идентичность в общей каше медиа-ресурсов, отдать результаты производства бесплатно и ничего не получить взамен — риски, которые зачастую сдерживают медиа-менеджеров в решении о максимальной публичности и открытости.

                                В этом смысле анонсированная Facebook поддержка OpenGraph кажется несколько провокационной. Технология позволяет сайтам экспортировать в социальную сеть профили всех объектов, которые они освещают – персоны, локации, товары, организации, произведения искусства и т.д. Пользователь, подписавшись на любой из этих объектов, сможет получать информационные сообщения в NewsFeed, увидит эти объекты в своих интересах и результатах поиска. Facebook предоставил удивительные возможности, но в то же время заставил серьезно задуматься о дальнейшей судьбе stand-alone media.

                                Sports.ru оказался первым российским сайтом, который ввязался в эту авантюру =) Какую задачу мы решаем с помощью OpenGraph и с какими проблемами столкнулись — в продолжении статьи об интеграции медийного проекта c социальной сетью.
                                Читать дальше →
                              • Декартово дерево: Часть 1. Описание, операции, применения

                                  Оглавление (на данный момент)


                                  Часть 1. Описание, операции, применения.
                                  Часть 2. Ценная информация в дереве и множественные операции с ней.
                                  Часть 3. Декартово дерево по неявному ключу.
                                  To be continued...

                                  Декартово дерево (cartesian tree, treap) — красивая и легко реализующаяся структура данных, которая с минимальными усилиями позволит вам производить многие скоростные операции над массивами ваших данных. Что характерно, на Хабрахабре единственное его упоминание я нашел в обзорном посте многоуважаемого winger, но тогда продолжение тому циклу так и не последовало. Обидно, кстати.

                                  Я постараюсь покрыть все, что мне известно по теме — несмотря на то, что известно мне сравнительно не так уж много, материала вполне хватит поста на два, а то и на три. Все алгоритмы иллюстрируются исходниками на C# (а так как я любитель функционального программирования, то где-нибудь в послесловии речь зайдет и о F# — но это читать не обязательно :). Итак, приступим.

                                  Введение


                                  В качестве введения рекомендую прочесть пост про двоичные деревья поиска того же winger, поскольку без понимания того, что такое дерево, дерево поиска, а так же без знания оценок сложности алгоритма многое из материала данной статьи останется для вас китайской грамотой. Обидно, правда?

                                  Следующий пункт нашей обязательной программы — куча (heap). Думаю, также многим известная структура данных, однако краткий обзор я все же приведу.
                                  Представьте себе двоичное дерево с какими-то данными (ключами) в вершинах. И для каждой вершины мы в обязательном порядке требуем следующее: ее ключ строго больше, чем ключи ее непосредственных сыновей. Вот небольшой пример корректной кучи:


                                  На заметку сразу скажу, что совершенно не обязательно думать про кучу исключительно как структуру, у которой родитель больше, чем его потомки. Никто не запрещает взять противоположный вариант и считать, что родитель меньше потомков — главное, выберите что-то одно для всего дерева. Для нужд этой статьи гораздо удобнее будет использовать вариант со знаком «больше».

                                  Сейчас за кадром остается вопрос, каким образом в кучу можно добавлять и удалять из нее элементы. Во-первых, эти алгоритмы требуют отдельного места на осмотр, а во-вторых, нам они все равно не понадобятся.
                                  А теперь собственно про декартово дерево