User

ProfileArticlesPostsNewsComments42

leszla May 31 2018 at 21:38

Где и как изучать машинное обучение?

2 min

76K

Machine learning * Artificial Intelligence

Tutorial

Всем привет!

Ни для кого не секрет, что интерес к машинному обучению и искусственному интеллекту растет в лучшем случае по экспоненте. Тем временем мой Яндекс Диск превратился в огромную свалку пейперс, а закладки в Google Chrome превратились в список, длина которого стремится к бесконечности с каждым днем. Таким образом, дабы упростить жизнь себе и вам, решил структурировать информацию и дать множество ссылок на интересные ресурсы, которые изучал я и которые рекомендую изучать вам, если вы только вначале пути (буду пополнять список постоянно).

Путь для развития новичка я вижу примерно так:

Untitled_presentation

Читать дальше →

+38

shifttstas May 31 2018 at 06:41

SSLH: Прячем SSH/HTTPS/OpenVPN/Telegram за единым портом 443

3 min

128K

Open source * Information Security *

Tutorial

SSH/HTTPS/OpenVPN/Telegram и всё на одном порту?! Что?!
— Да!

Хотите скрыть наличее у вас некоторых сервисов?

В публичной wi-fi сети блокируется всё кроме 443 (https) порта?

Настроили Telegram Proxy/OpenVPN и не хотите его «светить» ?

SSH подключение к своему серверу из стран с цензурой?

На все эти вопросы ответ один — Мультиплексирование SSL/TLS соединений, или SSLH.

В посте мы рассмотрим как в 1 команду спрятать кучу сервисов за 1 портом.

Читать дальше →

+72

SLY_G May 31 2018 at 07:00

Для проверки уравнений Эйнштейна необходимо пнуть чёрную дыру

9 min

15K

Popular sciencePhysics

Translation

Две команды исследователей значительно продвинулись к доказательству гипотезы устойчивости чёрных дыр, важнейшей математической проверке Общей теории относительности Эйнштейна.

В ноябре 1915 года на лекции в Прусской академии наук, Альберт Эйнштейн описал идею, перевернувшую представление человечества о Вселенной. Вместо того, чтобы принимать геометрию пространства и времени фиксированной, Эйнштейн объяснил, что мы живём в четырёхмерной реальности под названием пространство-время, чья форма колеблется, реагируя на материю и энергию.

Эйнштейн подробно расписал эту важную идею в нескольких уравнениях, называемых "уравнениями Эйнштейна" (или уравнениями гравитационного поля), формирующих ядро его ОТО. Эту теорию подтвердили все экспериментальные проверки, которым она подвергалась в следующее столетие.

Читать дальше →

+9

PatientZero May 30 2018 at 13:38

Станут ли воксели новой прорывной технологией?

10 min

72K

3D-graphics * Game development *

Translation

Мы пообщались с потрясающими разработчиками Atomontage, пытаясь разобраться, смогут ли воксели вернуться и победить пиксели.

Воксельная разработка

Бранислав: в 2000-2002 годах я участвовал в соревнованиях европейской демосцены. Я написал несколько 256-байтных демо (также называемых intro) под ником Silique/Bizzare Devs (см. «Njufnjuf», «Oxlpka», «I like ya, Tweety» и «Comatose»). Каждое из интро генерировало в реальном времени воксели или графику из облака точек. И воксели, и облака точек являются примерами сэмплированной геометрии.

Интро выполняли свою задачу всего в 100 инструкциях процессора, таких как ADD, MUL, STOSB, PUSH и им подобных. Однако из-за самой природы такого типа программ на самом деле десятки инструкций использовались просто для правильной настройки, а не для генерации самой графики. Тем не менее этих 50 с лишним инструкций, которые по сути являлись элементарными математическими операциями или операциями с памятью, оказалось достаточно для генерации довольно красивой подвижной 3D-графики в реальном времени. Все эти 256-байтные интро выигрывали с первого по третье места. Это заставило меня осознать, что если такую 3D-графику возможно создавать без полигонов, то в играх и других приложениях можно достичь гораздо большего с помощью того же принципа: использования сэмплированной геометрии вместо полигональных мешей. Решение заключается в простоте. Я понял, что доминировавшая тогда парадигма, основанная на сложных и фундаментально ограниченном (необъёмном) представлении данных, уже готова была упереться в потолок возможностей. То есть настало подходящее время испробовать эту «новую», более простую парадигму: объёмную сэмплируемую геометрию.

+92

T-Fazullin May 30 2018 at 14:47

Профессия: кибердетектив

9 min

21K

Innopolis University corporate blogInformation Security *

Веста Матвеева — эксперт в области информационной безопасности компании Group-IB, признанной изданием Business Insider UK одной из 7 самых влиятельных мировых организаций в индустрии кибербезопасности. За 6 лет она провела десятки экспертиз — технических разборов инцидентов в роли криминалиста, после чего перешла в отдел расследования и раскрыла несколько дел.

Веста приехала в Университет Иннополис по приглашению преподавателей и студентов программы магистратуры Разработка безопасных систем и сетей в рамках курса CyberCrime and Forensics. Гостья прочла лекцию о том, как глобализируется киберпреступность, какие тактики и инструменты используются для атак на финансовые и промышленные организации и какими методами пользуются киберкриминалисты для борьбы с хакерами.

Читать дальше →

+14

ashagraev May 28 2018 at 10:29

Яндекс.Блиц: машинное обучение

5 min

20K

Яндекс corporate blogEntertaining tasksMachine learning * Sport programming *

Не так давно мы проводили Яндекс.Блиц – соревнование по алгоритмическому программированию. Соревнование удалось: в финал пробилось более трёхсот участников, из которых двое сумели решить все предложенные задачи! Двадцать финалистов приехали в офис Яндекса, познакомились с руководителями различных сервисов и больше узнали об устройстве современных поисковых систем.

Однако в Яндексе разработчики решают самые разные задачи: от разработки высоконагруженных систем обработки данных до построения сложных моделей релевантности и смешивания поисковых источников. Поэтому нам показалось вполне логичным продолжить цикл соревнований от Яндекса соревнованием по машинному обучению и анализу данных.

Так же, как и в прошлый раз, мы заранее рассказываем на Хабре о том, какие задачи могут встретиться в контесте, и как их можно было бы решать, чтобы у потенциальных участников было представление о том, что их ждёт.

Квалификацию ML-блица можно будет пройти с 11 по 17 июня, а 23 июня состоится финал. Итоги соревнования будут подведены 25 июня. Для участия необходимо вовремя зарегистрироваться!

Читать дальше →

+20

Rumyantsev May 29 2018 at 22:02

Как быстро найти и не потерять AI и Data Science специалистов

9 min

11K

Big Data * Data Mining * Personnel Management *

В соавторстве с Анной Перовой

Введение

Каждый день человечество создает, использует и хранит огромные объемы данных. Каждая статья, пост в блоге или instagram, каждый лайк да и вообще каждый факт коммуникации — данные, которые, будучи обработанными становятся ценными, приносят прибыль и предостерегают от рисков того кто ими владеет и умеет извлекать соответствующую информацию.

С ростом возможностей анализа данных и осознания полезности имеющихся архивов повышается и потребность в экспертах по Data Science, машинного обучения и искусственного интеллекта (AI), способных работать с данными и создавать на их основе полезные модели, а также, системы самостоятельно обрабатывающие данные и заставляющие их работать.

Почему тем, кто набирает команды в этой сфере необходимо задуматься о новых методах рекрутинга?

Как еще в 2015 году писали на TechCrunch, по мнению Mckinsey, которые, надо признать оказались не далеко от истины, 490 000 специалистов потребуется в этой области к 2018 году.

Читать дальше →

-1

alizar May 17 2018 at 17:40

FontCode: новый способ стеганографии через форму букв

3 min

16K

Information Security * Cryptography * Machine learning * Image processing * Typography *

Рис. 1. Незначительное изменение глифа (формы конкретной литеры) кодирует цифровую информацию за счёт двухмерной матрицы вариантов начертания. Каждая точка в двухмерной координатной сетке генерирует соответствующий уникальный глиф

Специалисты по стеганографии придумали новый способ прятать шифровки в открытом канале. В данном случае — в открытом тексте. По мнению изобретателей, кроме естественного применения в разведке эту технологию можно использовать для скрытого внедрения метаданных, таких как водяные знаки.

Недавно на Хабре рассказывалось про фингерпринтинг текста непечатаемыми символами. Новая техника FontCode более изощрённая, но по сути похожа. И здесь обнаружить скрытое сообщение не так просто, даже сложнее, чем непечатаемые пробелы. В этом тексте никаких невидимых символов нет, а слегка изменённую форму букв сложно заметить на глаз и уж точно невозможно расшифровать, если вы не знаете принцип кодирования/декодирования.

Читать дальше →

+35

evigore May 11 2018 at 08:42

Теория вычислений. Введение в конечные автоматы

5 min

99K

Algorithms * Compilers * Mathematics * Programming * Regular expressions *

Спойлер

Cкажу cразу, что не буду объяснять слишком формально.

Конечные автоматы (finite-state machine)

Это до предела упрощенная модель компьютера имеющая конечное число состояний, которая жертвует всеми особенностями компьютеров такие как ОЗУ, постоянная память, устройства ввода-вывода и процессорными ядрами в обмен на простоту понимания, удобство рассуждения и легкость программной или аппаратной реализации.

С помощью КА можно реализовать такие вещи как, регулярные выражения, лексический анализатор, ИИ в играх и тд.

У конечных автоматов имеется таблица переходов, текущее состояние автомата, стартовое состояние и заключительное состояние.

Таблица переходов — В ней хранятся переходы для текущего состояния и входного символа. Простейшая реализация может быть как двумерный массив.

Пример 1

По горизонтали вверху находятся возможные входные символы.

По вертикали слева находятся текущие возможные состояния.

Здесь видно, что из состояния 0 в состояние 1 можно попасть только, если у нас будет входной символ 'a', из состояния 1 в состояние 2, если символ 'b'.

Текущее состояние — множество состояний в котором автомат может находиться в данный момент времени.

Стартовое состояние — состояние откуда КА начинает свою работу.

Заключительное состояние — множество состояний в которых автомат принимает определенную цепочку символов, в ином случае отвергает.

+16

astromid May 6 2018 at 19:29

SmartMailHack. Решение 1-го места в задаче классификации логотипов

7 min

6.7K

Machine learning * Python * Data Mining *

Две недели назад закончился проходивший в офисе Mail.Ru Group хакатон для студентов SmartMailHack. На хакатоне предлагался выбор из трех задач; статья от победителей во второй задаче уже есть на хабре, я же хочу описать решение нашей команды, победившей в первой задаче. Все примеры кода будут на Python & Keras (популярный фреймворк для deep learning).

Читать дальше →

+37

nullpexx Apr 27 2018 at 11:54

О том, как я хотел учить других, а в результате научился сам

6 min

12K

e-legion corporate blogStudying in ITDevelopment for Android * Development of mobile applications * Java *

Привет, Хабр! Вот уже год как я работаю над онлайн-программой обучения Android-разработчиков в Академии e-Legion. Под катом рассказываю, как пришёл к идее стать преподом и с какими сложностями сталкиваюсь в процессе.

Читать дальше →

+15

m1rko Apr 27 2018 at 20:59

Можно ли доверять свои пароли синхронизации Chrome и Firefox?

4 min

40K

FirefoxGoogle ChromeBrowsersInformation Security * Cryptography *

Translation

Недавно я писал о недостаточной защите локально сохранённых паролей в Firefox. Как правильно отметили некоторые читатели, злоумышленник с физическим доступом к вашему устройству — не главная угроза. Поэтому взглянем, как разработчики браузеров защищают ваши пароли при их передаче в облако. И Chrome, и Firefox предоставляют сервис синхронизации, который может загружать не только сохранённые пароли, но и куки, и историю просмотров страниц. Насколько безопасен этот сервис?

TL;DR: в настоящее время ответ «нет». У обеих служб есть слабые места в защите. Впрочем, некоторые из этих недостатков хуже других.

Читать дальше →

+31

deNULL Apr 27 2018 at 17:10

TON: Telegram Open Network. Часть 1: Вступление, сетевой уровень, ADNL, DHT, оверлейные сети

9 min

106K

Cryptography * Decentralized networks * Algorithms *

TON: Telegram Open Network

Уже две недели Рунет шумит про Telegram и ситуацию с его бессмысленной и беспощадной блокировкой Роскомнадзором. Рикошетом задело многих, но всё это — темы для постов на Geektimes. Меня же удивило другое — я до сих пор не видел на Хабре ни одного разбора запланированной к выходу на базе Telegram сети TON — Telegram Open Network. Мне захотелось восполнить этот недостаток, ибо поизучать там есть что — даже несмотря на отсутствие официальных заявлений о нём.

Напомню — ходят слухи о том, что Telegram запустил очень масштабное закрытое ICO, уже собрав в нём невероятные суммы. Предполагается, что уже в этом году будет запущена собственная криптовалюта Gram — и у каждого пользователя Телеграма автоматически появится кошелёк, что само по себе создает немалое преимущество перед остальными криптовалютами.

К сожалению, так как официальных заявлений нет, дальше я могу отталкиваться только от документа неизвестного происхождения, о чём я сразу вас предупреждаю. Конечно, он может оказаться очень искусной подделкой, но не исключено и то, что это — реальный whitepaper будущей системы, написанный Николаем Дуровым (и слитый, вероятно, кем-то из инвесторов). Но даже если это фейк, никто нам не запретит его поизучать и обсудить, верно?

Что же говорится в этом документе? Я попробую пересказать его своими словами, близко к тексту, но по-русски и чуть более человечно (да простит меня Николай со своей склонностью уходить в формальную математику). Имейте в виду, что даже в случае его подлинности, это черновое описание системы и оно, весьма вероятно, изменится к моменту публичного запуска.

Итак, приступим

+79

apla Apr 24 2018 at 14:38

Блокировка в тишине

3 min

52K

Legislation in IT

Уже почти неделю Роскомнадзор блокирует огромные диапазоны IPv4 адресов интернет сервисов по своему усмотрению. В какой–то момент было заблокировано 0.5% от всего объема адресов. Немного ранее уже были рассмотрены и способы обхода блокировок, и комментарии пострадавших бизнесменов, и юридические аспекты. К сожалению, ни одна из крупных компаний «рунета» не высказалась по этому поводу.

Читать дальше →

+96

stasus Apr 23 2018 at 15:46

Квантовая телепортация на языке Q#

9 min

13K

Microsoft corporate blogC# * Open source * Mathematics *

Translation

Скажу сразу: как бы мне этого ни хотелось, квантовая телепортация не позволит перенести мою бабушку из деревни в мою квартиру. Бабуля знает, что мне нравятся всякие квантовые штуки, и решила вместо денег и носков отправить мне на день рождения квантовое состояние. Здесь мы поговорим о другом — передаче квантовой информации.

Это вторая статья из серии о квантовом программировании. Предполагается, что читатель уже знаком с первой частью.

Читать дальше →

+11

snakers4 Apr 22 2018 at 14:55

Применяем Deep Watershed Transform в соревновании Kaggle Data Science Bowl 2018

7 min

8.6K

Image processing * Machine learning * Python * Data Mining *

Применяем Deep Watershed Transform в соревновании Kaggle Data Science Bowl 2018

Представляем вам перевод статьи по ссылке и оригинальный докеризированный код. Данное решение позволяет попасть примерно в топ-100 на приватном лидерборде на втором этапе конкурса среди общего числа участников в районе нескольких тысяч, используя только одну модель на одном фолде без ансамблей и без дополнительного пост-процессинга. С учетом нестабильности целевой метрики на соревновании, я полагаю, что добавление нескольких описанных ниже фишек в принципе может также сильно улучшить и этот результат, если вы захотите использовать подобное решение для своих задач.

описание пайплайна решения

Читать дальше →

+24

itNews Apr 16 2018 at 23:59

И снова о блокировке Telegram. Разворачиваем собственный VPN

3 min

82K

King Servers corporate blogInformation Security * Network technologies *

О том, что мессенджер Telegram заблокирован на территории России, сейчас не говорит и не пишет только ленивый. Общее количество пользователей мессенджера в РФ по словам Павла Дурова составляет примерно 15 млн, что весьма немаленькая цифра. Если Telegram сделать недоступным, то все эти люди (то есть и мы с вами) будут недовольны. Собственно, они уже недовольны.

Но проблему можно решить. Например, есть возможность воспользоваться плагином для браузера со встроенным VPN. Ну а если хочется чего-то более интересного, то можно попробовать поднять собственный VPN-сервер.

Читать дальше →

+53

jehy Apr 17 2018 at 08:12

Полезные фичи VPN

3 min

42K

IT Infrastructure * Information Security * Server Administration *

Не хотелось писать статью про настройку впн, потому что их и без меня в интернете тысячи — выбирай на вкус и цвет.

Просто хотел напомнить просто несколько простых вещей, которые вызывают много недоразумений и вопросов. Понимаю, что на статью не тянет, но очень хочется до вас достучаться, а других способов в рунете особо и нет.

Читать дальше →

+20

stasus Apr 16 2018 at 06:57

Основы квантовых вычислений: чистые и смешанные состояния

4 min

18K

Microsoft corporate blogC# * Open source * Mathematics *

Translation

Недавно мы рассказали о способе наглядного представления однокубитных состояний — сфере Блоха. Всем чистым состояниям соответствуют точки на поверхности сферы Блоха, а смешанным — точки внутри нее. В этой публикации мы постараемся объяснить, что на самом деле представляют собой чистые и смешанные состояния.

Читать дальше →

+14

repjov Apr 13 2018 at 08:34

Как я прокачивал скилы личной эффективности

10 min

27K

GTD * IT career

Работа 24 на 7

«Всем привет, меня зовут Антон, и я — трудоголик. Я часто работаю по 12 часов в день. Моя семья очень страдает от этого. Я очень хочу начать жить, как все нормальные люди, но каждый раз срываюсь и засиживаясь заполночь...» — наверное так бы я начал свою речь, если бы состоял в клубе анонимных трудоголиков.

Читать дальше →

+11

1 2 ...

76