Articles / Bookmarks / Profile of whitewind / Habr

How to become an author

User

Profile Publications Comments 2Bookmarks 226

kayan Jun 18 2017 at 09:43

Типичные распределения вероятности: шпаргалка data scientist-а

11 min

126K

Translation

У data scientist-ов сотни распределений вероятности на любой вкус. С чего начать?

Data science, чем бы она там не была – та ещё штука. От какого-нибудь гуру на ваших сходках или хакатонах можно услышать:«Data scientist разбирается в статистике лучше, чем любой программист». Прикладные математики так мстят за то, что статистика уже не так на слуху, как в золотые 20е. У них даже по этому поводу есть своя несмешная диаграмма Венна. И вот, значит, внезапно вы, программист, оказываетесь совершенно не у дел в беседе о доверительных интервалах, вместо того, чтобы привычно ворчать на аналитиков, которые никогда не слышали о проекте Apache Bikeshed, чтобы распределённо форматировать комментарии. Для такой ситуации, чтобы быть в струе и снова стать душой компании – вам нужен экспресс-курс по статистике. Может, не достаточно глубокий, чтобы вы всё понимали, но вполне достаточный, чтобы так могло показаться на первый взгляд.

Читать дальше →

+84

tlando Dec 7 2013 at 16:27

Извлечение объектов и фактов из текстов в Яндексе. Лекция для Малого ШАДа

6 min

42K

Яндекс corporate blogAlgorithms*Natural Language Processing*

В докладе рассказывается о том, как мы извлекаем сущности (например, имена людей и географические названия) из текстов и запросов. А также об извлечении фактов, т.е. связей между объектами. Мы рассмотрим несколько подходов к решению этих задач: формулирование правил, составление словарей всевозможных объектов, машинное обучение.

Лекция рассчитана на старшеклассников — студентов Малого ШАДа, но и взрослые смогут с ее помощью восполнить некоторые пробелы.

http://video.yandex.ru/users/e1coyot/view/4/

Конспект лекции

+65

Siarshai Jan 4 2017 at 14:18

Методы оптимизации нейронных сетей

17 min

214K

Algorithms*Mathematics*Machine learning*

В подавляющем большинстве источников информации о нейронных сетях под «а теперь давайте обучим нашу сеть» понимается «скормим целевую функцию оптимизатору» лишь с минимальной настройкой скорости обучения. Иногда говорится, что обновлять веса сети можно не только стохастическим градиентным спуском, но безо всякого объяснения, чем же примечательны другие алгоритмы и что означают загадочные $\inline \beta$ и $\inline \gamma$ в их параметрах. Даже преподаватели на курсах машинного обучения зачастую не заостряют на этом внимание. Я бы хотел исправить недостаток информации в рунете о различных оптимизаторах, которые могут встретиться вам в современных пакетах машинного обучения. Надеюсь, моя статья будет полезна людям, которые хотят углубить своё понимание машинного обучения или даже изобрести что-то своё.

Под катом много картинок, в том числе анимированных gif.

Читать дальше →

+78

Softliner Jan 17 2017 at 16:06

Система рекомендаций интернет магазина на основе методов машинного обучения в Compute Engine (Google Cloud Platform)

16 min

15K

Programming*Softline corporate blogGoogle App Engine*Google API*Machine learning*

Tutorial

Translation

С помощью сервисов Google Cloud Platform можно создать эффективную масштабируемую систему рекомендаций для интернет-магазина.

На рынке интернет-торговли сложилась интересная ситуация. Хотя общий денежный поток вырос, увеличилось и количество продавцов. Это привело к тому, что доля каждого магазина уменьшилась, а конкуренция между становится все напряженнее. Один из способов увеличить средний размер покупки (а значит, и прибыль) – предлагать покупателям дополнительные товары, которые могут их заинтересовать.

Из этой статьи вы узнаете, как на базе Cloud Platform настроить среду для поддержки базовой системы рекомендаций, которую со временем можно будет доработать и расширить.

В ней описывается решение для сайта агентства по аренде недвижимости, позволяющее подбирать и предлагать рекомендации пользователям.

Читать дальше →

+17

KatbertW Dec 14 2016 at 11:39

Автомобильный дайджест: Что почитать, посмотреть и послушать в новогодние праздники

4 min

8.9K

Car GadgetsTransport

Приближаются праздничные дни, после которых наступают продолжительные выходные. Поэтому я решил подготовить для вас предновогодний список интересных материалов и новостей на автомобильную тематику, чтобы было что почитать или посмотреть с кружкой какао вечерком.

Читать дальше →

+11

5atriot Nov 29 2016 at 17:17

Неизменно в лидерах: сводный обзор русских видеорегистраторов AdvoCam

8 min

14K

AdvoCam corporate blogGadgetsVideo equipmentCar Gadgets

Всем привет! В данном материале речь пойдет о четырёх автомобильных видеорегистраторах бренда AdvoCam: FD One, FD8 Black GPS, FD8 Red II (GPS+ГЛОНАСС) и FD8 Gold GPS. У этих устройств есть несколько ключевых особенностей, которые выгодно выделяют их на фоне основной массы «чёрных ящиков», продающихся в России. Прежде всего, это высокое качество сборки, комплектующих и, как следствие, высокое записи видео. Также стоит отметить удобное продуманное управление и широкий функционал. Наконец, подкупает происхождение: AdvoCam не покупает готовые регистраторы у китайских производителей, как это делает подавляющее большинство брендов, а самостоятельно проектирует свои аппараты. За это ответственны российские инженеры с 20-летним опытом в сфере разработки профессиональных систем видеонаблюдения.

+11

alex87is Nov 15 2016 at 15:16

Создание и тестирование Firewall в Linux, Часть 1.1 Виртуальная лаборатория

5 min

34K

Information Security*

Решил написать статью по следам курса, который я делал в прошлом семестре в институте. Конечно, тут я опишу лишь самые главные основы и максимально все упрощу. Постараюсь дать немного теоритической информации, но в основном больше ссылок, картинок и практики.

Итак, речь пойдет о написании firewall в среде Linux. Всю статью я поделю на несколько частей. То, что вы читаете сейчас – первая часть, она поделена еще на три части. Некоторые темы хорошо известны и задокументированы, поэтому я постараюсь отдельно давать минимум теории по ним и отдельно практику. Чтобы всем было интересно. А также ссылки для углубления (часто это будут английские статьи).

Содержание первой части:

1.1 — Создание виртуальной лаборатории (чтобы нам был где работать, я покажу как создать виртуальную сеть на вашем компьютере. Сеть будет состоять из 3х машин Linux ubuntu).
1.2 – Написание простого модуля в Linux. Введение в Netfilter и перехват траффика с его помощью. Объединяем все вместе, тестируем.
1.3 – Написание простого char device. Добавление виртуальной файловой системы — sysfs. Написание user interface. Объединяем все вместе, тестируем.

Содержание второй части:

Скрытый текст

2.1 — Введение во вторую часть. Смотрим на сеть и протоколы. Wireshark.
2.2 — Таблицы Firewall. Transport Layer. Структуры TCP, UDP. Расширяем Firewall.
2.3 — Расширяем функциональность. Обарабатываем данные в user space. libnetfilter_queue.
2.4 — (*Опиционально) Изучаем реальную Buffer Overflow атаку и предотвращаем с помощью нашего Firewall'а.

Читать дальше →

+24

Leono Oct 23 2016 at 18:27

Тематическое моделирование на пути к разведочному информационному поиску. Лекция в Яндексе

19 min

16K

Search engines*System Analysis and Design*Яндекс corporate blogAlgorithms*Data visualization*

Недавно в Москве прошла конференция Data Fest, организованная сообществом Open Data Science и Яндексом. Этой публикацией мы открываем серию расшировок докладов с Data Fest. Автор первого доклада — доктор наук, признанный специалист по машинному обучению и преподаватель Школы анализа данных Константин Вячеславович Воронцов.

Всякую ли поисковую функцию выполняет Яндекс или Google? К сожалению, пока нет. Существуют такие типы поиска, при которых никакая выдача не будет считаться правильной. И дело даже не в релевантности, а в том, что нужен другой поиск — помимо привычного нам всем. Под катом вы найдете расшифровку лекции о разведочном поиске, а также большинство слайдов.

+54

Spoilt333 Jul 12 2016 at 12:41

Как обучается ИИ

27 min

69K

VK corporate blogArtificial IntelligenceBrainThe future is here

^{Источник изображения.}

Есть ли связь между трехглазой жабой и нейронными сетями? Что общего у программы, выигрывающей в го, и приложением Prisma, перерисовывающим фотографии под стили картин известных художников? Как компьютеры одолели нарды, а затем покусились на святое — и выиграли у человека в “Космических захватчиков”?
Дадим ответы на все эти вопросы, а еще поговорим о революции, связанной с глубоким обучением, благодаря которому удалось добиться прорыва во многих областях.

Читать дальше →

+52

kozyrevskaya Aug 5 2016 at 17:40

8 лекций, которые помогут разобраться в машинном обучении и нейросетях

2 min

84K

Data Mining*Surfingbird corporate blogMathematics*Machine learning*

Мы собрали интересные лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться. Первая лекция рассчитана скорее на тех, кто вообще не понимает, как работает machine learning, в остальных много интересных кейсов.

Читать дальше →

+43

defuz Nov 8 2015 at 23:25

Обработка ошибок в Rust

32 min

39K

Programming*System Programming*Rust*

Translation

Как и многие языки программирования, Rust призывает разработчика определенным способом обрабатывать ошибки. Вообще, существует два общих подхода обработки ошибок: с помощью исключений и через возвращаемые значения. И Rust предпочитает возвращаемые значения.

В этой статье мы намерены подробно изложить работу с ошибками в Rust. Более того, мы попробуем раз за разом погружаться в обработку ошибок с различных сторон, так что под конец у вас будет уверенное практическое представление о том, как все это сходится воедино.

В наивной реализации обработка ошибок в Rust может выглядеть многословной и раздражающей. Мы рассмотрим основные камни преткновения, а также продемонстрируем, как сделать обработку ошибок лаконичной и удобной, пользуясь стандартной библиотекой.

Читать дальше →

+35

mammy Sep 13 2015 at 15:34

Подальше от обыденной реальности: фантастические романы, которые стоит прочитать

4 min

141K

Professional literature*RoboHunter corporate blogScience fiction

Фантастика как жанр заставляет читателей и писателей выйти за пределы разумного, дать волю своему воображению и отправиться в неизведанные миры. За это мы и любим этот жанр. RoboHunter этой осенью предлагает с головой погрузиться в мир научной фантастики.

Читать дальше →

+55

IlyaAbilov Sep 1 2015 at 01:38

Поздравление с 1 сентября от Vert Dider

2 min

10K

Vert Dider corporate blogPopular sciencePresentations

Сегодня важный для нас день, так как мы занимаемся популяризацией науки и в какой-то мере чувствуем себя причастными к этому празднику, мы решили сделать подборку видео, озвученных нашей студией, так как считаем, что эти идеи должны применяться на практике. Возможно, эту подборку увидят учителя или директора школ и возьмут идеи из этих видео себе на заметку. Далее под катом очень много видео, так что осторожнее, мы предупреждали.

Читать дальше →

+11

t3l3p4th Aug 30 2015 at 19:17

RAICamp 2015 — день первый

4 min

4.8K

RoboticsPopular scienceArtificial IntelligenceBrain

30 июля началась научно-инноваторская ~~тусовка~~ конференция Robotics & Artificial Intelligence Camp в МФТИ, которую мне удалось посетить в качестве вольного слушателя. Мероприятие было посвящено робототехнике, искуственному интеллекту и прочим наиболее трендовым научно-техническим направлениям, а также освещению текущей картины по части ~~кэша и профита~~ источников финансирования и коммерциализации перспективных разработок.

На RAICamp собралась преимущественно научно-инженерная публика, а действие проходило в ~~теплой ламповой~~ адемической атмосфере Физтех'а в Долгопрудном. И мне, как IT-шнику, далёкому от научно-исследовательской тусовки, удалось почерпнуть за 4 насыщенных дня массу нового и неожиданного. По идее, материалы конференции могут представлять определенный интерес и для GT-сообщества. Благо на мероприятии со мной были зеркалка, 2 беззеркалки и экшн-камера.

К сожалению, мой видеоредактор на таких объемах и количествах файлов тормозил как отечественные хайтек-инициативы и крашился аки российский финансовый сектор. Но за месяц мне всё же удалось смонтировать и залить хотя бы материалы первого дня RAICamp'а.

Keep Calm and Build Robots

+9

novoxudonoser Aug 12 2015 at 14:56

Погружение в пучину интерпретатора Python. Ч1

7 min

57K

От переводчика: Наверно всем интересно, что внутри у инструмента, который используешь, этот интерес овладел и мной, но главное не утопать в нём и не закопаться так что не вылезти. Найдя для себя интересный материал, я решил заботливо перевести его и представить хабросообществу (моя первая публикация, прошу ногами сильно не пинать). Тем, кому интересен как Python работает на самом деле, прошу проследовать под кат.

Читать дальше →

+27

SemperPeritus Jul 31 2015 at 13:00

Реализация поискового движка с ранжированием на Python (Часть 2)

4 min

12K

Search engines*Python*

Translation

В предыдущей части мы построили индекс, но мы всё ещё не можем выполнять запросы по нему. Про это я и расскажу в этой статье.

Выполнение запросов к индексу

Итак, есть два типа запросов, которые мы хотим обрабатывать: стандартные запросы, где по крайней мере одно из слов в запросе появляется в документе и запросы с фразой, где все слова запроса встречаются в документе в том же порядке.

Однако, прежде чем мы начнем, я бы рекомендовал обработать запрос так же, как мы обрабатывали документы, когда строили индекс, преобразовывая все слова, делая все буквы строчными и удаляя знаки препинания. Я не буду вдаваться в это, так как это тривиально, но это должно быть сделано перед выполнением запроса.

Примечание: во всех примерах кода ниже, каждая функция будет использовать в переменную с именем ‘invertedIndex’, которая генерируется в предыдущей части статьи. Для полного понимания происходящего ниже вы можете ознакомиться с финальным результатом на GitHub.

Мы собираемся реализовать стандартные запросы в первую очередь. Простой способ реализовать их — разбить запрос на слова (маркеры, как описано выше), получить список за каждое слово, документы в которых они встречаются, а затем объединить все эти списки. Вот как мы выполним запрос для одного слова:

Читать дальше →

+13

SemperPeritus Jul 29 2015 at 18:06

Реализация поискового движка с ранжированием на Python (Часть 1)

5 min

34K

Search engines*Python*

Просматривая ленту новостей я наткнулся на рекомендацию от Типичного Программиста на статью «Implementing a Search Engine with Ranking in Python», написанную Aakash Japi. Она меня заинтересовала, подобного материала в рунете не очень много, и я решил перевести её. Так как она довольно большая, я разделю её на 2-3 части. На этом я заканчиваю своё вступление и перехожу к переводу.

Каждый раз как я использую Quora, я в конечном итоге вижу по крайней мере вопрос вроде этого: кто-нибудь спрашивает, как работает Google и как они могли бы превзойти его по поиску информации. Большинство вопросов не настолько смелые и дезинформирующие, как этот, но все они выражают подобное чувство, и в этом они передают значительное непонимание того, как работают поисковые системы.

Но в то время как Google является невероятно сложным, основная концепция поисковой системы, которые ищут соответствия и оценивают (ранжируют) результаты относительно поискового запроса не представляет особой сложности, и это может понять любой с базовым опытом программирования. Я не думаю, что в данный момент возможно превзойти Google в поиске, но сделать поисковой движок — вполне достижимая цель, и на самом деле это довольно поучительное упражнение, которое я рекомендую попробовать.

Это то, что я буду описывать в этой статье: как сделать поисковую систему для локальных текстовых файлов, для которых можно обрабатывать стандартные запросы (по крайней мере, одно из слов в запросе есть в документе) и фразу целиком (появляется вся фраза в тексте) и может ранжировать с использованием базовой TF-IDF схемы.

Есть два основный этапа в разработке поискового движка: построение индекса, а затем, используя индекс, ответить на запрос. А затем мы можем добавить результат рейтинга (TF-IDF, PageRank и т.д.), классификацию запрос/документ, и, возможно, немного машинного обучения, чтобы отслеживать последние запросы пользователя и на основе этого выбрать результаты для повышения производительности поисковой системы.

Итак, без дальнейших церемоний, давайте начнем!

Читать дальше →

+13

frii_fond Jul 26 2015 at 17:34

Эммет Шир: Как в Twitch разговаривают с пользователями

7 min

14K

Web design*Interfaces*Usability*Фонд развития интернет-инициатив corporate blog

Translation

Cтэнфордский курс CS183B: How to start a startup. Стартовал в 2012 году под руководством Питера Тиля. Осенью 2014 года прошла новая серия лекций ведущих предпринимателей и экспертов Y Combinator:

Вторая часть курса

Первая часть курса

Сэм Альтман и Дастин Московитц: Как и зачем создавать стартап?
Сэм Альтман: Как сформировать команду и культуру стартапа?
Пол Грэм: Нелогичный стартап;
Адора Чьюнг: Продукт и кривая честности;
Адора Чьюнг: Стремительный рост стартапа;
Питер Тиль: Конкуренция – удел проигравших;
Питер Тиль: Как построить монополию?
Алекс Шульц: Введение в growth hacking [1, 2, 3];
Кевин Хейл: Тонкости в работе с пользовательским опытом [1, 2];
Стэнли Тэнг и Уокер Уильямс: Начинайте с малого;
Джастин Кан: Как работать с профильными СМИ?
Андрессен, Конуэй и Конрад: Что нужно инвестору;
Андрессен, Конуэй и Конрад: Посевные инвестиции;
Андрессен, Конуэй и Конрад: Как работать с инвестором;
Брайан Чески и Альфред Лин: В чем секрет культуры компании?
Бен Сильберман и братья Коллисон: Нетривиальные аспекты командной работы [1, 2];
Аарон Леви: Разработка B2B-продуктов;
Рид Хоффман: О руководстве и руководителях;
Рид Хоффман: О лидерах и их качествах;
Кит Рабуа: Управление проектами;
Кит Рабуа: Развитие стартапа;
Бен Хоровитц: Увольнения, повышения и переводы по службе;
Бен Хоровитц: Карьерные советы, вестинг и опционы;
Эммет Шир: Как проводить интервью с пользователями; 
Эммет Шир: Как в Twitch разговаривают с пользователями;
Хосейн Рахман: Как в Jawbone проектируют hardware-продукты;
Хосейн Рахман: Процесс проектирования в Jawbone.

Читать дальше →

+9

ComradMax Jun 26 2015 at 03:31

Семь итераций наивности или как я полтора года свою дебютную игру писал

32 min

78K

Development of mobile applications*Game development*Development for Android*

imagination

С появлением у меня в первом классе Dendy вопрос кем я стану отпал сам собой буквально через пару недель — программистом конечно же. Я долго и упорно шел к этому, невзирая на отсутствие информатики в школе, работал в техподдержке известного всем регистратора параллельно с учебой в институте, но полноценная жизнь началась лишь в тот момент, когда меня наконец-то взяли хоть куда-то писать код.

Очень скоро я понял, что мало быть программистом, работающим от звонка до звонка и получающим за это деньги на карточку — всё самое интересное начинается, когда решаешь сам без всяких архитекторов, тестировщиков и тимлидов что-нибудь этакое написать и заставить работать. Желательно что-нибудь веселое и захватывающее. Игру, например.

Под катом лежат семеро очевиднейших (как мне сейчас кажется) граблей, неожиданно вставших у меня на пути, а потому способных с отличной от нуля вероятностью встать на пути любого, идущего дорогой разработки игр.

Семь не слишком оригинальных мишеней для лба, разбавленных повествованием

+92

AirbnbHabr May 13 2015 at 19:56

Не Таиландом единым или Как фрилансеру за три часа поменять место обитания без проблем с визами

10 min

51K

Airbnb corporate blogOffices of IT companiesLifehacks for geeks

С падением курса рубля жизнь фрилансера-путешественника сильно осложнилась. Однако если все же заработок позволяет, а европейского гостеприимства, как и солнца, ох как не хватает в России – добро пожаловать в восемь стран, где фрилансер найдет покой и красивую картинку позади монитора без проблем и волнений с оформлением виз.

Маршруты кочевников за полторы тысячи лет не поменялись. Но нравы стали помягче

Читать дальше →

+59

2

3 4 ...