Articles / Bookmarks / Profile of imxotep / Habr

@imxotep^{read⁠-⁠only}

User

Profile Bookmarks 11

romovpa Apr 26 2017 at 17:05

Спортивный анализ данных, или как стать специалистом по data science

17 min

60K

Sport programming*Яндекс corporate blogData Mining*Big Data*Machine learning*

Меня зовут Пётр Ромов, я — data scientist в Yandex Data Factory. В этом посте я предложу сравнительно простой и надежный способ начать карьеру аналитика данных.

Многие из вас наверняка знают или хотя бы слышали про Kaggle. Для тех, кто не слышал: Kaggle — это площадка, на которой компании проводят конкурсы по созданию прогнозирующих моделей. Её популярность столь велика, что часто под «кэглами» специалисты понимают сами конкурсы. Победитель каждого соревнования определяется автоматически — по метрике, которую назначил организатор. Среди прочих, Kaggle в разное время опробовали Facebook, Microsoft и нынешний владелец площадки — Google. Яндекс тоже несколько раз отметился. Как правило, Kaggle-сообществу дают решать задачи, довольно близкие к реальным: это, с одной стороны, делает конкурс интересным, а с другой — продвигает компанию как работодателя с солидными задачами. Впрочем, если вам скажут, что компания-организатор конкурса задействовала в своём сервисе алгоритм одного из победителей, — не верьте. Обычно решения из топа слишком сложны и недостаточно производительны, а погони за тысячными долями значения метрики не настолько и нужны на практике. Поэтому организаторов больше интересуют подходы и идейная часть алгоритмов.

Kaggle — не единственная площадка с соревнованиями по анализу данных. Существуют и другие: DrivenData, DataScience.net, CodaLab. Кроме того, конкурсы проводятся в рамках научных конференций, связанных с машинным обучением: SIGKDD, RecSys, CIKM.

Для успешного решения нужно, с одной стороны, изучить теорию, а с другой — начать практиковать использование различных подходов и моделей. Другими словами, участие в «кэглах» вполне способно сделать из вас аналитика данных. Вопрос — как научиться в них участвовать?

Хардкор

+61

LukinB Feb 1 2017 at 12:20

Как я создал SaaS-сервис, который приносит мне 1000 долларов в месяц

6 min

63K

Programming*VK API*Development for e-commerce*

Translation

Примечание: здесь рассказано о создании с нуля небольшого, прибыльного SaaS-сервиса и о доведении его до состояния, когда он стал приносить 1 000 долларов в месяц. Это не имеет никакого отношения к многомиллиардным стартапам единорогов; я просто описываю мой опыт такой работы. Речь идёт о простом, надёжном и прибыльном инструменте, который может сделать для себя любой человек. И последнее — этот веб-сервис был сделан для внутреннего рынка России, поэтому я перевёл всё на английский и в доллары для удобства. Но, с другой стороны, этот опыт является довольно универсальным и может быть применён везде (ссылка на сервис).

Всё началось с моего другого SaaS-сервиса с названием Postio, который я сделал, чтобы облегчить людям поиск и публикацию контента на их страницах и в их группах в социальных сетях. В рамках своей маркетинговой стратегии я приобрёл и опубликовал на своём блоге десяток статей по различным темам, ориентированных на аудиторию веб-сервиса, чтобы получить дополнительный трафик с поисковых систем.

Потом вдруг Postio начал получать относительно большой трафик от Google и Яндекс (русская поисковая система) с ключевыми словами, которые не имели ничего общего с самим Postio.

Аналитическая статистика Гугл по суточному трафику

Здесь-то и начинается фактическая история.

Читать дальше →

+63

AlexeyR Feb 2 2015 at 10:38

Зачем вся эта недоказанная вселенная?

3 min

24K

Самое трудное в написании что статьи, что книги – это придумать хорошее название. Такое чтобы и звучало интригующе, и содержание статьи описывало, но при этом не сдавало полностью. А еще чтобы оно было двусмысленным — для полной красоты и изящности. Перебрав несколько и придя в уныние, решил: придет само по мере написания, а пока пусть будет:

О квантовой физике, мозге, теореме Геделя и судах присяжных.

Читать дальше →

alizar Nov 19 2010 at 20:45

В человеческом мозге столько же «транзисторов», сколько в мировой ИТ-инфраструктуре

2 min

25K

BiotechnologiesBrain

Стэнфордские нейробиологи потратили несколько лет, разрабатывая новый способ 3D-сканирования мозга. Они совместили объёмную компьютерную томографию (array tomography — техника «антенных решёток» из радиоастрономии) и специально разработанный софт, чтобы получить объёмную и реалистичную 3D-модель. Такую, по которой можно перемещаться, масштабировать и вращать её в разных измерениях.

Сканирование от мягкой оболочки коры мозга мыши через шесть слоёв и подкорковое белое вещество к прилегающему полосатому телу.

Изучив полученную картину, учёные пришли к выводу, что синапсы устроены гораздо сложнее, чем предполагалось раньше.

Читать дальше →

+76

193

aigame Aug 13 2015 at 18:05

Новые нейронные сети или моделирование работы нервной системы

6 min

26K

Artificial IntelligenceBrain

Привет, Geektimes! Хочу представить свои наработки в исследовании в области искусственного интеллекта.

Читать дальше →

+13

OlgaGanz Jul 17 2015 at 14:32

Обзор проектов роботов на Kickstarter от RoboHunter

4 min

6.4K

RoboHunter corporate blogRobotics

Прошел еще один месяц с последнего нашего обзора, а Kickstarter продолжает штамповать новые проекты роботов. Некоторые из них неуклюжи, другие, наоборот, – предмет гордости для своих разработчиков.

Для сравнения в подборке собраны стартапы, которые уже завершили сбор средств и практически готовы для запуска в серийную эксплуатацию.

Читать дальше →

YuriPanchul Jun 4 2015 at 09:17

Бесплатный учебник электроники, архитектуры компьютера и низкоуровневого программирования на русском языке

2 min

247K

Abnormal programming*

Господа! Я рад сообщить, что наконец-то все желающие могут загрузить бесплатный учебник на более чем 1600 страниц, над переводом которого работало более полусотни человек из ведущих университетов, институтов и компаний России, Украины, США и Великобритании. Это был реально народный проект и пример международной кооперации.

Учебник Дэвида Харриса и Сары Харрис «Цифровая схемотехника и архитектура компьютера», второе издание, 2012, сводит вместе миры программного обеспечения и аппаратуры, являясь одновременно введением и в разработку микросхем, и в низкоуровневое программирование для студентов младших курсов. Этот учебник превосходит более ранний вводный учебник «Архитектура компьютера и проектирование компьютерных систем» от Дэвида Паттерсона и Джона Хеннесси, причем соавтор предыдущего учебника Дэвид Паттерсон сам рекомендовал учебник от Харрисов как более продвинутый. Следуя новому учебнику, студенты строят реализацию подмножества архитектуры MIPS, используя платы с ПЛИС / FPGA, после чего сравнивают эту реализацию с индустриальными микроконтроллерами Microchip PIC32. Таким образом вводится вместе схемотехника, языки описания аппаратуры Verilog и VHDL, архитектура компьютера, микроархитектура (организация процессорного конвейера) и программирование на ассемблере — в общем все, что находится между физикой и высокоуровневым программированием.

Как загрузить? К сожалению, не одним кликом. Сначало надо зарегистрироваться в пользовательском коммьюнити Imagination Technologies, потом зарегистрироваться в образовательных программах на том же сайте, после чего наконец скачать:

Читать дальше →

+111

rocknrollnerd Jun 16 2014 at 13:31

Про котиков, собак, машинное обучение и deep learning

15 min

83K

Image processing*

From sandbox

«В 1997 году Deep Blue обыграл в шахматы Каспарова.
В 2011 Watson обставил чемпионов Jeopardy.
Сможет ли ваш алгоритм в 2013 году отличить Бобика от Пушистика?»

Эта картинка и предисловие — из челленджа на Kaggle, который проходил осенью прошлого года. Забегая вперед, на последний вопрос вполне можно ответить «да» — десятка лидеров справилась с заданием на 98.8%, что на удивление впечатляет.

И все-таки — откуда вообще берется такая постановка вопроса? Почему задачи на классификацию, которые легко решает четырехлетний ребенок, долгое время были (и до сих пор остаются) не по зубам программам? Почему распознавать предметы окружающего мира сложнее, чем играть в шахматы? Что такое deep learning и почему в публикациях о нем с пугающим постоянством фигурируют котики? Давайте поговорим об этом.

По заветам издателей Стивена Хокинга - без формул

+95

alconost Oct 28 2014 at 10:16

Во главе Гугла: как выжать максимум из контекстной рекламы

7 min

60K

Alconost corporate blogWeb analytics*Internet marketing*Contextual advertising*Increasing Conversion Rate*

Tutorial

Что делать, если потраченные на контекстную рекламу деньги вылетели в трубу? Как бороться с тем, что трафика из Google AdWords кот наплакал? Почему стоимость конверсии выше стоимости продукта? С чего вообще правильно начинать настройку контекстных рекламных кампаний? Мы решили поделиться своим опытом в этом посте.

Есть несколько основных проблем, которые чаще всего мешают достичь хороших результатов от контекстной рекламы:

высокая цена клика;
нет кликов;
высокая цена конверсии;
низкая позиция объявления;
низкий CTR;
плохое качество трафика (нет покупок, заказов, подписок и т.д.);
плохой показатель качества (QS).

Увы, любой из этих показателей не улучшается отдельно от остальных. Изменяя один, мы неизбежно влияем на другой, и не всегда в лучшую сторону.

Поэтому мы не будем рассматривать отдельные кейсы. Лучше поэтапно опишем, как создавать кампании в Google AdWords, которые будут эффективны и конкурентоспособны. Проверено специалистами Alconost.

Читать дальше →

+24

zz_wolf May 7 2014 at 19:50

Приглашаем к бета-тестированию фото-органайзера ZZ Photo

2 min

8.4K

Self Promo

Всем привет!

Грядут снова затяжные выходные, их можно провести с пользой для вас и для нас. Приглашаем всех, кто устал от хаоса в цифровых фотографиях, принять участие в бета-тестированиинового продукта и получить профессиональную камеру «GoPro Camera Hero White edition», которая будет разыграна среди активных тестеров.

Мы разработали Windows-приложение ZZ Photo, цель которого – автоматическое наведение порядка среди большого количества фотографий на компьютере. По ссылке http://zzphoto.me вы найдете лендинг с кнопкой «Try beta». После указания email в форме регистрации вам в течение часа придет письмо со ссылкой для скачивания. Иногда письма попадают в спам — пожалуйста, проверяйте.

Читать дальше →

OsipovRoman Apr 30 2014 at 16:40

Стивен Вольфрам: “Внедряя вычисления повсюду”

24 min

38K

Wolfram Research corporate blog

From sandbox

Перевод доклада Стивена Вольфрама, прочитанного им на фестивале SXSW 2014.
Оригинальный текст вы можете найти здесь.

Две недели назад я выступал с речью на конференции SXSW в Остине, Техас. Эта статья является немного доработанными тезисами доклада (это конспект текста, включающий демонстрации, от которых пришлось отказаться в процессе выступления):

Итак, на этот час запланировано довольно много.

В целом, мне бы хотелось рассказать историю, происходящую со мной в течение последних 40 лет, которая начинает приносить удивительные результаты только сейчас. Я имею ввиду что мы практически можем наблюдать эти результаты сегодня. Я хотел бы впервые представить вам весь спектр технологий, являющийся довольно-таки значительным результатом этих сорокалетних трудов. И я думаю что это достаточно важно.

Мне всегда нравилось представлять программы вживую. Но сегодня я собираюсь рискнуть больше обычного и продемонстрировать многие вещи, находящиеся еще на стадии тестирования. Надеюсь, что хотя бы большая часть из них работает.

Итак, основная задача в том чтобы начать относиться к вычислениям серьезно. Понять идею вычислений как таковых, а затем создать технологию, которая позволит внедрить их повсюду — после чего посмотреть к чему это приведет.

Можно сказать, я гонялся за этой идеей 40 лет. Я уже давно балансирую на стыке науки и технологий — создаю все более масштабные строительные блоки и строю из них все более высокую башню. И каждые несколько лет мне удается увидеть куда она будет расти дальше. По-моему, получается здорово. Однако, в последние несколько лет случилось нечто удивительное — своего рода великая унификация, которая ведет к технологическому Кембрийскому взрыву. И сегодня я впервые вам частично её представлю.

Но, для начала, немного истории. 40 лет назад я был 14-летним юнцом, который впервые прикоснулся к компьютеру (он тогда еще был размером со стол). Я не часто использовал его как нечто фундаментальное, но пытался с его помощью понять некоторые вещи из физики, которая меня по-настоящему интересовала. В тот момент я открыл для себя некоторые важные вещи, которыми пользуюсь до сих пор. Но сейчас я понимаю что самая важная вещь, которую я понял тогда относилась вовсе не к физике: чем лучше инструменты, которые мы используем, тем глубже мы сможем копнуть. Мне не очень хорошо давалась “математика на бумаге”, а в то время это было серьезной проблемой для тех, кто хотел заниматься физикой. Однако, я осознавал, что расчеты можно делать на компьютере и начал создавать инструменты для этого. Очень скоро я с моими программами был лучше всех в математических расчетах для физики.

Вернемся в 1981-й год. В этом году случилось нечто восхитительное для 21-летнего ученого — я превратил все это в свой первый продукт и свою первую компанию. Важно то, что это заставило меня осознать — программные продукты могут стимулировать интеллектуальное мышление. Предстояло выяснить как создать язык для математических расчетов на компьютере, и мне потребовалось многое понять о вычислениях чтобы достигнуть цели. А потом я снова погрузился в основы науки уже с использованием созданных инструментов.

В итоге, я понял, что в то время как с математикой все хорошо, её фундаментальная концепция нуждается в обобщении. Я начал изучать всю вселенную всевозможных формальных систем, которая по сути является всеобщей вычислительной вселенной возможных программ. Я ставил небольшие эксперименты — как бы направлял свой вычислительный телескоп на части этой вселенной и смотрел что там было. То что я увидел, было потрясающе. Ниже я покажу вам несколько простых программ.

Читать дальше →

+97