Pull to refresh
0
0
Михаил @MrBold

User

Материалы открытого курса OpenDataScience и Mail.Ru Group по машинному обучению и новый запуск

Reading time 9 min
Views 141K
VK corporate blog Open Data Science corporate blog Python *Data Mining *Machine learning *

Недавно OpenDataScience и Mail.Ru Group провели открытый курс машинного обучения. В прошлом анонсе много сказано о курсе. В этой статье мы поделимся материалами курса, а также объявим новый запуск.



UPD: теперь курс — на английском языке под брендом mlcourse.ai со статьями на Medium, а материалами — на Kaggle (Dataset) и на GitHub.


Кому не терпится: новый запуск курса — 1 февраля, регистрация не нужна, но чтоб мы вас запомнили и отдельно пригласили, заполните форму. Курс состоит из серии статей на Хабре (Первичный анализ данных с Pandas — первая из них), дополняющих их лекций на YouTube-канале, воспроизводимых материалов (Jupyter notebooks в github-репозитории курса), домашних заданий, соревнований Kaggle Inclass, тьюториалов и индивидуальных проектов по анализу данных. Главные новости будут в группе ВКонтакте, а жизнь во время курса будет теплиться в Slack OpenDataScience (вступить) в канале #mlcourse_ai.

Total votes 80: ↑79 and ↓1 +78
Comments 24

Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

Level of difficulty Easy
Reading time 15 min
Views 944K
Open Data Science corporate blog Python *Data Mining *Data visualization *Machine learning *
Tutorial


Открытый курс машинного обучения mlcourse.ai сообщества OpenDataScience – это сбалансированный по теории и практике курс, дающий как знания, так и навыки (необходимые, но не достаточные) машинного обучения уровня Junior Data Scientist. Нечасто встретите и подробное описание математики, стоящей за используемыми алгоритмами, и соревнования Kaggle Inclass, и примеры бизнес-применения машинного обучения в одном курсе. С 2017 по 2019 годы Юрий Кашницкий yorko и большая команда ODS проводили живые запуски курса дважды в год – с домашними заданиями, соревнованиями и общим рейтингом учаcтников (имена героев запечатлены тут). Сейчас курс в режиме самостоятельного прохождения.

Читать дальше →
Total votes 44: ↑43 and ↓1 +42
Comments 61

Эксперимент: создание алгоритма для прогнозирования поведения фондовых индексов

Reading time 7 min
Views 38K
ITI Capital corporate blog Website development *


Ученые факультета вычислительной техники из исламского университета Азад, расположенного в ОАЭ, опубликовали работу, посвященную прогнозированию поведения фондовых индексов на основе технологий нейронных сетей, генетических алгоритмов и data mining с использованием опорных векторов. Мы представляем вашему вниманию главные мысли этого документа.
Читать дальше →
Total votes 21: ↑14 and ↓7 +7
Comments 12

Самообучение в Data science, с нуля до Senior за два года

Reading time 9 min
Views 204K
IT career
Sandbox

Хочу поделиться методами освоения Data science с нуля человеком из другой ИТ специальности. Цель: дать понять, подходит ли Вам эта специальность в принципе, и рассказать про эффективные подходы к самообучению, которые мне помогли.

Отличные материалы уже существуют по большинству конкретных тем, я сам по ним учился. Думаю, многим будут полезны "мета" материалы о том, как выбирать курсы и статьи, по которым учиться.

Читать далее
Total votes 39: ↑27 and ↓12 +15
Comments 32

Изучение data science c нуля: этапы и вехи

Reading time 9 min
Views 58K
Big Data *Machine learning *IT career

В соответствии с концепцией спирального подхода к обучению, о которой писал ранее, привожу поэтапный план освоения data science. План составлен так, чтобы каждый этап делал учащегося в той или иной степени лучше подготовленным к выполнению реальных задач. Такой подход вдохновлен идеологией Agile в том смысле, что сколько бы времени вы не уделили обучению и в какой бы момент не остановились - у вас будет наиболее востребованный набор знаний, из возможных к освоению за такое время.

Читать далее
Total votes 13: ↑12 and ↓1 +11
Comments 12

Открытый курс машинного обучения. Тема 9. Анализ временных рядов с помощью Python

Reading time 27 min
Views 300K
Open Data Science corporate blog Python *Algorithms *Mathematics *Machine learning *

Доброго дня! Мы продолжаем наш цикл статей открытого курса по машинному обучению и сегодня поговорим о временных рядах.


Посмотрим на то, как с ними работать в Python, какие возможные методы и модели можно использовать для прогнозирования; что такое двойное и тройное экспоненциальное взвешивание; что делать, если стационарность — это не про вас; как построить SARIMA и не умереть; и как прогнозировать xgboost-ом. И всё это будем применять к примеру из суровой реальности.


UPD 01.2022: С февраля 2022 г. ML-курс ODS на русском возрождается под руководством Петра Ермакова couatl. Для русскоязычной аудитории это предпочтительный вариант (c этими статьями на Хабре – в подкрепление), англоговорящим рекомендуется mlcourse.ai в режиме самостоятельного прохождения.


Видеозапись лекции по мотивам этой статьи в рамках второго запуска открытого курса (сентябрь-ноябрь 2017).

Читать дальше →
Total votes 55: ↑53 and ↓2 +51
Comments 19

Как бы я изучал Data Science, если бы начал пару лет назад, или Руководство по эффективному изучению науки о данных

Reading time 5 min
Views 27K
SkillFactory corporate blog Algorithms *Mathematics *IT career Data Engineering *
Translation
Когда я только начал своё путешествие к науке о данных, я потратил много времени на то, чтобы понять, с чего начать, что я должен узнать в первую очередь и какие ресурсы должен использовать. За последние два года я узнал несколько вещей, о которых хотел знать раньше, например о том, стоит ли сначала сосредоточиться на программировании или статистике, какие ресурсы я должен использовать для изучения новых навыков, как я должен подходить к изучению этих навыков и так далее. Таким образом, эта статья написана, чтобы дать направления и идеи для тех, кто изучает Data Science.

Приятного чтения!
Total votes 37: ↑36 and ↓1 +35
Comments 3

Python на Хабре

Reading time 7 min
Views 446K
Python *Programming *
Некоторое время назад, в силу определенных причин, мне пришла в голову мысль о том, чтобы начать изучать какой-нибудь новый язык программирования. В качестве альтернатив для этого начинания я определил два языка: Java и Python. После продолжительного метания между ними и сопутствующих нытья и долбежки головой о стену (у меня с новыми языками всегда так — сомнения, раздумья, проблема выбора и т.д.), я все-таки остановился на Python. Окей, выбор сделан. Что дальше? А дальше я стал искать материал для изучения…
Читать дальше →
Total votes 182: ↑162 and ↓20 +142
Comments 65

Принципы дизайна веб-форм для мобильных устройств

Reading time 10 min
Views 13K
UXDepot corporate blog
Tutorial
Представляю вашему вниманию перевод статьи "Mobile Form Design Strategies" от Chui Chui Tan. Перевели в компании UXDepot. Специально для пользователей Хабрахабра с одобрением издания UX Booth.


Веб-форма, которая работает хорошо на настольном ПК, не обязательно столь же успешно будет использоваться на мобильном устройстве. Из-за природы использования настольных ПК, веб-формы не делают продуктивными. Из-за ограничений, присущих мобильным устройствам, и из-за контекста их пользования, при заполнении формы на мобильном устройстве продуктивность очень важна. Эта статья позволит вам понять принципы создания продуктивных и устойчивых к ошибкам веб-форм для мобильных устройств.

Интернет на экране мобильного телефона находится под влиянием нескольких важных факторов:
  • Окружающей среды — человек может пользоваться гаджетом в толпе, в режиме цейтнота или на ярком свету (соответственно, качество изображения на экране ухудшается)
  • Сети — соединение может быть медленным и ненадежным
  • Особенностей девайса — например, маленького экрана устройства

Читать дальше →
Total votes 112: ↑110 and ↓2 +108
Comments 12

БД Oracle для программиста

Reading time 9 min
Views 91K
Oracle *
Нужно ли программисту прикладных приложений понимать как работает БД? Том Кайт, признанный специалист Oracle, автор знаменитой колонки asktom, в своей книге «Oracle для профессионалов. Архитектура и основные особенности.» настаивает, что это просто необходимо. Даже если в вашей команде есть грамотный администратор, знание того, как работает СУБД Oracle поможет вам лучше понимать друг друга и эффективней взаимодействовать, не говоря уже о случае, когда такого специалиста у вас нет. В данном топике я упомяну об основных вещах, понимание которых позволит грамотно работать с БД Oracle и использовать некоторые её особенности с большой отдачей для вашего приложения. Если же вы уже прочитали вышеупомянутую книгу Тома Кайта, то можете просто исползовать эту статью в качестве памятки. Одно замечание — книжку я читал давно, и тогда еще последней версией БД Oracle была 9i, курсы по администрированию я тоже проходил по девятке, так что, если в десятке и выше что-то поменялось и добавилось, то не обессудьте. Хотя я пишу о довольно фундаментальных вещах, которые вряд ли сильно поменяись.
Читать дальше →
Total votes 60: ↑51 and ↓9 +42
Comments 27

Проверка идеи боем: fake landing page

Reading time 6 min
Views 36K
Sales management *
Sandbox

Основная проблема любой идеи стартапа — никто не знает, нужно ли это вообще кому-нибудь или нет. Готовы ли люди изменить своё поведение, свои привычки и начать пользоваться новым продуктом? И главное — готовы ли они за него заплатить?



Десятки-сотни тысяч стартапов ежегодно запускаются, не зная ответа на этот вопрос. Это понятно — никогда нельзя быть абсолютно уверенным в успехе нового бизнеса. Тем не менее, существуют несколько методов проверки идеи — и все они с разной степенью могут предсказать будущее продукта. Один из самых эффективных методов — это разработка fake landing page.



Начнем «раскручивать» термин с конца. Landing page («посадочная страница») называют страницу сайта, на которую пользователь переходит по нажатию на рекламное сообщение. Обычно на этой странице кратко и полно описывается суть продукта, а так же размещается action button, например «Зайти», «Начать», «Узанать подробнее». Цель landing page — «взять на руку» человека, пришедшего извне по рекламе, быстро и четко объяснить, что здесь происходит, и показать один путь, куда двигаться дальше. Переход же на главную страницу сайта, как часто делают многие рекламодатели, обычно является серьезной ошибкой — большое количество информации, которая понятна уже постоянному пользователю, пугает новичка — и даже не надейтесь, что он найдет раздел «О нас» или «Что это?».



С появлением приставки fake — фальшивый, ненастоящий — проявляется сакральный смысл всей идеи проверки будущего стартапа на реальности. Мы создаем landing page для еще несуществующего продукта, «пригоняем» траффик посредством рекламного объявления и проверяем, как ведут себя наши потенциальные клиенты. Итоговым результатом является четкий ответ — сколько из всех, кто в принципе заинтересован предложенной идеей (нажали на рекламное объявление) готовы стать вашими клиентами (нажали на кнопку «Зайти» на fake landing page).


Дальше - конкретные шаги по созданию fake landing page
Total votes 73: ↑66 and ↓7 +59
Comments 16

А после топ хоть потоп

Reading time 4 min
Views 2.1K
Lumber room
Навеяно топиками «стандартное резюме сеошника», «сеошники не ведают, что творят» и прочими.

Грустно все в сфере SEO. Я в этом деле с конца 2004 года. И вроде конференций и мероприятий становится больше интересных, и людей новых с новыми взглядами появляется больше.

А вот в целом ничего не меняется. Понятие «продвижение сайта» стало синонимом спама поисковой выдачи.

И моя маленькая компания все дальше отходит от того, что называется «продвижение сайта». Даже при разговоре с потенциальными клиентами мы стараемся говорить «продвижение компании, товаров и услуг в интернете». А не иначе.
Читать дальше →
Total votes 83: ↑63 and ↓20 +43
Comments 121

Мастерство целевого использования ключевых слов и оптимизации страниц

Reading time 8 min
Views 7.3K
Search engine optimization *
Translation
Пост опубликован по просьбе одного хорошего человека.

Как создать максимально оптимизированную веб-страницу?



Если вы СЕОшник (SEO оптимизатор), то этот вопрос вы часто слышите. К сожалению, однозначного ответа нет. Но, тем не менее, существует набор полезных приемов, которые помогут приблизиться к ответу на этот вопрос. В данном посте я поделюсь нашими лучшими рекомендациями для достижения «совершенства» оптимизации страницы и расположения ключевых слов. Или, по крайней мере, что-то близкое к этому. Некоторые из наших советов подтверждены данными, результатами исследований и тестирований, другие основаны на интуиции и общем опыте. Как и со всеми СЕО советами, мы рекомендуем постоянное тестирование и оттачивание, ну а данный пост поможет вам начать процесс оптимизации.
Читать дальше →
Total votes 107: ↑80 and ↓27 +53
Comments 52

Ошибки и заблуждения стартапов при охране интеллектуальной собственности. Патенты

Reading time 6 min
Views 15K
Patenting *
Sandbox

Введение


image
Большая часть стартапов создаётся энтузиастами своего дела, которые и знать не знают, и думать не думают о защите своей интеллектуальной собственности (ИС). Очень часто в дальнейшем это приводит к плачевным последствиям. В данном топике я хотел бы рассмотреть самые частые ошибки и как их избежать.
Читать дальше →
Total votes 12: ↑10 and ↓2 +8
Comments 24

Зимние каникулы с пользой

Reading time 4 min
Views 40K
Website development *

Всего лишь рассказ о 5-ти, по-моему, интересных книгах.

Привет, {{habrauser}}.

Скоро долгожданные новогодние выходные, и ты, наверное, уже спланировал, как их провести. Игры, горы, поездки, телевизор (серьезно?). Для себя решил, что хочу сделать карьерный рывок и просто научиться делать лучше, то чем сейчас занимаюсь — управление интернет-проектами. Надо сказать, учиться в моем (28) возрасте довольно тяжело. Если в школе или ВУЗе знания еще ровно ложились на пустой лист моего опыта, привычек и понимания, то сейчас все иначе. Учеба — это процесс внутреннего изменения, я должен переписать существующие знания новыми. Начать делать что-то иначе. Но и награда велика — новый результат, новый опыт, расширение сознания, да и просто жить так интереснее.

Что ж, для этой нелегкой цели я отобрал несколько книг и составил план, включающий в себя теорию и практику. Книги по большей части о проектировании новых продуктов и улучшении существующих. Инновации, знаете ли.)
Читать дальше →
Total votes 60: ↑46 and ↓14 +32
Comments 27

Летний переполох: ищем облачную CRM

Reading time 8 min
Views 85K
ERP-systems *CRM systems *Project management *Sales management *
В начале лета ко мне обратился знакомый владелец небольшого бизнеса и попросил о том, «сам не знаю о чем, ну, в общем такой электронный менеджер». Несмотря на растущий бизнес, он долго сокрушался и из его рассказа стало понятно, что мониторы менеджеров сплошь заклеены стикерами-напоминалками, таблицы MS Excel неудобны для ведения клиентов, сделки стали срываться хотя бы потому, что о некоторых из них забывали. После небольшого опроса выяснилось, что к старту осеннего бума продаж и клиентов он хочет приобрести программу, которую «раз и открыл», занес клиента, закрыл, проконтролировал, прикрепил документ, проверил оплату, поздравил всех с завершением сделки. Ну и, само собой, недорого и быстро. Дополнительным требованием была возможность доступа сотрудников с их iPad, устройств на Android и с домашних терминалов. Ответ для него возник незамедлительно: CRM, причем лучше в облаке, благо что бизнес не предъявляет особых требований к безопасности.

Он кивнул, сказал, что слышал, попросил подобрать и оставил меня наедине с добрым десятком сайтов и закачанных с них демо-версий. В итоге CRM была выбрана и куплена, а для хабрасообщества родился пост, который, возможно, поможет менеджерам при необходимости сделать выбор и избавиться от суетливых записок, блокнотов, стикеров и проч…

Конечно, абсолютно все CRM рассмотреть невозможно, выбор пал на те, что на слуху, на первой странице поиска или в Яндекс.Директе.
image
Читать дальше →
Total votes 35: ↑31 and ↓4 +27
Comments 58

Четыре навыка владения иностранным языком

Reading time 13 min
Views 257K
Studying in IT
В данной статье я постараюсь пересказать вам опыт изучения иностранных языков, полученный мной в течение последних двух с половиной лет. Статья раскрывает наиболее эффективные методики изучения языка, которые я использую, также раскрывает кучу советов по изучению языков.

Сразу скажу что здесь я говорю только от первого лица и исходя из своего опыта, который возможно подойдёт не всем. Но, однако, как я заметил, очень много солидных лингвистов пользуются именно этими методиками изучения языков. В любом случае вы вольны использовать или не использовать этот опыт на практике, либо использовать опыт других людей, либо вырабатывать свой собственный.

Статья изначально была просто сообщением в скайп моему другу. Однако, после того как я заметил что объём информации уже занимает 3 страницы формата A4, решил переобразовать это сообщение в полноценную статью, которую вы можете лицезреть.
Читать дальше →
Total votes 145: ↑108 and ↓37 +71
Comments 205

Тенденции инвестирования в стартапы

Reading time 11 min
Views 15K
Self Promo
Translation
imageДанная статья первоначально предполагалась для прочтения инвесторами, но будет интересна и для тех, кто хочет создать свой стартап или уже находится в процессе его создания. Автор хорошо описывает тенденции в мире стартапов, что будет полезно для начинающих бизнесменов. — Прим. переводчика

Работа Y Combinator


Венчурный фонд Y Combinator на сегодняшний день профинансировал 564 стартапа, включая текущую партию из 53 стартапов. Совокупная оценочная стоимость 287 стартапов, которые были оценены (вследствие привлечения раунда финансирования, приобретения кем либо или закрытия стартапа вследствие чего либо) составляет приблизительно $11,7 миллиарда. Предшествующие текущей партии 511 стартапов вместе составили приблизительно $1,7 миллиарда. [1]

Как правило, эти цифры формируются благодаря лидерам списка. На топ-10 стартапов приходится 8,6 из этих 11,7 миллиарда. Однако за ними следует группа более молодых стартапов. Есть еще порядка 40, которые намерены стать действительно крупными.
Читать дальше →
Total votes 21: ↑20 and ↓1 +19
Comments 4

Создаем личное облако на 3 Тб

Reading time 12 min
Views 201K
*nix *
Tutorial
Я бы хотел поделиться одним способом создания личного облака на базе трехтеррабайтного WD MyBook Live. Нет, я не буду даже упоминать про wd2go и их «полуоблака», которые по сути являются только доступами к самому NAS через сервисы WD при помощи довольно корявых Java-апплетов. В этой статье речь пойдет о «честном» облаке, работающем на MBL при помощи ownCloud.
Это решение подойдет тем, кто мечтает о личном аналоге Dropbox, файлы в котором хранятся не «где-то там», а на конкретном физическом носителе, и ограничены только его объемом, без необходимости платить ежемесячно за этот объем (пренебрегая абонентской платой за интернет и стоимостью электроэнергии).
Большинство решений подобной задачи требуют достаточно много покопаться в интернете и опираются на хорошее знание Linux-систем. В данном посте я попытаюсь дать наиболее полный и адекватный HOW-TO на русском, чего сам в интернете не нашел. Так что многое пришлось делать методом проб и ошибок на свой страх и риск. Реализация данного решения не требует каких-либо фундаментальных знаний Linux, и я постараюсь расписать все наиболее доступно, по шагам.

Если интересно что из этого вышло — добро пожаловать под кат.
Читать дальше →
Total votes 72: ↑58 and ↓14 +44
Comments 68
1

Information

Rating
Does not participate
Location
Россия
Registered
Activity