Articles / Bookmarks / Profile of Adisa / Habr

@Adisa^{read⁠-⁠only}

User

ProfileBookmarks15

kuznetsovin Dec 17 2013 at 04:36

Пример решения задачи множественной регрессии с помощью Python

6 min

133K

Python*Data Mining*

Введение

Добрый день, уважаемые читатели.
В прошлых статьях, на практических примерах, мной были показаны способы решения задач классификации (задача кредитного скоринга) и основ анализа текстовой информации (задача о паспортах). Сегодня же мне бы хотелось коснуться другого класса задач, а именно восстановления регрессии. Задачи данного класса, как правило, используются при прогнозировании.
Для примера решения задачи прогнозирования, я взял набор данных Energy efficiency из крупнейшего репозитория UCI. В качестве инструментов по традиции будем использовать Python c аналитическими пакетами pandas и scikit-learn.

Читать дальше →

+19

DaneSoul Feb 14 2017 at 20:23

Python: Работа с базой данных, часть 1/2: Используем DB-API

6 min

539K

Python*SQL*SQLite*Programming*

Tutorial

часть 1/2: Используем DB-API	часть 2/2: Используем ORM

Python DB-API – это не конкретная библиотека, а набор правил, которым подчиняются отдельные модули, реализующие работу с конкретными базами данных. Отдельные нюансы реализации для разных баз могут отличаться, но общие принципы позволяют использовать один и тот же подход при работе с разными базами данных.

В статье рассмотрены основные методы DB-API, позволяющие полноценно работать с базой данных. Полный список можете найти по ссылкам в конец статьи.

Требуемый уровень подготовки: базовое понимание синтаксиса SQL и Python.

Читать дальше →

+19

worksolutions Mar 6 2020 at 09:07

Подборка статей о машинном обучении: кейсы, гайды и исследования за февраль 2020

6 min

5.6K

Python*TensorFlow*Artificial IntelligenceMachine learning*

Вслед за январским постом встречайте второй выпуск дайджеста. Здесь вас ждёт список англоязычных материалов за февраль, которые написаны без лишнего академизма. Публикации содержат примеры кода и ссылки на непустые репозитории. Упомянутые технологии лежат в открытом доступе и многие из них не требуют сверхмощного железа для тестирования.

Читать дальше →

SLY_G Mar 3 2020 at 07:00

Математики доказали универсальный закон турбулентности

9 min

9.6K

Mathematics*Popular sciencePhysics

Translation

Используя случайные процессы, три математика доказали элегантный закон, лежащий в основе хаотического движения турбулентных систем

Представьте себе спокойную реку. А теперь представьте быстрый поток пенящейся воды. Какая между ними разница? Для математиков и физиков она состоит в том, что спокойная река течёт в одном направлении, а бурный поток – в нескольких направлениях сразу.

Физические системы с таким бессистемным движением называют турбулентными. Из-за того, что их движение имеет одновременно столько характеристик, их очень сложно изучать математически. Сменится не одно поколение математиков до тех пор, пока исследователи научатся описывать бурную речку точными математическими выражениями.

Однако новое доказательство говорит о том, что хотя некоторые турбулентные системы и кажутся непокорными, на самом деле они подчиняются одному универсальному закону. В этой работе приводится одно из самых строгих описаний турбулентности, когда-либо данных математикой. И появляется оно благодаря новому набору методов, которые сами по себе меняют процесс изучения исследователями этого доселе непокорного явления.

Читать дальше →

Syurmakov Sep 18 2019 at 08:45

Must-have алгоритмы машинного обучения

5 min

31K

Artificial IntelligenceAlgorithms*Python*Data Mining*Big Data*

Translation

Хабр, привет.

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи. Этот пост — краткий обзор общих алгоритмов машинного обучения. К каждому прилагается краткое описание, гайды и полезные ссылки.

Метод главных компонент (PCA)/SVD

Это один из основных алгоритмов машинного обучения. Позволяет уменьшить размерность данных, потеряв наименьшее количество информации. Применяется во многих областях, таких как распознавание объектов, компьютерное зрение, сжатие данных и т. п. Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных или к сингулярному разложению матрицы данных.

SVD — это способ вычисления упорядоченных компонентов.

Полезные ссылки:

Вводный гайд:

Учебное пособие по основному анализу компонентов

Читать дальше →

+24

ru_vds Feb 18 2020 at 10:20

5 вопросов по SQL, которые часто задают дата-сайентистам на собеседованиях

6 min

144K

RUVDS.com corporate blogSQL*Entertaining tasksIT career

Translation

Хотя составление SQL-запросов — это не самое интересное в работе дата-сайентистов, хорошее понимание SQL чрезвычайно важно для того, кто хочет преуспеть в любом занятии, связанном с обработкой данных. Дело тут в том, что SQL — это не только SELECT, FROM и WHERE. Чем больше SQL-конструкций знает специалист — тем легче ему будет создавать запросы на получение из баз данных всего, что ему может понадобиться.

Автор статьи, перевод которой мы сегодня публикуем, говорит, что она направлена на решение двух задач:

Изучение механизмов, которые выходят за пределы базового знания SQL.
Рассмотрение нескольких практических задач по работе с SQL.

В статье рассмотрено 5 вопросов по SQL, взятых с Leetcode. Они представляют собой практические задачи, которые часто встречаются на собеседованиях.

Читать дальше →

+34

crazyhatter Aug 30 2018 at 08:39

Анатомия рекомендательных систем. Часть вторая

12 min

37K

ГК ЛАНИТ corporate blogBig Data*Data Mining*Algorithms*Machine learning*

Неделю назад я делал здесь обзор существующих алгоритмов рекомендаций. В этой статье я продолжу данный обзор: расскажу об item-based варианте коллаборативной фильтрации, о методах, основанных на матричных разложениях, проблемах тестирования, а также о менее «раскрученных» (но не менее интересных) алгоритмах.

Читать дальше →

+39

crazyhatter Aug 21 2018 at 08:13

Анатомия рекомендательных систем. Часть первая

14 min

85K

ГК ЛАНИТ corporate blogBig Data*Data Mining*Algorithms*Machine learning*

Я работаю дата-саентистом в компании CleverDATA. Мы занимаемся проектами в области машинного обучения, и один из наиболее частых запросов на разработку основанных на машинном обучении маркетинговых решений — это разработка рекомендательных моделей.

В данной статье я расскажу о рекомендательных системах, постараюсь дать максимально полный обзор существующих подходов и на пальцах объясню принципы работы алгоритмов. Часть материала базируется на неплохом курсе по рекомендательным системам лаборатории MovieLens (которая большинству знакома по одноименному датасету для тестирования рекомендаций), остальное – из личного опыта. Статья состоит из двух частей. В первой описана постановка задачи и дан обзор простых (но популярных) алгоритмов рекомендаций. Во второй статье я расскажу о более продвинутых методах и некоторых практических аспектах реализации.

Источник

Читать дальше →

+45

varagian Feb 4 2019 at 07:35

Что такое логическое программирование и зачем оно нам нужно

17 min

48K

Data Mining*Prolog*Algorithms*Mathematics*Programming*

У того, кто в детстве не писал на Прологе — нет сердца, а у того, кто пишет на нём сегодня — нет мозгов. (оригинал)

Если вас всегда терзали мучительные сомнения — что за фигня это Логическое Программирование (ЛП) и вообще зачем оно нужно? То это статья для вас.

Можно по-разному разделить языки программирования на группы (часто их называют парадигмами программирования), например, вот так:

структурное: программа разбивается на блоки — подпрограммы (изолированные друг от друга), а основными элементами управления являются последовательность команд, ветвление и цикл.
объектно-ориентированное: задача моделируется в виде объектов, которые отправляют друг другу сообщения. Объекты обладают свойствами и методами. Абстракция. Инкапсуляция. Полиморфизм. Ну в общем, все в курсе.
функциональное: базовым элементом является функция и сама задача моделируется в виде функции, а, точнее, чаще всего в виде их композиции, если f(.) и g(.) — это функции, то f(g(.)) — это их композиция.
логическое: вот тут, как правило, начинается феерия — если про первые три написаны сотни статей, книг, обзоров, презентаций и учебников, то здесь мы в лучшем случае видим что-то про Prolog и разработки времён Pink Floyd и Procol Harum (ну хоть с музыкой им тогда повезло) и на этом история заканчивается.

Вот эту оплошность я и собираюсь сегодня исправить.

Важнейший тезис этой статьи:

Логическое программирование != Prolog.

И вообще последний вам скорее всего не нужен. А вот первое вполне может быть.

Структура статьи:

Что такое Пролог и почему он вам скорее всего не нужен
Зачем оно надо, или краткое введение в Answer Set Programming
Решаем задачи на ASP
Комбинаторная оптимизация
Вероятностное ЛП: ProbLog
ЛП на классической логике FO(.) и IDP
Sketched Answer Set Programming
Экспериментальный анализ
Тестирование и корректность программ
Заключение

Читать дальше →

+28

ru_vds Nov 22 2019 at 10:00

Работа не волк, часть 3. Новичок — вырасти или выжить?

10 min

26K

RUVDS.com corporate blogIT careerPersonnel Management*

Первое время на новой работе — это жизнь на иголках. Непонятно, куда вы попали, как устроена компания, что ценится в работе. Иногда даже после испытательного срока хочется сбежать от нового коллектива и не до конца понятных задач. Но ведь вы осознанно выбрали эту компанию, вы пришли в неё, потому что вас что-то привлекло. А значит, время бороться за возможности и авторитет — иногда даже матёрым профи. Готовы?

Часть 1. Поиск работы: источники, резюме, собеседование с HR
Часть 2. Устройство и адаптация: собеседуем с боссом, проходим испытательный срок с ветерком
Часть 3. Работа в роли новичка: рост в компании
Часть 4. Работа в роли опытного сотрудника: как не перегореть
Часть 5. Увольнение: я ухожу красиво

Читать дальше →

+43

scidev Jul 3 2017 at 15:10

Решение задачи коммивояжера алгоритмом Литтла с визуализацией на плоскости

8 min

72K

C++*Algorithms*

From sandbox

Известная как минимум с 19 века задача коммивояжера имеет множество способов решения и неоднократно описана. Ее оптимизационная версия является NP-трудной, поэтому оптимальное решение можно получить либо полным перебором, либо оптимизированным полным перебором — методом ветвей и границ.

Пытаясь запрограммировать алгоритм Литтла (частный случай метода ветвей и границ), я понял, что в рунете крайне трудно найти его правильное описание понятным языком и разобранную программную реализацию. Однако имеющиеся в изобилии описания обманчиво правдоподобны на данных малого размера и с трудом проверяются без визуализации.

animation

Читать дальше →

+34

demist Nov 24 2012 at 15:00

Поиск гамильтонова цикла в большом графе (задача коммивояжера).Часть 1

4 min

80K

Programming*

From sandbox

1. Постановка задачи

Полный взвешенный граф из 500 вершин задан матрицей смежности.
Необходимо найти гамильтонов цикл в этом графе как можно меньшей суммарной стоимости.

Читать дальше →

+25

ashagraev Nov 15 2019 at 07:04

Как проходят секции по машинному обучению на собеседованиях в Яндекс

6 min

31K

Яндекс corporate blogDevelopment Management*Machine learning*IT careerInterview

Каждый сервис компании Яндекс во многом основан на анализе данных и методах машинного обучения. Они требуются и для ранжирования результатов веб-поиска, и для поиска по картинкам, и для формирования рекомендательных блоков. Машинное обучение позволяет нам создавать беспилотные автомобили и голосовых ассистентов, уменьшать время бесполезного простоя для таксистов и уменьшать время ожидания для их клиентов. Все приложения и не перечислить!

Поэтому мы всегда испытываем потребность в специалистах по анализу данных и машинному обучению. Одним из важнейших этапов собеседования в Яндекс для них является общая секция по машинному обучению, о которой я и расскажу в этой статье. Пример модельной задачи для этой секции и возможного содержания ответа по ней я разобрал в видео, которое недавно стало доступно на YouTube. В этой статье я подробнее расскажу о том, чего мы ждём от сильного кандидата на такой секции и почему мы сформулировали именно такие критерии.

+22

JohnRico Nov 13 2019 at 13:12

Аддиктивные синдромы IT

12 min

20K

Слёрм corporate blogResearch and forecasts in IT*HealthThe future is hereIT Standards*

Здравствуйте, меня зовут Алексей. Я работаю в IT-сфере. Много времени провожу в социальных сетях и мессенджерах по работе. И у меня развились различные аддиктивные сценарии поведения. Я отвлекался от работы и заглядывал в Facebook, чтобы посмотреть, сколько «лайков» накапало на какую-то резонансную публикацию. И вместо того, чтобы дальше работать с новыми текстами, я подвисал на состоянии старого. Я несколько раз за час практически неосознанно брал в руки смартфон — и в какой-то степени меня это успокаивало. Давало контроль над жизнью.

В некий момент я остановился, задумался — и решил, что-то не так. Я почувствовал ниточки за моими плечами, которые периодически меня дёргают, заставляя делать то, что мне на самом деле не нужно.

С момента осознания у меня стало меньше аддикций — и я расскажу, как я от них избавился. Не факт, что мои рецепты подойдут вам или вызовут одобрение. Но расширение туннеля реальности и познание нового — вредным точно не будут.

— Па-ап, мы все на одну фоточку помещаемся? — Не бойся, у меня на смарте широкоугольник.

+33

yuliatsareva Nov 12 2019 at 13:53

Резюме глазами интервьюера

9 min

54K

Т-Банк corporate blogIT career

Когда я составляла свое первое резюме, процесс отбора на очное интервью мне казался магией. Люди, принимающие решения, представлялись «черными ящиками», которые определяют: кандидат «интересен» или «неинтересен» — по непонятным критериям.

Статьи «Как составить резюме» отчасти были полезны, а отчасти путали и нагоняли страх: их авторы утверждали, что мое письмо может попасть в корзину, если не выдержана структура или ответственный сотрудник не увидел в нем ключевых слов за первые 5 секунд чтения.

Прошли годы, сейчас я сама участвую в найме фронтенд-разработчиков и просматриваю резюме вместе с другими тимлидами.

В этой статье я хочу рассказать:

На какие моменты мы обращаем внимание, прежде чем пригласить кандидата на интервью, и как можно выгодно подать свой опыт.
Что, вопреки популярным мифам о поиске работы, наоборот, не оказывает влияния на решение работодателя.
Что делать, если нынешнего опыта объективно не хватает для позиции мечты.

А главное — хочу объяснить логику, которой мы руководствуемся, чтобы процесс больше не выглядел магией.

Не воспринимайте написанное как универсальный рецепт или требования. Скорее это дружеские советы и взгляд со стороны. У вас вообще может не быть резюме, если вы топовый разработчик, звезда конференций, у вас крутой профиль на GitHub, вас рекомендует друг и так далее. Эта статья — для начинающих специалистов и тех, кто впервые сталкивается с поиском работы.

Читать дальше →

+79

106