Как стать автором

Баев Александр @oldbay

GIS Python developer

Профиль Публикации 1Комментарии 200Закладки 1.7K

Stantin 23 окт 2018 в 17:00

Следование линии на основе OpenCV

4 мин

17K

Искусственный интеллектОбработка изображений*Разработка на Raspberry Pi*Робототехника

Сейчас очень популярны курсы по созданию автопилотов для машин. Вот эта нано-степень от Udacity — самый наверное известный вариант.

Много людей по нему учатся и выкладывают свои решения. Я тоже не смог пройти мимо и увлекся.

Разница в том, что курс предполагает разработку алгоритма на основе предоставляемых данных, а я делал все для своего робота.

Читать дальше →

+26

NIX_Solutions 11 окт 2018 в 10:06

Делаем проект по машинному обучению на Python. Часть 2

12 мин

51K

Блог компании NIXАлгоритмы*Машинное обучение*

Туториал

Перевод

Перевод A Complete Machine Learning Walk-Through in Python: Part Two

Собрать воедино все части проекта по машинному обучению бывает весьма непросто. В этой серии статей мы пройдём через все этапы реализации процесса машинного обучения с использованием реальных данных, и узнаем, как сочетаются друг с другом различные методики.

В первой статье мы очистили и структурировали данные, провели разведочный анализ, собрали набор признаков для использования в модели и установили базовый уровень для оценки результатов. С помощью этой статьи мы научимся реализовывать на Python и сравнивать несколько моделей машинного обучения, проводить гиперпараметрическую настройку для оптимизации лучшей модели, и оценивать работу финальной модели на тестовом наборе данных.

Весь код проекта лежит на GitHub, а здесь находится второй блокнот, относящийся к текущей статье. Можете использовать и модифицировать код по своему усмотрению!

Читать дальше →

+18

tbicr 10 окт 2018 в 17:59

Миграция схемы базы данных без даунтайма для postgresql на примере django

10 мин

15K

Django*PostgreSQL*Python*

Введение

Привет, Хабр!

Хочу поделиться опытом написания миграций для postgres и django. Речь в основном пойдёт про postgres, django же здесь хорошо дополняет, так как из коробки имеет автоматическую миграцию схемы данных по изменениям модельки, то есть имеет довольно полный список рабочих операций по изменению схемы. Django можно заменить на любой любимый фрэймворк/библиотеку — подходы скорее всего будут похожи.

Не буду описывать как я к этому пришёл, но сейчас читая документацию ловлю на мысли, что нужно было с большей внимательностью и осознанием делать это раньше, поэтому очень рекомендую.

Перед тем как пойти дальше позволю себе сделать следующие предположения.

Можно разделить логику работы с базой данных большинства приложений на 3 части:

Миграции — изменение схемы базы данных (таблиц), предположим мы всегда запускаем их в один поток.
Бизнес логика — непосредственная работа с данными (в пользовательских таблицах), работает с одними и теми же данными постоянно и конкурентно.
Миграции данных — не изменяют схемы данных, работают по сути как бизнес логика, по умолчанию, когда будем говорить про бизнес логику, будем также подразумевать и миграции данных.

Даунтайм — это состояние, когда часть нашей бизнес логики не доступна/падает/грузится на заметное для пользователя время, предположим это пару секунд.

Отсутствие даунтайма может быть критическим для бизнеса условием, которого любыми усилиями нужно придерживаться.

Читать дальше →

+13

NIX_Solutions 4 окт 2018 в 10:15

Делаем проект по машинному обучению на Python. Часть 1

13 мин

90K

Блог компании NIXМашинное обучение*

Туториал

Перевод

Перевод A Complete Machine Learning Project Walk-Through in Python: Part One.

Когда читаешь книгу или слушаешь учебный курс про анализ данных, нередко возникает чувство, что перед тобой какие-то отдельные части картины, которые никак не складываются воедино. Вас может пугать перспектива сделать следующий шаг и целиком решить какую-то задачу с помощью машинного обучения, но с помощью этой серии статей вы обретёте уверенность в способности решить любую задачу в сфере data science.

Чтобы у вас в голове наконец сложилась цельная картина, мы предлагаем разобрать от начала до конца проект применения машинного обучения с использованием реальных данных.

Читать дальше →

+18

helenblack 27 сен 2018 в 08:59

Символьные вычисления средствами Python. Часть1. Основы

7 мин

77K

Python*Программирование*

Туториал

При решении задач математического моделирования процессов и объектов часто очень практично использовать алгоритмы на языке Python с использованием символьных вычислений. Основываясь на библиотеке SymPy, Python с успехом справляется с решением уравнений и систем, интегрированием и дифференцированием, вычислением пределов, разложением в ряд и суммированием рядов, упрощением выражений, выполняет поиск решения дифференциальных уравнений и систем.

Читать дальше →

+23

Nokta_strigo 28 авг 2018 в 21:39

Что записано в файле .ssh/known_hosts

5 мин

63K

Информационная безопасность*Криптография*Сетевые технологии*

Каждый раз, когда мы подключаемся по протоколу ssh к серверу, ssh клиент проверяет совпадает ли публичный ключ для этого сервера с тем, который был прошлый раз (по крайней мере так рекомендует делать стандарт ssh). В OpenSSH список известных ключей серверов хранится в файле known_hosts. Под катом коротко о том, что и как конкретно там хранится.

Читать дальше →

+43

pagin 24 авг 2018 в 11:07

Почему не стоит выкидывать Radeon, если ты увлекся машинным обучением?

4 мин

56K

Машинное обучение*Исследования и прогнозы в IT*Искусственный интеллектВысокая производительность*Python*

Свою рабочую станцию мне выдалось собирать, будучи студентом. Достаточно логично, что я отдавал предпочтение вычислительным решениям AMD. потому что это ~~дешево~~ выгодно по соотношению цена/качество. Я долго подбирал компоненты, в итоге уложился в 40к с комплектом из FX-8320 и RX-460 2GB. Сначала этот комплект казался идеальным! Мы с соседом по комнате слегка майнили Monero и мой набор показывал 650h/s против 550h/s на наборе из i5-85xx и Nvidia 1050Ti. Правда, от моего набора в комнате бывало слегка жарковато по ночам, но это решилось, когда я приобрел башенный кулер к CPU.

Читать дальше →

+50

ZlodeiBaal 30 июл 2018 в 01:02

Правда и ложь систем распознавания лиц

11 мин

62K

Блог компании RecognitorData Mining*Алгоритмы*Машинное обучение*Обработка изображений*

Пожалуй нет ни одной другой технологии сегодня, вокруг которой было бы столько мифов, лжи и некомпетентности. Врут журналисты, рассказывающие о технологии, врут политики которые говорят о успешном внедрении, врут большинство продавцов технологий. Каждый месяц я вижу последствия того как люди пробуют внедрить распознавание лиц в системы которые не смогут с ним работать.

Тема этой статьи давным-давно наболела, но было всё как-то лень её писать. Много текста, который я уже раз двадцать повторял разным людям. Но, прочитав очередную пачку треша всё же решил что пора. Буду давать ссылку на эту статью.

Итак. В статье я отвечу на несколько простых вопросов:

Можно ли распознать вас на улице? И насколько автоматически/достоверно?
Позавчера писали, что в Московском метро задерживают преступников, а вчера писали что в Лондоне не могут. А ещё в Китае распознают всех-всех на улице. А тут говорят, что 28 конгрессменов США преступники. Или вот, поймали вора.
Кто сейчас выпускает решения распознавания по лицам в чём разница решений, особенности технологий?

Большая часть ответов будет доказательной, с сылкой на исследования где показаны ключевые параметры алгоритмов + с математикой расчёта. Малая часть будет базироваться на опыте внедрения и эксплуатации различных биометрических систем.

Я не буду вдаваться в подробности того как сейчас реализовано распознавание лиц. На Хабре есть много хороших статей на эту тему: а, б, с (их сильно больше, конечно, это всплывающие в памяти). Но всё же некоторые моменты, которые влияют на разные решения — я буду описывать. Так что прочтение хотя бы одной из статей выше — упростит понимание этой статьи. Начнём!

+83

kirillkosolapov 10 июл 2018 в 22:29

Принцип работы свёрточной нейронной сети. Просто о сложном

5 мин

40K

Читальный залМашинное обучение*Искусственный интеллектВизуализация данных*Алгоритмы*

Перевод

Глубокие нейронные сети привели к прорыву во множестве задач распознавания образов, таких как компьютерное зрение и распознавание голоса. Сверточная нейронная сеть один из популярных видов нейронных сетей.

В своей основе сверточную нейронную сеть можно рассматривать как нейронную сеть, использующую множество идентичных копий одного и того же нейрона. Это позволяет сети иметь ограниченное число параметров при вычислении больших моделей.

2D Свёрточная нейронная сеть

Читать дальше →

+19

i0am0raa 10 июл 2018 в 10:54

Как из PostgreSQL и ClickHouse в Python много, быстро и сразу в numpy

4 мин

24K

PostgreSQL*Python*SQL*Программирование*

Из песочницы

Разбил много кружек в поисках решения для быстрого получения длинных историй цен для большого количества активов в Python. Ещё имел смелость желать работать с ценами в numpy-массивах, а лучше сразу в pandas.

Стандартные подходы в лоб работали разочаровывающе, что приводило к выполнению запроса к БД в течение 30 секунд и более. Не желая мириться, я нашёл несколько решений, которые полностью меня удовлетворили.

Читать дальше →

+13

saul 9 июл 2018 в 13:58

AI, практический курс. Обзор нейронных сетей для классификации изображений

8 мин

29K

Блог компании IntelМашинное обучение*Обработка изображений*Программирование*

Перевод

В данной статье приводится доступный теоретический обзор сверточных нейронных сетей (Convolutional Neural Network, CNN) и разъясняется их применение к задаче классификации изображений.

Читать дальше →

+23

petuniaguardian 8 июл 2018 в 13:30

NumPy в Python. Часть 4

8 мин

114K

Туториал

Предисловие переводчика

Всем здравствуйте, вот мы и подошли к конечной части. Приятного чтения!
Навигация:

Математика многочленов

NumPy предоставляет методы для работы с полиномами. Передавая список корней, можно получить коэффициенты уравнения:

>>> np.poly([-1, 1, 1, 10])
array([ 1, -11,   9,  11, -10])

Здесь, массив возвращает коэффициенты соответствующие уравнению:

$inline$ .

Читать дальше →

+26

MaxRokatansky 5 июл 2018 в 17:24

Как использовать HDF5-файлы в Python

20 мин

48K

Блог компании OTUSPython*Программирование*

Перевод

Всем привет!

Приближается запуск курса «Web-разработчик на Python», соответственно, мы всё так же делимся интересными статьями и приглашаем на наши открытые уроки, где можно посмотреть интересный материал, познакомиться с преподавателями и позадавать им вопросы.

Поехали!

HDF5 позволяет эффективно хранить большие объемы данных

При работе с большими объемами данных, будь то экспериментальные или имитируемые, их хранение в нескольких текстовых файлах не очень эффективно. Иногда вам нужно получить доступ к конкретному подмножеству данных, и вы хотите сделать это быстро. В этих ситуациях формат HDF5 решает обе проблемы благодаря очень оптимизированной надстроенной библиотеке. HDF5 широко используется в научных средах и имеет отличную реализацию в Python, предназначенную для работы с NumPy прямо из коробки.

Формат HDF5 поддерживает файлы любого размера, и каждый файл имеет внутреннюю структуру, которая позволяет вам искать определенный набор данных. Это можно представить как отдельный файл со своей собственной иерархической структурой, так же как набор папок и подпапок. По умолчанию данные хранятся в двоичном формате, и библиотека совместима с разными типами данных. Одним из наиболее важных вариантов формата HDF5 является то, что он позволяет прикреплять метаданные к каждому элементу структуры, что делает его идеальным для создания автономных файлов.

Читать дальше →

+16

backmeupplz 4 июл 2018 в 22:33

Нейронки за 5 минут

5 мин

172K

Программирование*Ненормальное программирование*Машинное обучение*Искусственный интеллектАлгоритмы*

Давайте я за 5-10 минут чтения и понимания коротенькой статьи добавлю вам в резюме строчки «машинное обучение» и «нейронные сети»? Тем, кто далек от программирования, я развею все мифы о сложности ИИ и покажу, что большая часть всех проектов на машинном обучении строится на предельно простых принципах. Поехали — у нас всего пять минут.

Рассмотрим самый базовый пример нейронных сетей — перцептроны; я сам только после этого примера полностью осознал, как работают нейронные сети, так что, если я не накосячу, и вы сможете понять. Помните: никакой магии здесь нет, простая математика уровня пятого класса средней школы.

Читать дальше →

+84

JungleTryne 4 июл 2018 в 16:55

Формула Таппера и реализация алгоритма на Python

6 мин

46K

Python*Математика*Программирование*

Из песочницы

Вместо предисловия

Не так давно на просторах интернета узнал о такой замечательной и удивительной копии Вавилонской библиотеки как о формуле Таппера. Вернее, это больше неравенство Таппера, чем формула. Особенность данного неравенства — оно создает собственное же изображение на графике. Просто посмотрите на это чудо!

То, что Вы видите на изображении, и является формулой того самого Джеффа Таппера. Наверное, половина читателей уже понеслась в вольфраме рисовать результат выполнения данного неравенства… Но тут не все так просто. Как вы можете заметить в данном изображении, формула на графике может быть замечена на отрезке по оси OY [k; k+15]. Что же это за загадочное число k? Где же его взять? Все дело в том, что данное неравенство, по концепции Вавилонской библиотеки, способно вывести абсолютно любое изображение с разрешением 106х17! Каждое изображение, имеет собственную позицию на графике, тем самым, имеет уникальное число k. Таким образом, для каждого числа k существует единственное изображение на всем графике!

Для данного же изображения число k выглядит следующим образом:

4858450636189713423582095962494202044581400587983244549483093085061934704708809928450644769865524364849997247024915119110411605739177407856919754326571855442057210445735883681829823754139634338225199452191651284348332905131193199953502413758765239264874613394906870130562295813219481113685339535565290850023875092856892694555974281546386510730049106723058933586052544096664351265349363643957125565695936815184334857605266940161251266951421550539554519153785457525756590740540157929001765967965480064427829131488548259914721248506352686630476300

Интересно посмотреть на людей, которые будут прокручивать до такой координаты, чтобы увидеть формулу

Читать дальше →

+64

SLY_G 3 июл 2018 в 16:00

Почему физики считают, что теория струн может оказаться «теорией всего»

6 мин

58K

Научно-популярноеФизика

Перевод

В основе теории струн лежит идея о том, что вместо нульмерных элементарных частиц Вселенная состоит из одномерных струн

Теория струн – одна из самых гениальных, противоречивых и недоказанных идей физики. В её основе лежит физический тренд, живущий много столетий – что на некоем фундаментальном уровне все различные силы, частицы, взаимодействия и проявления реальности связываются вместе как разные части одной платформы. Вместо четырёх независимых фундаментальных взаимодействий – сильного, электромагнитного, слабого и гравитационного – есть одна объединённая теория, охватывающая их всех.

Во многих смыслах, теория струн – лучший кандидат на квантовую теорию гравитации, объединяющую взаимодействия на высочайших уровнях энергий. И хотя тому нет экспериментальных подтверждений, существуют убедительные теоретические причины считать, что это так и есть. В 2015 году крупнейший из живущих специалистов по теории струн, Эдвард Виттен, написал работу о том, что каждый физик должен знать о теории струн. И вот, что она означает – даже если вы не физик.

Читать дальше →

+22

Tishka17 1 июл 2018 в 21:12

Введение в Data classes

7 мин

227K

Одна из новых возможностей, появившихся в Python 3.7 — классы данных (Data classes). Они призваны автоматизировать генерацию кода классов, которые используются для хранения данных. Не смотря на то, что они используют другие механизмы работы, их можно сравнить с "изменяемыми именованными кортежами со значениями по умолчанию".

Введение

Все приведенные примеры требуют для своей работы Python 3.7 или выше

Большинству python-разработчикам приходится регулярно писать такие классы:

class RegularBook:
    def __init__(self, title, author):
        self.title = title
        self.author = author

Уже на этом примере видна избыточность. Идентификаторы title и author используются несколько раз. Реальный класс же будет ещё содержать переопределенные методы __eq__ и __repr__.

Модуль dataclasses содержит декоратор @dataclass. С его использованием аналогичный код будет выглядеть так:

from dataclasses import dataclass

@dataclass
class Book:
    title: str
    author: str

Читать дальше →

+44

lozga 18 июн 2018 в 06:55

Жизнь после взрыва

6 мин

41K

Научно-популярноеКосмонавтика

Взрыв, которым закончились испытания ракетного двигателя частной российской компании Лин Индастриал в декабре 2016 года, громко прозвучал не только в физическом, но и в информационном пространстве. К сожалению, сразу после происшествия, компания перешла в режим молчания, написав, что любое обсуждение может сильно ухудшить ситуацию. Спустя полтора года мы, наконец, можем узнать, чем закончилась история, как жила, а, точнее, выживала Лин Индастриал все это время, и какие у них планы сейчас. А еще мне удалось упросить руководителя фирмы, Александра Ильина, опубликовать полное видео испытаний, и мы наконец можем увидеть тот самый исторический взрыв.

+66

N01Z3 14 июн 2018 в 14:01

Kaggle: Amazon from Space — трюки и хаки при обучении нейросетей

9 мин

19K

Блог компании Open Data SciencePython*Алгоритмы*Машинное обучение*Обработка изображений*

Летом прошлого года закончилось соревнование на площадке kaggle, которое было посвящено классификации спутниковых снимков лесов Амазонки. Наша команда заняла 7 место из 900+ участников. Не смотря на то, что соревнование закончилось давно, почти все приемы нашего решения применимы до сих пор, причём не только для соревнований, но и для обучения нейросетей для прода. За подробностями под кат.

Читать дальше →

+56

Firemoon 13 июн 2018 в 11:07

Насколько хорошо ты знаешь bash?

4 мин

39K

Занимательные задачкиОболочки*Системное администрирование*

Пользуешься командным интерпретатором каждый день? Готов решить несколько логических задачек и узнать что-то новое? Добро пожаловать под кат.

Читать дальше →

+35

3

4 5 ...