NIX_Solutions Jul 24 2018 at 11:06

Памятки по искусственному интеллекту, машинному обучению, глубокому обучению и большим данным

4 min

36K

NIX corporate blogBig Data*Machine learning*Artificial Intelligence

Translation

В течение нескольких месяцев мы собирали памятки по искусственному интеллекту, которыми периодически делились с друзьями и коллегами. В последнее время сложилась целая коллекция, и мы добавили к памяткам описания и/или цитаты, чтобы было интереснее читать. А в конце вас ждёт подборка по сложности «О большое» (Big-O). Наслаждайтесь.

UPD. Многие картинки будут читабельнее, если открыть их в отдельных вкладках или сохранить на диск.

Нейронные сети

Памятка по нейронным сетям

Графы нейронных сетей

Памятка по графикам нейронных сетей

Памятка по нейронным сетям

Обзор по машинному обучению

Памятка по машинному обучению

Алгоритм Scikit-learn

Эта памятка по машинному обучению поможет найти подходящий алгоритм для оценки, что является наиболее сложной частью работы. Блок-схема поможет проверить документацию и задаст общее направление по каждому алгоритму. Это позволит лучше понять стоящие перед вами проблемы и способы их решения.

Scikit-learn (ранее известная как scikits.learn) — это бесплатная библиотека машинного обучения для Python. В нее входят различные виды классификации, регрессии и алгоритмы кластеризации, включающие метод опорных векторов, алгоритм Random forest («случайный лес»), градиентный бустинг, метод k-средних и DBSCAN. Scikit-learn предназначена для взаимодействия с вычислительными и научными библиотеками Python NumPy и SciPy.

Памятка по Scikit-learn

Памятка по алгоритмам машинного обучения

Эта памятка от Microsoft Azure поможет с выбором подходящих алгоритмов машинного обучения для вашего предсказательного аналитического решения. Вначале памятка спросит о природе данных, а затем посоветует наилучший алгоритм.

Python для Data Science

Памятка по Python для Data Science

Памятка по большим данным

TensorFlow

В мае 2017 года Google анонсировал TPU второго поколения, а также их доступность в Google Compute Engine. TPU второго поколения обладают производительностью до 180 терафлопов, а при кластеризации по 64 TPU — до 11,5 петафлопов.

Памятка по TensorFlow

Keras

В 2017 году команда TensorFlow в Google решила внедрить поддержку Keras в основную библиотеку TensorFlow. Шолле (Chollet) объяснил, что Keras является, скорее, интерфейсом, чем сквозной системой машинного обучения. Он предоставляет высокоуровневый, более интуитивный набор абстракций, который упрощает конфигурирование нейронных сетей, вне зависимости от используемой в бэкенде библиотеки научных вычислений

NumPy

NumPy предназначен для Cpython, эталонной реализации Python, которая является не оптимизирующим интерпретатором байт-кода. Математические алгоритмы, написанные для этой версии Python, часто работают гораздо медленнее скомпилированных аналогов. Библиотека NumPy частично решает проблему скорости за счет многомерных массивов, а также функций и операторов, оптимизированных для работы с массивами. Необходимо будет переписать часть кода с использованием NumPy, в основном внутренние циклы.

Памятка по NumPy

Pandas

Название «Pandas» происходит от эконометрического термина "panel data", который применяется для многомерных структурированных наборов данных.

Памятка по Pandas

Data Wrangling

Data Wrangling («выпас» данных, первичная обработка данных) — этот термин начинает проникать в поп-культуру. В фильме 2017 «Конг: Остров черепа» один из героев представлен как «Стив Вудвард, наш data wrangler».

Памятка по Data Wrangling

Памятка по Pandas Data Wrangling

Data Wrangling с помощью dplyr и tidyr

Памятка по Data Wrangling с dplyr и tidyr

SciPy

В основе SciPy лежит объект-массив NumPy. Эта библиотека является частью стека NumPy, который включает такие инструменты, как Matplotlib, Pandas и SymPy, а также расширяющийся набор библиотек для научных вычислений. У стека NumPy и приложений MATLAB, GNU Octave и Scilab одна и та же аудитория пользователей. Стек NumPy также иногда называют стеком SciPy.

Памятка по SciPy

Matplotlib

Matplotlib — это библиотека для построения графиков для Python и его вычислительного математического расширения NumPy. Она предоставляет объектно-ориентированный API для встраивания графиков в приложения с использованием универсальных GUI-инструментов, таких как Tkinter, wxPython, Qt, или GTK+. Существует также процедурный интерфейс «pylab» на основе конечного автомата (например, OpenGL), разработанный так, чтобы походить MATLAB, хотя его использование не рекомендуется. SciPy использует matplotlib.

Pyplot — это модуль matplotlib, который предоставляет интерфейс наподобие MATLAB. Matplotlib применяется так же, как и MATLAB, позволяет использовать Python, и к тому же бесплатен.