Алгоритмы *

Все об алгоритмах

@cointegrated 13 янв 2018 в 18:46

Как обучть мдль пнмть упртые скрщня

16 мин

42K

Data Mining * Python * Алгоритмы * Математика * Машинное обучение *

Недавно я натолкнулся на вопрос на Stackoverflow, как восстанавливать исходные слова из сокращений: например, из wtrbtl получать water bottle, а из bsktball — basketball. В вопросе было дополнительное усложнение: полного словаря всех возможных исходных слов нет, т.е. алгоритм должен быть в состоянии придумывать новые слова.

Вопрос меня заинтриговал, и я полез разбираться, какие алгоритмы и математика лежат в основе современных опечаточников (spell-checkers). Оказалось, что хороший опечаточник можно собрать из n-граммной языковой модели, модели вероятности искажений слов, и жадного алгоритма поиска по лучу (beam search). Вся конструкция вместе называется модель зашумлённого канала (noisy channel).

Вооружившись этими знаниями и Питоном, я за вечер создал с нуля модельку, способную, обучившись на тексте "Властелина колец" (!), распознавать сокращения вполне современных спортивных терминов.

Читать дальше →

+83

@ph_piter 10 янв 2018 в 11:01

Книга «Глубокое обучение. Погружение в мир нейронных сетей»

6 мин

77K

Блог компании Издательский дом «Питер»Профессиональная литература * Машинное обучение * Алгоритмы *

Привет, Хаброжители! Недавно у нас вышла первая русская книга о глубоком обучении от Сергея Николенко, Артура Кадурина и Екатерины Архангельской. Максимум объяснений, минимум кода, серьезный материал о машинном обучении и увлекательное изложение. Сейчас мы рассмотрим раздел «Граф вычислений и дифференцирование на нем» в котором вводятся основополагающее понятие для реализации алгоритмов обучения нейронных сетей.

Если у нас получится представить сложную функцию как композицию более простых, то мы сможем и эффективно вычислить ее производную по любой переменной, что и требуется для градиентного спуска. Самое удобное представление в виде композиции — это представление в виде графа вычислений. Граф вычислений — это граф, узлами которого являются функции (обычно достаточно простые, взятые из заранее фиксированного набора), а ребра связывают функции со своими аргументами.

Читать дальше →

+52

@PatientZero 3 янв 2018 в 07:08

Параллельная сортировка данных в GPU

7 мин

25K

Алгоритмы * Математика *

Перевод

В этой статье я познакомлю вас с концепцией параллельной сортировки. Мы обсудим теорию и реализацию шейдера, сортирующего пиксели.

GIF

Введение

Если вы изучали теорию вычислительных машин в 80-х или 90-х, есть вероятность, что вы упорно пытались понять, что же некоторые разработчики находят восхитительного в алгоритмах сортировки. То, что поначалу кажется незначительной задачей, оказывается краеугольным камнем Computer Science.

Но что же такое «алгоритм сортировки»? Представьте, что у вас есть список чисел. Алгоритм сортировки — это программа, получающая этот список и изменяющая порядок чисел в нём. Понятие алгоритмов сортировки часто вводится при изучении вычислительной сложности — ещё одной обширной области знания, которую я подробно рассмотрю в будущих статьях. Существует бесконечное количество способов сортировки списка элементов, и каждая стратегия обеспечивает свой собственный уникальный компромисс между затратами и скоростью.

+54

@befuddle 25 дек 2017 в 11:22

Сверточная сеть на python. Часть 3. Применение модели

7 мин

34K

Блог компании Open Data ScienceАлгоритмы * Математика * Машинное обучение * Обработка изображений *

Это заключительная часть статей о сверточных сетях. Перед прочтением рекомендую ознакомиться с первой и второй частями, в которых рассматриваются слои сети и принципы их работы, а также формулы, которые отвечают за обучение всей модели. Сегодня мы рассмотрим особенности и трудности, с которыми можно столкнуться при тестировании вручную написанной на python сверточной сети, применим написанную сеть к датасету MNIST и сравним полученные результаты с библиотекой pytorch.

Читать дальше →

+57

@Olga_ol 18 дек 2017 в 13:43

Лекции Техносферы. Нейронные сети в машинном обучении

3 мин

32K

Блог компании VKМашинное обучение * Алгоритмы * Big Data *

Представляем вашему вниманию очередную порцию лекций Техносферы. На курсе изучается использование нейросетевых алгоритмов в различных отраслях, а также отрабатываются все изученные методы на практических задачах. Вы познакомитесь как с классическими, так и с недавно предложенными, но уже зарекомендовавшими себя нейросетевыми алгоритмами. Так как курс ориентирован на практику, вы получите опыт реализации классификаторов изображений, системы переноса стиля и генерации изображений при помощи GAN. Вы научитесь реализовать нейронные сети как с нуля, так и на основе библиотеке PyTorch. Узнаете, как сделать своего чат-бота, как обучать нейросеть играть в компьютерную игру и генерировать человеческие лица. Вы также получите опыт чтения научных статей и самостоятельного проведения научного исследования.

+50

@befuddle 18 дек 2017 в 10:56

Сверточная сеть на python. Часть 2. Вывод формул для обучения модели

5 мин

32K

Блог компании Open Data ScienceОбработка изображений * Машинное обучение * Математика * Алгоритмы *

В прошлой статье мы рассмотрели концептуально все слои и функции, из которых будет состоять будущая модель. Сегодня мы выведем формулы, которые будут отвечать за обучение этой модели. Слои будем разбирать в обратном порядке — начиная с функции потерь и заканчивая сверточным слоем. Если возникнут трудности с пониманием формул, рекомендую ознакомиться с подробным объяснением (на картинках) метода обратного распространения ошибки, и также вспомнить о правиле дифференцирования сложной функции.

Читать дальше →

+62

@Dumbris 11 дек 2017 в 11:03

Рубрика «Читаем статьи за вас». Октябрь — Ноябрь 2017

21 мин

17K

Блог компании Open Data ScienceАлгоритмы * Математика * Машинное обучение * Обработка изображений *

Привет, Хабр! По традиции, представляем вашему вниманию дюжину рецензий на научные статьи от членов сообщества Open Data Science из канала #article_essense. Хотите получать их раньше всех — вступайте в сообщество ODS!

Статьи выбираются либо из личного интереса, либо из-за близости к проходящим сейчас соревнованиям. Напоминаем, что описания статей даются без изменений и именно в том виде, в котором авторы запостили их в канал #article_essence. Если вы хотите предложить свою статью или у вас есть какие-то пожелания — просто напишите в комментариях и мы постараемся всё учесть в дальнейшем.

Статьи на сегодня:

Читать дальше →

+58

@JustRoo 4 дек 2017 в 08:27

AlphaGo Zero совсем на пальцах

12 мин

68K

Big Data * Алгоритмы * Анализ и проектирование систем * Машинное обучение *

Завтра искусственный интеллект поработит Землю и станет использовать человеков в качестве смешных батареек, поддерживающих функционирование его систем, а сегодня мы запасаемся попкорном и смотрим, с чего он начинает.

19 октября 2017 года команда Deepmind опубликовала в Nature статью, краткая суть которой сводится к тому, что их новая модель AlphaGo Zero не только разгромно обыгрывает прошлые версии сети, но ещё и не требует никакого человеческого участия в процессе тренировки. Естественно, это заявление произвело в AI-коммьюнити эффект разорвавшейся бомбы, и всем тут же стало интересно, за счёт чего удалось добиться такого успеха.

По мотивам материалов, находящихся в открытом доступе, Семён sim0nsays записал отличный стрим:

А для тех, кому проще два раза прочитать, чем один раз увидеть, я сейчас попробую объяснить всё это буквами.

Сразу хочу отметить, что стрим и статья собирались в значительной степени по мотивам дискуссий на closedcircles.com, отсюда и спектр рассмотренных вопросов, и специфическая манера повествования.

Ну, поехали.

Читать дальше →

+58

@varagian 4 дек 2017 в 06:08

Разбираемся, что же там нового открыли в задаче о ферзях

6 мин

83K

Prolog * Алгоритмы * Занимательные задачкиМатематика * Учебный процесс в IT

Пару месяцев назад появилась занятная статья с анализом классической задачи о расстановке ферзей на шахматной доске (см. детали и историю ниже). Задача невероятно известная и вся уже рассмотрена под микроскопом, поэтому было удивительно, что появилось что-то действительно новое.

Сможете поставить ещё шесть? А найти все решения?
(картинка из статьи)

Далее, к сожалению, произошла какая-то совершенно невразумительная история из цепочки вот таких вот превращений:

Отличная статья ---пресс служба университета---> невразумительный пресс-релиз.
Пресс релиз ---занятный перевод---> непонятная статья на гиктаймс

Стоит отметить, что пять наугад открытых ссылок на русском ещё меньше проясняли картину происходящего.

Я тут подумал — надо бы кому-то эту странную цепочку прервать и нормальным языком изложить суть событий.

О чём пойдёт речь:

Читать дальше →

+81

@PatientZero 20 ноя 2017 в 08:37

Трёхмерная графика с нуля. Часть 1: трассировка лучей

42 мин

143K

Алгоритмы * Математика * 3D-графика * Разработка игр *

Перевод

Эта статья разделена на две основные части, Трассировка лучей и Растеризация, в которых рассматриваются два основных способа получения красивых изображений из данных. В главе Общие концепции представлены некоторые базовые понятия, необходимые для понимания этих двух частей.

В этой работе мы сосредоточимся не на скорости, а на чётком объяснении концепций. Код примеров написан наиболее понятным образом, который не обязательно является самым эффективным для реализации алгоритмов. Есть множество способов реализации, я выбрал тот, который проще всего понять.

«Конечным результатом» этой работы будут два завершённых, полностью рабочих рендереров: трассировщик лучей и растеризатор. Хотя в них используются очень отличающиеся подходы, при рендеринге простой сцены они дают схожие результаты:

Читать дальше →

+90

@dmitryegorov 17 ноя 2017 в 11:27

Переписать базу сообщений ВКонтакте с нуля и выжить

9 мин

63K

Блог компании VKВысоконагруженные системы * Алгоритмы * Хранение данных *

Наши пользователи пишут друг другу сообщения, не зная усталости.

Это довольно много. Если бы Вы задались целью прочитать все сообщения всех пользователей, это бы заняло больше 150 тысяч лет. При условии, что Вы довольно прокачанный чтец и тратите на каждое сообщение не больше секунды.

При таком объёме данных критически важно, чтобы логика хранения и доступа к ним была построена оптимально. Иначе в один не такой уж и прекрасный момент может выясниться, что скоро всё пойдёт не так.

Для нас этот момент наступил полтора года назад. Как мы к этому пришли и что получилось в итоге — рассказываем по порядку.

Читать дальше →

+88

@NIX_Solutions 15 ноя 2017 в 07:24

Раскрашиваем чёрно-белую фотографию с помощью нейросети из 100 строк кода

22 мин

81K

Блог компании NIXАлгоритмы * Машинное обучение *

Перевод

Перевод статьи Colorizing B&W Photos with Neural Networks.

Не так давно Амир Авни с помощью нейросетей затроллил на Reddit ветку /r/Colorization, где собираются люди, увлекающиеся раскрашиванием вручную в Photoshop исторических чёрно-белых изображений. Все были изумлены качеством работы нейросети. То, на что уходит до месяца работы вручную, можно сделать за несколько секунд.

Давайте воспроизведем и задокументируем процесс обработки изображений Амира. Для начала посмотрите на некоторые достижения и неудачи (в самом низу — последняя версия).

+60

@rakhlin 13 ноя 2017 в 11:01

Pediatric Bone Age Challenge. Deep Learning и много, много костей

7 мин

16K

Блог компании Open Data ScienceОбработка изображений * Машинное обучение * Исследования и прогнозы в IT * Алгоритмы *

Cоревнование по определению костного возраста. Заметки участника

6-го октября на радары Володи Игловикова попал очень интересный конкурс, организованный американскими рентгенологами из The Radiological Society of North America (RSNA) и Radiology Informatics Committee (RIC), и он бросил клич в сообществе ODS.ai

Целью конкурса было создание автоматической системы для определения костного возраста по рентгеновским снимкам руки. Костный возраст используется в педиатрии для комплексной оценки физического развития детей, и его отклонение от хронологического помогает выявить нарушения в работе различных систем организма. Когда дело касается медицинских проектов, меня уговаривать не надо, но это соревнование стартовало в августе и вступать в него за 8 дней до окончания выглядело авантюрой. Чтобы хотя бы начать препроцессинг снимков, требовались маски рук, и Володя сделал их за несколько дней, отличного качества, и поделился с остальными. Как он так быстро справился с этой тяжёлой задачей, включавшей ручную разметку – загадка, и об этом он, возможно, напишет сам. С масками затея уже не выглядела безнадёжной, я решился участвовать и в конечном счёте успел реализовать почти все планы.

Задача

Костный возраст (bone age) — это условный возраст, которому соответствует уровень развития костей детей и подростков. Формирование скелета происходит в несколько стадий. Это используется в педиатрии для сравнения костного возраста с хронологическим, что позволяет вовремя заметить нарушения в работе эндокринной системы и системы обмена веществ.

Для определения костного возраста в основном используются две методики — GP Грейлиха и Пайла (Greulich and Pyle) и TW2 Таннера, Уайтхауза и Хили (Tanner, Whitehouse, Healy), разработанные во второй половине XX века. Обе методики основаны на рентгенограмме кисти и лучезапястного сустава. Благодаря большому количеству участков растущей ткани в костях и ядер окостенения,

Читать дальше →

+54

@xcont 2 ноя 2017 в 04:55

Perfect shuffle

7 мин

20K

Алгоритмы * Математика * Ненормальное программирование *

Меня всегда привлекали элементарные алгоритмы, с помощью которых можно создавать сложные паттерны. Есть в таких алгоритмах что-то фундаментальное. Один из таких алгоритмов — Perfect Shuffle. Посмотрим на его необычные свойства, а также попробуем нарисовать несколько впечатляющих фракталов с помощью этого алгоритма.

Дальше много картинок, gif-анимации и немного музыки.

+55

@PatientZero 31 окт 2017 в 10:50

Реализация «Тетриса» в игре «Жизнь»

39 мин

39K

Алгоритмы * Компиляторы * Ненормальное программирование * Разработка игр *

Перевод

То, что начиналось как приключение, закончилось одиссеей.

Задача по созданию тетрис-процессора размером 2 940 928 x 10 295 296

Этот проект стал кульминацией труда множества пользователей в течение последних полутора лет. Хотя состав команды со временем менялся, в написании этой статьи принимали участие следующие авторы:

PhiNotPi
El'endia Starman
K Zhang
Muddyfish
Kritixi Lithos
Mego
Quartata

Также мы хотим поблагодарить 7H3_H4CK3R, Conor O'Brien и многих других пользователей, вложивших свои труд в решение этой задачи.

Из-за беспрецедентного масштаба этой задачи, статья разделена на несколько частей, написанных членами команды. Каждый участник писал о своей отдельной подтеме, приблизительно соответствующей тем областям проекта, в которых был задействован.

Стоит также заглянуть в GitHub нашей организации, в котором мы выложили весь код, написанный для решения задачи. Вопросы можно задавать в нашем чате разработки.

Читать дальше →

+163

@homm 26 окт 2017 в 07:53

Качественное уменьшение изображений за константное время

8 мин

29K

Алгоритмы * Высоконагруженные системы * Обработка изображений *

Хочу поделиться очень простым и эффективным методом ресайза изображении, который работает за константное время относительно размера исходного изображения и дает неожиданно качественный результат. Метод применим для любых языков и приложений.

Для начала давайте порассуждаем логически. Если вы делаете ресайз изображения, наверное вы хотите чтобы результат хотя бы отдаленно напоминал оригинал. Для этого нужно учесть как можно больше информации из исходного изображения. Вы слышали о методе «ближайшего соседа»? В этом методе для каждой точки конечного изображения просто берется какая-то одна точка из исходного изображения в неизменном виде.

Уменьшение изображения 4928×3280 до 256×170 ближайшим соседом.

Рекомендую смотреть примеры из статьи в браузере в масштабе 100% и без ретины. То есть по максимуму исключить ресайз при просмотре.

Результат не представляет ничего хорошего. Изображение дерганое, зернистое, даже трудно понять что на нем изображено. Особенно если на исходном изображении было много мелких деталей или оно само было зернистым. Почему так получается? Потому что в конечном изображении было учтено очень мало информации из исходного. Если условно отметить на исходном изображении те точки, которые попадают в конечное, получится вот такая сеточка:

Точки, которые попадут в конечное изображение размером 20×13.

Читать дальше →

+73

@chibiryaev 25 окт 2017 в 13:21

Разработка браузерной онлайн игры без фреймворков и движков

15 мин

38K

JavaScript * Node.JS * WebGL * Алгоритмы * Разработка игр *

Привет, Хабр!

В этом посте будет описан процесс разработки онлайн игры на чистом javascript и WebGL (без фреймворков и движков). Будут рассмотрены некоторые алгоритмы, техники рендеринга, искусственный интеллект ботов и сетевая игра. Проект является полностью опенсорсным, в конце поста будет ссылка на репозиторий.

Много картинок и гифок

+85

@Leono 22 окт 2017 в 12:00

Алгоритмы построения пути для беспилотного автомобиля. Лекция Яндекса

12 мин

30K

Блог компании ЯндексАлгоритмы * Математика * Промышленное программирование * Робототехника

Яндекс уже некоторое время ведет разработку беспилотного автомобиля. Перед вами одна из первых технических лекций на эту тему. В направлении беспилотных автомобилей работают сотрудники Яндекса в разных городах, включая и Минск. Автор лекции Роман Удовиченко как раз из Минска — он руководит группой обработки дорожной ситуации. На сентябрьском Я.Субботнике Роман рассказал об одной из больших задач, стоящих перед его группой.

Мы просто берем текущее положение машины, смотрим на путь, по которому мы хотели бы ехать, и плавно сворачиваем на этот путь, выруливаем на него. Получается достаточно просто. Но перемещение в городе связано с тем, что нужно соблюдать правила дорожного движения.

+56

@johnkorn 16 окт 2017 в 11:01

Смена пола и расы на селфи с помощью нейросетей

10 мин

89K

Блог компании Open Data ScienceАлгоритмы * Математика * Машинное обучение * Обработка изображений *

Привет, Хабр! Сегодня я хочу рассказать вам, как можно изменить свое лицо на фото, используя довольно сложный пайплайн из нескольких генеративных нейросетей и не только. Модные недавно приложения по превращению себя в даму или дедушку работают проще, потому что нейросети медленные, да и качество, которое можно получить классическими методами компьютерного зрения, и так хорошее. Тем не менее, предложенный способ мне кажется очень перспективным. Под катом будет мало кода, зато много картинок, ссылок и личного опыта работы с GAN'ами.

Читать дальше →

+87

@grisme 9 окт 2017 в 11:03

Рубрика «Читаем статьи за вас». Сентябрь 2017

13 мин

20K

Блог компании Open Data ScienceАлгоритмы * Математика * Машинное обучение * Обработка изображений *

Привет, Хабр! Мы продолжаем нашу традицию и снова выпускаем ежемесячный набор рецензий на научные статьи от членов сообщества Open Data Science из канала #article_essense. Хотите получать их раньше всех — вступайте в сообщество ODS!

Читать дальше →

+61

1 2 ...

19 20

22 23 ...

50 51

Алгоритмы *

Как обучть мдль пнмть упртые скрщня

Книга «Глубокое обучение. Погружение в мир нейронных сетей»

Параллельная сортировка данных в GPU

Введение

Сверточная сеть на python. Часть 3. Применение модели

Лекции Техносферы. Нейронные сети в машинном обучении

Сверточная сеть на python. Часть 2. Вывод формул для обучения модели

Рубрика «Читаем статьи за вас». Октябрь — Ноябрь 2017

AlphaGo Zero совсем на пальцах

Разбираемся, что же там нового открыли в задаче о ферзях

Трёхмерная графика с нуля. Часть 1: трассировка лучей

Переписать базу сообщений ВКонтакте с нуля и выжить

Раскрашиваем чёрно-белую фотографию с помощью нейросети из 100 строк кода

Pediatric Bone Age Challenge. Deep Learning и много, много костей

Cоревнование по определению костного возраста. Заметки участника

Задача

Ближайшие события

Perfect shuffle

Реализация «Тетриса» в игре «Жизнь»

Задача по созданию тетрис-процессора размером 2 940 928 x 10 295 296

Качественное уменьшение изображений за константное время

Разработка браузерной онлайн игры без фреймворков и движков

Алгоритмы построения пути для беспилотного автомобиля. Лекция Яндекса

Смена пола и расы на селфи с помощью нейросетей

Рубрика «Читаем статьи за вас». Сентябрь 2017

Вклад авторов