Pull to refresh
0
@infinity8read⁠-⁠only

User

Send message

Введение в курс «Анализ изображений и видео». Лекции от Яндекса

Reading time8 min
Views70K
Мы начинаем публиковать лекции Натальи Васильевой, старшего научного сотрудника HP Labs и руководителя HP Labs Russia. Наталья Сергеевна читала курс, посвящённый анализу изображений, в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS клуба



Всего в программе — девять лекций. В первой из них рассказывается о том, как применяется анализ изображений в медицине, системах безопасности и промышленности, какие задачи оно еще не научилось решать, какие преимущества имеет зрительное восприятие человека. Расшифровка этой части лекций — под катом. Начиная с 40-й минуты, лектор рассказывает об эксперименте Вебера, представлении и восприятии цвета, цветовой системе Манселла, цветовых пространствах и цифровых представлениях изображения. Полностью слайды лекции доступны по ссылке.
Читать дальше →
Total votes 60: ↑54 and ↓6+48
Comments5

Хватит заниматься Freemium – пора зарабатывать

Reading time6 min
Views59K
Вопрос о целесообразности использования Freemium актуален для самых разных продуктов и решений. Быть или не быть? Свои мысли на этот счет излагает Линкольн Мэрфи. Рассуждения подкреплены данными о компаниях, которые очень известны.

Позвольте мне объясниться… Я не ненавижу Freemium.

Вообще, нет такой маркетинговой стратегии, модели получения прибыли или привлечения клиентов, которую бы я ненавидел. В том числе и Freemium. Просто мне кажется, что при выборе бизнес-модели иногда следует более серьезно задуматься о том, что имеет смысл использовать, а от чего надо отказаться..
Читать дальше →
Total votes 57: ↑46 and ↓11+35
Comments22

SpeechMarkup API — превращаем речь в данные

Reading time8 min
Views18K

В статье пойдет речь о том, как из любого запроса на естественном языке получить реальные данные, с которыми может работать ваше приложение. А именно, о REST API сервиса SpeechMarkup, который преобразует обычную строчку текста в JSON со всеми найденными смысловыми сущностями с конкретными данными в каждой из них.

Да-да, это та самая технология, которая лежит в основе любого голосового ассистента и используется в поисковиках.
Она позволяет однозначно интерпретировать запрос, а затем вернуть вашему приложению результат в виде обычного набора данных.

В статье я расскажу, для чего можно использовать данный API и приведу небольшой пример работающего приложения.

Читать дальше →
Total votes 31: ↑28 and ↓3+25
Comments49

Учёные ищут путешественников во времени

Reading time6 min
Views42K


Путешествие во времени возможно — по крайней мере, так говорят серьёзные учёные. Скорее всего, тюнингованный Делореан для такого путешествия не подойдёт; зато путешественники во времени могли бы использовать «кротовые норы», цилиндры Типлера, и прочие механизмы, опирающиеся на Теорию относительности Эйнштейна. Тогда почему же мы до сих пор не встретили ни одного такого путешественника?

Этот вопрос может показаться глупым, но учёные относятся к нему совершенно серьёзно. Единственное, что окончательно доказало бы осуществимость путешествий во времени — это встреча с гостем из будущего. Учёные уже больше века спорят о возможности таких путешествий, так что гость, разом разрешающий все споры, был бы крайне желанным. Вдохновлённые этим, учёные и мечтатели с неиссякающим энтузиазмом продолжают ставить эксперименты по выявлению гостей из будущего в нашем современном мире.

Один из таких экспериментаторов — знаменитый учёный Стивен Хокинг. Он абсолютно убеждён в возможности путешествий во времени, и даже знает, как должна быть устроена машина времени. Он задаётся вопросом: «Если путешествия во времени возможны, то где же туристы из будущего?» Действительно, где они?
Читать дальше →
Total votes 58: ↑52 and ↓6+46
Comments311

Машинное обучение как сервис — бесплатно и в облаке

Reading time1 min
Views19K
Мы уже писали о машинном обучении как сервисе в облаке Microsoft Azure здесь. И, совсем недавно, Microsoft решили открыть (как ранее с Azure Web Sites) возможность бесплатного тестирования этого тестирования без аккаунта Microsoft Azure, без кредитной карты. Отличная возможность посмотреть, что умеет Machine Learning в облаке.


Читать дальше →
Total votes 42: ↑25 and ↓17+8
Comments15

Компьютерное зрение: распознавание одежды на фотографии с помощью мобильного приложения

Reading time6 min
Views24K
Не так давно мы решили сделать проект, который позволял бы искать одежду в различных интернет-магазинах по фотографии (картинке). Идея проста — пользователь загружает изображение (фото), выделяет интересующую его область (футболку, штаны и т.п.), указывает (опционально) уточняющие параметры (пол, размер и т.п.), и система ищет похожую одежду в наших каталогах, сортируя ее по степени схожести с оригиналом.

Сама идея не то что бы новая, но качественно никем не реализованная. На рынке уже несколько лет есть проект www.snapfashion.co.uk, но релевантность его поиска очень низкая, подбор происходит в основном по определению цвета изображения. Например, красное платье он сможет найти, но платье с определенным фасоном или рисунком уже нет. Аудитория этого проекта, к слову, не растет, мы это связываем с тем, что поиск определенно низкой релевантности и, по сути, ничем не отличается, если вы выберете на сайте магазина цвет при поиске по их каталогу.

В 2013 году появился проект www.asap54.com, и здесь поиск чуть лучше. Упор стоит на цвет и некоторые небольшие опции, указываемые вручную из специального каталога (короткое платье, длинное платье, платье средней длинны). Этот проект, столкнувшись с трудностями визуального поиска, слегка завернул в сторону социальных сетей, где модники могут делиться своими «луками» в одежде, из «шазама для одежды» в «инстаграм для модников».

Несмотря на то, что проекты в этой области существуют, определенно остается непокрытой потребность поиска по картинке, очень актуальная сегодня. И решение данной проблемы созданием мобильного приложения, как это сделали SnapFashion и Asap54, наиболее отвечает тенденциям e-commerce рынка: по различным прогнозам доля мобильных продаж в США с 11% в 2013 году может вырасти да 25-50% в 2017. Такой стремительный рост мобильной торговли предвещает и рост популярности самых разных приложений, помогающих совершать покупки. И скорее всего магазины будут сами вкладываться в разработку, продвижение подобных приложений, а также активно сотрудничать с ними.

Проанализировав конкурентов, мы решили, что нужно попробовать самим разобраться с этой темой и запустили проект Sarafan www.getsarafan.com.
Читать дальше →
Total votes 14: ↑12 and ↓2+10
Comments14

Если вы хотите следовать своей мечте, скажите «нет» отвлекающим делам

Reading time4 min
Views162K
imageСтатьи, написанные Oliver Emberton, постоянно вызывают повышенный интерес. Сегодня представляем вам перевод самой свежей публикации автора.

Дисклэймер: мы не ставили себе цель дословного или абсолютно точного перевода оригинала. Главное — передать его смысл. Просим помнить об этом при прочтении. Итак, начнем!

Если вы хотите следовать своей мечте, скажите «нет» отвлекающим делам!

Наш мозг порой ведет себя как пляжный мячик, наполненный пчелами. Сотни противоречащих друг другу импульсов толкают нас в разные стороны.
Читать дальше →
Total votes 71: ↑57 and ↓14+43
Comments24

Парные товары. Размещения товаров в торговом зале

Reading time2 min
Views23K


В этом небольшом и простом кейсе мы расскажем, что такое парные товары, и как с помощью ассоциативных взаимосвязей увеличить доходность бизнеса.

Итак, Пары — это товары, часто покупаемые вместе. В паре один товар является ключевым (якорным), а второй — сопутствующим. On-line сервис Datawiz.io выявляет парные взаимосвязи товаров при помощи алгоритма APRIORI.
Читать дальше →
Total votes 24: ↑18 and ↓6+12
Comments17

Обучение OpenCV каскада Хаара

Reading time8 min
Views191K
На хабре уже есть несколько статей и про то, что такое каскад Хаара (раз, два, три). Есть даже одна, где затронут процесс обучения, но в отношении описанной задачи. На тему обучения есть пара неплохих статей на английском (первая, вторая, третья), но, на мой взгляд, они путанные: либо рассказывают очень мало, либо слишком много и обо всём — выделить нужную мысль сложно.
image
В этой статье я попробую показать, как обучить каскад с нуля за несколько часов, натренировав на поиск простого предмета в видеопотоке (примером будет очаровательная сова с фотографии). Все обучающие выборки и программы будут приложены.
Зачем всё это нужно? Каскад Хаара это один из простейших способов распознавания классов объектов с большой скоростью работы. К ним относятся лица и руки людей, номера автомобилей, пешеходы. Детектором Хаара просто находить животных в кадре (кстати, удивительно, что я не видел ещё ни одной автоматической кормушки для синиц на raspberry pi). К тому же, готовые реализации OpenCV есть под большинство существующих систем (даже для blackfin'a встречал). Всё это делает Хаара одним из самых удобных методов, позволяющих решать задачи видеообработки даже людям, которые никогда не работали с обработкой видео.
Читать дальше →
Total votes 59: ↑57 and ↓2+55
Comments19

Пару слов о распознавании образов

Reading time13 min
Views309K
Давно хотел написать общую статью, содержащую в себе самые основы Image Recognition, некий гайд по базовым методам, рассказывающий, когда их применять, какие задачи они решают, что возможно сделать вечером на коленке, а о чём лучше и не думать, не имея команды человек в 20.
image

Какие-то статьи по Optical Recognition я пишу давненько, так что пару раз в месяц мне пишут различные люди с вопросами по этой тематике. Иногда создаётся ощущение, что живёшь с ними в разных мирах. С одной стороны понимаешь, что человек скорее всего профессионал в смежной теме, но в методах оптического распознавания знает очень мало. И самое обидное, что он пытается применить метод из близрасположенной области знаний, который логичен, но в Image Recognition полностью не работает, но не понимает этого и сильно обижается, если ему начать рассказывать что-нибудь с самых основ. А учитывая, что рассказывать с основ — много времени, которого часто нет, становится всё ещё печальнее.
Распознать
Total votes 130: ↑129 and ↓1+128
Comments52

Камуфляж против видеонаблюдения

Reading time3 min
Views121K


Сейчас в крупных городах практически не осталось мест, находящихся вне поля зрения одной или нескольких камер — полицейские и муниципальные камеры на улицах и площадях, частные системы видеонаблюдения в магазинах и кафе, видеорегистраторы в автомобилях, камеры смартфонов, а скоро и Google Glass, и других подобных гаджетов — часто в нашу сторону могут смотреть несколько объективов одновременно. Добавьте к этому функции распознавания лиц в социальных сетях и продвинутые системы видеоаналитики наподобие этой — и получится, что почти каждый наш шаг записывается и анализируется.

Каждое действие порождает противодействие, и в последнее время один за другим стали появляться проекты, цель которых — защититься от «всевидящего ока» или хотя бы привлечь внимания общества к проблеме тотального наблюдения.
Читать дальше →
Total votes 134: ↑125 and ↓9+116
Comments149

Автоматическое распознавание эмоций позволит улучшить дистанционное обучение

Reading time2 min
Views12K
В Университете штата Северная Каролина объединили две бурно развивающиеся технологии — онлайн-обучение и автоматическое распознавание эмоций. Учёные провели серию экспериментов, в ходе которых во время прохождения курсов лицо студентов снимала веб-камера, видео с которой анализировала система компьютерного зрения, умеющая распознавать выражения лица и эмоции человека. На основании этих данных компьютер может модифицировать стратегию обучения и давать ценную обратную связь для преподавателей — вместо того, чтобы гадать, какие части урока трудны для понимания, а какие навевают скуку, теперь можно просто посмотреть статистику.


Пример автоматического определения движений мимических мышц
Читать дальше →
Total votes 27: ↑23 and ↓4+19
Comments12

Система компьютерного зрения, разработанная в MIT, позволяет успешнее проходить собеседования

Reading time2 min
Views24K
В Массачусетском технологическом институте разработали программу для тренировки навыков общения. Она работает на обычном компьютере с веб-камерой. Программа выводит на экран трёхмерный анимированный персонаж, который «общается» с человеком и задаёт ему вопросы. Программа использует компьютерное зрение и распознавание речи, чтобы поддерживать визуальный контакт с человеком. Но самое интересное начинается потом. Программа воспроизводит запись разговора, сопровождая её подробными данными о жестах, смене выражений лица, тембре и интонациях голоса, частоте использования слов-паразитов вроде «вобщем», «как-бы», «ну». Это позволяет не просто взглянуть на себя со стороны, но и вывести на сознательный уровень все те признаки, по которым люди составляют интуитивное впечатление о собеседнике.



Читать дальше →
Total votes 46: ↑44 and ↓2+42
Comments12

Компьютерное зрение. Лекция для Малого ШАДа Яндекса

Reading time7 min
Views66K
Область применения компьютерного зрения очень широка: от считывателей штрихкодов в супермаркетах до дополненной реальности. Из этой лекции вы узнаете, где используется и как работает компьютерное зрение, как выглядят изображения в цифрах, какие задачи в этой области решаются относительно легко, какие трудно, и почему.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые смогут почерпнуть из нее много полезного.



Возможность видеть и распознавать объекты – естественная и привычная возможность для человека. Однако для компьютера пока что – это чрезвычайно сложная задача. Сейчас предпринимаются попытки научить компьютер хотя бы толике того, что человек использует каждый день, даже не замечая того.

Наверное, чаще всего обычный человек встречается с компьютерным зрением на кассе в супермаркете. Конечно, речь идет о считывании штрихкодов. Они были разработаны специально именно таким образом, чтобы максимально упростить компьютеру процесс считывания. Но есть и более сложные задачи: считывание номеров автомобилей, анализ медицинских снимков, дефектоскопия на производстве, распознавание лиц и т.д. Активно развивается применение компьютерного зрения для создания систем дополненной реальности.

Подробный конспект лекции
Total votes 53: ↑50 and ↓3+47
Comments11

Распознавание пола в изображениях и видео

Reading time8 min
Views51K
В данной статье представлен алгоритм распознавания пола, обладающий точностью 93.1% [1]. Статья не требует каких-либо предварительных знаний в области обработки изображений или машинного обучения. После прочтения статьи читатель будет в состоянии выполнить рассмотренный алгоритм самостоятельно.


Читать дальше →
Total votes 90: ↑90 and ↓0+90
Comments68

Нейросети для чайников. Начало

Reading time5 min
Views798K


Так получилось, что в университете тема нейросетей успешно прошла мимо моей специальности, несмотря на огромный интерес с моей стороны. Попытки самообразования несколько раз разбивались невежественным челом о несокрушимые стены цитадели науки в облике непонятных «с наскока» терминов и путанных объяснений сухим языком вузовских учебников.

В данной статье (цикле статей?) я попытаюсь осветить тему нейросетей с точки зрения человека непосвященного, простым языком, на простых примерах, раскладывая все по полочкам, а не «массив нейронов образует перцептрон, работающий по известной, зарекомендовавшей себя схеме».

Заинтересовавшихся прошу под кат.
Читать дальше →
Total votes 258: ↑226 and ↓32+194
Comments91

Подробно о Xamarin

Reading time12 min
Views441K
Вы неплохо владеете языком C# и платформой .NET в целом? Вам надоело стоять в стороне и смотреть, как кто-то другой пишет крутые мобильные приложения вместо вас? У меня есть для вас кое-что интересное! То, что поможет вам изменить сложившуюся ситуацию и позволит писать отличные мобильные приложения, не требуя отдельного изучения Objective-C и Java. Я расскажу вам о продукте Xamarin. Подробно и правдиво.

Что это?



Xamarin — это фреймворк для кроссплатформенной разработки мобильных приложений (iOS, Android, Windows Phone) с использованием языка C#. Идея очень простая. Вы пишете код на своем любимом языке, с применением всех привычных для вас языковых фич типо LINQ, лямбда-выражений, Generic`ов и async`ов. При этом вы имеете полный доступ ко всем возможностям SDK платформы и родному механизму создания UI, получая на выходе приложение, которое, строго говоря, ничем не отличается от нативных и (по крайней мере по заверениям) не уступает им в производительности.

Фреймворк состоит из нескольких основных частей:
Читать дальше
Total votes 83: ↑73 and ↓10+63
Comments63

ВКонтакте открыл доступ к бирже рекламы в сообществах

Reading time2 min
Views137K
Две недели назад ВКонтакте запустил закрытое тестирование функционала биржи рекламы в сообществах. В тесте приняли участие избранные рекламодатели и некоторые владельцы групп. С сегодняшнего дня размещение рекламы стало доступно всем рекламодателям через кабинет — vk.com/exchange?act=office

Реклама размещается администраторами сообществ как обычное обновление. По условиям размещения реклама должна быть на 1 первом месте в течение одного часа, затем 24 часа находиться в ленте.


Читать дальше →
Total votes 53: ↑48 and ↓5+43
Comments51

Уважение к учителю или «Профессор, а где Ваш репозиторий на GitHub?»

Reading time2 min
Views42K


Несколько последних лет преподавания дали мне понятие о том, что знают мои студенты и что они готовы узнать о программировании. В результате я немного подкорректировал свои учебные планы. Преподаватель должен быть гибким.

Некоторые из моих студентов — гики. У них уже есть достаточно много опыта в программировании, иногда даже на столь экзотических языках, как Clojure. Я надеюсь, что их время, потраченное на мои занятия, будет столь же полезно, как и для менее опытных учеников. Даже продвинутые студенты обычно много ещё не знают о построении сложных программных систем.

После интересного разговора с одним из таких студентов я подумал о роли доверия между учителем и учеником. Студент вынужден верить, что его профессор знает достаточно, чтобы его учить. Большинство студентов действительно в это верит, основываясь на авторитете университета или учёной степени лектора. Это делает работу преподавателя слегка полегче, да :). Если учитель будет вынужден перед каждым уроком, для каждого отдельного ученика доказывать свою квалификацию и право преподавать предмет — дела пойдут намного медленнее.

Как только преподавание курса было начато, каждое взаимодействие профессора и студента либо усиливает первоначальное доверие, либо разрушает его. Это одна из самых важных частей учебного процесса и, к сожалению, это не то, на чём фокусируются многие преподаватели.
Читать дальше →
Total votes 156: ↑144 and ↓12+132
Comments90

Программирование в стиле русских романов

Reading time1 min
Views27K


Одна из вещей, которая делает классические русские романы столь тяжелыми для чтения (для иностранцев) это то, что главные герои имеют кучу имён. К примеру, в романе "Братья Карамазовы" один из персонажей — Алексей Фёдорович Карамазов (Alexei Fyodorovich Karamazov), которого по ходу текста называют также Алёша, Алёшка, Алёшенька, Алёшечка, Алексейчик, Лёша и Лёшенька (Alyosha, Alyoshka, Alyoshenka, Alyoshechka, Alexeichik, Lyosha и Lyoshenka)

«Программирование в стиле русских романов» — это антипаттерн, возникающий в ситуации, когда одна вещь имеет много имён. Для какой-нибудь программы у вас может быть путь в системе контроля версий, путь на диске, имя проекта, имя исполняемого файла и т.д. Все они могут иметь одинаковые (однокоренные) имена или наоборот — называться каждая по-своему. Например, синонимами. Или вообще разными словами. Так уж вышло по историческим причинам, что бинарник foo.exe получается при компиляции проекта bar, лежащего в папке baz и т.д.
Читать дальше →
Total votes 79: ↑56 and ↓23+33
Comments42
1

Information

Rating
Does not participate
Location
Киев, Киевская обл., Украина
Registered
Activity