Как стать автором
Обновить

ВОЗ назвала варианты коронавируса буквами греческого алфавита

Время прочтения 2 мин
Просмотры 4.7K
Научно-популярное Здоровье

ВОЗ именовала ключевые варианты SARS-CoV-2 буквами греческого алфавита. По словам организации, новые названия упростят общение представителей властей с общественностью.

Читать далее
Всего голосов 14: ↑12 и ↓2 +10
Комментарии 18

В РСПП предложили отказаться от классификации при получении статуса ЦОД

Время прочтения 3 мин
Просмотры 593
Хранение данных *Хранилища данных *Законодательство в IT

Комиссия по связи РСПП считает, что нужно отказаться от внедрения процедуры классификации для получения юридического статуса центра обработки данных. По мнению участников комиссии, распространение процедуры на все ЦОД приведет к тому, что льготы на присоединение к энергоснабжению получат преимущественно владельцы дата-центров, оказывающих услуги госзаказчикам. 

Читать далее
Рейтинг 0
Комментарии 0

VK Tech Talks: митап для DS- и ML-специалистов

Время прочтения 1 мин
Просмотры 374
Блог компании VK Машинное обучение *Конференции Искусственный интеллект IT-компании

30 июня в 19:00 приходите на митап для DS- и ML-специалистов. Поговорим про особенности рекомендаций, обучение классификаторов и автораспознавание объявлений.

Встреча пройдёт в московском офисе VK, а прямой эфир для всех желающих — в сообществе VK Team. Регистрируйтесь.

Подробнее
Рейтинг 0
Комментарии 0

Странный Опрос

Время прочтения 1 мин
Просмотры 670
Чулан
Представьте, что по какой-то причине (например, прилетело НЛО Хабра ;)) тысячи пользователей бросились описывать ВСЕ вебсайты интернета по заданным параметрам. Например, с целью их классификации, каталогизации или еще зачем-то.

Как вам кажется, какие параметры сайтов могли бы представлять интерес для последующего практического использования?

Буду благодарен за мнения в коментариях.
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 17

Вопрос классификации: диалект или новый язык?

Время прочтения 1 мин
Просмотры 1.9K
Программирование *
Есть такой вопрос, что считать отдельным языком программирования, а что — диалектом?
Можно ли по каким-то формальным критериям отличать одно от другого?

Например, Object Pascal (Delphi) вроде как диалект паскаля, но отличия от паскаля примерно как отличия C++ от C, а это отдельные языки…

Может можно провести параллели с лингвистикой, с классификацией естественных языков…

Зачем мне нужна эта классификация? Для энциклопедии.

Кто что думает по этому поводу?
Всего голосов 10: ↑7 и ↓3 +4
Комментарии 22

Карта блогов

Время прочтения 4 мин
Просмотры 804
Habr

Зачем это?

  • Очень много постов попадают в первый попавшийся блог, что, на мой взгляд, неправильно. Наверняка, таким авторам как alizar сразу ясно, куда отправится пост, но многие топики попадают не туда, например, в стартапы пишут о бизнесе (о котором есть несколько очень похожих блогов), когда тема поста — продюсирование или менеджмент. То есть, посты мимо блога — нехорошо.
  • Надеюсь, получится полезная штука как ХабраРедактор и Source Code Highlighter.
  • И для хабраленты может пригодится — остается только выбрать интересующие разделы и подключиться или подписаться по RSS. К тому же бывают закрытые записи, в который может быть больше нужной информации чем в среднестатистической оной.
Update: Если есть мысли как это лучше все расположить — пишите обязательно.
Так же хочу выписать людей, кого наиболее интересно читать, но тут без коллективного опыта никак.
Пустые блоги отмечены курсивом. Первые три страницы топа осилено, потихоньку шагаем.

Собственно, карта
Всего голосов 78: ↑76 и ↓2 +74
Комментарии 27

Распознавание речи. Часть 1. Классификация систем распознавания речи

Время прочтения 4 мин
Просмотры 41K
Искусственный интеллект
Эпиграф

В России, направление систем распознавания речи действительно развито довольно слабо. Google давно анонсировала систему записи и распознавания телефонных разговоров… Про системы похожего масштаба и качества распознавания на русском языке, к сожалению, я пока не слышал.

Но не нужно думать, что за рубежом все уже все давно открыли и нам их никогда не догнать. Когда я искал материал для этой серии, пришлось перерыть тучу зарубежной литературы и диссертаций. Причем статьи и диссертации эти были замечательных американских ученых Huang Xuedong; Hisayoshi Kojima; DongSuk Yuk и др. Понятно, на ком эта отрасль американской науки держится? ;0)

В России я знаю только одну толковую компанию, которой удалось вывести отечественные системы распознавания речи на коммерческий уровень: Центр речевых технологий. Но, возможно, после этой серии статей кому-нибудь придет в голову, что заняться разработкой таких систем можно и нужно. Тем более, что в плане алгоритмов и мат. аппарата мы практически не отстали.

image

Классификация систем распознавания речи



На сегодняшний день, под понятием “распознавание речи” скрывается целая сфера научной и инженерной деятельности. В общем, каждая задача распознавания речи сводится к тому, чтобы выделить, классифицировать и соответствующим образом отреагировать на человеческую речь из входного звукового потока. Это может быть и выполнение определенного действия на команду человека, и выделение определенного слова-маркера из большого массива телефонных переговоров, и системы для голосового ввода текста.

Признаки систем и большущая диаграмма
Всего голосов 51: ↑50 и ↓1 +49
Комментарии 40

Троллинг и тролли (о том, как составлять классификацию и выделять группы)

Время прочтения 8 мин
Просмотры 6.7K
GTD *
Устав от обилия «аналитических» статей, посвященных такому социальному явлению, как троллинг, я, честно говоря, в очередной раз составил портрет среднестатистического обитателя сети и призадумался — а насколько вообще возможна классификация этого явления? Естественно, что в 99% виденных мной статей классификация никакой научностью даже не пыталась страдать в лучшем случае оставаясь на уровне «тролль закомплексованный — тролль незакомплексованный», а в худшем — на уровне «тролль хороший — тролль плохой». Естественно, что на основе такой классификации разобраться с этим явлением практически невозможно.

Кроме того, я считаю, что данная статья будет полезна всем, кто так или иначе пытается подходить к вопросу классификации с научной точки зрения. Опираясь на нее, можно составить представление о том, как следует заниматься классификацией, и она будет полезна вам даже в том случае, если вы в гробу видали всех этих троллей и нетроллей. Можете считать, что это статья на тему научной классификации явления на примере явления «троллинг».

Топик находится в блоге «учитесь работать» просто потому, что научитесь уже, блин, составлять классификации!
Читать дальше →
Всего голосов 34: ↑22 и ↓12 +10
Комментарии 28

Классификация интернет-пользователей для рекламодателя

Время прочтения 5 мин
Просмотры 3K
Социальные сети и сообщества
Интернеты – наиболее динамично развивающаяся коммуникационная среда, о чем хабраюзеры знают лучше других. Реклама в интернетах пытается успевать за сервисами и технологиями. Youtube, Одноклассники.ру, Twitter, … завтра появится очередной сайт, который изменит подход к коммуникациям в онлайне. Всё постоянно меняется, и если вы пристально не следите за интернет-рекламой, то сейчас я быстренько расскажу о нынешних реалиях.

Сегодня есть шесть типов наиболее распространенных интернет-пользователей. Каждого из них рекламодатель должен знать в лицо, чтобы понимать как именно ему продать свой товар.
здесь самое интересное начинается
Всего голосов 22: ↑17 и ↓5 +12
Комментарии 27

Аспекты структурирования 2

Время прочтения 4 мин
Просмотры 544
Чулан
У читателей Аспектов структурирования 1 сложилось непонимание, к чему это было написано. Подозреваю, что с второй серией выйдет аналогичное. Поэтому поясню, что в процессе написания связного текста, объясняющего некий предположительный стартап, отдельные вещи пришлось расписать относительно подробно, так что они занимают страницы вместо абзаца-другого. Но коль скоро инет-читатели вообще и Хабра в частности не любят длинных текстов, с этим тоже нужно считаться. В итоге выбрал из двух зол и оформил разросшиеся места двумя отдельными заметками, в которых суммированы мои попытки собрать, осмыслить и местами прокомментировать или дополнить существующее относительно тематики структурирования.
Читать дальше →
Всего голосов 2: ↑1 и ↓1 0
Комментарии 0

Классификация данных методом опорных векторов

Время прочтения 4 мин
Просмотры 133K
Data Mining *
Из песочницы
Добрый день!

В данной статье я хочу рассказать о проблеме классификации данных методом опорных векторов (Support Vector Machine, SVM). Такая классификация имеет довольно широкое применение: от распознавания образов или создания спам-фильтров до вычисления распределения горячих аллюминиевых частиц в ракетных выхлопах.

Сначала несколько слов об исходной задаче. Задача классификации состоит в определении к какому классу из, как минимум, двух изначально известных относится данный объект. Обычно таким объектом является вектор в n-мерном вещественном пространстве . Координаты вектора описывают отдельные аттрибуты объекта. Например, цвет c, заданный в модели RGB, является вектором в трехмерном пространстве: c=(red, green, blue).

Читать дальше →
Всего голосов 82: ↑78 и ↓4 +74
Комментарии 27

Licenzero: порно детектед

Время прочтения 3 мин
Просмотры 18K
Data Mining *
Licenzero У нас великолепная работа — нам платят за просмотр порнографических роликов. Ну а серьезнее, мы работаем в R&D отделе компании Inventos, которая занимается автоматической фильтрацией веб-контента: модерация, защита авторских прав и т. д. Перед нами была поставлена задача — построить систему для автоматического выявления роликов порнографического содержания. Здесь мы расскажем, как мы решали поставленную задачу.
Читать дальше →
Всего голосов 222: ↑208 и ↓14 +194
Комментарии 136

Licenzero: простые движения

Время прочтения 6 мин
Просмотры 7.1K
Data Mining *
Двустороннее движениеЭтим постом мы продолжаем цикл статей о том, как мы делали порнофильтр. Сейчас речь пойдет о попытке классифицировать порнографический контент по характерным движениям в кадре.

Началось это все как просто шутка из разговора. Ведь классифицировать порнографические движения довольно непросто — они слишком разные, чтобы найти в них что-то общее. Но мы попробовали, результат нас вполне устроил, и детектор движения занял свое место в общем классификаторе порнографического видеоконтента.
Читать дальше →
Всего голосов 80: ↑73 и ↓7 +66
Комментарии 38

Licenzero: ищем порно по цвету кожи

Время прочтения 3 мин
Просмотры 9.4K
Data Mining *
Маска по цвету кожиПродолжаем описание классификатора порнографического видеоконтента, разработанного компанией Inventos (Licenzero, присутствующее в заголовке это не отдельная компания, а подразделение в компании Инвентос).

Детектор цвета кожи является одним из детекторов, при помощи которых мы классифицируем видео. Он не такой сложный, как детектор движения, или детектор фрагментов, можно даже сказать совсем простой. Вначале у нас была куча идей, связанных с цветом кожи в видео. Но попробовав самый простой подход к классификации, мы решили (возможно временно) на нем остановиться, поскольку полученные результаты нас вполне устроили. Итак.
Читать дальше →
Всего голосов 125: ↑118 и ↓7 +111
Комментарии 118

Классификация систем автоматизации допечатной деятельности

Время прочтения 4 мин
Просмотры 3.2K
Анализ и проектирование систем *
Из песочницы
На сегодняшний день, развитие конкуренции между полиграфическими предприятиями влияет определяющим образом на эффективность их деятельности, которая зависит от правильности, отлаженности и грамотности организации технологического процесса, иными словами автоматизации рабочего потока. Фирмы, использующие в своей деятельности средства автоматизации, в первую очередь, стремятся уменьшить затраты человеческого труда, сократить время выполнения заказа, улучшить качество услуг, и, как следствие, увеличить производительность и прибыль предприятия. Однако автоматизация является очень сложным и трудоемким процессом.
Читать дальше →
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 7

Визуальная демонстрация алгоритмов машинного обучения

Время прочтения 1 мин
Просмотры 14K
Алгоритмы *


Кандидат наук из Федеральной политехнической школы Лозанны Басилио Норис создал замечательную программу, которая великолепно подходит для демонстрации некоторых задач, которые решают алгоритмы машинного обучения (классификация, кластеризация, регрессия — различными методами). В одной программе собраны библиотеки, алгоритмы и фрагменты кода, которые удалось найти. В отличие от Matlab, здесь GUI работает быстро в интерактивном режиме, поэтому получается очень красиво.

Дистрибутив:
MLDemos 0.3.2 for Windows (минимальные требования: XP SP3)
MLDemos 0.3.2 for Mac (минимальные требования: Snow Leopard)
MLDemos 0.1.3 for Linux 32bit (deb) (билд для: Ubuntu 10.04)
Всего голосов 78: ↑71 и ↓7 +64
Комментарии 13

Метод Виолы-Джонса (Viola-Jones) как основа для распознавания лиц

Время прочтения 15 мин
Просмотры 172K
Алгоритмы *
Хотя метод был разработан и представлен в 2001 году Полом Виолой и Майклом Джонсом [1, 2], он до сих пор на момент написания моего поста является основополагающим для поиска объектов на изображении в реальном времени [2]. По следам топика хабраюзера Indalo о данном методе, я попытался сам написать программу, которая распознает эмоцию на моём лице, но, к сожалению, не увидел на Хабре недостающей теории и описания работы некоторых алгоритмов, кроме указания их названий. Я решил собрать всё воедино, в одном месте. Сразу скажу, что свою программу успешно написал по данным алгоритмам. Как получилось рассказать о них ниже, решать Вам, уважаемые Хабрачитатели!
Добро пожаловать под кат!
Всего голосов 123: ↑121 и ↓2 +119
Комментарии 17

Upgrade Viola Jones

Время прочтения 12 мин
Просмотры 18K
Алгоритмы *
В моём предыдущем топике я старался показать, как метод Viola Jones работает, с помощью каких технологий и внутренних алгоритмов. В данном посте, дабы не прерывать цепочку, будет также много теории, будет показано за счет чего можно улучшить и до того прекрасный метод. Если здесь описать еще и программную реализацию, то будет огромное полотно, которое читать будет очень неудобно, и смотреться это никак не будет — решено разбить объем информации на два отдельных поста. Ниже — теория, мало картинок, но много полезного.
Заинтересованных прошу под кат
Всего голосов 37: ↑34 и ↓3 +31
Комментарии 11

Viola Jones на собственной шкуре, часть 2. — Emotion? — OMG, Yes!!!

Время прочтения 16 мин
Просмотры 40K
Алгоритмы *
Привет всем еще раз! Я решил сразу попробовать выпустить две статьи, практически в одно время, чтобы не прерывать цепь повествования, т.к. начало данной статьи очень важно!
Итак, многие ждали примеры моей программы и объяснения ее работы с точки зрения написания кода. Я же рассказываю последовательно, чтобы каждый смог ее повторить у себя на компьютере. Обращайте внимание побольше на обильные комментарии в коде, в них сила! И не бойтесь мега-мелкого скролла, т.к. информации много. Передислоцируйтесь в место с хорошим интернетом, в статье много схем и фотографий!
Let's get it started!
Всего голосов 40: ↑26 и ↓14 +12
Комментарии 10

Глава Group IB: русские хакеры считаются самыми меркантильными в мире

Время прочтения 2 мин
Просмотры 1.9K
Информационная безопасность *
Топики-ссылки некоторое время назад канули в лету, поэтому этот придётся оформить кратко, поскольку он будет представлять из себя только ссылку на материал другого ресурса с краткой аннотацией и цитатами, чтобы можно было понять о чём речь и стоит ли туда переходить.

Материал представляет из себя интервью с Ильёй Сачковым — генеральным директором компании Group IB, которая специализируется на расследовании компьютерных преступлений. Интервью изначально спорное, поскольку содержит оценки такой специфической социальной группы как хакеры по «национальному» признаку, но тем интереснее познакомиться с мнением «со стороны».

Американцы работают больше в исследовательском ключе: взламывают ради проверки собственных сил и возможностей. Американский хакер – это как в кино: человек, наделенный выдающимися способностями, который ставит себе задачу – «смогу или нет взломать новую систему или вон тот сайт?
Дочитать выдержку
Всего голосов 20: ↑12 и ↓8 +4
Комментарии 9