Pull to refresh
  • by relevance
  • by date
  • by rating

ВОЗ назвала варианты коронавируса буквами греческого алфавита

Popular science Health

ВОЗ именовала ключевые варианты SARS-CoV-2 буквами греческого алфавита. По словам организации, новые названия упростят общение представителей властей с общественностью.

Читать далее
Total votes 14: ↑12 and ↓2 +10
Views 4K
Comments 18

Странный Опрос

Lumber room
Представьте, что по какой-то причине (например, прилетело НЛО Хабра ;)) тысячи пользователей бросились описывать ВСЕ вебсайты интернета по заданным параметрам. Например, с целью их классификации, каталогизации или еще зачем-то.

Как вам кажется, какие параметры сайтов могли бы представлять интерес для последующего практического использования?

Буду благодарен за мнения в коментариях.
Total votes 2: ↑2 and ↓0 +2
Views 327
Comments 17

Вопрос классификации: диалект или новый язык?

Programming *
Есть такой вопрос, что считать отдельным языком программирования, а что — диалектом?
Можно ли по каким-то формальным критериям отличать одно от другого?

Например, Object Pascal (Delphi) вроде как диалект паскаля, но отличия от паскаля примерно как отличия C++ от C, а это отдельные языки…

Может можно провести параллели с лингвистикой, с классификацией естественных языков…

Зачем мне нужна эта классификация? Для энциклопедии.

Кто что думает по этому поводу?
Total votes 10: ↑7 and ↓3 +4
Views 1.7K
Comments 22

Карта блогов

Habr

Зачем это?

  • Очень много постов попадают в первый попавшийся блог, что, на мой взгляд, неправильно. Наверняка, таким авторам как alizar сразу ясно, куда отправится пост, но многие топики попадают не туда, например, в стартапы пишут о бизнесе (о котором есть несколько очень похожих блогов), когда тема поста — продюсирование или менеджмент. То есть, посты мимо блога — нехорошо.
  • Надеюсь, получится полезная штука как ХабраРедактор и Source Code Highlighter.
  • И для хабраленты может пригодится — остается только выбрать интересующие разделы и подключиться или подписаться по RSS. К тому же бывают закрытые записи, в который может быть больше нужной информации чем в среднестатистической оной.
Update: Если есть мысли как это лучше все расположить — пишите обязательно.
Так же хочу выписать людей, кого наиболее интересно читать, но тут без коллективного опыта никак.
Пустые блоги отмечены курсивом. Первые три страницы топа осилено, потихоньку шагаем.

Собственно, карта
Total votes 78: ↑76 and ↓2 +74
Views 721
Comments 27

Распознавание речи. Часть 1. Классификация систем распознавания речи

Artificial Intelligence
Эпиграф

В России, направление систем распознавания речи действительно развито довольно слабо. Google давно анонсировала систему записи и распознавания телефонных разговоров… Про системы похожего масштаба и качества распознавания на русском языке, к сожалению, я пока не слышал.

Но не нужно думать, что за рубежом все уже все давно открыли и нам их никогда не догнать. Когда я искал материал для этой серии, пришлось перерыть тучу зарубежной литературы и диссертаций. Причем статьи и диссертации эти были замечательных американских ученых Huang Xuedong; Hisayoshi Kojima; DongSuk Yuk и др. Понятно, на ком эта отрасль американской науки держится? ;0)

В России я знаю только одну толковую компанию, которой удалось вывести отечественные системы распознавания речи на коммерческий уровень: Центр речевых технологий. Но, возможно, после этой серии статей кому-нибудь придет в голову, что заняться разработкой таких систем можно и нужно. Тем более, что в плане алгоритмов и мат. аппарата мы практически не отстали.

image

Классификация систем распознавания речи



На сегодняшний день, под понятием “распознавание речи” скрывается целая сфера научной и инженерной деятельности. В общем, каждая задача распознавания речи сводится к тому, чтобы выделить, классифицировать и соответствующим образом отреагировать на человеческую речь из входного звукового потока. Это может быть и выполнение определенного действия на команду человека, и выделение определенного слова-маркера из большого массива телефонных переговоров, и системы для голосового ввода текста.

Признаки систем и большущая диаграмма
Total votes 51: ↑50 and ↓1 +49
Views 25K
Comments 40

Троллинг и тролли (о том, как составлять классификацию и выделять группы)

GTD *
Устав от обилия «аналитических» статей, посвященных такому социальному явлению, как троллинг, я, честно говоря, в очередной раз составил портрет среднестатистического обитателя сети и призадумался — а насколько вообще возможна классификация этого явления? Естественно, что в 99% виденных мной статей классификация никакой научностью даже не пыталась страдать в лучшем случае оставаясь на уровне «тролль закомплексованный — тролль незакомплексованный», а в худшем — на уровне «тролль хороший — тролль плохой». Естественно, что на основе такой классификации разобраться с этим явлением практически невозможно.

Кроме того, я считаю, что данная статья будет полезна всем, кто так или иначе пытается подходить к вопросу классификации с научной точки зрения. Опираясь на нее, можно составить представление о том, как следует заниматься классификацией, и она будет полезна вам даже в том случае, если вы в гробу видали всех этих троллей и нетроллей. Можете считать, что это статья на тему научной классификации явления на примере явления «троллинг».

Топик находится в блоге «учитесь работать» просто потому, что научитесь уже, блин, составлять классификации!
Читать дальше →
Total votes 34: ↑22 and ↓12 +10
Views 3.5K
Comments 28

Классификация интернет-пользователей для рекламодателя

Social networks and communities
Интернеты – наиболее динамично развивающаяся коммуникационная среда, о чем хабраюзеры знают лучше других. Реклама в интернетах пытается успевать за сервисами и технологиями. Youtube, Одноклассники.ру, Twitter, … завтра появится очередной сайт, который изменит подход к коммуникациям в онлайне. Всё постоянно меняется, и если вы пристально не следите за интернет-рекламой, то сейчас я быстренько расскажу о нынешних реалиях.

Сегодня есть шесть типов наиболее распространенных интернет-пользователей. Каждого из них рекламодатель должен знать в лицо, чтобы понимать как именно ему продать свой товар.
здесь самое интересное начинается
Total votes 22: ↑17 and ↓5 +12
Views 1.5K
Comments 27

Аспекты структурирования 2

Lumber room
У читателей Аспектов структурирования 1 сложилось непонимание, к чему это было написано. Подозреваю, что с второй серией выйдет аналогичное. Поэтому поясню, что в процессе написания связного текста, объясняющего некий предположительный стартап, отдельные вещи пришлось расписать относительно подробно, так что они занимают страницы вместо абзаца-другого. Но коль скоро инет-читатели вообще и Хабра в частности не любят длинных текстов, с этим тоже нужно считаться. В итоге выбрал из двух зол и оформил разросшиеся места двумя отдельными заметками, в которых суммированы мои попытки собрать, осмыслить и местами прокомментировать или дополнить существующее относительно тематики структурирования.
Читать дальше →
Total votes 2: ↑1 and ↓1 0
Views 286
Comments 0

Классификация данных методом опорных векторов

Data Mining *
Sandbox
Добрый день!

В данной статье я хочу рассказать о проблеме классификации данных методом опорных векторов (Support Vector Machine, SVM). Такая классификация имеет довольно широкое применение: от распознавания образов или создания спам-фильтров до вычисления распределения горячих аллюминиевых частиц в ракетных выхлопах.

Сначала несколько слов об исходной задаче. Задача классификации состоит в определении к какому классу из, как минимум, двух изначально известных относится данный объект. Обычно таким объектом является вектор в n-мерном вещественном пространстве . Координаты вектора описывают отдельные аттрибуты объекта. Например, цвет c, заданный в модели RGB, является вектором в трехмерном пространстве: c=(red, green, blue).

Читать дальше →
Total votes 82: ↑78 and ↓4 +74
Views 117K
Comments 27

Licenzero: порно детектед

Data Mining *
Licenzero У нас великолепная работа — нам платят за просмотр порнографических роликов. Ну а серьезнее, мы работаем в R&D отделе компании Inventos, которая занимается автоматической фильтрацией веб-контента: модерация, защита авторских прав и т. д. Перед нами была поставлена задача — построить систему для автоматического выявления роликов порнографического содержания. Здесь мы расскажем, как мы решали поставленную задачу.
Читать дальше →
Total votes 222: ↑208 and ↓14 +194
Views 18K
Comments 136

Licenzero: простые движения

Data Mining *
Двустороннее движениеЭтим постом мы продолжаем цикл статей о том, как мы делали порнофильтр. Сейчас речь пойдет о попытке классифицировать порнографический контент по характерным движениям в кадре.

Началось это все как просто шутка из разговора. Ведь классифицировать порнографические движения довольно непросто — они слишком разные, чтобы найти в них что-то общее. Но мы попробовали, результат нас вполне устроил, и детектор движения занял свое место в общем классификаторе порнографического видеоконтента.
Читать дальше →
Total votes 80: ↑73 and ↓7 +66
Views 6.9K
Comments 38

Licenzero: ищем порно по цвету кожи

Data Mining *
Маска по цвету кожиПродолжаем описание классификатора порнографического видеоконтента, разработанного компанией Inventos (Licenzero, присутствующее в заголовке это не отдельная компания, а подразделение в компании Инвентос).

Детектор цвета кожи является одним из детекторов, при помощи которых мы классифицируем видео. Он не такой сложный, как детектор движения, или детектор фрагментов, можно даже сказать совсем простой. Вначале у нас была куча идей, связанных с цветом кожи в видео. Но попробовав самый простой подход к классификации, мы решили (возможно временно) на нем остановиться, поскольку полученные результаты нас вполне устроили. Итак.
Читать дальше →
Total votes 125: ↑118 and ↓7 +111
Views 9.1K
Comments 118

Классификация систем автоматизации допечатной деятельности

System Analysis and Design *
Sandbox
На сегодняшний день, развитие конкуренции между полиграфическими предприятиями влияет определяющим образом на эффективность их деятельности, которая зависит от правильности, отлаженности и грамотности организации технологического процесса, иными словами автоматизации рабочего потока. Фирмы, использующие в своей деятельности средства автоматизации, в первую очередь, стремятся уменьшить затраты человеческого труда, сократить время выполнения заказа, улучшить качество услуг, и, как следствие, увеличить производительность и прибыль предприятия. Однако автоматизация является очень сложным и трудоемким процессом.
Читать дальше →
Total votes 5: ↑4 and ↓1 +3
Views 2.8K
Comments 7

Визуальная демонстрация алгоритмов машинного обучения

Algorithms *


Кандидат наук из Федеральной политехнической школы Лозанны Басилио Норис создал замечательную программу, которая великолепно подходит для демонстрации некоторых задач, которые решают алгоритмы машинного обучения (классификация, кластеризация, регрессия — различными методами). В одной программе собраны библиотеки, алгоритмы и фрагменты кода, которые удалось найти. В отличие от Matlab, здесь GUI работает быстро в интерактивном режиме, поэтому получается очень красиво.

Дистрибутив:
MLDemos 0.3.2 for Windows (минимальные требования: XP SP3)
MLDemos 0.3.2 for Mac (минимальные требования: Snow Leopard)
MLDemos 0.1.3 for Linux 32bit (deb) (билд для: Ubuntu 10.04)
Total votes 78: ↑71 and ↓7 +64
Views 13K
Comments 13

Метод Виолы-Джонса (Viola-Jones) как основа для распознавания лиц

Algorithms *
Хотя метод был разработан и представлен в 2001 году Полом Виолой и Майклом Джонсом [1, 2], он до сих пор на момент написания моего поста является основополагающим для поиска объектов на изображении в реальном времени [2]. По следам топика хабраюзера Indalo о данном методе, я попытался сам написать программу, которая распознает эмоцию на моём лице, но, к сожалению, не увидел на Хабре недостающей теории и описания работы некоторых алгоритмов, кроме указания их названий. Я решил собрать всё воедино, в одном месте. Сразу скажу, что свою программу успешно написал по данным алгоритмам. Как получилось рассказать о них ниже, решать Вам, уважаемые Хабрачитатели!
Добро пожаловать под кат!
Total votes 123: ↑121 and ↓2 +119
Views 162K
Comments 17

Upgrade Viola Jones

Algorithms *
В моём предыдущем топике я старался показать, как метод Viola Jones работает, с помощью каких технологий и внутренних алгоритмов. В данном посте, дабы не прерывать цепочку, будет также много теории, будет показано за счет чего можно улучшить и до того прекрасный метод. Если здесь описать еще и программную реализацию, то будет огромное полотно, которое читать будет очень неудобно, и смотреться это никак не будет — решено разбить объем информации на два отдельных поста. Ниже — теория, мало картинок, но много полезного.
Заинтересованных прошу под кат
Total votes 37: ↑34 and ↓3 +31
Views 17K
Comments 11

Viola Jones на собственной шкуре, часть 2. — Emotion? — OMG, Yes!!!

Algorithms *
Привет всем еще раз! Я решил сразу попробовать выпустить две статьи, практически в одно время, чтобы не прерывать цепь повествования, т.к. начало данной статьи очень важно!
Итак, многие ждали примеры моей программы и объяснения ее работы с точки зрения написания кода. Я же рассказываю последовательно, чтобы каждый смог ее повторить у себя на компьютере. Обращайте внимание побольше на обильные комментарии в коде, в них сила! И не бойтесь мега-мелкого скролла, т.к. информации много. Передислоцируйтесь в место с хорошим интернетом, в статье много схем и фотографий!
Let's get it started!
Total votes 40: ↑26 and ↓14 +12
Views 39K
Comments 10

Глава Group IB: русские хакеры считаются самыми меркантильными в мире

Information Security *
Топики-ссылки некоторое время назад канули в лету, поэтому этот придётся оформить кратко, поскольку он будет представлять из себя только ссылку на материал другого ресурса с краткой аннотацией и цитатами, чтобы можно было понять о чём речь и стоит ли туда переходить.

Материал представляет из себя интервью с Ильёй Сачковым — генеральным директором компании Group IB, которая специализируется на расследовании компьютерных преступлений. Интервью изначально спорное, поскольку содержит оценки такой специфической социальной группы как хакеры по «национальному» признаку, но тем интереснее познакомиться с мнением «со стороны».

Американцы работают больше в исследовательском ключе: взламывают ради проверки собственных сил и возможностей. Американский хакер – это как в кино: человек, наделенный выдающимися способностями, который ставит себе задачу – «смогу или нет взломать новую систему или вон тот сайт?
Дочитать выдержку
Total votes 20: ↑12 and ↓8 +4
Views 1.8K
Comments 9

Ошибки PHP: классификация, примеры, обработка

PHP *
Sandbox
В статье представлена очередная попытка разобраться с ошибками, которые могут встретиться на вашем пути php-разработчика, их возможная классификация, примеры их возникновения, влияние ошибок на ответ клиенту, а также инструкции по написанию своего обработчика ошибок.
Читать дальше →
Total votes 53: ↑50 and ↓3 +47
Views 58K
Comments 75

Классификация механизмов аутентификации пользователей и их обзор

Information Security *
Recovery mode
Во время написания своей диссертации по защите информации, посвященной разработке нового алгоритма аутентификации пользователей, передо мной встала задача классифицировать существующие механизмы аутентификации, чтобы можно было определить к какому классу относится моя разработка.
Я столкнулся с тем, что никакой общепринятой классификации нет, и у каждого автора она своя, если она вообще есть. Поэтому я предлагаю вам свою классификацию, синтезированную из тех что встретил в процессе работы. И хотел бы услышать мнение экспертов, насколько она рациональна, адекватна и полезна. А главное не слышали ли вы её где-нибудь раньше?

Проведя анализ существующих механизмов аутентификации пользователей я выделил 3 основных характеристики, которыми обладает каждый из них:
Читать дальше →
Total votes 17: ↑13 and ↓4 +9
Views 33K
Comments 5