Скорректированный скользящий экзамен, соклассификаторы, фрактальные классификаторы и локальная вероятность ошибки
В данной работе даются элементы введения в классификацию с обучением на малых выборках — от удобной системы обозначений до специальных оценок надежности. Постоянное наращивание быстродействия вычислительных устройств и малые выборки, позволяют пренебречь значительным объемом вычислений, необходимым при получении некоторых из этих оценок.
Определения и обозначения
Пусть задано некоторое исходное разбиение множества
(1)
Будем отождествлять двухклассовый классификатор с бинарной функцией вида
(2)
где
(3)
В зависимости от того, соответствуют или нет решения классификатора исходному разбиению
(4)
где
Исходим из отсутствия проверочной последовательности, а оценки вероятности ошибки классификации
(5)
где
(6)
(7)
Объекты
Скорректированный скользящий экзамен
Скользящий экзамен, как известно, отличает ряд недостатков. Эти недостатки могут быть в какой-то мере устранены через коррекцию скользящего экзамена. Скорректированные оценки, помечаемые левым штрихом, запишутся следующим образом
(8)
(9)
(10)
К недостаткам скорректированного скользящего экзамена следует отнести возрастание количества операций и в тот факт, что эта оценка проводится на обеих выборках на единицу меньшего объема. Таким образом при малых выборках оценка вероятности ошибки оказывается несколько завышенной, однако с возрастанием объема выборок этот эффект утрачивает значение.
Соклассификатор
Вследствие большой трудоемкости скорректированного скользящего экзамена, представляет интерес метод бинарной оценки надежности классификации – соклассификатор. Как и скользящий экзамен, он может базироваться и исключительно на информации из обучающих выборок, но может использоваться и при наличии проверочных последовательностей.
Введем выборки
(11)
(12)
Тогда решение соклассификатора первого порядка классификатора (2), определяемого как
(13)
истолковывается следующим образом
если
если
(14)
При этом будем считать, что выборки
При определении (13) предполагается, что объем выборки
Подобно adaptive boosting, композиция классификаторов
Остановимся на вопросах, связанных с выбором конкретной формы соклассификатора. Пусть, например, выборки
Фрактальный классификатор
Процесс синтеза соклассификаторов более высоких порядков может быть продолжен в рамках рекуррентной процедуры, когда первоначально осуществляется подстановка
(15)
затем, повторяя вышеописанный алгоритм, получаем на выходе соклассификатор второго порядка
(16)
и продолжаем эту процедуру. Императивный останов наступает при построении соклассификатора такого порядка
На практике нам приходилось использовать лишь соклассификаторы первого порядка. Они были разработаны нами много лет назад и зарекомендовали себя в качестве полезных инструментов при решении различных практических задач, в частности, при анализе отраженных радиосигналов для установок поиска пластиковых противопехотных мин [4], а также при создании системы LEKTON. Эта система позволила полностью автоматически проверять подлинность подписей на чеках, векселях и других документах и явилась первой реально используемой в банке системой такого типа.
Локальная вероятность ошибки
В практических исследованиях хорошо себя зарекомендовали локальные
(17)
где
(18)
где
Введем специальную
(19)
где
На основе оценки (19) можно обобщить определение классификатора (2), введя зону отказа либо зоны отказа. Обозначая ширину этих зон соответственно
(20)
где
Литература:
1. Archipov G. F. Collectives of determinative rules: optimal solutions and some of the characteristics of reliability of classification. – In the Collection of articles “Statistical problems of control”, Vilnius, 1983, vol.61, pp. 130-145.
2. Мясников В.В. O модификациях метода построения линейной дискриминантной функции, основанного на процедуре Петерсона-Маттсона. computeroptics.smr.ru/KO/PDF/KO26/KO26211.pdf.
3. Фукунага К. Введение в статистическую теорию распознавания образов. М. «Наука» 1979. стр. 105-130.
4. Archipov G., Klyshko G., Stasaitis D., Levitas B., Alenkowicz H., Jefremov S. Research of Metallic and Dielectric Underground Objects on the Basis of Original Computer Recognition Technique of Reflected Radio Signals. MIKON-2000., XII International Conference on Microwaves, Radar and Wireless Communications, Volume 2, pp. 495-498./>