В свое время, лет так 25 назад занимался из любви к искусству кластеризацией цветов изображений. А все потому, что видеокарточка была VGA с максимальной глубиной цвета 8-bit, а фотографии 15-bit, 16-bit и 24-bit уже появлялись.
Какие я только методы кластеризации не перепробовал. И плоские и иерархические.
Неплохой результат давал метод квантования цветового пространства.
Суть его примерно такая:
1. Для всего множества пикселей находится такая ось в цветовом пространстве RGB, сумма квадратов расстояний от которой до цветовых координат пикселей является наименьшей.
2. Пиксели проецируются на эту ось. Просто каждому пикселю присваивается координата проекции.
3. Массив пикселей сортируется по координате проекции.
4. Отсортированный массив разбивается на два подмассива, таких что сумма квадратов отклонений проекций от центра тяжести соответствующего подмассива была минимальна.
5. Разбиение повторяется рекурсивно для каждого подмассива, пока число разбиений не станет равным заданному.
6. В каждом кластере все цвета заменяются на координаты центра тяжести кластера.
Метод достаточно хороший в плане приближения цветов. Но очень-очень долгий.
Можно существенно его упростить. Не находить на каждом шаге проективную ось, а выбрать одну из осей R, G, B. Например такую, максимальный разброс оттенков по которой является наибольшим. И провести медианное разбиение (с учетом весов — количества пикселей каждого оттенка).
Так будет существенно быстрее, но несколько уступать в точности цветопередачи.
Хотя, последующий дайзеринг нивелирует эту погрешность.
Есть возможность заблокировать рекламу? Блокируют.
Нет возможности заблокировать рекламу? Не блокируют.
Да ну-у-у?
Вы считаете что рекламу блокируют просто из любви к искусству, а не потому что она реально мешает?
Человек ленив по своей природе. Установка блокировщиков требует каких-никаких телодвижений. А к чему это все, если она не мешает?
Я уже писал про причины, побудившие меня установить блокировщик. Дополню немного:
Я не пользовался блокировщиком, потому что на сайтах, на которых я обычно проводил время, ее было не так уж и много. Жена меня спрашивала, почему я не устанавливаю блокировщик (для нее он как раз был актуален)? Я отвечал, что мне реклама не мешает.
Но так было ровно до того момента, пока реклама на необходимых мне сайтах не стала реально тормозить или закрывать просмотр страниц.
Вы абсолютно правы — еще есть размер (size). Это если в программировании. В математике используется как раз понятие размерность.
Только вот к длине (норме) размер вектора никакого отношения не имеет. Длина — это длина. Она же евклидова длина или норма. А размерность (размер) — несколько другой иконостас.
И судя по контексту статьи, в данном случае имеется в виду именно размер, а не длина. Так и следовало бы писать.
Дальше мы из биграмм каждого сообщения получаем вектор, длина которого равна квадрату длины алфавита.
Задумался… Потом понял, что речь идет не о длине вектора, а о его размерности.
Согласитесь, что такие мелочи могут негативно сказаться на восприятии статьи в целом.
Когда-то он-лайн версия «ХАКЕР» была бесплатна. Только выкладывалась с задержкой 4 месяца.
Теперь же, стоило зайти туда почитать про AdBlock|AdBlock Plus, как первым делом мне сунули всплывающую рекламу (которую ABP не заблокировал), а потом попросили более 7000 рублей за годовую подписку.
Был, например, Proxomitron. Такой вот прозрачный прокси, позволяющий на лету изменять вид сайта: стили, верстку, резку рекламы.
Правда, не уверен, что он по HTTPS работает. Да и настраивать его, в большой степени, приходилось для каждого сайта вручную.
У меня, повторяю, на компе Wi-Fi нет.
А у жены что-то Wi-Fi модуль барахлит. Чувствительность такая, что еле сигнал от нашего роутера за 1,5-2 метра ловит. Точек доступа провайдера и разных других организаций просто физически не видит.
Обычно подключается тоже не через Wi-Fi, а кабелем.
У меня (и у жены) Wi-Fi только с домашним роутером. Далее — серая зона провайдера с одним шлюзом из нее в Инет.
Т.е. у нас треть города (или половина) за этим шлюзом. И какая тут локация?
Кстати, когда я ее включаю функцию «Моё местоположение» на Яндекс.карте, то определяет его с точностью =/- 3 км. Что дома, что на работе (провайдеры разные).
Какие я только методы кластеризации не перепробовал. И плоские и иерархические.
Неплохой результат давал метод квантования цветового пространства.
Суть его примерно такая:
1. Для всего множества пикселей находится такая ось в цветовом пространстве RGB, сумма квадратов расстояний от которой до цветовых координат пикселей является наименьшей.
2. Пиксели проецируются на эту ось. Просто каждому пикселю присваивается координата проекции.
3. Массив пикселей сортируется по координате проекции.
4. Отсортированный массив разбивается на два подмассива, таких что сумма квадратов отклонений проекций от центра тяжести соответствующего подмассива была минимальна.
5. Разбиение повторяется рекурсивно для каждого подмассива, пока число разбиений не станет равным заданному.
6. В каждом кластере все цвета заменяются на координаты центра тяжести кластера.
Метод достаточно хороший в плане приближения цветов. Но очень-очень долгий.
Можно существенно его упростить. Не находить на каждом шаге проективную ось, а выбрать одну из осей R, G, B. Например такую, максимальный разброс оттенков по которой является наибольшим. И провести медианное разбиение (с учетом весов — количества пикселей каждого оттенка).
Так будет существенно быстрее, но несколько уступать в точности цветопередачи.
Хотя, последующий дайзеринг нивелирует эту погрешность.
Да ну-у-у?
Вы считаете что рекламу блокируют просто из любви к искусству, а не потому что она реально мешает?
Человек ленив по своей природе. Установка блокировщиков требует каких-никаких телодвижений. А к чему это все, если она не мешает?
Я уже писал про причины, побудившие меня установить блокировщик. Дополню немного:
Я не пользовался блокировщиком, потому что на сайтах, на которых я обычно проводил время, ее было не так уж и много. Жена меня спрашивала, почему я не устанавливаю блокировщик (для нее он как раз был актуален)? Я отвечал, что мне реклама не мешает.
Но так было ровно до того момента, пока реклама на необходимых мне сайтах не стала реально тормозить или закрывать просмотр страниц.
Извлечение корня квадратного будет в данном случае лишней операцией.
msdn.microsoft.com/ru-ru/library/3y41k4hb.aspx
Но корректней для вектора, как программной структуры, писать «размер» или «размерность».
Только вот к длине (норме) размер вектора никакого отношения не имеет. Длина — это длина. Она же евклидова длина или норма. А размерность (размер) — несколько другой иконостас.
И судя по контексту статьи, в данном случае имеется в виду именно размер, а не длина. Так и следовало бы писать.
ru.solverbook.com/spravochnik/vektory/dlina-vektora
И она никак не может быть квадратом длины алфавита.
А вот размерность вектора встречаемости биграмм как раз равна квадрату размерности алфавита.
Задумался… Потом понял, что речь идет не о длине вектора, а о его размерности.
Согласитесь, что такие мелочи могут негативно сказаться на восприятии статьи в целом.
Да за такое надо канделябром по голове!
Увидев такую «светомузыку» моя неокрепшая психика просто отказалась читать этот пост.
Когда-то он-лайн версия «ХАКЕР» была бесплатна. Только выкладывалась с задержкой 4 месяца.
Теперь же, стоило зайти туда почитать про AdBlock|AdBlock Plus, как первым делом мне сунули всплывающую рекламу (которую ABP не заблокировал), а потом попросили более 7000 рублей за годовую подписку.
Наглядненько…
Был, например, Proxomitron. Такой вот прозрачный прокси, позволяющий на лету изменять вид сайта: стили, верстку, резку рекламы.
Правда, не уверен, что он по HTTPS работает. Да и настраивать его, в большой степени, приходилось для каждого сайта вручную.
У меня, повторяю, на компе Wi-Fi нет.
А у жены что-то Wi-Fi модуль барахлит. Чувствительность такая, что еле сигнал от нашего роутера за 1,5-2 метра ловит. Точек доступа провайдера и разных других организаций просто физически не видит.
Обычно подключается тоже не через Wi-Fi, а кабелем.
Т.е. у нас треть города (или половина) за этим шлюзом. И какая тут локация?
Кстати, когда я ее включаю функцию «Моё местоположение» на Яндекс.карте, то определяет его с точностью =/- 3 км. Что дома, что на работе (провайдеры разные).
Ну, если установить какой-нить ActiveX или плагин, то, наверное, и не такое можно узнать. Но как это сделать незаметно?