«На этом этапе у нас есть 450 векторов с размерностью 128.»
В коде у вас 64 для 3 слоя или вы берете 2й? и не понятен смысл дальнейшего сжатия PCA, почему не сделать четвертый скрытый слой без сигмоида шириной 2 и тогда будет более четкое отображение PCA.
Интересно, а можно выделить «знаковые» голосования по особенностям поведения выборки?
Спасибо за внимательное прочтение статьи. Это моя ошибка, как я и писал, подбирал несколько слоев и на момент написания статьи были 256x128x128x256 слои. В конечной реализации добавился еще один слой 64.
>>почему не сделать четвертый скрытый слой без сигмоида шириной 2
Такая идея в голову не пришла, обязательно попробую.
>> Интересно, а можно выделить «знаковые» голосования по особенностям поведения выборки
Сейчас это только промежуточные результаты. Есть желание разобрать и детализировать каждое голосования по действиям:
Выделение бюджета;
Внесение поправок в нормативную базу;
Отрасль:
Наука / Образование;
Медицина;
ОК;
Внешняя политика;
Так что идей много как и данных, есть с чем поработать.
Знаковые я имею ввиду не политическом, а в смысле данных. Например есть сто термометров расположенных на улице, в доме, на вышке и т д и в принципе они колеблются как то «скорректировано». Но например выход термометра из строя сменит поведение.
Кроме того у вас не учитывается временная последовательность.
Не очень ясна обоснованность сжатия данных в 2 цифры из 5 возможных исходов, ухудшает ли это результат.
Автоэнкодер в задачах кластеризации политических событий