Как стать автором
Обновить
62
0
Дмитрий Лобашевский @0decca

Пользователь

Отправить сообщение
Так а C5.0 или J4.8 — они все текстовые файлы принимают на вход.
Более того, по Вашей же ссылке на датасет — как раз данные в C5.0 формате, все что надо — запустить с командной строки
c5.0 -f breast-cancer-wisconsin -X 4
Только не забыть что он два файла на вход требует — names и data (тот на который линк).
А тот names что лежит в их каталоге, он никакой не names, а список работ почему-то

Вот я сделал нормальный names

2,4. | classes

Sample_code_number: continuous.
Clump_Thickness: continuous.
Uniformity_of_Cell_Size: continuous.
Uniformity_of_Cell_Shape: continuous.
Marginal_Adhesion: continuous.
Single_Epithelial_Cell_Size: continuous.
Bare_Nuclei: continuous.
Bland_Chromatin: continuous.
Normal_Nucleoli: continuous.
Mitoses: continuous.

вот результат на 4-folds

Fold        Decision Tree
----      ----------------
          Size      Errors

   1        10        4.0%
   2         8        4.0%
   3         8        4.6%
   4         8        5.7%

  Mean     8.5        4.6%
  SE       0.5        0.4%


           (a)   (b)    <-classified as
          ----  ----
           441    17    (a): class 2
            15   226    (b): class 4
Вот еще бы сравнить с С5.0 или хотя бы с J4.8 из WekaWeka.

Причем именно на k-fold тестах, об этом правда уже написали выше.
А то на тренировочной выборке получить 100% — не проблема, банальный подбор функции можно сделать, типа генетики.

И кстати задачка-то с несимметричной ценой ошибки, ложная детекция опухоли — штука стремная, муж ложно облученной девушки может и по голове настучать и демонстрация ему исходников не поможет…
Интересно, что сознание, кроме права вето, отвечает еще и за «объяснение» своих действий.
Т.е. фактически подгонку реальности под модель постфактум.

Этот процесс можно описать как компрессию воспоминаний с потерей информации, но, возможно, это не единственное назначение.

Имхо так как мы врем сами себе — мы не врем никому больше.

(ушел перечитывать Матцингера)
Я подозреваю, что результат будет намного хуже, чем если бы сейчас блокировать все сайты в TLD ххх.
Ну а если еще окажется, что у Буркина-Фасо порнобизнес составляет заметную часть бюджета — то проблема превращается в нерешаемую в принципе.

Как там у нас, в Афгане опиумный мак уже перестали сажать?
Вот когда там решат проблему — можно и порнухой заняться.

Блин, да хоть вирусняк бы в интеренете победили, так нет, теперь еще с порнухой надо побороться…
Иногда кажется, что депутаты — они как дети, честное слово.
И даже хочется их ограничить от информации.
:-)
А, ну я думал реальный блокер на клиенте, сорри.

А с ответом сервера — осталась маленькая задачка — как заставить сервер писать Content-rating.
Я так думаю, что это начнет работать аккурат когда завершится переезд порносайтов на домен .xxx
Не раньше.
</irony off>

Тут ведь проблема — в отсутствии международного законодательства.
Которое конечно можно договором ввести — но при отсутствии международной полиции и международного суда этот договор работать будет совсем не так как ожидается.
Потому единственный способ местных законодателей заставить сайт из Буркина-Фасо выдавать этот респонс — заблокировать его насовсем и ждать милостей от природы.
Как-то так.

Вот если бы бизнес мог предложить дешевую десктопную блокировку — тогда была бы тема и был бы способ что-то изменить.
И никакое государство было бы не нужно.
решение о фильтрации следует доверить браузеру


В теории — хорошо бы.
Но вот на практике возникает ряд вопросов.

Например — а какого размера базы будут?
Или — с каким FPS будет показываться видео, в котором ищутся фагменты сисек-писек в реальном времени или вырезается фаллоимитатор, торчащий из под шкафа в левом нижнем углу кадра (если очень внимательно присмотреться)?

Имхо функциональность на браузере будет порезана до упора, особенно на мобильных платформах.
Или же возвращаемся к тупым блеклистам, что малоинтересно клиенту и ни от чего реально не спасает.

Разве что запрос на SaaS с браузера — но вопрос с FPS все равно остается, latency будет ниже плинтуса.
И стоить услуга будет очень недешево — т.к. серваков будет немало, это ж надо весь порнотуб перекачать и перемотать.
А скорость анализа видео между прочим всего в 5-10 раз выше скорости реального простмотра человеком.
И не на десктопе.
А вот как раз именно этот возраст самый опасный.
Здесь уже нет того доверия взрослым, но есть доверие стае и страх потери уважения стаи.
Девочками интересоваться начинают намного раньше.
Тут не в девочках дело.
В 8 лет пацан может и послать свой круг общения, типа «обидеться» и т.п.
В 15 это сложнее.
Ну и многие взрослые привычки закладываются именно в этот момент.

Не в наркоте и порнухе дело имхо.
Дело в общем настроении бессмысленности и однообразия, там имхо какие-то биологические механизмы включаются, типа регулирования популяции.
Если люди, которые героин десятками лет жрут и не то, чтобы не помирают, а и демонстрируют бодрость духа и волю к жизни — ничто их не берет.
Вот если понять причины — наркомания же с порнухой только одно из следствий, — то все должно стать проще.

www.ultraculture.net/blog/soprotivlenie/narkoticheskie-zavisimosti-vzglyad-iz-krysinoj-kletki/
Не то, чтобы это было достоверно, но…
В детстве мой приятель притащил в школу джойнт.
В 8-м классе.
Школа была хорошая, с матуклоном, я там специальность «программист» получил.
Но рядом была школа еще круче — для мажоров, с английским уклоном.
Поэтому если мой одноклассник забивал косяк на задней парте во время урока (да, прямо вот так, это не для красного словца), то с мажорной школы нам приносили маковую соломку в коробочках — на продажу.
Синтетики тогда еще не было — начало 80-х.

Вот так.

И да, с моего класса наркоманами стало не много — гораздо больше сторчались из мажорных соседей, кто продавал.
Наверное в английском уклоне дело.
И наверное пока нету ясного понимания всех взаимосвязей и последствий — лучше все же не дергаться, а просчитать и понять, что происходит.
Кораблю без компаса — любой ветер встречный.
Информация в СМИ делится на две категории — позитивную и негативную.
Позитивная называется пропагандой.
Негативная — новостями.

По данным исследования Американской ассоциации психологов (APA): дети в возрасте до 8 лет не могут критически оценивать телевизионные рекламные сообщения и склонны считать их полезными, точными и объективными.

Казалось бы при чем тут Интернет

И казалось бы, почему никому в голову не приходит фильтровать ТВ?
Странное дело кстати, виноват интернет, а ТВ — то самое ТВ с кучей пропаганды и рекламы, под пропаганду и рекламу заточенное — никто не трогает.

И кстати, очевидно же, что воздействие рекламы в сети и телевизоре принципиально разное, как кстати и аудитория.
Единственное активное действие при просмотре ТВ — переключение каналов на другие с такой же рекламой.
ТВ работает фоном и не выключается, пока вы делаете что-то и не смотрите его, вбивая суггестию прямо в мозги минуя анализ.
В отличие от.

Дальше.

Пропаганда.
Хм, где ее больше — на ТВ или в сети?
Я, как свидетель евромайдана, вижу эту гадость просачивающейся через социалки и блоги в сеть.
Но в сети больше возможностей от нее уйти.
Ее проще фильровать самому, без государства и тяжелых расходов на нелегкий депутатский труд.

Нецензурная брань и другие бранные выражения.
Если нам не нравится нецензурная брань — надо запрещать интернет, безусловно.
Ее правда больше на улицах, в маршрутках и на заднем дворе школы.
Но запретить надо не улицы, маршрутки и задние дворы.
Запретить надо интернет.
Ага.

Порнографическая информация и половые отношения в виде изображения или описания.
В 1977-м году я учился в 3-м классе советской школы.
Военного городка.
Т.е. что может быть более закрытым или более контролируемым — сложно представить.
Именно в этом году один одноклассник нашел у родителей колоду эротических карт и принес с собой в школу.
И я буду сильно удивлен, если наше государство сумеет переплюнуть СССР по контролю хоть чего-либо.
Кроме финансовых потоков понятно.

Люди, вы что, собираетесь бороться с основным инстинктом, реализующимся у молодого здорового организма?
И вы серьезно надеетесь победить?
Честно?

Они найдут где и как.
Не обманывайтесь.
Они сильнее — им жить, когда все мы будем мирно лежать в земле.
И не только жить, но и страшное дело — трахаться.
Так что давайте не будем завидовать.

Хотя посмотреть на шоу «Государство против Основного инстинкта» будет интересней, чем сходить на «Чужой против Хищника».

Насилие и пугающий контент.
Да, конечно.
Щас, новости по ТВ запретим.

У сына знакомого (2-й класс) днюха была, спрашиваю у папика что подарить.
Папик порылся в памяти и спросил у сына, сын честно ответил, что у них в классе проходит чемпионат по GTA (!) на PSP.
Сами дети организовали.
Никому кроме меня ничего неправильного не показалось.
Вот реально — у кого не спрашивал.

Но да, запретить надо не PSP/GTA.
Фильтровать надо Интернет.

Персональная информация о ребенке
Наверное единственный пункт, который имеет отношение к интернету.
Правда, по странному совпадению, он имеет еще отношение к известным педохантерам и авторам хайпа о защите детей.
Евпочя.

А теперь серьезно.
Из личных наблюдений за собственным 5-летним бандитом могу сказать.
Когда перед ютубовским лунтиком крутят рекламу форекса — это меня раздражает.
Но я могу это решить без государства.
И это пока единственная проблема его и интернета последние 4 года — с момента первого зависания на poissonrouge.

Очевидно для общества (не для меня или конкретного родителя!) есть опасность распространения деструктивных мемов — ну мода на самоубийства например после просмотра очередных Сумерек.
Или на что другое после «триллиона оттенков серого».
Или даже на такое жуткое извращение, как митинг — страшное дело, хуже петтинга.

Очевидно, что для этого надо не фильтровать потоки, а для начала иметь модель динамики распространения мемов.
Ну видимо разработанную Институтом мем-динамики. При Академии Наук, ага.

Очевидно что этой модели не то, чтобы нет.
Нет, их наоборот, много и все они в частной собственности политтехнологов и работают через раз.

Так что пока с этим не решим — ситуация будет в рамках сценария "сделаем хоть что нибудь заплатим хоть кому-нибуть и помолимся, чтобы леарство не было хуже болезни".

С другой стороны, социальный запрос от родителей есть.
Но зададим себе простой вопрос.
А почему этот социальный запрос не спешит удовлетворить бизнес?
Почему нет продукта для индивидуальной фильтрации контента на десктопе?

Родители ведь на все готовы ради детей — значит купят и задорого.
Или они на все готовы только в интернет срачах?
Ну же, где многочисленные стартапы по фильтрации?
Где «Сколково против педофилов»?
Где Билл с Мелиндой, отстегивающие кеш на благое дело?

И вот тут — при анализе рынка реальных продаж реальных решений — и наступает момент истины.
Не DPI, продвигаемых за взятки ничего не понимающим в них випам.
Нет, того конечного десктопа, которым сами родители и пользуются, без посредников.
И на который их никто напряь не может — кроме блага ребенка.

Вот она, причина, определяющая что взлетит, а что не взлетит.
Клиенты.
Люди.
Покупатели на рынке.
То, что в состоянии предоставить технология — им не нужно.
Точка.

И если им не подходят бизнес-решения, значит им не подойдут и решения государства.

PS
Ждите нас с обзором коммерческих десктопных продуктов по защите детей.
К сожалению не от родителей.
И даже не от государства.

Обзор будет очень уныл — примерно как и сами продукты.
Кстати не все знают, что у большинства из них основная функция не фильтрация, а слежка за детьми — логгирование, удаленный десктоп…
Инструмет скорее для педофила, желающего поиметь ребека в мозг. Ну или для родителя, озабоченного обработкой напильником собственной личинки до состояния персонального клона.

Своему малолетнему бандиту я такое не буду ставить даже под угрозой — я слишком уважаю его, чтобы читать его дневники и воровать его жизнь.

Но что-то мне подсказывает что решения, предлагаемые государством будут такими же как и коммерческие.
Или даже хуже.
Вот с малой распространенностью можно и поспорить.
Просто она очень не видна с точки зрения программиста.

Куча сетевых устройств используют.
Другой вопрос, что для программиста это оверкилл и ад.
Как раз в ASN.1 формат отделен от схемы данных.
Там есть отдельно Encoding Rules — хоть в битовый поток засунуть, хоть в XML.
Сертификаты X.509 например кодируются в DER.

ru.wikipedia.org/wiki/X.690

Так что ничто не мешает кодировать ASN.1 данные даже в protobuf
Боюсь, ответ уже получается сильно объемным, а полную статью я буду очень уж долго писать, даже если забыть о предновогодних дедлайнах…
:-(

Я пока кину просто несколько роликов, где в картинках расписан процесс.
Но самого интересного с точки зрения программиста — клеток памяти например или соматической гипермутации, там не показано.

www.youtube.com/watch?v=Rpj0emEGShQ
(грипп, да)

www.youtube.com/user/kandrew5v5
достаточно интересный канал, почти комиксы на тему ИС.

PS
Я собственно не биолог, я программист, и некоторое время работал в области нестандартных средств защиты информации.
Соответственно мое знание натуральных ИС достаточно специфичное и фрагментарное, биолог может объяснить получше.
А вот искусственные ИС я проработал довольно плотно, есть рабочие имплементации некоторых кусков, которые несут боевую вахту на живых серверах уже годами.

Возможно попытаюсь сделать отдельную статью по биологической ИС позже, но опыт подсказывает что-то пессимистическое — вот этот пост я обещал написать год назад.
Распишу обязательно.
Просто у меня через два часа поезд, в котором вайфай (к сожалению) не предусмотрен. Потому где-то на выходных, не раньше.

Отвечу в этой ветке или же сделаю апдейт к статье.

Но там самое интересное — при повторной инфекции.
Поэтому грипп может быть не самым удачным примером.

fixed, спасибо
Ну, сенная лихорадка известна с времен, когда детская смертность еще была главным демографическим фактором.
Т.е. аутоиммунные нарушения — вещь все же старая, доспидовая.

Гемато-энцефалический барьер имхо больше «фаерволл» (причем в докомпьютерной терминологии), чем «песочница».
Но разграничения доступа в организме безусловно существуют, хотя и связь «каждый с каждым» в пределах подсистемы тоже наличествует.

В любом случае, уровень рефлексивности живого организма не сравним с компьютерными системами, возможно это и есть одно из ключевых отличий жизни. Ну или наших представлений о ней.

На этот момент я и обращал внимание.
Нет углеводородов — пользуйтесь возобновляемыми источниками энергии. Нет бумаги — переходите на электронные чернила. Технологии помогут выкрутиться. А если не помогут, то купите недостающее у соседнего холона. При этом ваш рейтинг устойчивости будет 98% вместо 100%. Разумно предположить, что стопроцентной полноты не будет ни у кого.


Хуже когда нет антибиотиков.
Боюсь в этом случае рейтинг устойчивости будет несколько ниже 98%.
А примерно как средневековье — во время чумы, там кстати тоже холоны были — графства, герцогства, феоды…
Или чума была от отсутствия очков?

Вот интересно сколько холонов откажутся делать прививки и через сколько лет это приведет к полному БП всех и вся…
Государство — то, что обладает монополией на насилие.
Без насилия крупные группы людей жить не могут — биология-с. Паттерны наших волосатых предков (отгеноцидивших и сожравших умных неандертальцев) пока еще не научились вырезать скальпелем, хотя с нашим прогрессом можно ожидать и этого.

С распределенным насилием есть две точки устойчивости.
Первая — война всех против всех.
Вторая — разделение на иерархии, обладающие монополией на насилие в пределах своих зон влияния.
Квазигосударства — или если назвать привычными словами — кланы, банды, полевые командиры, мафиозные семьи и прочее.

Отмирание государства приведет либо к рождению новых банд, либо к развалу на сверхмелкие банды размером с одного индивидуума (возможно включая его личный гарем и рабов). Собственно, пережившие отмирание государства в 90-е могут многое рассказать про этот поучительный опыт для свободы личности. Особенно в тех местах, где роль государства всегда была не самой сильной.

Этот процесс продемонстрирован историей много раз, город-крепость Коулун, воспетый Гибсоном и прочими анархо-{вставить подвид}истами — один из последних реальный примеров, что бывает с обществом, где нет законов, а есть лишь соглашения.
Этот мегабомжатник был снесен в конце 90-х соседями, которых задрал тот уровень криминала и поток наркоты, и неоднократный ввод войск в количестве одного полисмена на 6 жителей (вкл. детей и стариков) ничего не смог решить.
При окончательной зачистке выселили всех жителей, уничтожили все что там находилось и разбили парк на этом месте.

Есть правда обходные пути к анархическим сообществам. Лоботомия с хирургическим снижением агрессии всего населения конечно всерьез никем не обсуждается, как-то не похоже на заявленный фен-шуй.
Но вот если сделать социальную лоботомию — заменить все управляющие звенья и компенсаторные механизмы компьютерами — вот тогда получаем самое то.
А получаем мы техноанархизм, где каждый холон может поставить себе завод по производству процессоров с 45 нм техпроцессом, хе-хе.
И заодно брать энергию из астрала, что столь же реалистично.

Правда и здесь получаем мы техноанархизм только тогда, если сразу захардкодим его в компьютерах.
Иначе боюсь природа найдет свою устойчивую точку, несколько отличающуюся от воззрений очередного доктора Опира.

И да, чем крупнее клан — тем больше ресурсов он может подгрести под себя и тем более крупные проекты он может реализовать.
Кто-то космос осваивает, кто-то фонтан в своем доме делает.
Холоны конечно в космос не полетят, ясное дело.
Им точно не до этого.

Перспективы совершенно офигенные, если доползут до картографирования разума и вычленения составляющих — вообще будет песня, философские факультеты будут делать харакири в массовом порядке.
Так что тут не спорю совершенно, как исследовательский проект — это может и круче чем геном человека.

Другой вопрос, что применение этих ништяков внушает некоторые опасения — политтехнологи должны быть очень рады результатам.
:-)

Ну и мое замечание все же больше относится к перспекивам использования в ИИ, и вот их я тут точно не вижу.
Т.е. вижу, но примерно как светящийся кролик в генной инженерии — показать инвесторам и публике, создать шум.
Первый мой компьютер — это калькулятор Б3-34.
:-)

Так как программа не сохранялась и приходилось ее долго набирать, то я обратился к старшему брату и мы вместе нарисовали идею хранимой памяти — наклеивать на текстолит магнитную ленту и как-то ее читать/писать снятой с магнитофона головкой.
Естественно ничем не закончилось, но процесс был интересен.

В 8-м классе (1982-й) в моей школе впервые ввели специализацию «программирование» и на практику нас возили на ЕС-1022. Независимо от этого я несколько раз пытался проникнуть на универовский ВЦ и даже что-то пытался ваять на таких почтенных машинах, как Мир-2 — рулоны перфоленты (которая через два-три считывания осыпалась) и электрическая пишущая машинка «Консул», вместо монитора и клавиатуры. Играть в морской бой там было интересно, тетриса не было, как и GTA V.
:-)

Заодно освоил языки Алмир и Аналитик — благо книжки были доступны и команды были на русском языке и посмотрел издали на легенду — М220.
Зато на школьной практике даже написал кусочек кода на PL/I, который я к тому времени изучил (или думал что изучил) — для вполне реальной программы управления городским транспортом, взрослые дяди дали написать.
Возможно этот код даже пошел в продакшн (30 лет тому назад), но думаю, что взрослые программисты просто не хотели огорчать йуного фаната.
Тем более, что IDE того времени представляла собой большой механический девайс по набивке перфокарт.

Свидетельство программиста (1984 года, документ на плохом картоне) я иногда таскаю на собеседования — приколоться над HR.
:-)

Потом первый курс, Искра 226 — бейсик на зеленом экране, к большим ЕС-кам меня не пускали, потом армия, по возвращению устроился админом и на полставки программистом в ВЦ, при дневном обучении получалось, тем более, что препод по программированию официально разрешил не ходить на занятия вообще.

Клас из ДВК-2 и ДВК 3, были еще странные машинки Д3-28 (команда ассемблера — поднять электромагнит кассетника), потом первая сеть на японских чудо-машинках с 8-дюймовыми дисковводами на i8080 и CP/M — первый раз услышал нормальный саунд, а не дребезг ШИМ. 8-дюймовые диски вылетали пачками. Первая база данных на 8-дюймовых дисках (лингвистика), сортировка сутки, проснуться утром в аудитории, от того, что студенты пришли на пары.
Ассемблер ДВК я любил больше чем С — быстрая компиляция и свобода, писал визуализацию и софт для физиков. Хотел даже БПФ на ассемблере — но не вытянул.

Синклеры — много их, герконовые клавиатуры менял не реже раза в месяц — тупо ломались, начинался бизнес, синклера не клепали только ленивые, я писал софт на продажу и просто по приколу.
Для развлечения накатал под них проволочное 3д на ассемблере Z80 — таблица синусов и чистый фиксед-пойнт, до двух десятков узлов даже нормально крутилось.
:-)
Сети на синклерах — когда магнитофон имитировался передачей по лапше, а данные грузились с центральной ноды с единственной 5-дюймовки на всю сеть, я делал оконный интерфейс — да, на ассемблере, редактируя графические примитивы. :-)
БК-шки (для мелких халтур).

Закончил универ в 91-м.
К тому времени уже были ЕС-1080 — MSDOS и правленный в hex-кодах нортон, зеленый диггер и кажется даже «лексикон».
В том раздрае ушел на завод, в АСУ, покантовавшись перед этим в нескольких местах.

CM/80, опять же EC-1841, первая программа на С++ — том раннем, еще не накачанном сахарином.
Халтуры в виде сетей, халтуры для врачей, халтуры админские и кодерские, Novell Netware. Бездисковые станции, работающие годами без вмешательства и UPS.
Одесский узел сети ИАСНЕТ. Первая БД на прологе. UUCP, юниксы.
Винда, роутеры, интеграция — куча разных интересных железок и программы управления ими на линуксе, переписывание RADIUS и модули под апач.
HP PA RISC — железный дровосек за много тысяч баксов, неубиваемый как утюг.
Линукс, линукс, линукс — похоже он останется со мной до конца (ну если не допилят Plan9 с нейроинтерфейсом).

Бизнес-критикал системы, 24х7, когда 10 минут поднятия системы означает физические повреждения морды лица и от звука СМС-ки ночью подпрыгиваешь на три метра вверх и начинаешь заикаться, набирая на клавиатуре смартфона пароль к ssh-ключу.
Да, на первом своем смартфоне Treo 180 я так ничего и не написал — не до того было, на всех серваках надо было увеличивать таймаут, т.к. хендшейк SSH занимал больше двух минут.

Затем кластеры, MPI, собственные менеджеры ресурсов, написанные на коленке на скорость и почему-то работающие, data mining, machine learning, терабайтные сортировки и системы, обучающиеся неделями.
Большие кластеры. Большие базы. Кучи Xeon'ов о 16 ядрах, месяцами держащие 99% на каждое ядро — и потому иногда сдыхающие от перегрева, если ДЦ дешевый.

Хз что дальше будет, самому интересно.
:-)

Но предыдущие 30 лет были прикольными.

Информация

В рейтинге
Не участвует
Откуда
Одесса, Одесская обл., Украина
Дата рождения
Зарегистрирован
Активность