alizar11 сен 2015 в 00:52

«ВКонтакте» реализовал автоудаление сообщений по ключевым словам

1 мин

23K

Социальные сети

+13

Комментарии 36

EvilArcher 11 сен 2015 в 03:27

Извени

Это гениально. Надо вносить в фильтр все грамматические ошибки. Тогда уровень русского языка во вконтакте значительно вырастет.

Error1024 11 сен 2015 в 04:45

А кроме того, возможно будет удален действительно полезный комментарий, хоть и с грамматической ошибкой.

EvilArcher 11 сен 2015 в 04:48

Никто не запрещает исправить ошибку и опубликовать его заново.

Alexeyslav 11 сен 2015 в 05:20

Только если будешь знать что удалили именно из-за этой ошибки а не какой-то другой.

MaksimMukharev 11 сен 2015 в 08:36

А если заранее будешь знать, что это слово в стоп-фильтре, то придумаешь 1000 способов обойти этот фильтр.

tendium 11 сен 2015 в 09:10

Писать грамотно входит в эту тысячу способов?

Alexeyslav 11 сен 2015 в 11:39

Для этого нужен не список ключевых слов, а спелчекер прикрутить.

batja84 11 сен 2015 в 16:57

Он в основных браузерах включается парой нажатий кнопок мыши. Ну Хром и Опера точно.

Alexeyslav 11 сен 2015 в 19:17

Но он не мешает оставлять комментарии с ошибками.

batja84 11 сен 2015 в 19:23

Только наличие работающих мозгов и уважения к тем, кто будет читать написанный текст, может этому помешать. А так… всеобщий доступ в интернет показал насколько безграмотны в принципе люди. Далеко ходить не надо, в каждой второй статье на хабре/гиктаймз по десятку ошибок в статьях. Вроде бы умные (в своих сферах) люди пишут, а с грамматикой проблемы невероятные.

MaksimMukharev 11 сен 2015 в 16:11

Иногда. Стоит ли обсуждать, что эту тему в свое время уже проходили в чатах и на форумах? И это было абсолютное поражение. Замена кириллических символов на латинские, написание каждой буквы через пробел, замена некоторых букв знаками @#$%, замена букв схожими по начертанию числами, использование слов-суррогатов, использование изображений (ненужное — заштрихуйте)…

Alexeyslav 11 сен 2015 в 19:19

Вот именно что проходили, а значит эти особенности учтены и словарик матов расширен. Найти лазейку будет весьма трудно, а закрыть её достаточно просто.

MaksimMukharev 12 сен 2015 в 08:09

Перечитайте мой комментарий еще пару раз. Невозможно создать такую систему, где человек не сможет ругаться матом, если захочет. За исключением единственной системы — с белым списком доступных слов. Но тогда мы выкидываем большинство названий и сокращений, которые по определению не смогут в словарь входить. Прощайте и комментарии с орфографическими ошибками и опечатками. Эта система нежизнеспособна.

VenomBlood 12 сен 2015 в 22:42

Белым списком тоже можно ругаться.
Легкость сравнима с ругательством при наличии черных списокв
# допускаю что это создает лишние проблемы, но тем не менее цель может быть
Достигнута.
ЬА вот мягкий знак придется запретить, да.

Alexeyslav 13 сен 2015 в 08:09

Абсолютной системы не будет, но можно сделать так чтобы для ругани надо было очень постараться — тогда таких комментариев будет очень мало, ибо упорных матершинников в мире мало — большинству просто надоест подбирать способы обхода фильтра.
Замены символов, написание через пробел, слова с числами —
это всё задачка для студента как это свести к единому виду.
Слова суррогаты просто будут добавляться в словарь по мере появления.

vintage 13 сен 2015 в 08:55

Как показывает практика матерными становятся в этом случае слова совсем не имеющие к половым органам отношения.

х*й -> куй, хрен
п*зда -> манда

и тп

Alexeyslav 13 сен 2015 в 10:45

И пусть. В конце концов, и их добавят в словарь матов.
Вобщем-то не беда если пару отщепенцев прорвутся — их уже будет легко закрыть вручную.
Цель этих фильтров — предотвратить массовые явления, уменьшить объём работы живым модераторам.

vintage 13 сен 2015 в 10:55

… и создать кучу проблем обычным пользователям, которые хотят обсуждать садоводство, путешествия и крафт, а не заниматься обходом антимата.

zv347 11 сен 2015 в 05:33

Горошек неудачно нарисован.

Firsto 11 сен 2015 в 05:54

А может специально, чтобы обратили внимание на картинку и задержались на лишние три секунды. :)

vintage 11 сен 2015 в 08:37

Не стоит потакать комплексу вахтёра.

immaculate 11 сен 2015 в 10:00

Тот, кто хочет написать матерное слово, все равно его напишет, так или иначе.

wormball 11 сен 2015 в 10:33

где можно скиголубой купить?
чего-чего купить???
скипедар. тут однако антимат стоит.

Arilas 11 сен 2015 в 13:53

Вспоминаю, как в одной игре от Mail.ru добавили фильтр нецензурных выражений. В итоге, внутриигровой элемент «корабль», стали писать как «кор», потому что за слово «корабля», получали бан на час. Интересно, здесь так же?

tundrawolf_kiba 11 сен 2015 в 15:48

Я помню на каком-то новостном форуме не мог оставить комментарий, в котором было сочетание «не бывает», потому что находило там мат(подсказка, если убрать пробел — 2 и 3 буквы)

Alexeyslav 11 сен 2015 в 19:24

Какой-то студент алгоритм разрабатывал. Лет 15 назад в IRC видел такой антимат, и совсем недавно тоже но через 1-2 дня его научили не реагировать на такие недоразумения. Дело только в тщательности обучения, а это возможно только когда исполнитель заинтересован. Конечно, гораздо проще взять алгоритмы и словарик 20-летней давности а дальше хоть трава не расти — ТЗ соблюдено, алгоритм формально работает… но в качестве мало кто заинтересован.

Efrit 11 сен 2015 в 15:50

Э…
Возможно, я один не понимаю — но что плохого в слове «Беларусь»?

ximaera 11 сен 2015 в 15:58

«Беларусь или Белоруссия» — старый спор, наподобие «на/в Украине». Если хотите вникать, то можете начать с обсуждения вопроса на русскоязычной Википедии: 1, 2, 3, 4, 5, 6, 7, 8…

DnV 11 сен 2015 в 16:57

То, что такого слова в русском языке не существует, но некоторые белорусы пытаются доказать обратное.

VenomBlood 12 сен 2015 в 00:34

Если вокруг «существования» какого-либо слова возникает более-менее резонансный спор значит это слово существует, потому что люди так говорят. А «ревнители чистоты языка» могут говорить что угодно и призывать вернуться к «херам» и «ятям», язык развивается и этого не изменить.