Думаю, почти всем, кто сколько-нибудь серьезно занимался публикацией материалов в интернете (в своем блоге или в каком-то ином формате), хорошо известно новое русское слово «копипаст». Для тех, кому оно непонятно, поясню смысл. Термин образовался от английского copy/paste, и как правило означает копирование чужого текста, фотографий или любых других материалов без авторского согласия, а зачастую вообще без указания авторства или со ссылкой на неправильный источник.
Природа такого явления похожа на ту, что у стихийного нелегального копирования коммерческой продукции, в том числе программ, музыки и фильмов. А если конкретно, виной тому влияние социальной среды, сформированное национальным менталитетом («Что я, дурак за это платить, когда все вокруг не платят?!» риторический вопрос самому себе). Но сейчас я бы хотел затронуть эту тему в более узкой области именно по отношению к распространению «бесплатных» материалов с неограниченным доступом в интернете.
Стоит начать с того, что 99% тех, кто занимается копипастом, делает это без осознания причин, по которым это плохо и неправильно. А плохо это потому, что «безобидное», как может показаться, перекладывание информации с места на место, может повлиять на внешние по-отношению к копипастеру сущности и не лучшим образом.
В частности массовое распространение одного и того же материала приводит к снижению релевантности среди найденных поисковыми машинами ссылок. В свою очередь, это приводит к утечке трафика от первоисточника к его клонам. На практике это выражается в том, что даже по уникальной и точной фразе из текста бывает сложно найти оригинальный ресурс, на котором этот текст был опубликован, и не попасть перед этим несколько раз на увешанные рекламой сайты-паразиты. Кроме того, повторная публикация текста, без указания автора и ссылки на источник, приводит к тому, что посетители сайта-паразита будут по-умолчанию принимать за автора того, кто этот текст опубликовал. А это уже косвенное нарушение авторского права.
Мораль состоит в том, что никогда не стоит забывать об ответственности за любые манипуляции с информацией в общественной сети, и том, что эта сеть по естественным причинам накладывает определенные требования в отношении этики («гигиены») ее использования. Даже самое «укромное» место в интернете не скроется от тысячеглазого робота Google и, соответственно, миллионов всех тех, кто умеет им пользоваться.
Конечно, я не на столько идеалист, чтобы поверить в реальность воплощения этой концепции в ближайшие много-лет в рамках рунета, где логотип Creative Commons в чьем-нибудь блоге не приносит больше пользы, чем сомнительное заклинание вроде «кто украдет тот дурак», а о возможной юридической ответственности даже говорить смешно. Поэтому вопрос защиты от несанкционированной утечки информации с сайта сейчас более актуален, чем тема просвещения бессознательной мОлодежи и прочего контингента, который эту утечку обеспечивает.
Способов защиты контента веб-сайтов от копирования на данный момент придумано множество. Но большинство из них страдает тем, что за повышение уровня безопасности бездумно платят удобством доступа к информации. Вот некоторые из подобных неправильных методов:
Подводя итог этому перечню, можно сказать, что текст, чье копирование необходимо предотвратить, ни в коем случае и ни в каком виде не стоит выкладывать в интернет вообще. А еще лучше уничтожить для надежности вместе с носителем. Тем не менее, приближая требования к реальности, можно переформулировать постановку задачи.
Вместо того, чтобы пытаться предотвратить копирование, нужно сделать так, чтобы во всех копиях присутствовала обязательная ссылка на первоисточник. Такая ссылка, во-первых, сохранит авторское право, а во-вторых, повысит индекс цитирования в поисковиках сайта оригинала, подняв его до первого (или одного из первых) мест в результатах поиска.
Добиться этого зачастую не так уж и сложно, т.к. все копипастеры обычно «работают» по одинаковой предсказуемой схеме: содержательная честь страницы, т. е. основной массив текста, копируется ими без изменений, а заголовок обычно заменяется на собственные «вариации на тему». Плюс к тому может быть добавлено небольшое введение (больше одного-двух предложений среднестатистическая особь добавить не осиливает), но последний факт существенного значения не несет.
Так вот, для того чтобы вместе с контентом была унесена ссылка на «родной» сайт, бывает недостаточно просто добавить ее в конце страницы. С большой долей вероятности, такую ссылку не скопируют, особенно если она оформлена как отдельный элемент, а не составная часть информационного блока. Гораздо эффективнее тем или иным образом упомянуть первоисточник внутри самого текста, если это возможно. В общем случае, удобнее всего это делать во введении или заключении. Кроме того полезно не только ставить гиперссылку, но и непосредственно указывать URL, т.к. ссылки при копировании часто теряются, если HTML выносится из браузера как plain text. При этом, по эстетическим соображениям, желательно, чтобы ссылка была короткой и читаемой. Например, http://paradigm.ru/posts/184.
Конечно же, данный метод тоже не безгрешен. Из-за его применения происходит увеличение объема текста за счет, возможно, не очень нужной информации. Поэтому применять его следует осмысленно. И, конечно же, не забывая о качестве самого материала.
PS: Поводом к написанию данного поста стало ~240 копий (возможно, их уже больше) одной из моих предыдущих заметок, которые нашел Яндекс. Будет забавно, если и эту статью кто-нибудь скопипастит.
Природа такого явления похожа на ту, что у стихийного нелегального копирования коммерческой продукции, в том числе программ, музыки и фильмов. А если конкретно, виной тому влияние социальной среды, сформированное национальным менталитетом («Что я, дурак за это платить, когда все вокруг не платят?!» риторический вопрос самому себе). Но сейчас я бы хотел затронуть эту тему в более узкой области именно по отношению к распространению «бесплатных» материалов с неограниченным доступом в интернете.
Стоит начать с того, что 99% тех, кто занимается копипастом, делает это без осознания причин, по которым это плохо и неправильно. А плохо это потому, что «безобидное», как может показаться, перекладывание информации с места на место, может повлиять на внешние по-отношению к копипастеру сущности и не лучшим образом.
В частности массовое распространение одного и того же материала приводит к снижению релевантности среди найденных поисковыми машинами ссылок. В свою очередь, это приводит к утечке трафика от первоисточника к его клонам. На практике это выражается в том, что даже по уникальной и точной фразе из текста бывает сложно найти оригинальный ресурс, на котором этот текст был опубликован, и не попасть перед этим несколько раз на увешанные рекламой сайты-паразиты. Кроме того, повторная публикация текста, без указания автора и ссылки на источник, приводит к тому, что посетители сайта-паразита будут по-умолчанию принимать за автора того, кто этот текст опубликовал. А это уже косвенное нарушение авторского права.
Мораль состоит в том, что никогда не стоит забывать об ответственности за любые манипуляции с информацией в общественной сети, и том, что эта сеть по естественным причинам накладывает определенные требования в отношении этики («гигиены») ее использования. Даже самое «укромное» место в интернете не скроется от тысячеглазого робота Google и, соответственно, миллионов всех тех, кто умеет им пользоваться.
Конечно, я не на столько идеалист, чтобы поверить в реальность воплощения этой концепции в ближайшие много-лет в рамках рунета, где логотип Creative Commons в чьем-нибудь блоге не приносит больше пользы, чем сомнительное заклинание вроде «кто украдет тот дурак», а о возможной юридической ответственности даже говорить смешно. Поэтому вопрос защиты от несанкционированной утечки информации с сайта сейчас более актуален, чем тема просвещения бессознательной мОлодежи и прочего контингента, который эту утечку обеспечивает.
Способов защиты контента веб-сайтов от копирования на данный момент придумано множество. Но большинство из них страдает тем, что за повышение уровня безопасности бездумно платят удобством доступа к информации. Вот некоторые из подобных неправильных методов:
- Отключение контекстного меню в браузере, с помощью клиентских скриптов. Эффективность способа не выдерживает никакой критики, т.к. для настоящего джедая обход подобной «защиты», как правило, дело нескольких секунд. Тем не менее, побочный эффект такого приема немалое раздражение, вызываемое отсутствием в нужный момент привычной детали интерфейса браузера (ведь контекстное меню используется не только для копирования, да и копирование не всегда означает кражу материалов).
- Разбиение большого текста статьи на несколько страниц. В принципе, такой способ лишь косвенно мешает копировать текст, сильно снижая удобство этого процесса. Основной причиной использования разбиения обычно является искусственная генерация трафика внутри сайта и повышение количества показанной рекламы. Для защиты метод бестолковый и опять же неэффективный.
- Экзотические способы вывода текста (Flash, Java апплеты или просто отображение текста в виде картинок). Не стану останавливаться на перечислении органов, которые следует отрывать дизайнерам за применение подобных идей. В первую очередь это еще один метод понижения удобства доступа к материалам сайта, а уже потом вариант защиты.
- Публикация текста в виде PDF. Данный метод неплох, но опять же имееет свои минусы. Во-первых, поисковики уже давно умеют успешно преобразовывать PDF в HTML. Кроме того, накладывается дополнительное требование для доступа к контенту наличие установленного в браузере плагина или программы для просмотра PDF.
Подводя итог этому перечню, можно сказать, что текст, чье копирование необходимо предотвратить, ни в коем случае и ни в каком виде не стоит выкладывать в интернет вообще. А еще лучше уничтожить для надежности вместе с носителем. Тем не менее, приближая требования к реальности, можно переформулировать постановку задачи.
Вместо того, чтобы пытаться предотвратить копирование, нужно сделать так, чтобы во всех копиях присутствовала обязательная ссылка на первоисточник. Такая ссылка, во-первых, сохранит авторское право, а во-вторых, повысит индекс цитирования в поисковиках сайта оригинала, подняв его до первого (или одного из первых) мест в результатах поиска.
Добиться этого зачастую не так уж и сложно, т.к. все копипастеры обычно «работают» по одинаковой предсказуемой схеме: содержательная честь страницы, т. е. основной массив текста, копируется ими без изменений, а заголовок обычно заменяется на собственные «вариации на тему». Плюс к тому может быть добавлено небольшое введение (больше одного-двух предложений среднестатистическая особь добавить не осиливает), но последний факт существенного значения не несет.
Так вот, для того чтобы вместе с контентом была унесена ссылка на «родной» сайт, бывает недостаточно просто добавить ее в конце страницы. С большой долей вероятности, такую ссылку не скопируют, особенно если она оформлена как отдельный элемент, а не составная часть информационного блока. Гораздо эффективнее тем или иным образом упомянуть первоисточник внутри самого текста, если это возможно. В общем случае, удобнее всего это делать во введении или заключении. Кроме того полезно не только ставить гиперссылку, но и непосредственно указывать URL, т.к. ссылки при копировании часто теряются, если HTML выносится из браузера как plain text. При этом, по эстетическим соображениям, желательно, чтобы ссылка была короткой и читаемой. Например, http://paradigm.ru/posts/184.
Конечно же, данный метод тоже не безгрешен. Из-за его применения происходит увеличение объема текста за счет, возможно, не очень нужной информации. Поэтому применять его следует осмысленно. И, конечно же, не забывая о качестве самого материала.
PS: Поводом к написанию данного поста стало ~240 копий (возможно, их уже больше) одной из моих предыдущих заметок, которые нашел Яндекс. Будет забавно, если и эту статью кто-нибудь скопипастит.