Как Википедия может засветить ваши персональные данные и как она их использует на самом деле

    … или как вы можете засветить свои персональные данные, загружая фотографии в сеть

    Что такое Википедия знают все читатели Хабра. Возможно, что не все из них знают, что «Википедию править может каждый», в том числе зарегистрировавшись под произвольным именем. Если при регистрации вы укажете свои реальные данные в качестве имени пользователя, то вы будете ССЗБ, но это будет ваш осознанный выбор. Однако если пользователь с таким именем и фамилией уже есть, вам придется использовать другое логическое имя (login). В остальном Википедия вроде бы защищает вашу анонимнось/реальные данные, если вы не раскроете их сами, например на своей странице участника. Кроме одного случая…

    Этот случай касается загрузки изображений и фотографий в Википедию. Если вы загрузите свое изображение в Википедию (в большинстве случаев — на «Викисклад», Commons), то на странице описания изображение кроме обязательной лицензии и вашего описания автоматически будут помещены данные из EXIF файла. А среди этих данных могут оказаться ваши персональные данные, т.е. «информация о правообладании». И если вы в Википедии зарегистрированы как Вася Иванов, а в EXIF стоит «автор: Марья Ивановна», то ваши персональные данные могут быть раскрыты. Если в EXIF стоят реальные данные. В любом случае эти данные движком Википедии выставляются на всеобщее обозрение без предупреждения и очевидно, что для некоторых авторов это может оказаться проблемой личной безопасности. Это с одной стороны.

    С другой стороны, Википедия известна тем, что очень строго относится к авторским правам, и, как оказывается, администраторы Викисклада, смотрят на этот самый EXIF, чтобы определить имеются ли нарушения копирайта или нет. Вот таким образом они смотрят.

    Пример 1

    Фотография авиаконструктора академика Марата Николаевича Тищенко выставляется на удаление администратором Sealle Причина для запроса на удаление: As per metadata, scanned by Stanislav Zbarassky, so unlikely to be own work, copyright status is unclear.

    image

    В метаданных: Автор Stanislav Zbarassky, Владелец авторского права: Stanislav Zbarassky, Модель камеры Nikon SUPER COOLSCAN 5000 ED, Программное обеспечение Adobe Photoshop CS5 Macintosh, Дата и время изменения файла 05:17, 6 мая 2013.

    Загружено участником Zbarassky 6 мая 2013, в описании стоит дата снимка 10 декабря 2010.

    Т.е. фотография, загруженная семь лет назад участником Zbarassky, который в описании пишет «автор Станислав Збарасский», выставляется на удаление потому что в метаданных стоит Stanislav Zbarassky. Причем эти данные изменялись Фотошопом.

    Пример 2

    Изображение, загруженное в 2014 году пользователем Anisimov Vasiliy выставляется тем же администратором на удаление, Причина для запроса на удаление: As per metadata, created by Yuliya Anisimova, the permission is missing. В метаданных стоит «Автор: Юлия Анисимова» и нет никаких данных по использованному программному обеспечению.

    В обсуждениях вокруг авторского права в Википедии очень много слов сказано о том, что если вас, например, попросили сделать фотографию на чужой фотоаппарат или смартфон, то автором снимка являетесь вы, а не владелец аппарата, и, следовательно, сведения об авторстве в EXIF будут не соответствовать действительности. Если вы сделали снимок, а потом его обрезали на компьютере жены или сестры, на котором стоит какое-то программное обеспечение для редактирования изображений, то автором являетесь всё равно вы. Но одно дело — слова, другое — реальная практика.

    Мораль: если вы загружаете изображение в Википедию, будьте готовы к тому, что любой дятел может его удалить по любой причине или без нее. Ну и смотрите на EXIF. Если там есть ваши персональные данные, которые вы не желаете распространять — просто удалите их любой программой, которая позволяет редактировать метаданные. Мой смартфон, кстати, очень много пишет в EXIF, но данных об авторстве там нет.
    Ads
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More

    Comments 62

    • UFO just landed and posted this here
        –5
        1. Предложите свой вариант названия.
        2. светит движок без каких-либо предупреждений, причем загрузка изображений — еще тот квест для непосвященных/новичков
        3. Какая перестраховка в первом приведенном примере?
          +10
          Предложите свой вариант названия.

          "Как вы можете засветить свои персональные данные, загружая фотографии в сеть".

            –6
            ну это слишком общо, хотя и справедливо. В качестве подзаголовка, на мой взгляд можно использовать.
              +9

              Ну так и проблема общая, а не только в Википедии. Википедия тут ничем от любого соседнего фотохостинга не отличается.

                –3
                для общего надо бы приводить примеры, отличные от Википедии, на что нет ни желания, ни готовых примеров. Да и что-то так сходу не вижу выставленных наружу метаданных на паре первых подвернувшихся фотохостингах
                  +3
                  для общего надо бы приводить примеры, отличные от Википедии, на что нет ни желания, ни готовых примеров

                  Ну так и не надо. Достаточно просто объяснить, что выкладывая файл с EXIF, вы автоматически светите данные из EXIF (если, конечно, хостинг не чистит EXIF).


                  Да и что-то так сходу не вижу выставленных наружу метаданных на паре первых подвернувшихся фотохостингах

                  Ну вот на фликре прекрасно доступен EXIF, скажем. На Google Photos, афаик, тоже был.


                  Понимаете, чтобы данные не были выставлены, надо делать дополнительные действия. А если сделать по простому пути — использовать файл, загруженный пользователем — то все, что в этом файле было, любому интересующемуся и доступно.

                    –3
                    Понимаете, чтобы данные не были выставлены, надо делать дополнительные действия.


                    не понимаю. Поясню почему. У меня на смартфоне личных данных нет. В профессиональных или не очень профессиональных фотокамерах для того, чтобы в EXIF были ваши персональные данные, наоборот, нужно делать дополнительные действия при настройке фотоаппарата.
                      +2
                      не понимаю.

                      Потому что вы не понимаете, что я говорю о хостинге. Если ничего специально не делать, то с какими данными фотография была залита, с такими и будет доступна остальным.

                        –7
                        а я говорю о другом конце — клиентской части, устройстве, которое заботится или не заботится о вашей безопасности. Хостинг по идее должен об этом предупреждать. И не где-нибудь в середине пользовательского соглашения, которое ни прочитать толком, ни запомнить невозможно, а при загрузке
                          +7
                          а я говорю о другом конце — клиентской части, устройстве, которое заботится или не заботится о вашей безопасности.

                          Подождите, только что же речь шла о Википедии? При чем тут "клиентская часть"?


                          Хостинг по идее должен об этом предупреждать

                          Неа. С чего бы он это кому-то должен? Вы себе представляете объем работ, который нужен, чтобы этому "должен" соответствовать?

                            –2
                            Подождите, только что же речь шла о Википедии


                            Вы же сами выше начали говорить не только о Википедии

                            При чем тут «клиентская часть»?

                            При том, что если в EXIF изначально нет персональных данных, то нет и проблемы.

                            С чего бы он это кому-то должен?

                            С того. Хотя бы для соблюдения законов о персональных данных или приватности

                            Вы себе представляете объем работ, который нужен, чтобы этому «должен» соответствовать?

                            И какой там объем работ? Расскажите, я пока за попкорном схожу.
                              +2
                              Вы же сами выше начали говорить не только о Википедии

                              Я везде говорю о серверах.


                              При том, что если в EXIF изначально нет персональных данных, то нет и проблемы.

                              Ну так и не загружайте, все же прекрасно будет.


                              Хотя бы для соблюдения законов о персональных данных или приватности

                              Если вы самостоятельно делаете свои персональные данные публичными, хостер вам ничего не должен.


                              И какой там объем работ?

                              … ну то есть не представляете. Ок.

                                –5
                                Если вы самостоятельно делаете свои персональные данные публичными, хостер вам ничего не должен.

                                И такие люди являются администраторами Викисклада. Которые типа следят за соблюдением законодательства…

                                Ну Ок.
                                … ну то есть не представляете.

                                Т.е. не можете сказать, в чем заключается объем работ <<взять готовые данные, которые уже есть, найти в них слово «автор» и выдать предупреждение>>?

                                Ну Ок…
                                  +3
                                  И такие люди являются администраторами Викисклада. Которые типа следят за соблюдением законодательства…

                                  Какое конкретно законодательство нарушается в данном случае?


                                  Т.е. не можете сказать, в чем заключается объем работ <<взять готовые данные, которые уже есть, найти в них слово «автор» и выдать предупреждение>>?

                                  А чем вам поможет найти слово "автор"?

                                    –2
                                    Какое конкретно законодательство нарушается в данном случае?


                                    Могу предположить, что GDPR и CCPA

                                    А чем вам поможет найти слово «автор»?


                                    О, вы не только не представляете объем работ, но даже и не догадываетесь, в чем эта работ заключается. Ну Ок.
                                      +2
                                      Могу предположить, что GDPR и CCPA

                                      Предположить-то можете, несомненно. Но вот доказать, что сайт, на котором человек самостоятельно, по своей воле, разместил в публичном доступе свои личные данные, нарушил эти положения, мне кажется, вам не удастся.


                                      О, вы не только не представляете объем работ, но даже и не догадываетесь, в чем эта работ заключается.

                                      Да нет, я как раз представляю: предупреждать о публикации personally identifying information. Или вы не это имели в виду под фразой "хостинг по идее должен об этом предупреждать"?

                                        –2
                                        Вы начинаете юлить. То у вас хостинг ничего не должен, то доказать ничего не удастся

                                        Да нет, я как раз представляю: предупреждать о публикации personally identifying information.


                                        И что, написать плашку предупреждения с готовым парсером EXIF — это такой непосильный труд, года на три для команды из десяти человек?
                                          0
                                          Вы начинаете юлить. То у вас хостинг ничего не должен, то доказать ничего не удастся

                                          Да нет, я вполне последователен: хостинг ничего не должен, потому что не удастся доказать, что он что-то должен.


                                          И что, написать плашку предупреждения с готовым парсером EXIF

                                          Плашку предупреждения о чем?


                                          Ну и да, "готовый парсер EXIF" — это, конечно, мило. Но надо не забыть про IPTC, XMP, и, что особенно весело, Maker Notes, а потом посадить кого-то поддерживать актуальность всего этого.


                                          Но не суть. Предположим, у вас есть вечно актуальный парсер всех стандартов метаданных, который возвращает вам набор пар ключ-значение. О чем вы собрались предупреждать на основании этого набора?

                                        +3
                                        Могу предположить, что GDPR и CCPA

                                        Вот прямо давайте на близком, простом и понятном примере. Предположим, что я, вы или некое третье лицо написало в комментарии на Хабре свои фамилию, имя и отчество. Нарушены ли GDPR и/или CCPA, какой пункт, и кем конкретно?

                                      0
                                      Уважаемый. Вместо того, чтобы спориьт и собирать минуса, могли бы просто заменить название статьи, и возможно все пошло бы вверх.
                                      Вам же дельные советы предлагают, которые соответствуют действительности.
                                        –1
                                        Уважаемый без имени — звучит намеренно оскорбительно, а минусуют те самые вики-удалисты
                                  –1
                                  Я с вами полностью согласен. Нечего постить EXIF куда попало, а то потом попадёшь!

                                  Но
                                  Вы себе представляете объем работ, который нужен, чтобы этому «должен» соответствовать?


                                  Вот, например, команда
                                  find / -type f -name '*.jpg' | xargs -L1 -P16 -I@ exiftool -exif:all=  @
                                  

                                  отчистит EXIF из всех файлов *.jpg в 16 процессов на сервере и
                                  find ~ -type f -name '*.jpg' | xargs -L1 -P16 -I@ exiftool -exif:all=  @
                                  

                                  отчистит EXIF из всех файлов *.jpg в 16 процессов внутри домашней папки на компьютере.

                                  На здоровье! Не надо благодарностей.
                                    +3

                                    Был запрос на "предупреждать", а не на "очистить".

              +3
              То есть то, что эти самые EXIF метаданные любой может получить напрямую из файла изображения с помощью определённых программ и сервисов, вас не смущает, а претензия к сервису викисклада только в том, что сервис лишний раз напоминает пользователям о наличии этих самых метаданных в файле изображения и удобно их отображает.
                +1
                при загрузке движок как раз не напоминает. И удалить файл самостоятельно тоже не дает. И показывать метаданные он стал не помню когда, но далеко не сразу. Т.е. при загрузке метаданных не показывалось, а через несколько лохматых лет они стали показываться
                  +1
                  Какая разница, что движок показывает и чего не показывает, если в онлайн-сервис наподобие metapicz.com я могу парой клавиш передать URL любого JPEG-файла на любом хостинге?
                    0
                    И показывать метаданные он стал не помню когда, но далеко не сразу.

                    В 2007-м точно показывал, а может даже и раньше

                  +8
                  Т.е. фотография, загруженная семь лет назад участником Zbarassky, который в описании пишет «автор Станислав Збарасский», выставляется на удаление потому что в метаданных стоит Stanislav Zbarassky.

                  Нет, не поэтому.
                  А потому, что в метаданных указано, что изображение сделано не фотоаппаратом, а сканером Nikon SUPER COOLSCAN. Т.е. чувак взял и отсканировал чужое фото, заявив его как «own work» и выставив лицензию по своему желанию. Вот если бы он сфотографировал академика сам — всё было бы корректно. А с отсканированным чужим фото так, конечно, не прокатит.

                  На Викискладе действует презумпция виновности: при сомнениях в лицензионной чистоте файлы удаляются. И это правильно, потому что файлы с Викисклада могут использоваться любым человеком, в том числе, в коммерческих целях. Если сохранять там потенциальное нарушение авторских и прочих прав, то это ставит под угрозу пользователей, которым может прилететь иск, если они попытаются в коммерческих целях использовать несвободный файл.

                  Так что вопрос, кто тут ещё дятел.

                  В обсуждениях вокруг авторского права в Википедии очень много слов сказано о том, что если вас, например, попросили сделать фотографию на чужой фотоаппарат или смартфон, то автором снимка являетесь вы, а не владелец аппарата, и, следовательно, сведения об авторстве в EXIF будут не соответствовать действительности.
                  А это вы должны не Википедии предъявлять, а законодательству об авторском праве. Да, если вы попросили приятеля щёлкнуть вас в кафешке, то автор — он. Разве это не очевидно? Если нет, замените «щелкнуть» на «написать красками ваш портрет». Если человек написал ваш портрет (и без разницы, чьи были краски и холст), то с какого перепуга вы будете автором картины? Автор «Мона Лизы» же не изображённая на картине Лиза Герардини, а Леонардо да Винчи. Так вот и автором фото, где запечатлён я, является тот, кто нажимал на кнопку.

                  Из-за этого в своё время было нашумевшее дело о том, может ли нажавшая кнопку обезъяна быть субъектом авторского права. Закончилось тем, что признали — животное не может.
                    +3
                    А потому, что в метаданных указано, что изображение сделано не фотоаппаратом, а сканером Nikon SUPER COOLSCAN. Т.е. чувак взял и отсканировал чужое фото, заявив его как «own work»

                    Вообще-то этотсканер — слайд-сканер, т.е. сканировалась плёнка, что конечно же ничего удалистам не доказывает…

                    Да, если вы попросили приятеля щёлкнуть вас в кафешке, то автор — он. Разве это не очевидно?

                    но данные в EXIF будут говорить о другом. И по этим данным никак не отличить ситуации когда вас снял приятель, когда смартфон стоял на штативе и был использован автоспуск или пульт, или когда приятель был использован вместо штатива, а на кнопку (на пульте) нажали вы.
                      +1
                      Вообще-то этотсканер — слайд-сканер, т.е. сканировалась плёнка, что конечно же ничего удалистам не доказывает…

                      Конечно, не доказывает. Мало ли, кому пленка принадлежит.


                      но данные в EXIF будут говорить о другом.

                      Ну и поправьте их, велика сложность. Или удалите вовсе.

                        +2
                        Мало ли, кому пленка принадлежит.

                        Ну так и мало ли кому фотоаппарат принадлежит. По этой же логике можно удалить вообще любой файл.

                          0
                          По этой же логике можно удалить вообще любой файл.

                          Именно по этой логике Sealle и занимается удализмом
                            0
                            Можете считать это социальным garbage collection: если файл нужный, то за него найдётся кому вступиться, а если всеми забытый — то и не страшно, что будет удалён, даже если проблемы с копирайтом надуманные.

                            Если любопытно, можете посмотреть историю File:Flag_of_Hezbollah.svg, как его удаляли и восстанавливали и снова удаляли и снова восстанавливали, с километровыми спорами по поводу копирайта.
                              +2
                              Большая часть статей в ВП никому особо не нужна, соответственно фотографии для них тоже особо никому не нужны. Автор написал статью и переключился на другие темы или вообще ушел из ВП. А если не ушел, то в случае удаления фотографии с викисклада никакого уведомления не получит, если только не он сам эту фотографию загружал. Таким образом, админ викисклада может тешить собственное ЧСВ вандаля потихоньку изображения «за которые не найдется кому вступится». Социальным называть этот garbage collection неправильно, скорее lobbyless garbage collection. Потому как «ксть кому вступится» как правило либо в случае организованной группы, отстаивающей какие-либо интересы, либо для конфликтных статей с большим числом участников, к каковым и относится Flag_of_Hezbollah.
                                +2
                                1) То, что из Википедии постепенно вытирается заброшенный контент («автор переключился на другие темы или вообще ушел из ВП») — это не баг, это фича.

                                2) Конкретно в случае Flag_of_Hezbollah парадокс был в том, что Хезболла, очевидно, только рада была бы неограниченному распространению своей символики; но поскольку нет никакого документа, гласящего «Мы только рады были бы неограниченному распространению нашей символики. --Хезболла», то их флаг на Commons признали нарушающим копирайт.
                        +1
                        Добавлю, что когда-то давным-давно я отсканировал и загрузил в Википедию обложку российского паспорта, обозначив как «Own work». Её удалили с комментарием, что я не являюсь автором герба России, и поэтому не имею права его загружать.
                      0
                      Вот если бы он сфотографировал академика сам — всё было бы корректно. А с отсканированным чужим фото так, конечно, не прокатит.

                      То есть самому сфотографировать на плёнку, напечатать и отсканировать — никак нельзя, если сканировал — значит точно чужое?

                        +1
                        Где вы увидели «значит точно чужое»?
                        В номинации на удаление — «unlikely to be own work, copyright status is unclear.»
                          0

                          Я увидел что метаданные и имя участника совпадают, но почему-то авторство ставится под сомнение:


                          Т.е. фотография, загруженная семь лет назад участником Zbarassky, который в описании пишет «автор Станислав Збарасский», выставляется на удаление потому что в метаданных стоит Stanislav Zbarassky.

                          Исходя из этого вполне логично предположить что сам факт сканирования каким-то образом подвергает сомнению авторство.

                            +1

                            Метаданные относятся к скану. Собственно, тот факт, что Станислав Збарасский отсканировал изображение, никто не ставит под сомнение. А вот то, что сканируемое изображение тоже было создано им, уже не так очевидно. Если это и правда скан плёнки, то вероятно, что так и было. Но очень часто на Викисклад загружают сканы чужих фотографий, так что в общем случае вероятнее история, что авторство указано некорректно.

                      +2
                      Мне очень интересно, а каким образом википедия вообще предлагает доказывать авторство снимка? В EXIF можно вписать любое имя, можно вообще не вписывать. На какой-нибудь вечеринке одним и тем же смартфоном могли 10 человек по очереди фотографировать. В каком случае будет copyright status is clear?
                        +1
                        Обычно хватает явно сформулированного заявления «автором являюсь я».
                        Сложности возникают только тогда, когда есть конкретные свидетельства противного — например, когда в EXIF указан другой автор.
                          +1
                          В первом примере все это есть, но для удалистов этого недостаточно. Если бы вообще EXIF не было — у них тоже вопросов не возникло бы.
                            +2
                            Совершенно верно: когда нет EXIF, есть строчка «автором являюсь я», изображение не гуглится в других источниках, и оно не содержит чужие работы (например логотипы) — то докопаться не к чему.
                          +1

                          Она не предлагает доказывать, она предлагает не загружать снимки с противоречивой информацией о праве.

                          +2
                          Изображение, загруженное в 2014 году пользователем Anisimov Vasiliy выставляется тем же администратором на удаление, Причина для запроса на удаление: As per metadata, scanned by Stanislav Zbarassky, so unlikely to be own work, copyright status is unclear.

                          Это тупо неправда. Указана причина: «As per metadata, created by Yuliya Anisimova, the permission is missing.»
                            +1
                            Это тупо описка, не сработал cut'n'paste :-(
                            Спасибо за замечание, поправил.
                            +2
                            Мораль: если вы загружаете изображение в Википедию, будьте готовы к тому, что любой дятел может его удалить по любой причине или без нее.


                            Несколько лет назад сверху было дано ЦУ — обязать специалистов писать статьи в википедию по их специальности.
                            Все спецы дружно отказались наотрез — именно по той причине, что указана в цитате (речь не о фото). Написать было бы нетрудно — но смысл?
                              0
                              Смысл такой работы — в том, чтобы создавать свободный контент, который можно использовать без ограничений.
                                0
                                Смысл такой работы — в том, чтобы создавать свободный контент, который можно использовать без ограничений.


                                Ну вот создал человек такой контент.
                                И, затем, по праву автора, использовал его еще где-то.
                                И тут ему: «Это вы из вики скопипастили!» (реал, причем многократный)
                                  0
                                  Если контент со ссылками на АИ, то не имеет значения, откуда он скопипащен — любой может проверить его достоверность.
                                  А если без, то и в вики ему не место.
                                    +1
                                    Если контент со ссылками на АИ, то не имеет значения, откуда он скопипащен — любой может проверить его достоверность.


                                    Есть у меня слабость — проверять в вики ссылки на АИ.
                                    Забавно, что в русской вики (не в переводных статьях) по сугубо прикидочным оценкам, примерно половина ссылок ведут на источники, авторитетность которых, мягко говоря, сомнительна (типа публикаций в непрофильных СМИ или на источники, имеющие весьма косвенное отношение к фактам, в этой статье изложенным).
                                    Поэтому, кстати, и ссылки на википедию в студенческих работах не принимаются.
                                      0
                                      В научных работах (в том числе студенческих) никогда не принимались ссылки на словари и энциклопедии. Просто потому, что словари и энциклопедии — слишком общая информация, бесполезная для научных работ.
                                        +2
                                        В научных работах (в том числе студенческих) никогда не принимались ссылки на словари и энциклопедии.

                                        Это, скажем так, странное утверждение. У меня и в курсовых, и в дипломной работе ссылки на словари принимались. Или это не считается за научную работу?

                                    0
                                    Очень разумный упрёк, потому что просто так копипастить из Википедии нельзя. Закон позволяет копировать из Википедии только по условиям лицензии, по которой работает Википедия.

                                    Должно быть, упомянутый вами автор нарушил эти условия?
                                      +1
                                      Очень разумный упрёк, потому что просто так копипастить из Википедии нельзя


                                      Тексты были созданы авторами.
                                      Затем их тезисно изложили в статьях вики.
                                      После чего другие люди, прочитав эти статьи в вики, стали упрекать авторов в заимствовании идей и смысла текста из википедии.

                                      Кто в данном случае что нарушил?
                                        0
                                        «Другие люди» нарушили здравый смысл, не сравнив дату публикации научных статей этих авторов и дату публикации статей в Википедии.

                                        Сравнив одно с другим, «другие люди» могли увидеть, что сами авторы от своего имени поместили свои тексты в Википедии.

                                        Может быть, эти «другие люди» хотели не разобраться, а поругать? Тогда другое дело.
                                          0
                                          «Другие люди» нарушили здравый смысл, не сравнив дату публикации научных статей


                                          Другим людям пофиг на такие тонкости. Им интересно посплетничать, перемыть косточки.

                                          Клевета вначале сладко
                                          ветерочком чуть-чуть порхает.
                                          И, как будто бы украдкой,
                                          слух людской едва ласкает,
                                          и журчит, как ручеёк, как ручеёк,
                                          тихо, тайно, полегоньку
                                          проползает всюду, всюду,
                                          незаметно, потихоньку,
                                          постепенно всему люду
                                          ум и сердце наполняет, наполняет
                                          и из уст в уста летает,
                                          как затверженный урок.

                              Only users with full accounts can post comments. Log in, please.