Как стать автором
Обновить

Комментарии 113

Ребята из Firefox медленно проверяют расширения. Сейчас Pure URL находится на 93 месте в очереди. И это при том, что очередь занята несколько дней назад. Поэтому на addons.mozilla.org кнопка установки пока что оранжевая. К моменту начала валидации думаю выпустить новую версию с поддержкой SeaMonkey и с опциональным изменением ссылок на просматриваемых страницах, чтобы при копировании ссылки из контекстного меню мы получали также чистый URL. Сейчас же ссылки автоматически подменяются только при переходе по ним, в момент отсылки запроса.

Не могу не добавить тематическое видео к картинке в топике.
Новая версия для Firefox и SeaMonkey уже есть на addons.mozilla.org. Устанавливать нужно вручную. Автообновления судя по всему должны заработать после валидации. Почему-то уже на 96 месте в очереди из 150 :(

Появилась локализация настроек на русский. Также появилась возможность исправлять ссылки сразу на страницах, чтобы при копировании через контекстное пользователь получал корректную ссылку. Здесь есть два режима: статический будет обрабатывать статические ссылки, которые появились сразу после загрузки страницы. Динамический будет отслеживать изменения на странице (через MutationObserver) и исправлять также новые ссылки. При желании эту функцию можно вообще отключить.
Решили поломать статистику владельцам сайтов в промышленных масштабах?)
К сожалению, мне так часто присылали испорченные ссылки, что в итоге я «психанул».
На самом деле правильно сделали, аналитика (тем более сторонняя) не должна влиять на работу сайта подобным образом, это варварство с их стороны.
Когда я вижу такие ссылки (или автоматические редиректы, в которые превращается любая ссылка в выдаче гугла, яндекса, или дакдакго, если им не «бить по рукам» скриптами гризманки), чья-то там статистика — это последнее, о чем я думаю. Неужели нельзя собираться ее как-то незаметно, условным «яваскриптом» каким-нибудь, но не уродовать урлы? Хочется взять и уе Очень уж раздражает.
Для борьбы с редиректами в выдаче поисковиков есть хорошее расширение для Firefox.
Да, конечно, они (расширения, скрипты для гризманки) и не могут не существовать, ибо долго такое надругательство над людьми и здравым смыслом терпеть невозможно. Мне вот интересно, зачем они (гугл и др.) делают это настолько топорно и «в лоб»? Не удивлюсь, кстати, если в один прекрасный момент появится приличный поисковик, не трекающий пользователей и не декорирующий ссылки в выдаче, и сразу оттяпает приличную долю аудитории. ;-)
уже есть duckduckgo.com, пользуйтесь на здоровье
Дык, пользуемся; я его еще в первом комментарии упомянул. Даже сделал его поисковиком по умолчанию в лисице. Правда, пока все еще приходится порой искать гуглом (чаще, чем хотелось бы).
Есть еще startpage.com
НЛО прилетело и опубликовало эту надпись здесь
Присоединяюсь к вопросу
И для Opera.
НЛО прилетело и опубликовало эту надпись здесь
прошу прощения, но гуглится за пару запросов.

Единственно, что немалое количество таких болкировщиков иногда пропускает некоторые редиректы, но я заодно занес в адблок http*://*google.*/url*, и на такие ссылки просто не заходится без рефреша, и с рефрешем ссылки обычно становятся безредиректными.
Уродование ссылок Гуглом вообще-то не всегда во вред. Отображение информации о посещённых сайтах в выдаче бывает полезным.
Ээ… а причем тут уродование? Любая посещенная ранее ссылка обычно (по умолчанию) отображается «фиолетовым».
Тут даже наоборот — если был по ссылке БЕЗ Гугла, то в поисковой выдаче она не будет фиолетовой.
У дакдакго редиректы отключаются в настройках. И там же написано зачем оно нужно:
Redirect — If On it prevents sharing of your search with sites you click on.
О, спасибо. В настройки-то его я как-то не догадался заглянуть.
Может это заказ от Яндекс.Метрики?
Было бы круто. При поддержке Яндекса можно было бы действительно развернуться до промышленных масштабов :)
У Яндекс.Метрики нету ведь таких же некрасивых парметров, да?
И метрика, и аналитика и куча других как рекламных, так и аналитических систем используют стандартизованный набор utm-меток. Грубо говоря, используется для более детального анализа источника трафика. Посетителю от наличия или отсутствия этих параметров ни холодно, ни горячо.
Это даже хорошо, что набор стандартизирован. Не придётся заносить в блэклист слишком большое количество параметров.
Ну да, параметры-то эти и Метрика и Аналитика понимают. Просто Метрика умеет детализовывать в отчетах свою рекламу (Яндекс.Директ), и к тому же, отделять другие рекламные системы от поискового трафика даже если они utm-тегами не помечены. А вот «наше все» Google отчего-то не может различить никакой тип рекламы без utm-меток кроме своего AdWords.

А так-то да, многие рекламные системы предлагают добавить эти и другие параметры к ссылкам сами.
Странно почему владельцы ресурсов не делают редирект на нормальную страницу.
Один заход будет считаться как 2 — реферальный и внутренний
Не, можно же сразу при наличии параметров делать переадресацию на обычную страницу, а там уже через JS отправлять данные в аналитикс.
Это не делают по 3 причинам:
— загрузка adv-js может быть заблокирована
— пользователь может закрыть страницу раньше чем загрузиться adv-js
— редиректы ломают history
не, я имел ввиду типа:
header(«Location: /url»);
Урлы с utm_* в аналитиксе обычно используются для отслеживания эффективности различных маркетинговых или коммерческих активностей. Так, если будет серверный редирект, Вы не сможете четко понимать, откуда пришли люди — рассылка партнера, ваша рассылка или прямой заход, партнерское рич-медиа размещение или переход с премиум-баннера, и т.д.
Кто мешает при заходе с параметрами utm_* записать их в сессию, редиректнуть на страницу без этих параметров, а в самой странице уже через сам код GA передать параметры из сессии в аналитикс?
Cookie могут быть заблокированы + есть еще лимиты на кроссдомены
Ну вот теперь и эти мусорные параметры могут быть заблокированы :)
НЛО прилетело и опубликовало эту надпись здесь
А в чем разница какая статистика? Это же параметры для отслеживания рекламы (каким угодно инструментом отслеживания).
Что-то не встречал таких url'ов. Может это эффект от donottrackme или чего-то подобного?
По-моему, автору комментария нечем заняться. В этом комментарии нету практического смысла.
Как только автору понадобится отслеживать конверсию с переходов с помощью GA, он сам снесет свое расширение.
Популярность расширения ничтожна. Соответственно, влияние на аналитику — в рамках статистической погрешности.

Например, у меня вообще забанен скрипт гугло-аналитики. Однако это нисколько не мешает мне ей пользоваться.
Лучше бы изобрели способ заставить людей копировать нормальные ссылки из Хрома. А то постоянно вижу мусор вроде ru.wikipedia.org/wiki/%D0%A5%D0%B0%D0%B1%D1%80%D0%B0%D1%85%D0%B0%D0%B1%D1%80.

Как я ненавижу за такие ссылки ru.wikipedia.org/wiki/%D0%93%D1%83%D0%B3%D0%BB.

ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D1%80%D1%84%D0%BE%D0%BA%D1%81 и то нормальные ссылки выдаёт.
Поддерживаю. Куда как большая проблема чем какие-то utm
Я бы начал с русскоязычных доменов.

Раньше поставл в адресную строку курсор, написал «рабрюкг» — сразу понятно, что ошибка, можно было хоть расширение браузера вешать на обработку (и переходить на habr.ru). Сегодня а) это белиберда может (ой!) оказаться полезным адресом и б) браузеры порываются по ней еще и искать в гугле/яндексе. Кто-то всерьез эти.рф и прочее использует, чтобы без них не прожить было? Я, понятно, не про самих регистраторов )

Крик души, чес-слово! Адресная строка — для адреса (я про FF, напр.), не нужно из нее искать, нужно юзера, наоборот, поправлять от написания в ней не-url-а. А искать нужно из поискового поля, оно логичнее…
Не знаю, почему «рабрюкг», но при поиске «рфикюкг» (habr.ru в русской раскладке) в Google с опцией «gfns=1» (http://www.google.ru/search?ie=UTF-8&oe=UTF-8&sourceid=navclient&gfns=1&q=рфикюкг) сразу открывается хабрахабр. Это не «Мне повезет», а чуть более интеллектуальный режим поиска: открывается первая ссылка, только если она «достаточно релевантна» запросу. Поменяйте поисковый механизм в браузере на предложенный, и забудете про строку поиска
Нет, логичнее — когда пользователь может в одном и том же поле написать что угодно, и получить то, что хочет.
Следующий шаг — когда пользователь сможет сказать вслух, что хочет, и надёт это.
Следущий — подумать, и получить результат.

Если вы часто набираете не той раскладкой — это ваша личная невнимательность. Усложнение интерфейса и разделение омнибара на адресную и поискувую строки — шаг назад, и даже более того — это вам никак не поможет. Будете набирать неправильной раскладкой в два поля.

А для вас уже есть ПунтоСвитчер, да и сам Гугл последнее время стал прекрасно понимать англоязычные запросы на кирилице, будь то хоть слова, хоть URL, хоть текст песни.

Но как алгоритм должен понять, что приведённый вами в пример «рабрюкг» — это «habr.ru», я не совсем понимаю.
Скайп, например, не хочет отправлять в браузер URL с кирилицей. Тоесть ваши варианты он нормально отработает, а вот ru.wikipedia.org/wiki/Гугл он не отработает. По крайней мере было такое много версий назад.
Кстати, Firefox дает такие адресса только если в конфиге поковыряться, иначе не хочет :(
Видимо, такое было очень много версий назад.
Вот в свежем скайпе проблема.
Если скопировать русскоязычный домен с русскими адресами, то он превращется в кошмар вида
xn--ertsds.xn--sdf/%D3%D3%D0D%D
и так далее, скайп такое не понимает и не подсвечивает как ссылку даже не смотря на http:// в начале.
Вообще очень большая гпупость адреса, которые показываются нормально, копировать в таком уродском виде — только людей пугать.
Сейчас в скайпе всё нормально отправляется
В версиях 5.* точно была подобная гадость. Много раз такие ссылки вводили в ступор. В 6-й, вроде, пофиксили.
Опера 12 тоже нормальные.

Опера на хромиуме — увы.
Я думаю, pepelsbey это прочитает, сообщит кому нужно, и это будет исправлено в новой Опере :)
Ну да, ну да. А еще сделают нормальные мышиные жесты, выделение текста и вернут боковую панель, RSS и меню по F12.
rss не будет как я понял. opera mail
Ничего перечисленного не будет, это был сарказм. Увы.
Я в таких случаях использую декодер: meyerweb.com/eric/tools/dencoder
А вот меня ссылки с кириллицей бесят, а сам я всегда даю ссылки в urlencode, потому что иначе приходится бороться с пробелами и прочим мусором в ссылках, который автоматизированно распарсить в тексте невозможно.
Так пробелы должны быть закодированы. Мы должны все символы с кодом ниже 0x7F кодировать так, как это положено по стандарту. А вот все остальные символы можно смело оставлять в декодированном виде — все браузера это отлично понимают и воспринимают написанное как UTF-8, и многие сайты тоже не огорчаются от таких ссылок. А те, что огорчаются — следует исправить :) Хотя да, это не по стандарту. Думаю, здесь как раз повод обновить стандарт до состояния, которое поддерживается браузерами, как и в случае с HTML5.
Меньше статистических данных у рекламодателей → менее точный анализ эффективности интернет-рекламы → меньшая заинтересованность вкладывать деньги в интернет-рекламу → медленнее рост всей интернет-индустрии → меньше денег в кармане среднего разработчика.

Понятно, что одно такое расширение — капля в море. Тем не менее, если абстрагироваться от личных капризов эгоистичного человека, такие расширения вредят всем. То же самое касается всех расширений, блокирующих Google Analytics и т.д.
Начните с себя, отключите AdBlock.
Никогда не включал.
Пусть научатся обращаться с этими данными, потом подумаем, давать ли им их.

А пока adBlock, disconnect и никаких сторонних печенек.
ознакомился, добавил к обязательным плагинам disconnect, спасибо за подсказку.
На каком основании кто-то может считать себя человеком, у которого есть моральное право судить, умеют ли рекламодатели трактовать эти данные?
Продажа данных сторонним лицам, утечки данных, незаконный сбор и хранение и тд и тп — известные истории.

Я имею полное право отключать все, что я хочу. Меня вообще-то не спрашивают, разрешаю ли я третьей стороне следить за каждым моим кликом, собирать данные о моем компьютере и местоположении. Вот и я не буду спрашивать, можно ли мне что-то отключить.
НЛО прилетело и опубликовало эту надпись здесь
Я думаю, что при желании можно придумать менее варварскиие способы для сбора необходимой статистики.
В крайнем случае можно было ведь обойтись одним параметром с коротким идентификатором источника ссылки, а соответствие id со всей остальной информацией (рекламная кампания и т.д.) уже делать в админке аналитики. Но то что творится на некоторых сайтах сейчас — это просто ужас. Пример с картинки — вполне себе реальная ссылка, я такие по скайпу уже больше года периодически получаю.
Следуя подобной логике, можно оправдать, например, брутфорс паролей к чужим аккаунтам — «при желании можно было придумать стойкий пароль».

P.S. Сам сторонник единой метки-идентификатора, но для подавляющего большинства сторонних аналитических решений этого недостаточно.
По-моему удаление мусора из URL и брутфорс — это «две большие разницы».
Большинство сайтов используют якобы ЧПУ. Но когда к ним прибавляются вот такие get-параметры — это варварство со стороны разработчиков, потому что реальному пользователю это не нужно. Ссылку копируют и ею обмениваются. Эти токены должны действовать один раз, а получается если такую ссылку скинуть в чат с 10 пользователями, по ней пройдут 10 раз, опять таки статистика на смарку
А разве такие плагины как disconnect, которые блокируют загрузку скриптов аналитических сервисов, не решают эту проблему?
Возможно, я что-то пропустил. Это расширение удаляет мусор из URL, или всё-таки просто блокирует загрузку скриптов аналитических сервисов?
Интересует YouTube. Как обстоят дела с удалением feature=player_embedded, feature=youtu.be и прочего подобного?
Присутствие таких значений в URL портит статистику YouTube, потому что в таком виде ссылки копируются и открываются другими людьми. Или я не прав насчёт статистики? И зачем такое нужно прописывать в URL?
Поскольку это характерно только для youtube.com, я не стал добавлять этот параметр в глобальный список. В одном из следующих обновлений решим этот вопрос.
А можно ли к вашему плагину прикрутить функцию обрезки _начала_ строки до следующего адреса, то есть кликая в поисковых выдачах яндекса/гугла сразу попадать на сайт. То есть вместо треша при клике по ссылке www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CCwQFjAA&url=http%3A%2F%2Fwww.svp-team.com%2F&ei=b6AkUue-DpHLswaNmYDIBg&usg=AFQjCNFnRWjVGck1Bg5x0GzhwJZ4I0ir5g&bvm=bv.51495398,d.Yms&cad=rja получать сразу www.svp-team.com/?
НЛО прилетело и опубликовало эту надпись здесь
Плейлисты все же не являются данными для аналитики.
Здесь только параметр feature лишний, а параметр list отвечает за используемый плейлист.
feature=c4-overview — один из костылей YouTube. Можете ознакомиться с моим комментарием выше.
Логичнее было бы резать URL после загрузки страницы. Тогда бы и статистика работала и URL красивый был.

Либо сделать только копирование URL с обрезкой. В этом смысл я так понимаю. Ведь людям в принципе всё равно что там в адресной строке, важнее передавать чистую строку при копировании в тот же месенджер или вставке на сайт.
Расширение реализовано по принципу минимального вмешательства в работу браузера. Перехватывать и переделывать запросы проще всего. Да и в целом то, что запрос на сервер уходит уже без мусора я воспринимаю как преимущество. В логах веб-серверов тоже будут красивые адреса, это же так прекрасно :)
Странный мотив. Если ты хочешь у себя на сервере от этого избавиться, то плагин не поможет. Надо для сервера писать примочку. А так другие пользователи всё равно тебе сервер загадят теми урлами, которые они вбивают.
Смайлик. Там смайлик в конце :)
Те же мысли были, когда по первому же (любому) клику на ссылку в выдаче гугла она полностью преображалась… и не скопировать уже (если слишком длинная). Сперва временно отключал javascript, сейчас решаю эту проблему расширениями, но вопросы «почему? зачем так по-тупому?» остались.
Меня также интересует опция удаления якорей.
Например, на странице трекера хабра ссылки прописаны с якорем #first_unread.
На страницах *.livejournal.com в ссылках присутствуют якоря #comments и #cutid1, причём часто нет нормальной ссылки без якоря.
А есть ли полностью противоположное расширение?
То есть мне надо на конкретном сайте, чтобы автоматически добавлялись параметры… (Конкретно на livejournal.com чтобы добавлялся параметр style=my)
Да точно это и имелось ввиду…
блин… :/ весомый аргумент перейти на хром с фарфокса)
Такое расширение пишется за 20 минут на builder.addons.mozilla.org. У вас получится немножко модифицированный вот этот пример. Вам нужно будет работать с объектом channel.URI (channel.URI.path и т.д.). Проверяете хост, есть ли ваш параметр, если нет и хост ваш — просто дописываете параметр и всё.
ДА я знаю)
Просто я большой лентяй… меня максимум хватило на Gmonkey скрипт)))
Для Фаерфокса же сто лет как есть какое-то особое ЖЖ-расширение, которое среди прочего умеет и style=mine
Вообще бесят эти длиннющие ссылки с процентами когда в тексте урла русские буквы. В адресной строке выглядит нормально, а когда человек копирует оттуда и вставляет куда-нибудь, получается такое непотребство. Раньше хоть Опера этим не грешила, но уже давно и она. Надо отключать это вручную в about:config, но никто не отключает :-( И вот какая-нибудь ссылка на два слова русских превращается в полстраницы этого уродства… Парсеры — тоже лохи почти везде: если им скормить нормальную, не закодированную ссылку, то они часто обрезают её «на первом же шухере» (запятой какой-нибудь или типа того — в Википедийных урлах очень часто встречается).
Нормальная ссылка — закодированная.

И да, Вы хотите несовместных вещей. Или красивые буковки, или беспроблемный парсинг. Выбирайте.
Некоторые отдельные символы можно кодировать (как всю жизнь кодировали пробелы, например). Но нормальные алфавитные буквы (не важно какого языка, хоть того же арабского) в наш век глобализации и юникода кодировать в огромные нечитаемые конструкции — уродство, IMHO.
На самом деле обработка и убирание мусора из таких URL'ов, я считаю, должно быть заботой лишь самого сайта, так что это больше свидетельствует о недостаточной разработке. Попробуйте перейти по любой ссылке из твиттера Medium — вы увидите нормальное поведение сайта, при котором мусор с аналитикой уберётся без участия пользователей и без плагинов.
Говорят, такие же параметры кто-то добавляет и в хеш, т.е. #utm_source=blabla&utm_shit=blabla2 и т.п. Неплохо было бы вычищать и их.

А еще, видимо, не обойтись без настроек для сайтов. На то же Ютубе нужно удалять feature, в мозилловском каталоге расширений к ссылкам добавляется ?src= и вообще много чего такого напридумано.
Согласен, постараюсь как появится больше свободного времени добавить поддержку локальных правил для сайтов и настройки в Opera и Chrome.
Расширение отказывается дружить с HTTPS Everywhere. Последнее постоянно ругается на YouTube.
Какой браузер? Как ругается? Если Firefox, какие настройки установлены?
Chrome. Ругается как раз HTTPS Everywhere:
Текст ошибки
Расширение не может перенаправить сетевой запрос на https://www.change.org/ru/%D0%BF%D0%B5%D1%82%D0%B8%D1%86%D0%B8%D0%B8/%D0%B4%D0%B5%D0%BF%D0%B0%D1%80%D1%82%D0%B0%D0%BC%D0%B5%D0%BD%D1%82-%D0%BA%D1%83%D0%BB%D1%8C%D1%82%D1%83%D1%80%D1%8B-%D0%B2%D0%BE%D0%BB%D0%BE%D0%B3%D0%BE%D0%B4%D1%81%D0%BA%D0%BE%D0%B9-%D0%BE%D0%B1%D0%BB%D0%B0%D1%81%D1%82%D0%B8-%D0%BF%D1%80%D0%B8%D0%B7%D0%BD%D0%B0%D0%B9%D1%82%D0%B5-%D0%BF%D0%B0%D0%BC%D1%8F%D1%82%D0%BD%D0%B8%D0%BA%D0%BE%D0%BC-%D0%B4%D0%BE%D0%BC-%D0%B3%D0%B4%D0%B5-%D0%B2-%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B5-%D0%B6%D0%B8%D0%BB-%D0%B2%D0%B5%D0%BB%D0%B8%D0%BA%D0%B8%D0%B9-%D0%BA%D0%BD%D1%8F%D0%B7%D1%8C-%D0%BD%D0%B8%D0%BA%D0%BE%D0%BB%D0%B0%D0%B9-%D0%BC%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87?share_id=AUPvKkYaVN&utm_campaign=friend_inviter_chat&utm_medium=facebook&utm_source=share_petition&utm_term=permissions_dialog_false, поскольку другое расширение (Pure URL) перенаправило его на http://www.change.org/ru/%D0%BF%D0%B5%D1%82%D0%B8%D1%86%D0%B8%D0%B8/%D0%B4%D0%B5%D0%BF%D0%B0%D1%80%D1%82%D0%B0%D0%BC%D0%B5%D0%BD%D1%82-%D0%BA%D1%83%D0%BB%D1%8C%D1%82%D1%83%D1%80%D1%8B-%D0%B2%D0%BE%D0%BB%D0%BE%D0%B3%D0%BE%D0%B4%D1%81%D0%BA%D0%BE%D0%B9-%D0%BE%D0%B1%D0%BB%D0%B0%D1%81%D1%82%D0%B8-%D0%BF%D1%80%D0%B8%D0%B7%D0%BD%D0%B0%D0%B9%D1%82%D0%B5-%D0%BF%D0%B0%D0%BC%D1%8F%D1%82%D0%BD%D0%B8%D0%BA%D0%BE%D0%BC-%D0%B4%D0%BE%D0%BC-%D0%B3%D0%B4%D0%B5-%D0%B2-%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B5-%D0%B6%D0%B8%D0%BB-%D0%B2%D0%B5%D0%BB%D0%B8%D0%BA%D0%B8%D0%B9-%D0%BA%D0%BD%D1%8F%D0%B7%D1%8C-%D0%BD%D0%B8%D0%BA%D0%BE%D0%BB%D0%B0%D0%B9-%D0%BC%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87?share_id=AUPvKkYaVN.

Не критично, но когда браузер регулярно кидает предупреждения, работать не очень комфортно.
Странно вообще, что Chrome отдаёт расширению не исправленный HTTPS Everywhere адрес, а оригинальный, а потом рапортует об ошибке :(
Спасибо, работает прекрасно(пока пока :D ).
Новая версия! Проходит валидацию, можно поставить здесь.

Новые возможности:
— Мусорные параметры могут быть указаны для конкретных доменов
— Поддержка окон в приватном режиме
— При включённом динамическом отслеживании изменений на страницах также отслеживаются и изменения атрибутов href для ссылок
— Применение настроек с задержкой, когда пользователь редактирует их (оптимизация)

Добавлены новые мусорные поля в стандартный список:
— yclid (шпионский параметр для Яндекс.Метрика)
— feature (мусор на youtube.com)
— fb_action_ids, fb_action_types, fb_ref, fb_source, action_object_map, action_type_map, action_ref_map (шпионские параметры от facebook.com)
— ref, fref, hc_location (мусор на facebook.com)

Просьба протестировать кто может.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории