Pull to refresh

Участники хакатона разработали алгоритм для поиска информации в газетах военных лет

Algorithms *Hackathon
image

Российская государственная библиотека и «Школа 21» провели онлайн-хакатон по прикладному применению средств алгоритмической обработки текстов на русском языке. Его участники создали алгоритм поиска необходимых данных в текстах подшивок газеты «Красная звезда» за 1941-1945 гг.
Total votes 5: ↑4 and ↓1 +3
Views 1.4K
Comments 1

Казахстан против Носика

IT-companies
Борьбу с Антоном Носиком, Мамутом и «СУПом», кажется, решил поддержать братский Казахстан.

Интерфакс:

«Президент Казахстана Нурсултан Назарбаев предлагает специалистам вновь вернуться к обсуждению вопроса о возможности перевода казахского алфавита на латиницу.»


Котоёб жжот.
Total votes 12: ↑6 and ↓6 0
Views 524
Comments 1

Google Docs стал лучше понимать русский

IT-companies
Невозможность использования в Google Docs кириллических тегов и поиска по словам на кириллице — старая проблема, существовавшая ещё со времён Writely. Однако она явно решена: сегодня я решил в очередной раз проверить, исправились ли разработчики, и оказалось, что да :) Теперь документы можно помечать кириллическими тегами, а поиск на кириллице доступен в полном формате — как по названиям документов, так и по их содержанию.
Total votes 17: ↑15 and ↓2 +13
Views 328
Comments 8

Киберсквоттеров развели на кириллические домены

Lumber room
Ажиотаж вокруг кириллических доменов, раздутый отечественными регистраторами в начале этого года, похоже, оказался обыкновенным «кидаловом». Опубликованные в январе правила регистрации кириллических имен в национальном домене RU, безусловно, не стоило воспринимать как окончательный вариант. Однако на пункт о графически похожих доменах пользователи на всякий случай ответили новыми регистрациями, дабы застолбить себе прочное место, как только будет запущена кириллица. Хотели схитрить — да только регистраторы оказались проворнее.

В декабре прошлого года TelNews писал о том, что регистрация русскоязычных доменов, вполне возможно, начнется уже в начале 2007 года. С нелатинскими доменными именами традиционно связано немало сложностей и вопросов, в частности, серьезные опасения Координационным центром домена RU связывались с графически похожими доменами. Многие русские слова можно написать латинскими буквами и наоборот. Такие домены, как МОСКВА.RU создают угрозу фишинга — возможность появления фальшивых двойников уже существующих сайтов, либо почтовых ящиков. Это было очевидно и администрации национального домена, поэтому в Правила был внесен знаменитый пункт 4.4.

Суть его заключается в том, что администратором графически похожих доменов — латинского и русскоязычного — не могут быть разные лица. Соответственно, владелец правильной комбинации, составленной из букв латинского алфавита и зарегистрированной в качестве доменного имени, сможет в дальнейшем легко претендовать и на кириллический домен. Регистрация традиционных доменов в зоне RU была и остается реальностью, русскоязычные же домены — лишь проект с не слишком ясными перспективами. Тем не менее, «хитрый» пункт, о котором раструбили по всему Рунету, взяли на заметку дальновидные пользователи. До официального запуска кириллицы регистрация графически похожих доменов пошла в гору.

Тогда же Сергей Шариков, возглавляющий «Регтайм», назвал пункт 4.4 воротами с надписью «Добро пожаловать!», адресованной киберсквоттерам. Когда же большинство интересных «по схожести» доменных имен были зарегистрированы, участники рынка вдруг вспомнили о том, что этот пункт, оказывается, ограничивает их права. На прошлой неделе в Координационном центре домена RU состоялось заседание Комитета регистраторов. Светлана Прозорова, представляющая компанию «Регистратор Доменов», выступила с протестом против текущей версии Правил, касающихся регистрации кириллических имен в национальном домене. В итоге все регистраторы, за исключением RU-CENTER, единодушно высказались против запуска русскоязычных доменов. Серьезную поддержку нашла идея внедрения кириллицы в отдельном IDN TLD.РФ, в рамках тесного сотрудничества с ICANN.

«Если TLD русскоязычный, например.РФ., проблема фишинга не возникает вообще. Поэтому регистраторами и был принят этот вариант для национального домена на кириллице. TLD на национальных языках уже давно работают в Китае при поддержке правительства. В ближайшее время ожидается запуск официальной регистрации в IDN TLD в Корее и Израиле», — пояснил Сергей Шариков странное решение Комитета.

«Ошибкой (а возможно, и продуманной акцией) стало опубликование Правил задолго до вступления их в силу. В декабре 2006 года, сразу после опубликования новых Правил, наблюдался всплеск регистрации графически похожих доменов. Цель таких регистраций одна: пока русскоязычные домены еще не доступны, можно зарегистрировать имя, написанное латиницей, чтобы затем претендовать на «графически похожий» кириллический вариант. Сегодня, по нашим данным, зарегистрировано свыше 2 тысяч графически похожих доменов, причем большая часть зарегистрирована за декабрь 2006 — февраль 2007», — сообщил Андрей Воробьев, возглавляющий департамент по связям с общественностью компании RU-CENTER.

По его словам, заблаговременная публикация Правил привела к тому, что к моменту запуска кириллицы в зоне RU были бы заняты все привлекательные графически похожие имена. Понимая это, регистраторы просто отменили старт русскоязычных имен в национальном домене, выдумав зону.РФ. Андрей Воробьев полагает, что ждать ее придется еще лет пять.

telnews.ru
Total votes 8: ↑2 and ↓6 -4
Views 270
Comments 0

Неанглийских доменов не будет ещё два года

Domain names administrating *
Возможно, появления кириллической доменной зоны.РУ или.РФ и, соответственно, кириллических доменов в ней придётся ждать ещё долго. Раньше предполагалось, что ICANN сумеет утрясти все формальности к концу 2007 года, а теперь заговорили, что срок может растянутся до двух лет.

В ноябре 2007 года начнётся широкомасштабное «живое» тестирование доменов с неанглийскими символами. Эти тесты нужны, чтобы убедиться в нормальной работе браузеров, почтовых программ и других приложений. «Мы уже проводили некоторые тесты в лаборатории, — сказал Винт Серф на встрече ICANN в пятницу. — Мы уверены, что ни одно звено инфраструктуры не должно создать проблем, но никогда не знаешь наверняка, пока не запустишь всё по-настоящему».

Настоящие проблемы, однако, имеют вовсе не технический характер.
Читать дальше →
Total votes 9: ↑9 and ↓0 +9
Views 379
Comments 9

Кириллические УРЛы на BlogSpot.com

Lumber room
Поводом для написания статьи послужил этот топик, после его прочтения у меня возникло желание поэкспериментировать – я зарегистрировал себе аккаунт на Хабре с кириллицей в имени, однако, мое любопытство не угасло, более того, у меня возникла идея выбрать какой-нибудь популярный блоговый ресурс и проверить его на возможность регистрации кириллических имен. Первое что пришло в голову – BlogSpot.com, на котором я когда-то пытался завести свой блог, однако, руки до его ведения у меня не дошли.
подробный рассказ о том, как регистрировать русские урлы
Total votes 6: ↑6 and ↓0 +6
Views 279
Comments 2

Top4Top — первый тестовый пост

Lumber room
Зарегистрировался за пару секунд. Минимум ввода личной информации и готово.
Большой трабл с кирилицей на сайте под Linux (Ubuntu 7.10). По крайней мере в Firefox — абракадабра при наборе, но при Paste из буфера — все Ок.
Успешно запостил в рейтинг Сайт Дня — Habrahabr.ru.
http://www.top4top.ru/swf/Main.html#/rating/post/1624
Rating 0
Views 405
Comments 0

Хотел и бабы

Lumber room
Увидел на днях новость о том, что Гугль теперь умеет переводить кириллицу в латиницу, и, недолго думая, ввел в поиске «хотел» и «бабы» ;)
Результат меня не разочаровал:
Читать дальше →
Total votes 26: ↑20 and ↓6 +14
Views 197
Comments 13

Кое-что об использовании латиницы в кириллических текстах

Lumber room
Обрамлять ли имя собственное, написанное латинскими буквами, кавычками в русском тексте? Как быть со смешанными названиями, у которых часть написана на латинице, а часть — на кириллице?

Автор «Оформления цитат на сайтах», уважаемый heath, считает, что нужно все имена собственные выделять одинаково.

Правила с ним не согласны:
Читать дальше →
Total votes 12: ↑11 and ↓1 +10
Views 807
Comments 5

Регистрация кириллических доменов в зоне SU

Domain names administrating *
Цитирую письмо, которое только что пришло мне от одного из регистраторов:

С 28 апреля 2008 года, в соответствии с решением Наблюдательного Совета
Фонда Развития Интернет, вступают в силу изменения в регламентирующем
документе «Положение о регистрации доменных имен в домене SU», а именно:

снимаются ограничения на регистрацию доменов с префиксом xn--, что
позволит начать регистрацию мультиязычных доменов в этой зоне (вида «имя.su»).

Стоимость регистрации мультиязычных доменов будет соответствовать Вашей
текущей стоимости регистрации доменов SU.

Регистрации подлежат только доменные имена с префиксом «XN--»,
которые при преобразовании с помощью алгоритма PUNYCODE имеют
представление доменного имени, состоящее из букв, входящих только
в одну из используемых таблиц стандарта UNICODE
и/или цифр «0»,«1»,«2»,«3»,«4»,«5»,«6»,«7»,«8»,«9» и/или знаков "-" (дефис).


Если я правильно понимаю, это плохо. Плохо ведь?
Total votes 10: ↑6 and ↓4 +2
Views 948
Comments 10

Ссылки на Хабрахабре

Habr
Посмотрел я на частоту появления в комментариях фраз типа «у Вас русские буквы закрались в ссылочку» или «уберите кириллицу из линка» и подумал, что не может быть у такого количества людей ошибок такого рода. Особенно если это обычно Ctrl + C -> Ctrl + V из адрессной строки браузера.

Соответственно, напрашивается вывод, что алгоритм работы Хабра сам делает подстановки вместо английских букв на аналогичные кирилличные.

Ну и, естесственно, спрашивается зачем?

Есть предположение что из-за поисковой жадности. К примеру, при подсчете Гугловского PageRank страницы учитывается PageRank страниц, которые ссылаются на нее, соответственно Хабр имея высокий PageRank не хочет ним ни с кем делиться, поэтому заменяет некоторые буквы на кирилличные, чтобы ссылки вели в несуществующие места.

P.S. Можно еще дополнить это предположение популярным об НЛО. :)
Total votes 56: ↑37 and ↓19 +18
Views 578
Comments 39

ICANN и домен.РФ

Domain names administrating *
Вот такое письмо пришло от моего регистратора r01.ru:

В настоящий момент в Интернет-корпорации ICANN разрабатывается ускоренная процедура создания ограниченного числа доменов верхнего уровня с использованием символов национальных алфавитов (IDN) для государств, где национальное интернет-сообщество имеет высокую потребность в их использовании.

Итоговый документ, определяющий ускоренную процедуру делегирования, будет представлен на утверждение на конференции ICANN в Париже в конце июня этого года, после чего станет возможным подать заявку на делегирование домена верхнего уровня с символами кириллицы в интересах российских интернет-пользователей.

Для России уже в самом ближайшем времени именем национального кириллического домена может стать.РФ.

Делегирование кириллического доменного имени верхнего уровня по ускоренной процедуре станет возможным только в случае поддержки российского сообщества пользователей сети Интернет. Национальному домену.РФ необходим именно Ваш голос! В период с 30 мая по 8 июня Вы можете выразить свое мнение через онлайн опрос, организованный на нашем Интернет-ресурсе. Результаты голосования будут опубликованы на нашем сайте.


Если нужно было бы точно выбрать одно из двух:.РУ или.РФ, что выбрали бы вы?
Total votes 29: ↑20 and ↓9 +11
Views 682
Comments 58

«Рус, здавайс!»

Lumber room
Кириллические домены это здорово, но всему должен быть разумный предел — как государство допустило регистрацию доменов «.ру»? Ребята, есть же «.py» — Парагвай (http://www.presidencia.gov.py/) —, на что они надеялись? Как такое произошло, что куча людей поназарегистрировала ещё неизвестно будущий ли вообще в употреблении «.ру»? И ещё хватило нагласти заявлять о зоне «.рус»… ладно там киберсквоттеры, их не жалко, но ведь и обычные люди могут попасться, будучи абсолютно уверенными, что покупая домен, отдавая реальные деньги, они получают именно гарантию обладания им, а не шанс, что когда-то это может стать реальностью.

Читать дальше →
Total votes 18: ↑2 and ↓16 -14
Views 244
Comments 13

Как вы относитесь к использованию кириллицы в доменном имени?

Domain names administrating *
Предлагаю обсудить использование кириллицы в доменном имени. Как вы к этому относитесь?

До сих пор существует некоторые проблемы с использование кириллицы. Известно, что даже русифицированный Firefox очень не любит использование кириллицы в строке браузера и всегда пытается перевести кириллические символы либо в латиницу, либо в какие то не меренного размера коды.

Например, такие.

Две свежие новости на тему кириллицы в доменном имени:
1. Евросоюз разрешил регистрировать сайты с русскими адресами на европейском домене .eu (26.06.2009):
Евросоюз разрешил регистрировать интернет-сайты с русскими адресами на общеевропейском домене .eu
В сообщении официального представителя Еврокомиссии Мартина Зелмайера отмечается, что со следующей недели для регистрации сайтов на домене .eu можно будет использовать кириллицу и греческий алфавит. Также на европейском домене создана техническая поддержка для использования в названиях сайтов не входящих в базовый латинский алфавит букв европейских языков. Раньше для регистрации сайтов на домене .eu можно было использовать только буквы латинского алфавита и цифры от 0 до 9.
Читать дальше →
Total votes 87: ↑63 and ↓24 +39
Views 4K
Comments 254

opechatka.ru

Lumber room
Только что захотел почитать новостей на сайте 3dnews.ru.
Забыв поменять раскладку с кириллицы на латиницу, и написав в адресной строке «3втуцыюкг», был приятно удивлен выданным результатом:
поехали
Total votes 27: ↑9 and ↓18 -9
Views 278
Comments 16

Копирование ссылок с кириллицей в Firefox

Lumber room
Наверное, каждый пользователь Firefox сталкивался с проблемой копирования и вставки ссылок, содержащих кириллицу (или, например, иероглифы).

Предположим, я хочу дать ссылку на заглавную страницу Википедии; если я выделю адрес и скопирую его в буфер обмена, то при вставке он примет следующий вид: ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0

О том, как сохранить читабельность ссылки, я расскажу далее.
Читать дальше →
Total votes 15: ↑11 and ↓4 +7
Views 4.1K
Comments 7

Началась регистрация доменов в зоне .РФ

Domain names administrating *
Сегодня официально открылась регистрация доменных имен в кириллической зоне.РФ. На первом этапе будут рассматривать заявки только владельцев товарных знаков. Регистрация для всех желающих, согласно календарю событий зоны.РФ, начнётся в июле 2010 года.

«Для удобства населения» регистратор доменных имен Reg.ru открыл горячую линию по домену.РФ, бесплатную на всей территории России.

Телефон горячей линии: 8-800-77-REGRU или 8-800-777-3478.

Что бы у них спросить?
Total votes 18: ↑9 and ↓9 0
Views 383
Comments 15

Кириллица в именах переменных и функций

PHP *
Здравствуй, сообщество.

Вероятно, то, что я сейчас напишу, кому-то было известно, но буквально недавно с этим столкнулись впервые.

Я сейчас тут код приложу, в принципе, там всё понятно. У меня и моих бывших коллег вчера был культурный шок. Сегодня немного набросал тестового кода, для проверки.
Работает в кодировках cp1251 и в UTF, проверяли на версиях php 4.4.7, 5.2.9, 5.2.10–2ubuntu6.4

Вообщем, вы посмотрите на это и выскажите своё мнение.
Что ж там дальше?
Total votes 125: ↑79 and ↓46 +33
Views 12K
Comments 101

Набор доменных имён в другой раскладке

Self Promo
На фоне всяких рассуждений о национальных доменах, которые делают для удобства запоминания и ввода названия, вспомнился метод создания паролей, когда смотришь на русскую раскладку, но вводишь латинскими буквами. Можно ли зарегистрировать доменное имя на том же принципе? Идея кажется ещё интереснее, если вспомнить, что точке соответствует русская буква «ю». Беглый перебор популярных доменов верхнего уровня дал один перспективный вариант — .kz, который в русской раскладке выглядит как «юля». Скажем, мог бы существовать кулинарный сайт «Кастрюля» с доменным именем rfcnh.kz. Довольно страшно выглядит, но легко запоминается. Логотип сайта может подсказывать способ ввода:

Да, я знаю, что кнопка с «Ю» выглядит не так, но в логотипе такой вариант нагляднее.

Сомневаюсь в перспективности идеи, но вдруг кому пригодится :-)
Total votes 177: ↑135.5 and ↓41.5 +94
Views 737
Comments 85

Придумать замену @: тендер на 10 млн руб

Hosting
Как известно, международные стандарты по интернационализации почтовых адресов пока существуют в экспериментальном виде и будут приняты через несколько лет. Поэтому сейчас домены в зоне .РФ действуют, но на них можно завести лишь ящики с латинскими буквами, например, podderzhka@президент.рф. Это явно мозолит глаза российским чиновникам. Они не собираются дожидаться принятия международных стандартов, а организовали свой тендер прямо сейчас.

Министерство связи и массовых коммуникаций 31 мая 2010 года объявило тендер «Комплексное исследование вопросов обеспечения граждан Российской Федерации и органов государственной власти электронной почтовой связью в домене .РФ для организации государственной системы общения между государственными органами и гражданами Российской Федерации в рамках развития комплекса электронных государственных услуг». Цена контракта — 10 млн руб. из государственного бюджета.

Проще говоря, в рамках госзаказа нужно просто придумать систему, которая позволила бы реализовать почтовую инфраструктуру на кириллице. А также решить ещё одну проблему — чем заменить символ @.

Победитель открытого конкурса станет известен 15 июля 2010 года, после этого у него будет 110 дней на придумывание системы.
Total votes 120: ↑97 and ↓23 +74
Views 857
Comments 285