Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Участники хакатона разработали алгоритм для поиска информации в газетах военных лет

Алгоритмы *Хакатоны
image

Российская государственная библиотека и «Школа 21» провели онлайн-хакатон по прикладному применению средств алгоритмической обработки текстов на русском языке. Его участники создали алгоритм поиска необходимых данных в текстах подшивок газеты «Красная звезда» за 1941-1945 гг.
Всего голосов 5: ↑4 и ↓1 +3
Просмотры 1.4K
Комментарии 1

История славянских шипящих: почему мы пишем жи-ши через И?

Блог компании RUVDS.com Научно-популярное Изучение языков
tl;dr: потому что перед Ы не могли возникнуть ни Ж, ни Ш.

Орфография многих живых языков отражает давно исчезнувшие вещи: например, написание английского слова knight указывает на то, что когда-то в 14 в. оно произносилось «книхт». В русской орфографии тоже полно «доисторических окаменелостей»; и для того, чтобы не зубрить, а понимать орфографические правила — нужно разбираться, откуда эти правила взялись. Готового обзора истории шипящих я не нашёл, так что взялся составить его сам. Особенно интригует природа буквы Щ — самой необычной в нашем алфавите.

Читать дальше →
Всего голосов 107: ↑102 и ↓5 +97
Просмотры 27K
Комментарии 206

Казахстан против Носика

IT-компании
Борьбу с Антоном Носиком, Мамутом и «СУПом», кажется, решил поддержать братский Казахстан.

Интерфакс:

«Президент Казахстана Нурсултан Назарбаев предлагает специалистам вновь вернуться к обсуждению вопроса о возможности перевода казахского алфавита на латиницу.»


Котоёб жжот.
Всего голосов 12: ↑6 и ↓6 0
Просмотры 524
Комментарии 1

Google Docs стал лучше понимать русский

IT-компании
Невозможность использования в Google Docs кириллических тегов и поиска по словам на кириллице — старая проблема, существовавшая ещё со времён Writely. Однако она явно решена: сегодня я решил в очередной раз проверить, исправились ли разработчики, и оказалось, что да :) Теперь документы можно помечать кириллическими тегами, а поиск на кириллице доступен в полном формате — как по названиям документов, так и по их содержанию.
Всего голосов 17: ↑15 и ↓2 +13
Просмотры 302
Комментарии 8

Киберсквоттеров развели на кириллические домены

Чулан
Ажиотаж вокруг кириллических доменов, раздутый отечественными регистраторами в начале этого года, похоже, оказался обыкновенным «кидаловом». Опубликованные в январе правила регистрации кириллических имен в национальном домене RU, безусловно, не стоило воспринимать как окончательный вариант. Однако на пункт о графически похожих доменах пользователи на всякий случай ответили новыми регистрациями, дабы застолбить себе прочное место, как только будет запущена кириллица. Хотели схитрить — да только регистраторы оказались проворнее.

В декабре прошлого года TelNews писал о том, что регистрация русскоязычных доменов, вполне возможно, начнется уже в начале 2007 года. С нелатинскими доменными именами традиционно связано немало сложностей и вопросов, в частности, серьезные опасения Координационным центром домена RU связывались с графически похожими доменами. Многие русские слова можно написать латинскими буквами и наоборот. Такие домены, как МОСКВА.RU создают угрозу фишинга — возможность появления фальшивых двойников уже существующих сайтов, либо почтовых ящиков. Это было очевидно и администрации национального домена, поэтому в Правила был внесен знаменитый пункт 4.4.

Суть его заключается в том, что администратором графически похожих доменов — латинского и русскоязычного — не могут быть разные лица. Соответственно, владелец правильной комбинации, составленной из букв латинского алфавита и зарегистрированной в качестве доменного имени, сможет в дальнейшем легко претендовать и на кириллический домен. Регистрация традиционных доменов в зоне RU была и остается реальностью, русскоязычные же домены — лишь проект с не слишком ясными перспективами. Тем не менее, «хитрый» пункт, о котором раструбили по всему Рунету, взяли на заметку дальновидные пользователи. До официального запуска кириллицы регистрация графически похожих доменов пошла в гору.

Тогда же Сергей Шариков, возглавляющий «Регтайм», назвал пункт 4.4 воротами с надписью «Добро пожаловать!», адресованной киберсквоттерам. Когда же большинство интересных «по схожести» доменных имен были зарегистрированы, участники рынка вдруг вспомнили о том, что этот пункт, оказывается, ограничивает их права. На прошлой неделе в Координационном центре домена RU состоялось заседание Комитета регистраторов. Светлана Прозорова, представляющая компанию «Регистратор Доменов», выступила с протестом против текущей версии Правил, касающихся регистрации кириллических имен в национальном домене. В итоге все регистраторы, за исключением RU-CENTER, единодушно высказались против запуска русскоязычных доменов. Серьезную поддержку нашла идея внедрения кириллицы в отдельном IDN TLD.РФ, в рамках тесного сотрудничества с ICANN.

«Если TLD русскоязычный, например.РФ., проблема фишинга не возникает вообще. Поэтому регистраторами и был принят этот вариант для национального домена на кириллице. TLD на национальных языках уже давно работают в Китае при поддержке правительства. В ближайшее время ожидается запуск официальной регистрации в IDN TLD в Корее и Израиле», — пояснил Сергей Шариков странное решение Комитета.

«Ошибкой (а возможно, и продуманной акцией) стало опубликование Правил задолго до вступления их в силу. В декабре 2006 года, сразу после опубликования новых Правил, наблюдался всплеск регистрации графически похожих доменов. Цель таких регистраций одна: пока русскоязычные домены еще не доступны, можно зарегистрировать имя, написанное латиницей, чтобы затем претендовать на «графически похожий» кириллический вариант. Сегодня, по нашим данным, зарегистрировано свыше 2 тысяч графически похожих доменов, причем большая часть зарегистрирована за декабрь 2006 — февраль 2007», — сообщил Андрей Воробьев, возглавляющий департамент по связям с общественностью компании RU-CENTER.

По его словам, заблаговременная публикация Правил привела к тому, что к моменту запуска кириллицы в зоне RU были бы заняты все привлекательные графически похожие имена. Понимая это, регистраторы просто отменили старт русскоязычных имен в национальном домене, выдумав зону.РФ. Андрей Воробьев полагает, что ждать ее придется еще лет пять.

telnews.ru
Всего голосов 8: ↑2 и ↓6 -4
Просмотры 270
Комментарии 0

Неанглийских доменов не будет ещё два года

Администрирование доменных имен *
Возможно, появления кириллической доменной зоны.РУ или.РФ и, соответственно, кириллических доменов в ней придётся ждать ещё долго. Раньше предполагалось, что ICANN сумеет утрясти все формальности к концу 2007 года, а теперь заговорили, что срок может растянутся до двух лет.

В ноябре 2007 года начнётся широкомасштабное «живое» тестирование доменов с неанглийскими символами. Эти тесты нужны, чтобы убедиться в нормальной работе браузеров, почтовых программ и других приложений. «Мы уже проводили некоторые тесты в лаборатории, — сказал Винт Серф на встрече ICANN в пятницу. — Мы уверены, что ни одно звено инфраструктуры не должно создать проблем, но никогда не знаешь наверняка, пока не запустишь всё по-настоящему».

Настоящие проблемы, однако, имеют вовсе не технический характер.
Читать дальше →
Всего голосов 9: ↑9 и ↓0 +9
Просмотры 370
Комментарии 9

Кириллические УРЛы на BlogSpot.com

Чулан
Поводом для написания статьи послужил этот топик, после его прочтения у меня возникло желание поэкспериментировать – я зарегистрировал себе аккаунт на Хабре с кириллицей в имени, однако, мое любопытство не угасло, более того, у меня возникла идея выбрать какой-нибудь популярный блоговый ресурс и проверить его на возможность регистрации кириллических имен. Первое что пришло в голову – BlogSpot.com, на котором я когда-то пытался завести свой блог, однако, руки до его ведения у меня не дошли.
подробный рассказ о том, как регистрировать русские урлы
Всего голосов 6: ↑6 и ↓0 +6
Просмотры 279
Комментарии 2

Top4Top — первый тестовый пост

Чулан
Зарегистрировался за пару секунд. Минимум ввода личной информации и готово.
Большой трабл с кирилицей на сайте под Linux (Ubuntu 7.10). По крайней мере в Firefox — абракадабра при наборе, но при Paste из буфера — все Ок.
Успешно запостил в рейтинг Сайт Дня — Habrahabr.ru.
http://www.top4top.ru/swf/Main.html#/rating/post/1624
Рейтинг 0
Просмотры 405
Комментарии 0

Хотел и бабы

Чулан
Увидел на днях новость о том, что Гугль теперь умеет переводить кириллицу в латиницу, и, недолго думая, ввел в поиске «хотел» и «бабы» ;)
Результат меня не разочаровал:
Читать дальше →
Всего голосов 26: ↑20 и ↓6 +14
Просмотры 197
Комментарии 13

Кое-что об использовании латиницы в кириллических текстах

Чулан
Обрамлять ли имя собственное, написанное латинскими буквами, кавычками в русском тексте? Как быть со смешанными названиями, у которых часть написана на латинице, а часть — на кириллице?

Автор «Оформления цитат на сайтах», уважаемый heath, считает, что нужно все имена собственные выделять одинаково.

Правила с ним не согласны:
Читать дальше →
Всего голосов 12: ↑11 и ↓1 +10
Просмотры 588
Комментарии 5

Регистрация кириллических доменов в зоне SU

Администрирование доменных имен *
Цитирую письмо, которое только что пришло мне от одного из регистраторов:

С 28 апреля 2008 года, в соответствии с решением Наблюдательного Совета
Фонда Развития Интернет, вступают в силу изменения в регламентирующем
документе «Положение о регистрации доменных имен в домене SU», а именно:

снимаются ограничения на регистрацию доменов с префиксом xn--, что
позволит начать регистрацию мультиязычных доменов в этой зоне (вида «имя.su»).

Стоимость регистрации мультиязычных доменов будет соответствовать Вашей
текущей стоимости регистрации доменов SU.

Регистрации подлежат только доменные имена с префиксом «XN--»,
которые при преобразовании с помощью алгоритма PUNYCODE имеют
представление доменного имени, состоящее из букв, входящих только
в одну из используемых таблиц стандарта UNICODE
и/или цифр «0»,«1»,«2»,«3»,«4»,«5»,«6»,«7»,«8»,«9» и/или знаков "-" (дефис).


Если я правильно понимаю, это плохо. Плохо ведь?
Всего голосов 10: ↑6 и ↓4 +2
Просмотры 878
Комментарии 10

Ссылки на Хабрахабре

Habr
Посмотрел я на частоту появления в комментариях фраз типа «у Вас русские буквы закрались в ссылочку» или «уберите кириллицу из линка» и подумал, что не может быть у такого количества людей ошибок такого рода. Особенно если это обычно Ctrl + C -> Ctrl + V из адрессной строки браузера.

Соответственно, напрашивается вывод, что алгоритм работы Хабра сам делает подстановки вместо английских букв на аналогичные кирилличные.

Ну и, естесственно, спрашивается зачем?

Есть предположение что из-за поисковой жадности. К примеру, при подсчете Гугловского PageRank страницы учитывается PageRank страниц, которые ссылаются на нее, соответственно Хабр имея высокий PageRank не хочет ним ни с кем делиться, поэтому заменяет некоторые буквы на кирилличные, чтобы ссылки вели в несуществующие места.

P.S. Можно еще дополнить это предположение популярным об НЛО. :)
Всего голосов 56: ↑37 и ↓19 +18
Просмотры 555
Комментарии 39

ICANN и домен.РФ

Администрирование доменных имен *
Вот такое письмо пришло от моего регистратора r01.ru:

В настоящий момент в Интернет-корпорации ICANN разрабатывается ускоренная процедура создания ограниченного числа доменов верхнего уровня с использованием символов национальных алфавитов (IDN) для государств, где национальное интернет-сообщество имеет высокую потребность в их использовании.

Итоговый документ, определяющий ускоренную процедуру делегирования, будет представлен на утверждение на конференции ICANN в Париже в конце июня этого года, после чего станет возможным подать заявку на делегирование домена верхнего уровня с символами кириллицы в интересах российских интернет-пользователей.

Для России уже в самом ближайшем времени именем национального кириллического домена может стать.РФ.

Делегирование кириллического доменного имени верхнего уровня по ускоренной процедуре станет возможным только в случае поддержки российского сообщества пользователей сети Интернет. Национальному домену.РФ необходим именно Ваш голос! В период с 30 мая по 8 июня Вы можете выразить свое мнение через онлайн опрос, организованный на нашем Интернет-ресурсе. Результаты голосования будут опубликованы на нашем сайте.


Если нужно было бы точно выбрать одно из двух:.РУ или.РФ, что выбрали бы вы?
Всего голосов 29: ↑20 и ↓9 +11
Просмотры 655
Комментарии 58

«Рус, здавайс!»

Чулан
Кириллические домены это здорово, но всему должен быть разумный предел — как государство допустило регистрацию доменов «.ру»? Ребята, есть же «.py» — Парагвай (http://www.presidencia.gov.py/) —, на что они надеялись? Как такое произошло, что куча людей поназарегистрировала ещё неизвестно будущий ли вообще в употреблении «.ру»? И ещё хватило нагласти заявлять о зоне «.рус»… ладно там киберсквоттеры, их не жалко, но ведь и обычные люди могут попасться, будучи абсолютно уверенными, что покупая домен, отдавая реальные деньги, они получают именно гарантию обладания им, а не шанс, что когда-то это может стать реальностью.

Читать дальше →
Всего голосов 18: ↑2 и ↓16 -14
Просмотры 244
Комментарии 13

Как вы относитесь к использованию кириллицы в доменном имени?

Администрирование доменных имен *
Предлагаю обсудить использование кириллицы в доменном имени. Как вы к этому относитесь?

До сих пор существует некоторые проблемы с использование кириллицы. Известно, что даже русифицированный Firefox очень не любит использование кириллицы в строке браузера и всегда пытается перевести кириллические символы либо в латиницу, либо в какие то не меренного размера коды.

Например, такие.

Две свежие новости на тему кириллицы в доменном имени:
1. Евросоюз разрешил регистрировать сайты с русскими адресами на европейском домене .eu (26.06.2009):
Евросоюз разрешил регистрировать интернет-сайты с русскими адресами на общеевропейском домене .eu
В сообщении официального представителя Еврокомиссии Мартина Зелмайера отмечается, что со следующей недели для регистрации сайтов на домене .eu можно будет использовать кириллицу и греческий алфавит. Также на европейском домене создана техническая поддержка для использования в названиях сайтов не входящих в базовый латинский алфавит букв европейских языков. Раньше для регистрации сайтов на домене .eu можно было использовать только буквы латинского алфавита и цифры от 0 до 9.
Читать дальше →
Всего голосов 87: ↑63 и ↓24 +39
Просмотры 3.8K
Комментарии 254

opechatka.ru

Чулан
Только что захотел почитать новостей на сайте 3dnews.ru.
Забыв поменять раскладку с кириллицы на латиницу, и написав в адресной строке «3втуцыюкг», был приятно удивлен выданным результатом:
поехали
Всего голосов 27: ↑9 и ↓18 -9
Просмотры 236
Комментарии 16

Копирование ссылок с кириллицей в Firefox

Чулан
Наверное, каждый пользователь Firefox сталкивался с проблемой копирования и вставки ссылок, содержащих кириллицу (или, например, иероглифы).

Предположим, я хочу дать ссылку на заглавную страницу Википедии; если я выделю адрес и скопирую его в буфер обмена, то при вставке он примет следующий вид: ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0

О том, как сохранить читабельность ссылки, я расскажу далее.
Читать дальше →
Всего голосов 15: ↑11 и ↓4 +7
Просмотры 3.4K
Комментарии 7

Началась регистрация доменов в зоне .РФ

Администрирование доменных имен *
Сегодня официально открылась регистрация доменных имен в кириллической зоне.РФ. На первом этапе будут рассматривать заявки только владельцев товарных знаков. Регистрация для всех желающих, согласно календарю событий зоны.РФ, начнётся в июле 2010 года.

«Для удобства населения» регистратор доменных имен Reg.ru открыл горячую линию по домену.РФ, бесплатную на всей территории России.

Телефон горячей линии: 8-800-77-REGRU или 8-800-777-3478.

Что бы у них спросить?
Всего голосов 18: ↑9 и ↓9 0
Просмотры 355
Комментарии 15

Кириллица в именах переменных и функций

PHP *
Здравствуй, сообщество.

Вероятно, то, что я сейчас напишу, кому-то было известно, но буквально недавно с этим столкнулись впервые.

Я сейчас тут код приложу, в принципе, там всё понятно. У меня и моих бывших коллег вчера был культурный шок. Сегодня немного набросал тестового кода, для проверки.
Работает в кодировках cp1251 и в UTF, проверяли на версиях php 4.4.7, 5.2.9, 5.2.10–2ubuntu6.4

Вообщем, вы посмотрите на это и выскажите своё мнение.
Что ж там дальше?
Всего голосов 125: ↑79 и ↓46 +33
Просмотры 11K
Комментарии 101

Набор доменных имён в другой раскладке

Я пиарюсь
На фоне всяких рассуждений о национальных доменах, которые делают для удобства запоминания и ввода названия, вспомнился метод создания паролей, когда смотришь на русскую раскладку, но вводишь латинскими буквами. Можно ли зарегистрировать доменное имя на том же принципе? Идея кажется ещё интереснее, если вспомнить, что точке соответствует русская буква «ю». Беглый перебор популярных доменов верхнего уровня дал один перспективный вариант — .kz, который в русской раскладке выглядит как «юля». Скажем, мог бы существовать кулинарный сайт «Кастрюля» с доменным именем rfcnh.kz. Довольно страшно выглядит, но легко запоминается. Логотип сайта может подсказывать способ ввода:

Да, я знаю, что кнопка с «Ю» выглядит не так, но в логотипе такой вариант нагляднее.

Сомневаюсь в перспективности идеи, но вдруг кому пригодится :-)
Всего голосов 177: ↑135.5 и ↓41.5 +94
Просмотры 692
Комментарии 85