Pull to refresh
  • by relevance
  • by date
  • by rating

Ученый-лингвист нашел ключ к рукописи Войнича. Или нет

Learning languages

В конце апреля Джерард Чешир из Бристольского университета опубликовал статью в журнале Romance Studies, где описывается языковая система, представленная в рукописи Войнича — средневековом литературном памятнике, который до сих не удавалось расшифровать. Новая попытка вызвала резонанс среди лингвистов, и большинство из них настроены скептически.
Total votes 21: ↑18 and ↓3 +15
Views 5.1K
Comments 19

В МТИ нейросеть научилась расшифровывать забытые языки

Algorithms *Machine learning *Learning languages
image

В Массачусетском технологическом институте разработали нейросеть, которая поможет лингвистам расшифровать давно забытые языки.
Читать дальше →
Total votes 16: ↑16 and ↓0 +16
Views 7.1K
Comments 9

Лингвистический анализ показал резкий рост депрессивных настроений в обществе с 2007 года

Statistics in IT Brain Health

Исследователи Школы информатики и вычислительной техники и кафедры физиологии и нейрофизиологии Индианского университета провели анализ более 14 миллионов книг, опубликованных в период с 1855 по 2019 год. Авторы обнаружили, что за последние два десятилетия частота текстовых аналогов когнитивных искажений резко выросла. Они связывают это с недавними социально-экономическими изменениями, новыми технологиями и социальными сетями.

Читать далее
Total votes 22: ↑22 and ↓0 +22
Views 4.2K
Comments 6

Стив Джобс говорит понятнее, чем Билл Гейтс

Lumber room
На прошлой неделе Билл Гейтс, и Стив Джобс практически одновременно произнесли большие программные речи. Стенограммы этих речей опубликованы в интернете: и речь Гейтса, и выступление Джобса.
Читать дальше →
Total votes 32: ↑30 and ↓2 +28
Views 471
Comments 26

Кто взломает zip-архив, тот узнает, кто убил Летвиненко

Lumber room
Есть такая экспертная система ВААЛ — лингвистическая экспертиза.
Здесь еще 05.01.2007 появился пост такого содержания:

«Литвиненко умер 23 ноября 2006 года, а вечером 24 ноября нам в руки попало одно интересное интервью. Оперативно был проведен его контент-анализ. Не может быть, сказали мы себе <lj-cut>и не стали ничего публиковать. Со временем «не может быть» стало обретать плоть и кровь.
Мы решили поступить так.
По адресу www.vaal.ru/download/enigma.zip находится файл, который можно скачать уже сейчас. Но этот файл зашифрован.
Когда завершится следствие по делу Литвиненко, и конкретным лицам будут предъявлены обвинения, мы сообщим в открытом доступе пароль к зашифрованному файлу, и каждый сам сможет проверить, насколько верными оказались наши предположения.»


Потом 06.06.2007 было продолжение
… После опубликования предыдущего материала к нам постоянно обращаются с просьбой дать пароль для расшифровки файла. Обращаются по электронной почте, обращаются в комментариях к публикации, иногда даже звонят по телефону.
Пришло время открыть пароль?
Нет, не пришло. Да, Великобритания обратилась к России с просьбой о выдаче Лугового, но это еще ни о чем не говорит...

И т.д., в том же ключе

Задача!
Файл доступен для скачивания.
Может быть его стоит взломать? И открыть миру истину?
Это возможно (взломать)?

ps
Такой вот странный мой первый пост.
С новосельем!
Total votes 54: ↑33 and ↓21 +12
Views 340
Comments 37

Uz-Translations: иностранные языки, онлайн образование

Self Promo


Уважаемые хабрапользователи, хочу представить вашему вниманию мой языковой проект: Uz-Translations — информационный блог для филологов и переводчиков. Сайт был запущен в 2004 году.

Цель сайта создать в Интернете уникальный ресурс, где будут собраны материалы как для изучающих, так и преподающих иностранные языки. Ежедневно на сайте размещаются статьи, посвященные искусству перевода, лингвистике, страноведению, а также обзоры программ, учебных материалов, словарей и онлайн курсов, которые сейчас набирают популярность во всем мире!

Буду рад услышать вашу критику и замечание в адрес сайта!
Total votes 24: ↑15 and ↓9 +6
Views 1.6K
Comments 34

Кузявые ли бутявки, т.е. пишем морфологический анализатор на Python

Python *
Морфологический анализатор для русского языка — это что-то заумное? Программа, которая приводит слово к начальной форме, определяет падеж, находит словоформы — непонятно, как и подступиться? А на самом деле все не так и сложно. В статье — как я писал аналог mystem, lemmatizer и phpmorphy на Python, и что из этого получилось.
Читать дальше →
Total votes 115: ↑109 and ↓6 +103
Views 49K
Comments 44

Такете и Малума. Практическое использование феномена

Design
«Билайн и МТС неожиданно в один день сменили логотипы вот на такие»:



«Как вы думаете, что из этого символ МТС, а что — Билайн?»

С таким вопросом я приставал к своим коллегам, а полученные ответы заносил в тетрадку и задумчиво хмыкал. В конце статьи будут результаты опроса, а пока что объясню в чем его смысл.

Давно известен и описан феномен сопоставления человеком бессмысленных слов бессмыссленным фигурам согласно их форме. Как вы думаете, что из этого Малума, а что — Такете?



В. Келер (W. Kohler) в 1947 году показал, что большинство людей называют округлую фигуру Малума, а угловатую — Такете. Это означает, что у людей есть механизмы возникновения стойких ассоциаций между словами и фигурами, независимо от их смысла. А раз так, просто необходимо эти механизмы использовать.

Развиваю тему под катом. Если вам интересно применение психологии в дизайне, некоторые другие идеи я описывал на своем сайте.

Читать дальше →
Total votes 151: ↑140 and ↓11 +129
Views 5K
Comments 101

Гибридная реализация русской морфологии

Lumber room
При создание поисковых решение одним из первых с чем приходиться сталкивать разработчику это предварительная обработка текста. Разбивка на термины, фильтрация стоп слов. Важной операцией влияющей на качество поиска на данном этапе является приведение слов к нормальной форме. Ниже приведены основные подходы к этой проблеме.
Читать дальше →
Total votes 17: ↑15 and ↓2 +13
Views 741
Comments 4

Нанотехноблогии

Lumber room
image

предыстория


Мы живем в постоянно ускоряющемся и постмодернизирующемся мире, в котором потоки информации выливаются на каждого в непомерном объеме.

Типичный представитель нашей эпохи склонен к клиповому мышлению, многозадачности и восприятию целой мозайки разнообразных данных каждый день.
Читать дальше →
Total votes 29: ↑16 and ↓13 +3
Views 203
Comments 38

Слова имеют значение: языковые проблемы проектирования интерфейсов

ALEE Software corporate blog
imageРазрабатывая пользовательские интерфейсы, поневоле приходится иметь дело с проблемой языка. Невозможно смоделировать процесс человеко-машинного взаимодействия, вообще не используя слов и выражений естественного языка. Удовлетворение пользователя в процессе работы во многом обусловлено тем, насколько ясно и понятно написаны тексты инструкций, подсказок, какие языковые выражения использованы в пунктах меню и т. п. Если эти тексты перегружены малопонятной терминологией и содержат стилистические ошибки, то о каком удобстве пользователя можно вести речь? В данном тексте мы бы хотели выделить основные языковые проблемы, с которыми приходится сталкиваться при проектировании интерфейсов, и попытаться наметить возможные пути их решения. Приглашаем читателей к обсуждению. Надеемся, что в дискуссии примут участие не только представители ИТ-сферы, но и гуманитарии.

Читать дальше →
Total votes 7: ↑6 and ↓1 +5
Views 4.1K
Comments 19

Узнать всё о лингвистическом аннотировании текстов на семинаре ABBYY Open

ABBYY corporate blog
В ближайший вторник, 24 мая, мы организуем в Москве семинар «Актуальные проблемы компьютерной лингвистики», посвящённый лингвистическому аннотированию текстов (корпусов). Мероприятие состоится в рамках серии открытых лекций и семинаров ABBYY Open.

Лингвистическое аннотирование является сегодня центральной темой, объединяющей интересы теоретических и компьютерных лингвистов. Разметка корпусов нужна как для задач машинного обучения систем Natural Language Processing (NLP), так и для получения собственно лингвистических результатов.

Приглашенные докладчики – известные специалисты в области компьютерной лингвистики Эдуард Хови (Eduard Hovy, University of Southern California/Information Sciences Institute) и Диана Маккарти (Diana McCarthy, Lexical Computing Ltd).

Подробную информацию о месте и времени проведения мероприятия, а также аннотации докладов вы можете прочитать здесь. Семинар бесплатный, для участия обязательно нужно зарегистрироваться и дождаться подтверждения регистрации.

Рабочий язык семинара – английский.
Total votes 21: ↑18 and ↓3 +15
Views 2.3K
Comments 1

Австралийские роботы сами придумали себе язык

Artificial Intelligence
Пара разговаривающих роботов, изначально не обладавшая никаким языком для общения между собой, сама выработала его в ходе взаимодействия.
Читать дальше →
Total votes 218: ↑215 and ↓3 +212
Views 2.8K
Comments 67

Нечёткий поиск на клиенте и Soundex

JavaScript *
Soundex — один из алгоритмов сравнения двух строк по их звучанию. Был разработан чуть менее 100 лет назад Робертом Расселом и Маргарет Оделл. Активно используется в США при диктовке фамилий.

Я давно интересовался применением этого алгоритма и нашёл ему место для фильтрации данных на клиенте, а точнее, для поиска отеля по названию в проекте Островок.ru.

Задача

На Островке все найденные отели передаются на клиент и вся фильтрация и сортировка выдачи происходит в браузере. Необходимо было добавить фильтр по названию отеля.

Решение, проблемы и готовый скрипт
Total votes 72: ↑70 and ↓2 +68
Views 7.7K
Comments 44

Имена людей и интерфейс

Interfaces *
Пространство рассуждения статьи затрагивает вопросы различия имен людей во всем мире, и то, как это влияет на дизайн форм ввода, баз данных, онтологий информатики и др. в контексте Всемирной Паутины.

image

Заинтересованная аудитория: авторы HTML-контента, разработчики скриптов серверных приложений (PHP, JSP и т.д.), менеджеры веб-проектов и любые другие люди, так или иначе связанные с дизайном форм ввода данных, дизайна баз данных и онтологий, которые затрагивают личные имена людей.

Следует помнить о различиях формирования и традициях употребления имен людей в других странах. Зачастую создатели сайтов или программ одной культуры не учитывают национальные особенности пользователя другой, что заставляет последнего чувствовать себя непривычно, и ставит дополнительные преграды к использованию продукта.

Читать дальше →
Total votes 314: ↑301 and ↓13 +288
Views 39K
Comments 121

Скрытые Марковские модели в распознавании речи

Algorithms *
Sandbox
Самое быстрое и эффективное взаимодействие между людьми происходит посредством устной речи. С помощью речи могут быть переданы различные чувства и эмоции, а главное — полезная информация. Необходимость создания компьютерных интерфейсов звукового ввода-вывода не вызывает сомнений, поскольку их эффективность основана на практически неограниченных возможностях формулировки в самых различных областях человеческой деятельности.

Читать дальше →
Total votes 35: ↑29 and ↓6 +23
Views 21K
Comments 9

Методы современной лингвистики для изучения китайского языка

Learning languages
Sandbox
Очевидно, что перед каждым ученым, серьезно исследующим китайский язык, остро стоит вопрос о методологии (методе) своих изысканий, следовательно, — их перспективах и собственном месте в лоне китаистики.

Данный вопрос, несмотря на видимую простоту, сложен хотя бы потому, что эффективность конкретной лингвистической методологии должна быть обоснована в сопоставлении с другими методологическими системами и проанализирована на предмет возможности ее применения для изучения конкретного языкового материала.

Подобное исследование до сих пор целенаправленно не проводилось, что, как нам представляется, определяет актуальность исследования.

Итак, до начала 20 века — периода, когда стали известны идеи Ф. де Соссюра о необходимости формирования лингвистики как отдельной дисциплины, российские китаисты уже добились огромных успехов в деле подбора, анализа, систематизации языкового материала.

Читать дальше →
Total votes 22: ↑9 and ↓13 -4
Views 2.2K
Comments 10

Заходят русский, англичанин и китаец в программу…

«Лаборатория Касперского» corporate blog
Привет, Хабровчане!
Что вы думаете про нашу техническую документацию и локализации продуктов, если вам доводилось с ними сталкиваться? И читаете ли вы документацию вообще?
В свою очередь, мы хотим рассказать вам, как ЛК удается делать так, чтобы и русский, и англичанин, и китаец одинаково легко обращались с нашими программами. Больше всех об этом знает руководитель отдела локализации и разработки технической документации Татьяна Родионова.


image― Татьяна, насколько это вообще объемная работа, как много сотрудников числится в вашем отделе?

― Сейчас в отделе работают 48 человек. По функциям все они делятся на 4 группы. Группа технического документирования разрабатывает материалы, которые помогают пользователю разобраться в программе. Это тексты графического интерфейса продуктов, справка, интегрированная в продукт, а также сопроводительные документы, такие как «Руководство пользователя». Тексты пишут технические писатели.
Локализацией текстов на языки занимаются переводчики и инженеры группы локализации. Сегодня мы локализуем наши продукты на 33 языка. Основные языки ― русский, английский, немецкий, французский и для некоторых продуктов ― китайский. Понятно, что локализовать продукт на 33 языка силами только штатных сотрудников невозможно. В помощь мы привлекаем переводческие агентства и носителей языков по всему миру.
Читать дальше →
Total votes 11: ↑8 and ↓3 +5
Views 4.8K
Comments 1