Mathlingvo — блог о компьютерной лингвистике

    Natural Language Processing — область, которая становится все популярнее и популярнее в Росссии. Но отдельных ресурсов, посвященных этой теме, в рунете практически нет. Полгода назад на Хабре представляли NLPub, каталог ресурсов по компьютерной лингвистике. Но что делать, если хочешь читать новости? Можно попробовать начать с блога mathlingvo.ru

    image



    Одним из крупнейших лингвистических ресурсов в мире является LinguistList. В день в среднем там публикуется порядка 10-15 сообщений, включая анонсы о школах и конференциях, объявления о выходе новых книг и даже некрологи. Есть возможность подписаться только на определенные типы сообщений, например вакансии или новые книги. К сожалению подписаться на тематики невозможно. Поэтому информацию о компьютерной лингвистике придется в любом случае выуживать из общего потока.

    Из специализированных ресурсов, посвященных Natural Language Processing, хочется упомянуть nlppeople. Это международная доска объявлений о вакансиях в области автоматической обработки языка. К сожалению, кроме вакансий там ничего не публикуется.

    В русскоязычном лингвистическом сообществе основной рассылкой является Мослинг, рассылка московских лингвистов, в которой публикуются объявления о событиях не только в Москве, но и в других городах и даже странах. Информации о компьютерной лингвистике хватает, но много информации и о других направлениях. Есть аналогичная питерская рассылка spb_ling.

    Mathlingvo же наоборот сконцентрирован именно на информации о компьютерной лингвистике. Блог не претендует на полноту, его ведет всего два человека, но зато вся информация релевантна автоматической обработке языка. Авторы освещают новости интересные в первую очередь им самим.

    Что публикуется в блоге?
    Авторы стараются охватить самые разные темы, связанные с компьютерной лингвистикой. Объявления о школах и конференциях, в том числе и из LinguistList и Мослинг, вакансии, новые ресурсы для лингвистической разработки, объявления о конкурсах и стажировках, новых научных журналах и т.д. В последнее время появились «редакционные» посты, например пост «Как стать хорошим компьютерным лингвистом» вполне достоин и Хабра.

    Кто ведет блог?
    Сейчас у блога два постоянных автора:
    Дмитрий Грановский, разработчик лингвистического отдела Яндекса, преподаватель кафедры СПбГУ
    Лидия Пивоварова — аспирантка Университета Хельсинки, преподаватель
    кафедры СПбГУ, организатор известного в Петербурге семинара по автоматической обработке текста.

    Как читать?
    Для тех, кто пользуется читалками на сайте есть ссылка на RSS (можно даже подписаться на новые комментарии). Еще есть трансляции в твиттер и фейсбук.

    Чем помочь?
    Самый простой и действенный способ — пополнить число авторов. Блог дает возможность предложить новость редакции. Предлагать можно не только новости, но и релевантные вакансии, описание интересного, но почему-то неизвестного ресурса, даже рассказать о своем проекте в области автоматической обработки естественного языка.
    Проект полностью некоммерческий, все публикации абсолютно бесплатные (даже о вакансиях). Поэтому проекту хотелось бы привлечь новых авторов, чтобы снизить нагрузку на существующих.

    И разумеется проект будет рад новым читателям.
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 8

      +3
      еще nlpub.ru/ — замечательная база знаний по лингвистическим инструментам.
        +5
        Ага, о ней написано в третьем предложении.
          0
          ой, глаза скакнули
        +1
        Могу еще посоветовать рассылку corpora. Кроме свободно распространяемых результатов, знаний и т.д., приглашения на Master, PhD и RA, вакансии.
          0
          Пользуясь случаем хотел бы спросить, знает ли кто-нибудь где простому смертному можно достать синтаксически размеченный корпус русского языка? Я уже подавал документы и получил доступ к НКРЯ, ожидая получить общеизвестный СинТагРус, не раз упоминавшийся на хабре, но в том архиве что пришел мне по ссылке, никаких намёков на разметку синтасиса не заметил, только морфология. Говорят, нужно подавать какие-то еще документы, в общем я потонул в этой бюрократии, а ведь просто хотел поисследовать «для себя», но я не силен в юридических аспектах и спросить мне больше не у кого. Больше синтасически размеченных корпусов не нашел.
          0
          на сайте есть ссылка на RRS

          RSS, исправьте пожалуйста
            +1
            Спасибо!
            Сколько бы я ни проверяла, все равно остается одна дурацкая ошибка каждый раз.

          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

          Самое читаемое