Pull to refresh
66
0
Светлана Лузгина@luciana

Внутренние коммуникации в Nebius

Send message

Тезаурус РуТез: структура и приложения – новый семинар в серии ABBYY Open

Reading time1 min
Reach and readers4K
imageВсем привет! Сегодня у нас новость для лингвистов. 20 декабря в нашем московском офисе пройдет очередной семинар по компьютерной лингвистике ABBYY Open.

Семинар будет посвящен описанию структуры тезауруса русского языка РуТез, который представляет собой крупнейшую лингвистическую онтологию, используемую для автоматической обработки текстов. В докладе будет проведено сопоставление структуры тезауруса с другими подобными проектами: традиционными информационно-поисковыми тезаурусами, тезаурусами типа WordNet, формальными онтологиями. Будут рассмотрены приложения автоматической обработки текстов, в которых используется тезаурус РуТез.

Ведет семинар Наталья Лукашевич – кандидат физико-математических наук, ведущий научный сотрудник НИВЦ МГУ. Под ее руководством и при непосредственном участии разрабатываются такие лингвистические ресурсы, как Тезаурус русского языка РуТез, Онтология по естественным наукам и технологиям ОЕНТ, созданы онтологические ресурсы в конкретных предметных областях (компьютерная безопасность, авиационная сфера, банковское дело и др.). Данные ресурсы применяются в различных технологиях автоматической обработки текстов: автоматическое концептуальное индексирование, расширение поискового запроса, рубрицирование, автоматическое аннотирование отдельных документов и групп тематически близких документов, кластеризация документов.

Семинар начнется 20 декабря в 17.00. Подробная информация и регистрация – на странице ABBYY Open.

Поддержка Windows Azure в продуктах ABBYY для разработчиков

Reading time1 min
Reach and readers2.8K
Привет, хабрачитатель!

Сегодня у нас новость от команды, которая занимается продуктами для разработчиков. Мы добавили поддержку Windows Azure в наши SDK-решения ABBYY FineReader Engine 10 и ABBYY FlexiCapture Engine 9.0.

Windows Azure предъявляет ряд жестких требований к программному обеспечению, которое на нем работает (например, объем системной папки для временных файлов может быть не больше 100 Мб, ограничены права учетной записи, под которой выполняется код, точка входа всегда 64-битная – необходимо сопряжение с 32-битным кодом).

Мы адаптировали продукты к этим требованиям, провели тщательное тестирование и обновили техническую документацию. Лицензируйте наших слонов :)

Светлана Лузгина
при поддержке департамента продуктов для разработчиков

Бета-тестирование ABBYY Lingvo Dictionaries for Android

Reading time1 min
Reach and readers9.8K
image
В комментариях вы часто спрашиваете нас, когда выйдет словарь Lingvo для платформы Android. Рассказываем: мы активно работаем над этим приложением и рассчитываем в декабре выпустить его. Когда вышел Lingvo для iOS, вы помогли нам улучшить программу, предложив в комментариях много полезного. Мы очень благодарны вам за это и хотели бы учесть ваши пожелания и при разработке версии для Android. Поэтому в октябре мы планируем провести открытое бета-тестирование ABBYY Lingvo Dictionaries for Android. Если вы хотите принять в нем участие, пишите email и имя в личку, первые 100 желающих смогут протестировать программу.
Системные требования: Android 2.2 и выше.

Теперь немного о бета-версии:

1. Она будет содержать словарь для тестирования, а также позволит скачивать и устанавливать другие словари с внешнего сервера.

2. Морфологическая поддержка. Если программа не нашла точно такого слова, которое вы написали в строке ввода, сначала она будет искать его нормализованные формы, а если такой формы нет, предложит похожие слова.

3. Возможность просмотра грамматических форм слова и т.д.

Программа будет работать без соединения с интернетом (он понадобится только тогда, когда вы захотите скачать новые словари или звук к ним).

UPDATE
Cпасибо всем приславшим заявки! Сотня набралась (13.00 MSK).

Интернет как корпус – новый семинар в серии ABBYY Open

Reading time1 min
Reach and readers3.6K

В следующий вторник, 19 июля, в московском офисе ABBYY состоится очередной семинар в серии ABBYY Open «Актуальные проблемы компьютерной лингвистики». На семинаре выступит Сергей Шаров – сотрудник кафедры перевода Университета Лидса (Великобритания), ранее работавший в Российском НИИ искусственного интеллекта и Институте русского языка, РАН. Его доклад «Web as Corpus, Подходы к количественному и качественному анализу текстового содержания интернета» посвящен методам сбора лингвистических корпусов в интернете, оценке качества этих методов и рассмотрению подходов к автоматической классификации текстов.

На семинаре будут описаны способы быстрого сбора корпусов в нужной области, подходы к автоматической классификации текстов по предметным областям и жанрам с помощью таких методов как Support Vector Machines (SVM), Topic Modeling, Multidimensional Scaling. Помимо количественной оценки качества методов необходимо также проводить качественную оценку соответствия результатов классификации языковой интуиции. На семинаре будут приведены примеры использования методов создания и обработки корпусов для русского, английского, китайского и немецкого языков.

Подробную информацию о мероприятии вы можете прочитать здесь. Семинар бесплатный, для участия обязательно нужно зарегистрироваться и дождаться подтверждения регистрации.

UPD: Видео с семинара можно найти здесь

«Диалог» задаёт стандарты компьютерной лингвистики в России

Reading time6 min
Reach and readers8.6K
Как вы знаете, ABBYY создаёт программы, которые так или иначе связаны с обработкой языков: ABBYY Lingvo переводит слова с одного языка на другой, ABBYY FineReader преобразует тексты из печатного вида в электронный, ABBYY Compreno (о ней мы писали здесь) будет переводить на разные языки целые тексты. Программы такого типа называют «наукоемкими», потому что они основываются на результатах серьезных научных исследований. А в нашем случае – на результатах из области искусственного интеллекта, распознавания образов и компьютерной лингвистики. О компьютерной лингвистике и пойдет речь в этом посте.

Мы очень заинтересованы в том, чтобы эта наука развивалась, поэтому не ограничиваемся исследованиями внутри компании, но и который год подряд организуем целую научную конференцию на эту тему – «Диалог». Поскольку компьютерная лингвистика – достаточно специфическая область знаний, о «Диалоге» много знают лингвисты и мало знают все остальные. Под катом мы расскажем вам о нём подробнее.
Читать дальше →

«Яблочный» Lingvo научился переводить слова на фотографиях

Reading time2 min
Reach and readers17K
image
У нас вышла вторая версия ABBYY Lingvo Dictionaries for Apple iOS. Новая версия создавалась с учётом просьб и пожеланий наших пользователей, и прежде всего мы хотим поблагодарить всех хаброжителей, которые написали свои комментарии к первой версии продукта (о ней мы рассказывали здесь).

Что же нового появилось? Самое главное – теперь программа умеет переводить слова на фотографиях, сделанных с помощью фотокамеры iPhone. Эта функция реализована на основе нашей технологии OCR (оптическое распознавание текста) и раньше ей могли пользоваться только обладатели девайсов на Symbian (продукт выходил под названием ABBYY FotoTranslate, о нем мы писали здесь).

Читать дальше →

Как сотрудники ABBYY соревновались в метании гаджетов, или немного о стафф-митинге

Reading time4 min
Reach and readers4K

Мы редко пишем в блоге о внутренней жизни нашей компании, но недавнее событие, пожалуй, заслуживает внимания.

Итак, справа вы видите сотрудника ABBYY, который собирается забросить клавиатуру далеко-далеко. Чем дальше, тем лучше. Сотрудник этот не одинок в своём стремлении, потому что бросить клавиатуру он собирается не просто так, а с целью победить в соревновании по метанию гаджетов, и желающих победить – много. Ведь победитель получит возможность забросить подальше самый настоящий ноутбук. Гаджеты для метания подготовлены самые разные: мобильные телефоны, мыши, клавиатуры и прочее, а происходит всё это на стафф-митинге – большом корпоративном выезде компании ABBYY.

Что ещё эти люди там делали?
Под катом 5 Мб фоток

На следующей неделе начнётся «Кубок Lingvo»

Reading time2 min
Reach and readers4.2K
image
19 апреля заканчивается регистрация на четвёртый онлайн-чемпионат по переводу со словарём «Кубок Lingvo», который проводит наша компания.

В соревнованиях могут принимать участие школьники старше 16 лет, студенты всех форм обучения, а также аспиранты, получившие диплом не ранее 2009 года, из России и других стран.

Турнир пройдёт в 2 этапа: 20-21 апреля и 19 мая 2011 года. В первом туре определятся финалисты «Кубка», второй выявит чемпиона и еще 29 победителей, продемонстрировавших самые выдающиеся результаты.

Турнир проходит так:
Читать дальше →

Кафедра ABBYY в МФТИ – 5 лет инвестиций в российское образование

Reading time5 min
Reach and readers11K

7 апреля исполняется пять лет кафедре ABBYY на факультете Инноваций и высоких технологий Московского физико-технического института. Казалось бы, пять лет – небольшой срок, но за это время на кафедре Распознавания изображений и обработки текста было подготовлено несколько десятков специалистов, которые успешно работают в компании. Мы немного расскажем о том, почему в ABBYY решили самостоятельно учить студентов, и чему именно их учат.
Читать дальше →

Вышла четвёртая версия ABBYY Business Card Reader for iPhone

Reading time1 min
Reach and readers7.1K
image
На днях мы выпустили новую, четвёртую версию ABBYY Business Card Reader для iPhone. Что появилось нового? Прежде всего, ABBYY BCR 4.0 научился распознавать корейский язык, и теперь в программе языков распознавания аж целых 20. Но главное новшество – это CardHolder, или «Визитница», – специальный архив для хранения фотографий визиток вместе с распознанными данными.
Читать дальше →

История ABBYY Lingvo. Как всё начиналось

Reading time5 min
Reach and readers16K
image В нашем блоге мы уже немного рассказывали о старых версиях ABBYY Lingvo, но всё время за рамками постов оставалось главное в истории словаря – как же он создавался. Было это больше двадцати лет назад – срок немалый, но в ABBYY люди работаю долго, и Александр Москалёв, который спроектировал первую версию Lingvo в 1989 году, до сих пор в компании. Мы попросили рассказать его о том, как всё начиналось, – и вот что из этого получилось.
Рассказывает Александр Москалёв

Что такое ABBYY FormReader и как он работает в «Альфа-банке»

Reading time3 min
Reach and readers16K
Мы уже довольно много рассказывали о продуктах для разработчиков и для конечных пользователей, но ещё ни разу речь не заходила о решениях для целых компаний. Исправляемся: сегодняшний пост об ABBYY FormReader – системе ввода форм, заполненных от руки или на принтере, с применением технологии ICR (Intelligent Character Recognition). А рассказывать о ней мы будем на примере внедрения в «Альфа-банке».
Читать дальше →

Каждому студенту – по «хомяку»

Reading time2 min
Reach and readers13K
image
Пару недель назад вышла облегчённая версия ABBYY FineReader 10 – Home Edition (мы её ласково называем «хомяк»). «Домашняя» версия нашего любимого продукта создавалась на тех же технологиях, что и Professional Edition (возможно, вы уже читали о нём на Хабре), но в ней меньше функций. «Лёгкий» (читай: дешёвый) FineReader 10 уже давно ждала студенческая братия – наконец, дождалась :)

Что умеет этот зверь

Словари ABBYY Lingvo на Mail.ru

Reading time1 min
Reach and readers5.2K
Lingvo продолжает шагать по планете по просторам рунета. С сегодняшнего дня им могут бесплатно пользоваться все посетители Mail.ru – для этого нужно просто зайти на закладку «Словари». В основе сервиса лежит портальное решение ABBYY Lingvo Web Server с Web API.

image

Что умеет эта штука?
2

Information

Rating
Does not participate
Registered
Activity