Я написала выше — это нужно, если хочешь нанимать классных программистов. Когда люди видят, что у компании хорошая экспертиза в какой-то технической теме, это очки в пользу работодателя.
Писать понятно для всех — это, конечно, хорошо, но не стоит этим ограничиваться. У корпоративных блогов есть и техническая аудитория — про это важно помнить, особенно если вы хотите рассказывать о компании потенциальным сотрудникам-технарям. Вот был у меня в корп.блоге автор, который писал про C++ и компиляторы — самые рейтинговые посты были. Я (как гуманитарный редактор) сама понимала в них далеко не всё, но читатели были довольны, и компании польза.
«Нормализация» должностей и объектов к заранее заданным справочникам действительно требует учёта контекста и разрешения лингвистических явлений таких как анафорические связи, эллипсис и омонимия. Это может быть выполнено как с помощью чистого семантико-синтаксического разбора, так и гибридным подходом с использованием машинного обучения и семантических разборов. Оба этих подхода поддержаны в движке ABBYY Comrpeno на технологическом уровне.
Информационную модель, которую необходимо получать на выходе парсинга разрабатывала Эвола. Алгоритмы извлечения (включённые в онтологии) разрабатывали специалисты ABBYY. Алгоритмы основаны на базовом семантическом разборе, который уже давно есть в Compreno.
У ЭВОЛА есть инструмент анализа резюме для SAP HR Human Capital Management с нашим ABBYY Compreno внутри. Он умеет автоматически анализировать входящие резюме, проверять, насколько они соответствуют открытым вакансиям, и выявлять значимую информацию о кандидатах. Информацию может извлекать самую разную, список длинный и может меняться\дополняться по потребностям пользователя. В общем виде это так (не обидитесь, если скопирую из пресс-релиза?):
Личная информация (ФИО, пол, дата рождения/возраст, семейное положение, гражданство);
• Контактная информация (телефон, e-mail, skype и др.);
• Желаемая должность и пожелания по уровню дохода;
• Опыт работы (период работы, название компании, сфера деятельности компании,
• должность, отдел, обязанности, стаж);
• Образование (год выпуска, название учебного учреждения, факультет, кафедра, специальность, специализация, квалификация);
• Уровень владения иностранными языками;
• Знание программного обеспечения и технологий;
• Личные качества, хобби;
• Рекомендации (ФИО, должность, компания).
Здравствуйте! Я из ABBYY. Наши разработчики прочитали ваш комментарий и просили передать, что завели рекламацию и будут исправлять этот момент в файнридере.
Вот что мне рассказали в команде, которая делала проект:
«Гендерный вопрос что в Индии, что в Бангладеш, стоит очень остро (начиная с доступности образования, заканчивая личной безопасностью) — общества более патриархальные и традиционные, чем у нас. Религия тоже накладывает свои особенности.
>>В соседней Индии девушки в ИТ секторе представлены очень даже широко на всех позициях.
Далеко не на всех позициях и не во всех компаниях. В основном, в международных «гигантах» типа TCS, Wipro и филиалах иностранных компаний — там есть квоты на % девушек в коллективе. По своему опыту могу сказать, что в Индии на бизнес-встречах крайне редко присутствовали девушки, обычно они заняты в секторе BPO эникейщицами, секретарями или в административном персонале. И это в международных компаниях, а в SMB сегменте в ИТ практически нет девушек».
В общем, думаем, что на фото нет девушек именно из-за этих особенностей.
Перепись проходила в 2011 году — в статье это упомянуто.
Ещё в некоторых странах по законодательству нужно хранить материалы переписей и любые другие документы с государственных проектов в бумажном виде (у любого электронного документа должен быть бумажный оригинал). Мы не знаем точно, но, возможно, в Бангладеш так же.
Форма была сделана так, чтобы её понимали участники переписи, сами переписчики, и софт который распознаёт только английский текст.
Для нашего софта при обработке фиксированной формы достаточно «ключевых» слов на английском, чтобы правильно определить секцию с ответами, а варианты подписанные под чекмарками, нужны только во время заполнения анкеты.
В Бангладеш, как в бывшей британской колонии, многие официальные документы дублируются на английском. Также английский используется в гос. учреждениях: https://en.wikipedia.org/wiki/English_in_Bangladesh и преподаётся в школах. Так что простые фразы понятны всем местным. Более сложные конструкции написаны на бангла – чтобы точно никто не запутался.
Буквы-подсказки в чекмарках бледно-розового цвета и исчезают после сканирования с color drop-out. Кроме пункта религии таким же образом сделаны поля дат (DD/MM/YY). Шифровка для религии простая (M- muslim, H – hindu, B- buddist, C- Christian, O- other) https://en.wikipedia.org/wiki/Religion_in_Bangladesh,
а переписчики обязательно проходят инструктаж/обучение по заполнению анкет.
Информационную модель, которую необходимо получать на выходе парсинга разрабатывала Эвола. Алгоритмы извлечения (включённые в онтологии) разрабатывали специалисты ABBYY. Алгоритмы основаны на базовом семантическом разборе, который уже давно есть в Compreno.
Личная информация (ФИО, пол, дата рождения/возраст, семейное положение, гражданство);
• Контактная информация (телефон, e-mail, skype и др.);
• Желаемая должность и пожелания по уровню дохода;
• Опыт работы (период работы, название компании, сфера деятельности компании,
• должность, отдел, обязанности, стаж);
• Образование (год выпуска, название учебного учреждения, факультет, кафедра, специальность, специализация, квалификация);
• Уровень владения иностранными языками;
• Знание программного обеспечения и технологий;
• Личные качества, хобби;
• Рекомендации (ФИО, должность, компания).
«Гендерный вопрос что в Индии, что в Бангладеш, стоит очень остро (начиная с доступности образования, заканчивая личной безопасностью) — общества более патриархальные и традиционные, чем у нас. Религия тоже накладывает свои особенности.
>>В соседней Индии девушки в ИТ секторе представлены очень даже широко на всех позициях.
Далеко не на всех позициях и не во всех компаниях. В основном, в международных «гигантах» типа TCS, Wipro и филиалах иностранных компаний — там есть квоты на % девушек в коллективе. По своему опыту могу сказать, что в Индии на бизнес-встречах крайне редко присутствовали девушки, обычно они заняты в секторе BPO эникейщицами, секретарями или в административном персонале. И это в международных компаниях, а в SMB сегменте в ИТ практически нет девушек».
В общем, думаем, что на фото нет девушек именно из-за этих особенностей.
Ещё в некоторых странах по законодательству нужно хранить материалы переписей и любые другие документы с государственных проектов в бумажном виде (у любого электронного документа должен быть бумажный оригинал). Мы не знаем точно, но, возможно, в Бангладеш так же.
Для нашего софта при обработке фиксированной формы достаточно «ключевых» слов на английском, чтобы правильно определить секцию с ответами, а варианты подписанные под чекмарками, нужны только во время заполнения анкеты.
В Бангладеш, как в бывшей британской колонии, многие официальные документы дублируются на английском. Также английский используется в гос. учреждениях: https://en.wikipedia.org/wiki/English_in_Bangladesh и преподаётся в школах. Так что простые фразы понятны всем местным. Более сложные конструкции написаны на бангла – чтобы точно никто не запутался.
Буквы-подсказки в чекмарках бледно-розового цвета и исчезают после сканирования с color drop-out. Кроме пункта религии таким же образом сделаны поля дат (DD/MM/YY). Шифровка для религии простая (M- muslim, H – hindu, B- buddist, C- Christian, O- other) https://en.wikipedia.org/wiki/Religion_in_Bangladesh,
а переписчики обязательно проходят инструктаж/обучение по заполнению анкет.