Как стать автором
Обновить
1
0

Пользователь

Отправить сообщение
Я заметил, что на Рис. 1. Методологии бизнес-процессов есть Casewise и CW, что как я предполагаю одно и то же в контексте. Хочу заметить, что такого продукта и бренда в настоящий момент уже нет. Это все ушло в erwin.
Имел честь получить эту задачку на экзамене в Киевском инженерно-строительном институте (АСУ, инженер системотехник) от А. М. Шарадкина + А.М. Щербаня в 1985 кажется… Три вопроса билета по 1 балу, плюс любые от преподавателя дополнительные для дополнительных баллов. И вот эта — для получения «четверки», необходимой для стипендии. Вспомнились муки :-) Но «4» было… Ситема была — ответил=+1, нет = -1… :-) Бесконечное количество дополнительны вопросов по желанию улучшить итоговый бал… :-) Свободный выход из аудитории и консультаций или с сокурсниками, ну или в библиотеку :-)
Я дам три отчасти синтетических, отчасти реальных примера. Мне кажется это даст представление о чем писал я. Все три примера после анализа человеком адресуются в одну группу исполнения:
1.Русский:
"… От сотрудника прямого контакта поступил запрос: «Отсутствуе возможность активации номера ХХХХХХ (л/сХХХХХХХХХХ)» Просьба помочь в данном вопросе. Спасибо!..."
2. Украинский:
"… Від працівника прямого контакту надійшов запит: «Відсутня можливість активувати номер ХХХХХХ (о/рХХХХХХХХХХ)» Прохання допомогти у цьому питанню. Дякую!..."
3.«Суржик»:
"… От сотрудника прямого контакта поступил запрос: «Відсутня можливість активувати номер ХХХХХХ (л/сХХХХХХХХХХ)» Просьба помочь в данном вопросе. Спасибо!..."

Это три комбинации. Причем «суржик» может иметь больше вариаций. То что делал я, переводил пословно без учета контекста на английский с задачей распознания языка слова источника. Распозначание языка слова источника не всегда срабатывает. Или срабатывает неверно, может определить источник как скажем словацкий язык, с совершенно другим значением и как следствие — переводом… Вот здесь проблема таких задач…
Поясню еще — «суржик», это когда в одном предложении могут быть и русские и украинские слова с соответствующим написанием. Такие предложения люди в Украине воспринимают и понимают без проблем. И алфавит русского и украинского языков несколько отличен :-) Так что решение совсем не простое… И я его, в этой части к сожалению, не вижу…
Я прошел тот же путь. Задача была не класификация. Было обучение с учителем. Т. е. был доступен датасет с историческими данными обращений и направлениями в определенную рабочую группу (одну из 80) для решения. Определение группы. Остановился на достижении необходимого качества. Основная проблема с которой столкнулся — это подготовка данных и… «суржик». Обращения пользователей в моем случае — это обращения пользователей живущих в Украине. Тексты могут быть на украинском языке, на руссском и «суржике», т. е. смеси двух языков. Пытался решить проблему переводом на английский с определением исходного языка используя Google Cloud Translation API… Качество стало лучше, но не достаточно… Путей решения пока не вижу.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность