Как стать автором
Поиск
Написать публикацию
Обновить

Некоторые особенности голосового ввода на реальном производстве

Время на прочтение8 мин
Количество просмотров6.1K
Всего голосов 36: ↑36 и ↓0+36
Комментарии40

Комментарии 40

у китайцев видел в аналогичной ситуации сидит китаянка, у нее китайские электронные штанген и рейсмус, на них кнопки, она меряет, давит кнопку, данные уходят (по блютуз скорее всего, но там может и кастомный радиопротокол, китайцы такие китайцы).

в принципе если инструмент не сложнее штангена и микрометра - отличная схема, но если там кастомная оснастка какая то да, человека посадить удобнее

Вот это наверное самый перспективный подход

Инструмент на заводе весь поверенный и сертифицированный три раза, купить штанген с блютусом - это будет только первый шаг на длинном и дорогом пути, лайт версия с автоматизированным измерением, описанным автором в статье, считай.

ну в моем наблюдении китайский полуподвал, где штангена с его 5соток точности вполне, а тут может быть вполне себе топовое производство, где допуски в микрометрах меряются, но да, человек как прокладка между измерительным инструментом и базой данных выглядит как костыль)

"Штангель -- это просто калиброванная рука." По-английски даже прямо так и называется -- caliper, калибр, а разговорно так вообще scale. Штангель прикладывает по-любому человек, и от навыка прикладывания у человека зависит ну вот приблизительно всё.

Блютус, конечно, делает всё лучше. Но качественный и надежный в условиях цеха беспроводной инструмент, даже штангель с контролем усилия и помехоустойчивым мощным модулем связи/приемником (каковых еще поискать на рынке), требует совсем непростого софта на базе САП, и гибкого взаимодействия с этим софтом, либо очень кастомной тулзы и разработчика этой тулзы в шаговой доступности. И там кончно нужен интерактивный ввод с контролем и редактированием... ну или голосовой интерфейс, штатно отрабатывающий "&%$! @#$%& сказал, дык, там 72.3 заушина, абономат".

Ну а совсем уж высший пилотаж, -- это калиброванный 3Д-сканер с кастомым софтом на борту, что-то вроде Artec Leo, но там экономика мягко говоря взрывается уже на этапе разработки.

Ваш К. О.

Можно стукнуть молоточком, деталь должна откликаться на определенной частоте. При любом отклонении собственная частота колебаний будет изменяться. Может отсюда что-то удастся вытащить.

вряд ли это будет работать в условиях шума станков и производства

Это надо конкретно смотреть. Для начала надо взять эталонную деталь и разные дефектные и сравнить отклик где-нибудь в тихом месте, работает ли вообще.
Второй момент - а почему вообще может возникать брак? То есть 10 деталей нормально, а 11-я с брачком? А потом опять все нормально? Типа заготовка может встать кривовато и от этого брак?

Так обычно и бывает. Или заготовка неформатная. Или свойства материала отличаются от среднего (партия материала сменилась, к примеру), или толщина (на толщину например есть допуски, и вам может на стадии отработки технологии попасться партия вблизи минусового допуска, а потом снабженцы купят вблизи плюсового. И то и то соответствует стандартам, а если вы требуете точность выше стандартов, с вас могут содрать три шкуры или вы не найдете поставщиков, если вы маленький и небогатый)

Метод свободных колебаний называется. Геометрические параметры так не снять, если нужно точнее чем плюс-минус лапоть

На частоту колебаний влияет ещё и состав материала детали, а он не бывает всегда на 100% стабилен. От партии к партии что-то, да различается.

А почему нельзя автоматизировать сам процесс контрольных измерений?

В основном потому что это дорогостоящий и не особо рентабельный проект, так как нужно дополнительно оборудовать каждый станок.

Подробнее об этом — в самой статье, часть «Почему деталь измеряет рабочий, а не автоматика?»)

но это ж явный регресс.

Просто нажать на ручном терминале кнопки 7, 2, Ентер будет быстрее, проще и понятней. Терминал в ударопрочном корпусе с экраном который можно нажимать в промасленных перчатках стоит порядка 100т.р.

А тут вы всем работу нашли. Программисты программируют, рабочие обучаются, отдел обучения проводит семинары "как правильно произносить цифры", отдел кадров при приёме на работу проверяет чтоб у рабочего не было дефектов речи и он хорошо говорил по-русски.

Терминалу нужны свободные руки.То есть двумя руками рабочий измеряет, а ещё двумя - вводит информацию в терминал. Если же "измерил- ввёл" - не особо отличается от похода к компьютеру, измерялку придётся положить.

это не на чём не основанное предположение об условиях работы.

Не надо стегать мёртвую лошадь. Это плохая реализация ввода которую придётся исправлять.

Сразу вот это всё голосовое выбросить нельзя т.к. потрачены огромные деньги и собственник накажет за неверное решение. Ему ж перед внедрением рассказывали с про большой театр бороздящий просторы, обещали что всё круто будет, а тут такая подстава в результате.

Где-то через год можно будет по-тихому купить обычные терминалы сбора данных и внедрить что-то нормальное.

Я такое не раз встречал. Ничего особенного. Лучше бы такого избегать, но такова жизнь.

Проблема в том, что на рабочем месте человек сидит в специальных перчатках, и вводить данные на компьютере всё равно не может. Зато может карандашом ставить отметки в бумаге.

То есть вместо стандартного интерфейса ввода отчёта и стандартной клавиатуры планшета (которая тоже умеет использовать голосовой ввод) сделали "мастер" с голосовым озвучанием интерфейса с вводом ответов голосом?

Надеюсь планшет хотя бы показывает обратную связь для рабочего, чтобы ему не приходилось переспрашивать?

Сделали голосового ассистента, который идет по сценарию, спрашивая сотрудника поочередно об проделанных им геометрических измерениях. В стандартной клавиатуре планшета использовать голосовой ввод не удалось, потому что нет возможности распознавать большое количество специализированных производственных слов.

Планшет конечно же показывает сотруднику, что именно он вводит, для сокращения времени проверки вводимых данных и поднятия доверия к системе.

Сделали голосового ассистента, который идет по сценарию, спрашивая сотрудника поочередно об проделанных им геометрических измерениях.

До того как появились голосовые ассистенты, в интерфейсах начали использоваться визуальные ассистенты https://ru.wikipedia.org/wiki/Мастер_(интерфейс_пользователя)

В стандартной клавиатуре планшета использовать голосовой ввод не удалось, потому что нет возможности распознавать большое количество специализированных производственных слов.

Насколько кастомизировать голосовой ввод было проще чем добавить большое количество специализированных производственных слов в выпадающие списки интерфейса или на крайний случай словарь клавиатуры?

Добавление большого количества специализированных производственных слов в выпадающие списки неудобно тем, что сотрудник будет вынужден руками тыкать в списки. Нам же нужно, чтобы он не отвлекался от ручных измерений и параллельно вводил данные.

Кастомизация словаря прошла не сложно. Мы вместе с сотрудниками цеха составили глоссарий, отправили в Яндекс и они дообучили свою языковую модель нужными нам словами/аббревиатурами.

Голосовой ввод обычно никому не нужен.

Я себе вот буквально на днях сделал "голосовой ввод", распознающий единственное "слово" - щелчок языком, и интерпретирующий его как команду поставить на паузу видео в активном плэере (youtube в браузере, VLC). Делая что-то по дому, часто слушаю что-то по беспроводным наушникам - типа, я на кухне, мою посуду, и тут вдруг кто-то из членов семьи и домочадцев подходит и начинает чего-то задвигать - обычно надо тарелку в раковину положить, руки сполоснуть, воду закрыть, руки вытереть, в комнату к себе сбегать, паузу на компе нажать, вернуться, сказать: "Давай всё то же второй раз излагай." Дослушав, обратным порядком действий возобновить мытьё посуды. А тут - языком щёлкнул, видео застопорилось, щёлкнул опять - заиграло. Вот только иногда бывают ложные срабатывания на звон тарелок. Потому что "распознаётся", фактически, только резкий пик уровня звука: поставишь слишком высокий порог срабатывания - не с первого раза удаётся достаточно громко и резко языком щёлкнуть, поставишь слишком низкий - то и дело на звяканье столовых приборов реагирует. А прикручивать прям реальное распознавание речи чо-то неохота...

отличная идея. Сразу пришло в голову, что можно срабатывать на два щелчка, чтобы отсеять ложноположительные срабатывания.

Мы примерно прикидывали: нужно около 30–40 миллионов, чтобы просто оснастить автоматикой каждый станок

А что измерять нужно, если не секрет?

Измеряем наружный диаметр, отклонение высоты профиля, отклонение шага, конусность, диаметр расточки, диаметр резьбы, резьбовой калибр, натяг.

Можно повесить 4 2d сканера на раму и прогонять трубу через неё, и математика там несложная. А у вас с каким подходом столько денег на рабочее место получилось?

В посте, в разделе "Почему деталь измеряет рабочий, а не автоматика" подробно рассказываем почему не пошли в использование автоматики в данном кейсе.

У меня очень странный вопрос, скорее всего на который имеется вполне логичный ответ, но в рамках статьи я его не увидел (недопонял). Какова реакция системы на выход одного из измерений за расчетный параметр? Станок ведь останавливается для перенастройки, верно? Разбор полетов там, так ведь? При ЛЮБОМ неверном измерении? Может к каждому контролеру (не путать с контроллером)))) вместо навороченного планшета просто провести большую кнопку СТОП? (или пару кнопок, если действительно разница есть). А голосом он уже наладчику будет в понятных терминах объяснять что пошло не так?

Если какой-либо параметр выходит за норматив, то да, станок останавливают и проверяют настройки и режущий инструмент. Не совсем понял на какие контроллеры вешать кнопки СТОП и кто на них будет нажимать))

Отличный рассказ, спасибо.

Проблема в том, что на рабочем месте человек сидит в специальных перчатках, и вводить данные на компьютере всё равно не может. Зато может карандашом ставить отметки в бумаге. 

А почему нельзя сделать клавиатуру с кнопками размером с кулак?

Можно, но штангенциркуль из рук все равно придется выпустить.

Решение с голосовым вводом данной задачи выглядит как "Надо повысить наукоемкость производства, например, внедрить ИИ, придумайте там что-нибудь".

Еще Вы пишите "рабочий склонен к ложноположительным ошибкам", но при этом делаете голосовой ввод значений - не будет ли рабочий умышленно говорить "нужные", а не измеренные числа?

Может лучше ему выдать электронный штангенциркуль с передачей данных (есть блютузные, есть проводные, опредяются как клавиатура), да монитор поближе переставить, чтобы значения по кнопке записывались куда надо? Возможно понадобится пульт с тремя кнопками, но его как угодно можно делать, лишь бы перчатки нажимать позволяли. Пульт с тремя кнопками "отменить предыдущий замер", "начать замер изделия сначала" и "отправить замер" - тут прикинуть надо, какие нужны.

Изменение процесса ввода значений не приводит к изменению принятия решений у рабочих.

Насчет электронного штангерциркуля и поставить поближе монитор подробно написано в статье, почему мы не стали так делать.

Во-первых, это просто великолепно:

требовать немедленной реакции на специальном заводском языке, преимущественно состоящем из коротких специальных контекстно зависимых терминов.

Во-вторых, если рабочий может держать карандаш в перчатках, то он может этим же карандашом (или любой другой палкой) нажимать кнопочки цифровой клавиатуре 3х4 (или чуть больше). Тот же мастер будет его водить от поля к полю и просить вводить данные. Эффект примерно тот же, но не нужен ни голосовой помощник, ни даже тачскрин.

НЛО прилетело и опубликовало эту надпись здесь

Мы как раз сейчас пробуем использовать whisper v3 для запуска бота по ключевой фразе.

НЛО прилетело и опубликовало эту надпись здесь

Цифры хорошо распознает, а вот со словами пока есть проблемы. Разбираемся как можно можно поднять точность. Если есть мысли как это можно сделать, буду рад))

Воск использовать с адаптацией словаря https://alphacephei.com/vosk/lm

Как высказались в комментариях 2д сканер или умный измерительный инструмент будет гораздо более правильным решением.

Что касается голосового ввода, то очевидно, что вам надо искать edge SDK, а не Клауд. То есть, если отбросить всю остальную критику и принять ваш подход правильным то cloud - самый большой concern для всей архитектуры. Как максимум - локальный деплой, однако edge это самое правильное.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий