
Комментарии 4
Еще одна статья как "иишка написала мне приложение, как круто"! Скучно, таких можно писать по 5 за вечер, с иишкой, 10..
Мне было нескучно, хотя целевая задача и не актуальна. За потраченную на статью минуту-две, вынес для себя 2 момента:
идея (вроде бы лежащая на поверхности, но не совсем очевидная) - использование OCR с экрана прибора. Пригодится ли? Не знаю. Но идея интересная, её обдумывание может привести к чему-то.
OCR библиотеки могут сильно отличаться по качеству (если я когда-нить решу что-то подобное делать, то буду делать так же через ИИ, ибо стек совсем не мой). Такие моменты в общем - полезны, ибо дают направления, куда смотреть.
Сейчас ИИ дают колоссальную свободу в написании программ "под себя", этакий DIY в софте. Читаешь чужие проекты - что-то, нет-нет и сам сделаешь.
Спасибо, именно за этим и пишу — не «вот готовое решение», а «вот направление куда смотреть». OCR с физических приборов — действительно недооценённая ниша, тонометр это просто удобный личный кейс. Та же логика работает для любых промышленных дисплеев, счётчиков, панелей управления. Во второй части будет сам CV-пайплайн с камерой — там уже детали реализации, а не только выбор стека.
Понимаю скепсис — статей «ИИ написал за меня» действительно много. Но здесь немного другой угол: не «смотрите что сгенерировал ChatGPT», а как CV-инженер разбирается в незнакомом стеке и какие решения принимает на каждом шаге — выбор нативного Vision framework вместо ML Kit, валидация OCR через физиологические ограничения вместо чистого regex, архитектурные решения. Во второй части будет реальный CV-пайплайн с AVFoundation и ROI-детекцией — там уже меньше про «ИИ написал» и больше про инженерные решения.
BP Tracker: считываем давление с тонометра камерой iPhone. Часть 1 — выбор стека и первый экран