Обновить
0
@Ivan25read⁠-⁠only

Пользователь

Отправить сообщение

В Кремниевой Долине начинает формироваться мрачный консенсус по поводу детей и экранов

Время на прочтение5 мин
Охват и читатели42K

«Убеждена, что в наших телефонах живёт дьявол»




Люди, ближе всего находящиеся к явлению, часто относятся к нему настороженнее других. Технологи знают, как на самом деле работают телефоны, и многие из них решили, что не хотят, чтобы к ним прикасались их дети.

Медленно растущее беспокойство превращается в повсеместный консенсус: преимущества экранов в качестве устройства для обучения преувеличены, а риски привыкания и замедления развития велики. Сейчас в Кремниевой Долине спорят по поводу того, какое время использование телефонов считать нормальным.

«Полностью запретить доступ к телефону кажется почти более лёгким делом, чем ограничить его», — сказала Кристин Стечер, бывшая исследователь социальных вычислений, замужем за программистом из Facebook. «Если мои дети получают немного доступа, им хочется больше».
Читать дальше →

Программный модуль оцифровки поврежденных документов

Время на прочтение6 мин
Охват и читатели5.5K

Оптическое распознавание символов (OCR) — это процесс получения печатных текстов в оцифрованном формате. Если вы прочитали классический роман на цифровом устройстве или попросили врача поднять старые медицинские записи через компьютерную систему больницы, вы, вероятно, воспользовались OCR.


OCR делает ранее статический контент доступным для редактирования, доступным для поиска и для обмена. Но многие документы, нуждающиеся в оцифровке, содержат кофейные пятна, страницы с загнутыми уголками и множество морщин сохраняют некоторые печатные документы в не оцифрованном виде.


Всем давно известно, что существуют миллионы старых книг, которые хранятся в хранилищах. Использование этих книг запрещено по причине их ветшалости и дряхлости, и поэтому оцифровка этих книг столь важна.


В работе рассматривается задача очистки текста от зашумленности, распознавание текста на изображении и конвертации его в текстовый формат.


image


Для обучения использовалось 144 картинки. Размер может быть разным, но желательно должен быть в пределах разумного. Картинки должны иметь формат PNG. После считывании изображения используется бинаризация – процесс преобразования цветного изображения в черно-белое, то есть каждый пиксель нормализуется в диапазон от 0 до 255, где 0 – это черный, 255 – белый.


Чтобы обучить сверточную сеть, нужно больше изображений, чем имеется. Было принято решение разделить изображения на части. Так как обучающая выборка состоит из картинок разного размера, каждое изображение было сжато до 448х448 пикселей. В результате получилось 144 изображения в разрешении 448х448 пикселей. После чего все они были нарезаны на неперекрывающиеся окна размером 112x112 пикселей.

Читать дальше →

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность