Как стать автором
Обновить
1
0

Пользователь

Отправить сообщение

Почему мы в «Дадате» тратим 2 млн долларов в год на 99,99% точность обработки данных

Время на прочтение6 мин
Количество просмотров13K

Вы когда-нибудь задумывались, почему вообще возможно исправить ошибки и опечатки в текстовых данных, например, в адресах и именах? Почему мы думаем, что «Терская» — это, скорее всего, Тверская улица, а не какая-нибудь фантастическая улица Василиятёрского? А вдруг это Комсомольский проспект, в котором сделано двадцать опечаток?


Наш жизненный опыт говорит о том, что упорядоченные низкоэнтропийные состояния менее вероятны, чем высокоэнтропийные неупорядоченные. То есть «Терская» скорее Тверская с одной опечаткой, чем Комсомольский проспект с двадцатью опечатками. Однако в жизни возникает много спорных случаев, где вероятности не так однозначны.

Читать дальше →
Всего голосов 34: ↑30 и ↓4+26
Комментарии28

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность