Комментарии 56
Круто! А можно где-то скачать обученные модели? Хочу опробовать на видео с регистратора.
Если вы про центры регионов, то так как Горно-Алтайск совсем небольшой, является местной столицей, а чиновники любят ездить с удобствами, то дороги в нем очень даже хорошие, особенно по сравнению со средним российским «стотысячником».
Так что если у вас данные только по городам, то итоговые результаты как минимум по РА вызывают большие вопросы.
Посмотрел на "худшие" города Керчь и Биробиджан на панормах Яндекса — обычные дороги, далеко не то, что я представляю после пугающего словосочетания "русские дороги".
Отличная статья!
Но… я живу в Марий Эл и могу с уверенностью сказать, что дороги здесь хуже, чем в большинстве других регионов.
Сколько, если не секрет, стоила разметка данных?
Сколько, если не секрет, стоила разметка данных?
Разметка обошлась где-то в 15 $ (с учетом тестовых прогонов).
Если 30000 размеченных фотографий, получается около 3.5 копеек за фото. Это реально так дешево?
да правильно, минусуйте ) правда она такая.
Почему в качетсво не вложен момент дорожных знаков и трафика?
Вы правы качество дорог комплексный показатель. Я оценивал только один его аспект в силу ограниченности моих ресурсов (в основном временных) по разработке и разметки данных.
Так же не понятно как вы определяете более детальный состав из чего состоит полотно. Каким машинам разрешено ездить и всякое такое.
Я этого не определяю, я исхожу из того что дорого должна быть ровной. Неважно ездят по ней только микролитражки и скутеры или фуры с тракторами. Это вопрос к тем кто эту дорогу проектировал, строил и обслуживает.
вариант панорам Гугла я исключил, т. к. сервис представлен в меньшем количестве городов России и обновляется реже
Зря, по моему опыту у них даже побольше панорам (в свежести не уверен). Есть, например, почти все федеральные трассы, тогда как у Яндекса только города.
Ну и правильней было бы составить что-нибудь вроде максимального остовного дерева дорог по загруженности и анализировать только его. А то может получиться так, что в где-нибудь энтузиасты отсняли кучу второстепенных малоиспользуемых дорог и испортили рейтинг.
Так что, скорее всего, на горизонте лет 3х, мы получим такой инструмент, но будет его делать какая-нибудь большая корпорация за очень много денег для богатых клиник
Врачебная тайна тут совершенно ни при чём по тому что никто не должен разглашать что у Василия Пупкина сифилис, а всего лишь в наборе данных рамечено, что меланома в случае номер восемь.
И разметка эта уже выполнена высококвалифицированными специалистами. Ведь в сети клиник все рентгенограммы, анализы, ЭКГ, МРТ и пр. уже отсканированы и вложены в электронные медкарты и к каждой сделано заключение — а это и есть разметка.
Даже в каждом МРТ кабинете есть все цифровые снимки, сделанные в нём и к каждому снимку сделано заключение.
Попиксельная разметка где-то нужна, где-то нет. В ЭКГ нечего попиксельно размечать. Разметка является проблемой для программиста-одиночки, но не для сети медклиник. А есть ещё условно-бесплатные студенты-медики, которые вполне способны камни в пузыре размечать в рамках своей практики — за пятёрки :-).
Кстати, по точности требования не такие жёсткие. Если алгоритм будет выявлять подозрения на патологию, дальше уже материалы можно передавать специалисту для диагноза. Так и дообучится.
Т.е. датчики нужно ставить на колесо, а не после системы амортизации — где в угоду клиенту стараются отсечь всяческие дорожные изъяны (смартфон с приложением прикреплён на стекло/корпус авто)
Думаю, именно этому на разных интенсивах по big data как раз и обучают.
1. Картинка с полной таблицей для городов кривая, там сейчас что-то мелкое и не то.
2. До скольки знаков округлялись проценты при ранжировании регионов? Явно не до целого знака, хотя на картинках они приведены в целых значениях и из-за этого возникает когнитивный диссонанс, т.к. многие регионы нужно менять местами. Например:
имхо, при равенстве у нескольких регионов (в целых процентах) количества хороших дорог, нужно было ранжировать по количеству дорог среднего качества. А то когда регион с 64% хороших дорог и 31% средних дорог находится ниже, чем регион с 64% хороших и 18% средних — это огорчает.
2.1. Либо вообще стоило отказаться от ранжирования по количеству хороших дорог, а ранжировать по кумулятивному показателю вида: (доля хороших дорог)*2 + (доля средних дорог)*1
3. Если верить вики, то примерно в половине регионов единственный город с населением 100k человек — сам областной центр, в этом случае рейтинг региона = рейтингу одного города, что не совсем корректно.
Картинка с полной таблицей для городов кривая, там сейчас что-то мелкое и не то
Проблема с Habrastorage — моя картинка 8k px по высоте, а он принимает максимум 5k px. Я думал обмануть его и залил на сторонний хостинг, но Habrastorage оказался хитрым и мстительным — скачал картинку себе, кропнул и уменьшил ее. Сейчас сделал картинку кликабельной.
До скольки знаков округлялись проценты при ранжировании регионов?Ранжирование проводилось с числами в формате float32. Согласен по поводу введения формулы ранжирования, учитывающей все показатели, но боюсь, что введение любой формулы вызовет не меньшие споры по поводу ее адекватности.
Если верить вики, то примерно в половине регионов единственный город с населением 100k человек — сам областной центр, в этом случае рейтинг региона = рейтингу одного города, что не совсем корректно.Скажу даже больше — многие областные центры имеют меньше 100k. К сожалению покрытие панорамами в малых городах оставляет желать лучшего. Время на разработку, ресурсы домашнего компьютера и прочие факторы вынудили поставить планку по количеству городов для анализа в том виде в каком она представлена в статье.
А я то думал, будет road trip.
В голову приходит выбор случайных точек в границах населенного пункта из графа дорог (например, из базы Openstreetmap, с учетом направления), и подстановка этих точек + направления взгляда в URL панорамы, но наверняка есть более простые способы.
Делаем рейтинг городов России по качеству дорог