Мысли вслух или «что останавливает прогресс ?»

    Я не особо умный человек. У меня нет достижений ни в сфере веб-дизайна, ни в сфере маркетинга. Даже работа моя не особо оригинальная. Я уверен что большинство из вас – талантливые люди, которые достигли в жизни намного большего, чем ваш покорный слуга. Но почему-то даже я, простой житель этой планеты, иногда вижу вещи такими, какими они могли бы быть.
    — Почему они еще этого не сделали? — спрашиваю я себя. У меня ответа нет…

    Я не льщу себе, думаю многие из вас уже думали, или подумывали о том, что я сейчас озвучу: идеи просты. Но почему никто это еще не реализовал — непонятно.

    Например, я думаю, многие из вас видели ролик, в категории «Будущее здесь», в котором актер наводит многофункциональный кпк на здание и получает информацию по этому зданию, 3d модель и прочее. Я тогда подумал: эти ребята умеют искать идеи. Ведь действительно, мало кто мог придумать подобный сервис. При чем он действительно станет очень удобным и популярным. Я намеренно употребляю слово «станет», а не «может стать». Это очевидно.



    Но этот сервис еще не реализован, хотя реализация не так уж и сложна, как кажется на первый взгляд.
    Давайте рассмотрим, что нам надо для того, что бы воплотить подобное в реальность.
    Во-первых: нам нужна возможность распознать здание на телефоне. Этот этап кажется самым сложным, но учитывая современное развитие технологий и здравый смысл мы опровергнем данное утверждение. Главное не бояться и мыслить поэтапно.
    Попробуем представить структуру того, что мы видели так, как если бы оно работало:

    1) Считывание данных (фотография, потоковое видео).
    2) Отправка данных на сервер для обработки.
    3) Собственно обработка.
    4) Получение данных с сервера.

    Мы с вами знаем, что в нынешний век маркетинговых уловок, почти в каждом фотоаппарате есть мобильный телефон с возможностью доступа в Интернет мобильном телефоне есть фотоаппарат, так же доступ к сети Интернет. Многие города покрыты 3g, или даже WiMAX. Почти везде есть доступ к интернету по GPRS или EDGE. Сведя эти две прямые мы можем сделать вывод, что отправить не “тяжелую» фотографию на сервер получится почти везде. А при определенных условиях – можно отправлять и потоковое видео. Или вместо потокового видео – цикл изображений.

    Допустим первый и второй пункты нашего очень простого плана – исполнены: мы можем передавать информацию на сервер. Но зачем серверу фотографии? Думаю самые догадливые поняли это с самого начала и я их отвлекаю своей трепотней, но потерпите немного.

    Все из вас знают такого гиганта IT индустрии, как Google. Многие из вас выбирают его поисковик, как основной. Всех вас привлекает богатый функционал и удобный поиск. А так же постоянное развитие проекта. Добавлений новых функций и возможностей. И это классно.
    Так вот. У гугла есть один замечательный сервис Similar Images . Думаю, многим из вас он знаком, и вы даже неоднократно им пользовались. Для остальных поясню: этот сервис ищет похожие изображения. Вы можете перейти по ссылке и более подробно посмотреть информацию по данному сервису. Ну а я пока вернусь к нашим баранам.

    Перейдем к пункту три. Допустим, отправим мы фотографии, а что дальше? Мы можем сфотографировать здание с различных позиций и передать фотографии на сервер, где каждой фотографии присвоить метку, ну например «Пизанская Башня». Достаточно просто. К каждому зданию – отдельная метка. Вы спросите: «Какой в этом прок? Ведь сфотографировать с всех ракурсов невозможно». И вы будете правы. Действительно невозможно сфотографировать с всех сторон. Но мы ведь уже знаем, что есть различные механизмы распознавания изображений. Имея в наличии движок распознавания, и большого количества фотографий мы можем любую фотографию здания, сделанную любым устройством распознать, как фотографию этого здания. Остался вопрос наполнения.

    Сам по себе вопрос наполнения базы зданий ( пусть это будут только здания, для начала ) кажется очень масштабным и сложным. Ведь надо нанять громадное количество операторов и наполнителей базы данных, где будет храниться информация по объектам.
    Действительно, очень сложно. И затратно. Особенно если забыть про то, что на нашей планете живет достаточно большое количество людей, которые готовы совершенно бесплатно помогать в данном проекте, если увидят его перспективы.
    Вот скажите честно, вы бы сфотографировали памятник в своем городе, а свой дом? Ведь это совершенно не сложно и не затратно — сделать две-три фотографии и отправить их на сервер с минимальными комментариями. И если каждый десятый из миллиардов пользователей интернета сделает две-три фотографии какого-либо памятника архитектуры, или просто дома — у нас будет в наличии достаточно большая коллекция изображений с метками. Вроде неплохо.

    Естественно, на первых порах организатору надо будет самому заполнить множество особо крупных и популярных зданий, для того, что бы добавить энтузиазма обычным пользователям, но ведь дальше то в дело вступят обычные люди!..

    Итоговая схема будет выглядеть так: человек направляет камеру на здание и делает фотографию ( или цикл фотографий ), программа отправляет их на сервер для сравнения, получает результат, сортирует по ревалентности похожие снимки и выбирает наиболее похожие. Далее идет считывание метки с фотографии и поиск информации в базе, после чего — отправка данных на обратно клиенту. Всё очень просто. И очень юзабельно.

    Конечно же, это всё затраты. Это и необходимое программное обеспечение для мобильных телефонов, при помощи которого можно вызвать функцию камеры, получить снимок, отправить снимок на сервер и получить ответ. Это и первоначальные затраты. Это и мощность серверов для обработки информации. Но ведь какая перспектива! Это ведь настоящая, полезная функция, а не высасывание из пальца последних соков маркетологами.

    Перспектив множество. К примеру, продвижение мобильной ОС, в которой удобно реализована данная функция.

    Но вот очень сложно понять, почему это еще не реализовано. Ведь идея не сложна. Реализация – для какого то крупного игрока вроде гугла – тоже. Может кто то намеренно притормаживает, что бы выдать это, когда закончатся остальные уловки маркетологов? Но ведь если стоять в стороне – кто то может реализовать и раньше? Вот как вы считаете?

    P.S. Я не редактор и не корректор. Я даже не журналист. Так что если вы нашли какие-то грамматические или стилистические ошибки в моем тексте – обязательно оповестите меня через ПМ. Заранее спасибо =)
    Поделиться публикацией

    Комментарии 46

      +2
      Еще бы привязку к геокоординатам у фотографиях сделать.
      Тогда при наличии девайса с GPS распознавание фото будет намного проще, и ошибок будет в разы меньше.
        0
        А привязка к GPS уже давно реализована в picasa. Вы правы, так будет намного удобнее.
        Тоже, кстати, очень удобный сервис.
          0
          А также в Panoramio, Flickr, Fotki.com и ещё кое-где.

          Причём всюду по-разному, что лично меня дико раздражает.
            0
            Со временем данная фича станет более универсальной, т. к. довольно небесполезна.
          0
          Без привязки сервис просто работать не будет :) Просто вспомните сколько у нас по стране однотипных хрущовок.
            0
            А не обязательно любое здание. Без гпс — только памятники архитектуры или информацию по типу здания. Ну что угодно =)
          –1
          Может не реализовано из за глобального кризиса?
            +2
            Мы делали такую систему, правда не для мобильного использования. С географической привязкой, как заметил комментатор выше. Заказчик быстро охладел к такому проекту. То есть, да, круто, но дальше мысль останавливается. Короче, он не придумал, как это дело монетизировать, и все тихо умерло.
              0
              То есть вы хотите сказать, что прогресс останавливает капитализация? Я имею ввиду не доходно = не перспективно?
              Эту задумку очень трудно реализовать на среднем и низком уровнях развития и популярности компаний, но крупный игрок может извлечь массу пользы.
              Например, как я уже писал выше, гугл может продвигать телефоны на платформе андроид, снабдив его уникальным сервисом взаимодействия с данной функцией. Можно продавать патенты на использование. Я не знаю, я не маркетолог. Но если пофантазировать — можно много придумать способов монетизации.
                0
                > То есть вы хотите сказать, что прогресс останавливает капитализация? Я имею ввиду не доходно = не перспективно?

                К сожалению, да.

                Вот наш заказчик (скорее крупный, чем средний) уже пытался пофантазировать. Как-то не вышло.
              –1
              Честно говоря, мне казалось, что многие работают над таким проектом. Даже я вот скоро буду искать программистов под реализацию мобильного приложения подобного ( как часть большого проекта)
                +1
                Любопытно. Но почему тогда про подобные проекты не трубят на всех углах? Было бы логичным создать ажиотаж и шумиху вокруг себя. Привлечь внимание обычных людей и инвесторов. Но я, человек проводящий часть своего времени в интернете — ничего про это не слышал.
                  0
                  Ну чего шуметь. Что " я собираюсь искать программистов"? Я такой же как и вы написали: "… У меня нет достижений ни в сфере веб-дизайна, ни в сфере маркетинга...". Вот как начну — так и буду создавать ажиотаж. А кричать с тремя страницами на сайте и пятью записями в базе: «Оригинальный, уникальный и востребованный стартап» — неправильно. Лучше отточить идею и знать каждый пункт ТЗ, кажду запятую, каждый шаг влево и вправо и уже после этого реализовывать
                    0
                    >Но почему тогда про подобные проекты не трубят на всех углах?

                    Честно говоря, не понятен Ваш восторг по поводу фичи. Хотите по фотографии строения/местности найти о нем/ней инфу? Почему бы не воспользоваться обычным поиском? Да, не так удобно. Прийдется вбить текст, да и нужно хоть приблизительно знать, что вбивать. Но ведь не невозможно.
                    Вердикт. Да, смотрится эффектно. Да, кому-то эта фича будет полезна. Но на killer app, которая заставит народ поменять свои кпк на «кпк с фичей, imho, не тянет.
                      0
                      С мобильного телефона зайти в поиск и вбить инфу не зная правильного названия? Не очень удобно.
                        0
                        можно пользоваться стационарными телефонами (кстати, по все России стоят по деревням)… любой маркетолог или хваткий парень предложит тысяча и один способ использования технологии. Одна возможность пихать название кафешек рядом с «распознаваемым зданием» создает целую отрасль в рекламе
                    +1
                    Upd. %username%, присоединяйся: как можно монетезировать описанный выше проект?
                      –1
                      Реклама, меню ресторанов, стоимость билета…
                        0
                        Продать гуглу. :)
                        0
                        А ведь у гугла уже есть необходимая база для этого — Street View, Panoramio.
                          0
                          Не забывайте про сервис maps.google.com/?сервис гугла.
                          Многие города уже сфотографированы и оцифрованы. Но я думаю, что информацию по этому зданию, 3d модель и прочее не каждый согласится предоставить/
                          А ещё есть такой сервис.
                          Т.е. картка с фотографиями есть, информация по местам есть (по меньшей мере наполнение идёт), гугл-карта умеет по gps находить где вы находитесь. Остаётся только это объединить вместе.
                          Это я к тому, что "Почему они еще этого не сделали?" не совсем корректно, отсутствует только поиск по фотографии. и если за бугром такой сервис достаточно быстро найдёт применение (и гугл встроит этот функционал в свою карту), то у нас не всё так просто — на МТС wap-трафик стОит примерно полтора рубля за 10 килобайт (в любую сторону), у меня на телефоне мегапикселей не много, но фотографии весят по 400-500 кб, я-то пользую gprs-интернет, где стоимость в разы выгоднее, но многие знают этого, а у некоторых телефоны и не дают толком самостоятельно настроить подключение
                            0
                            Парсер съел ссылку
                            ссылка
                              0
                              * но многие НЕ знают этого, а у некоторых телефоны и не дают толком самостоятельно настроить подключение.

                              Итого фотография будет отправляться достаточно долго и за это с меня возьмут 30-50 руб. А в новые телефоны стараются запихнуть побольше мегапикселей, что стоимость отправки только увеличит. Думаю, что не многие станут ходить по городу и «тратить» на каждом углу деньги.
                                0
                                Ну во-первых, нужна не одна фотография. И не две. Даже не три.
                                Надо много фотографий с всевозможных ракурсов, что бы любую фотографию, с любого ракурса можно было распознать.
                                Информацию по зданию предоставить можно. Не обязательно должна быть 3d модель. Это может быть информация по компаниям, которые есть в этом здании. Или информация по памятнику архитектуры, что угодно.
                                Да и сервис ориентирован изначально на крупные и развитые города. То есть ожидать от него что то в Тибете не стоит. Но вот, например, получить информацию по бизнес-центру в Москве — можно.
                                  0
                                  В общем нужен сервиc, который будет объединять гугл- и яндекс- maps, там и фото со спутника и информация по организациям. А если говорить про крупные города, то можно достаточно не затратно нанять по человеку в городе, который в течение одного-двух дней поездит по городу и сделает побольше фотографий, чего для начала вполне будет достаточно…
                              0
                              Я в восторге от вашего описания разработки.

                              Ваш топик читается так:
                              «Я думаю, сделать самолет — очень просто. Нужно взять паровоз, приделать колеса от форда и слегка доточить его напильником».
                                0
                                Я рад слышать, что вам понравилось, но приведенное сравнение не точно. Вы уверены в том, что прочитали статью?
                                Я не вижу ничего сложно в том, что бы используя существующие рабочие механизмы сделать еще один на их основе.

                                Опять же, я нигде не утверждал то, что это просто. Я просто хотел обратить внимание, что это не так сложно, как могло показаться на первый взгляд.
                                0
                                Думаю, что все достаточно банально, затраты на разработку такого сервиса просто не окупятся… Возможно выводить информацию о здании, офисах в нем и прочую коммерческую информацию — это весьма полезно, но добиться этого можно простым совмещением карты, GPS и компаса (ну и естественно соотвествующего ПО)… А распознавание фотографии и 3D-модель — по-моему абсолютно бесполезная фича, которая только усложнит процесс и приведет к потере потенциального дохода…
                                  0
                                  Естественно компас не в прямом понимании, а что-то вроде этого…
                                    0
                                    Столько людей — столько и мнений. Я, к примеру, наоборот думаю что это было бы удобно и популярно. При чем и без GPS, потому что без него эта функция будет доступна любому кто имеет мобильный и выход в интернет.
                                    А по поводу рентабельности… Окупила себя пикаса? А сервис распознавания изображений?
                                    0
                                    один вопрос — ЗАЧЕМ?
                                      0
                                      Полностью поддерживаю. Вопрос резонный.
                                      Зачем мне 3Д модель, когда передо мной оригинал?
                                      Зачем мне информация о какой-то хрущевке?
                                      О памятниках и более-менее значимых строениях (стадионы, супермаркеты; правительственные здания, наконец ) информацию можно найти тупо по адресу.
                                      О монетизации тоже забывать нельзя.
                                      –1
                                      Все из-за того, что люди, когда видят проблему, думают, «почему ее еще никто не решил?», вместо того, чтобы найти себе проблему по вкусу и хотя бы попытаться ее решить. Вот и вы туда же.
                                        0
                                        Вы пишете комментарии основываясь только на названии статьи?
                                        0
                                        В распознавании мне видится проблема однообразности и шаблонности множества построек, то есть лишь уникальные здания и постройки будут достаточно релевантны.
                                          0
                                          Согласен. По типовым зданиям можно выводить только общую информацию по данному типу строений. А вот если сделать еще и привязку к GPS — можно и по зданию выводить ( правда в данном случае это неоправданно )
                                          0
                                          «Например, я думаю, многие из вас видели ролик, в категории «Будущее здесь», в котором актер наводит многофункциональный кпк на здание и получает информацию по этому зданию, 3d модель и прочее.»

                                          А чем GPS не устроил? Зачем на дом кпк наводить?
                                            0
                                            На мой взгляд, реализация похожа растовую карту, в сравнении с векторной. Просто, при наличии GPS и G-датчика реализовать подобное можно и проще… (пусть при наводке на объект G-датчик скорее всего калибровать придется пока).

                                            Ну, как пример: идет пожилой японец с женой, видит Псковкий Кремль например (GPS в телефоне ведет трек, помнит координаты+направление, вектор-точка есть). Достает свой навороченный мобильник, (G-датчик догадался, откуда мобильник достали, куда повернули, и куда навели; прям wii у него в руках), и как джедай наводит объектив своего девайся на древнюю крепость…

                                            у нас есть точка, на которую в этот момент и узнает все, что хотел узнать о ней (например, рядом с кремлем есть кафешка, туалет, и гостиница).
                                              0
                                              Надеюсь вы шутите ))
                                                0
                                                Технически невозможно? Вердикт?))))

                                                Предыдущий пост к сожалению рваный, из-за CTRL и ENTER (((

                                                Если вкратце: координаты из джопса берем, положение в кармашке из g-sensor'а (+ акселерометр), куда смотрит камера — из акселерометра. На основе этого можно посчитать, куда камера телефона смотрит (если Вы считаете, что на основе этих данных искомое посчитать нельзя — пожалуйста, объясните).

                                                Все перечисленное — без remote requests. то есть client-side. В последнюю очередь обращаемся к тому же гуглу с вопросом: чё там такое? ({я=>тут}, {смотрю=>туда}+ etc.)
                                                То есть, все сводится к обсчету местоположения телефона на момент нажатия кнопки X, и приему остального с сервера.

                                                GPS дает координаты гатжета, g-sensor расскажет, как он лежал в кармане (плюс акселерометр и его трек), на момент вытаскивания телефона. Акселерометр расскажет — куда навели.
                                                  0
                                                  буду только 15-ого, но обязательно прочту
                                              0
                                              распознавание с телефона хорошо реализовано на ukot.ru
                                              сам пользовался. отличо генерит QR код и считывает нужное
                                                0
                                                а как насчет PhotoSynth? :)

                                                www.photosynth.net/
                                                  0
                                                  Слишком усложняете.
                                                  1. Needed: устройство с GPS и компасом.
                                                  2. Пишем софт для различных платформ, в задачи которого входит получение GPS-координат и данных компаса и отправка на сервер.
                                                  3. Обработка запроса на сервере, анализ полученных результатов, выборка наилучшего.
                                                  3. Получение на устройство информации о запрашиваемом объекте.

                                                  Вопрос удаленности пользвателя от объекта можно решить несколькими способами. Либо user defined значение (<200 м, <20м), либо принудительно задать рекомендуемое положение от объекта.
                                                    0
                                                    Реализаций можно много придумать :) Ваш вариант более реален сегодня.
                                                      0
                                                      Можно. Много. Ну так автор же и базирует идею на сегодняшних технологиях :)

                                                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.