Зачем мы ездим на научные конференции?

    Привет, это Smart Engines. Десант из 28 разработчиков систем распознавания на основе искусственного интеллекта только что вернулся из Амстердама, где мы принимали участие в международной научной конференции по компьютерному зрению ICMV. В статье мы постараемся объяснить, почему мы так много времени уделяем науке и ездим на научные конференции.



    Сегодня в мире развития науки и высоких технологий произошла катастрофическая подмена понятий: за науку выдается то, что наукой не является ни в каком приближении, учеными называют программистов и инженеров, наукой называют решение простейших инженерных задач. В информационном пространстве роль фундаментальной науки в развитии технологий явно занижена. Многие забывают, что сенсорный экран айфона — это не сам по себе сенсорный экран айфона, а воплощение в жизнь идей фундаментальных исследований полупроводниковых гетероструктур нашего соотечественника нобелевского лауреата Ж.И. Алферова. Карты Google (или Яндекcа) — это не просто карты в мобильнике, а воплощение фундаментальных исследований в области вычислительной геометрии. И кстати фильм “Аватар” — это тоже на 99% вычислительная геометрия. Машинное зрение, нейросети и искусственный интеллект не исключение: весь этот комплекс работает хорошо и правильно только потому, что в основе лежат фундаментальные исследования. Фундаментальный подход к разработкам с одной стороны, является залогом правильного вектора развития отрасли, а с другой — демонстрирует наводнившим рынок различным стартапам гаражного типа, что фундаментальная наука всегда дает явное преимущество.

    Мы — ученые. Мы — ученые и совершенно этого не стесняемся. Наш стартап (который на самом деле уже давно не стартап, а вполне хорошо работающий бизнес, известный как в России так и за рубежом, развившийся исключительно за счет разрабатываемых технологий без каких-либо инвестиций со стороны государства или фондов) — это про тот самый хайп, который сегодня у всех на слуху: компьютерное зрение, машинное обучение, искусственный интеллект, нейросети — в общем, весь набор слов bullshit bingo, употребление которых, по мнению многих стартаперов, делает проект заведомо успешным. Это, разумеется, не так. Важно, разбираетесь ли вы в существе вопроса. Именно поэтому многие старты из положения up очень быстро оказываются в положении down, а потом в положении out. Потому что не ученые.

    Мы очень редко ходим на собрания стартаперов, визионеров и евангелистов в области искусственного интеллекта. Дело в том, что делать красивые презентации сейчас научились все. Кто не научился — нашел подрядчика. Огромные ресурсы вкладываются в раскрутку и продвижение технологических решений (сначала с целью привлечения инвестиций, а потом с целью оправдания деятельности слабого коллектива), за которыми нет ни новизны, ни эффективности. В красивой обертке презентации, инфографики и анимации, особенно когда в них вплетаются модные и непонятные научные и технологические термины, всегда можно скрыть отсутствие реального смысла деятельности. За многими презентациями нет науки. Это пустота, обернутая в красивую оболочку. Это приманка для инвесторов, которые клюют (или делают вид, что клюют) на блестящие стекляшки и дают деньги непонятно под какие задачи. В реальности в научной составляющей мало кто хочет разбираться, большинство предпочитает обращать внимание на внешнюю сторону «питчинга». Что поделать — презентационная экономика в действии. А мы не про это. Мы про науку.

    Мы ездим на научные конференции. Например, недавно были в Австралии на конференции по распознаванию документов. Россия — и не только она — страна с повышенным уровнем развития бюрократии. Одни, страдая, собирают бумажки, другие с не меньшими страданиями работают с ними. Министерства объявляют конкурсы по цифровизации и автоматизации рутинных процессов, появляются вполне серьезные компании-исполнители, предлагающие свои подходы в этой области. С высоких трибун объясняется, что на этот раз пора заменять не только глаз и руку, что речь идет об искусственном интеллекте, способном разобраться в документах содержательно. И в этом контексте очень странно, что на ведущей профильной конференции из России были только мы и Abbyy. Представителей флагманов цифровой трансформации и участников госпрограммы развития искусственного интеллекта мы там не увидели. Получается, в области понимания документов в России больше ученых нет?



    Только что мы вернулись из Амстердама, где проводилась ICMV — научная конференция по компьютерному зрению. Там мы совершенно не ставили целью продвигать успехи нашей компании как бизнес-структуры. Мы рассказали сообществу профессионалов, над какими фундаментальными проблемами работает наш научный коллектив. Для наших молодых ученых (в качестве основных докладчиков на конференции выступают именно молодые сотрудники, предлагающие и развивающие смелые идеи в нашей области) это возможность погружения в научную деятельность, собственного развития в научном и профессиональном плане.

    Мы уверены: чтобы стартап “взлетел” и превратился в развивающийся бизнес, в его основе должна лежать наука, из которой вырастет работающая технология, являющаяся “двигателем” сервиса или продукта, востребованного рынком и отвечающего его требованиям.
    В нашей области — области распознавания (это документы, удостоверяющие личность, различные анкеты, банковские карты, таблицы, штрих-коды, образы) — технология и наука, лежащая в основе — это фундамент. Цена ошибки очень высока, и именно поэтому у нас очень высокие требования к алгоритмам. Это как самолет — он либо летит, либо не летит, третьего не дано. Если летит плохо — значит, не летит совсем. И точно так же, как и в самолетостроении, — в основе алгоритма лежит наука, серьезная фундаментальная наука, которая выросла из задела наших соотечественников, стоявших у истоков нашего, домашнего, искусственного интеллекта. Распознаванием сейчас занимаются очень многие, создавая рынок этих услуг, который пока находится в зачаточном состоянии. Он не сформирован в полной мере, несмотря на то, что аналитики прогнозируют мировой объем этого рынка до 16-17 млрд долларов к 2024 году. Но очень мало коллег мы видим на научных конференциях. Еще меньше тех, кто публикуется в научных журналах. Вот мы уже слышим, как в нас полетели тапки возмущенных стартаперов, которые наверняка уверены в бесполезности проведения исследований и написания статей. “Мы делом занимаемся, а не какой-то теоретической наукой!” Вот именно поэтому многие системы распознавания на рынке работают откровенно плохо (несмотря на красивые презентационные ролики и рекламные слоганы), ошибаются, требуют участия человека-оператора (или целой фабрики этих операторов), который будет разглядывать нечеткий образ и корректировать решение машины собственными усталыми ручками. А ведь задача — сделать так, чтобы полностью автоматизировать процесс распознавания. В нашем случае это не означает устранить ошибку полностью, а сделать так, чтобы машина ошибалась в разы, в десятки и сотни раз реже человека.

    Мы постоянно работаем над улучшением собственной технологии. Это процесс, связанный с большой теоретической работой и серьезными исследованиями. В технологии мы улучшаем точность, скорость, гибкость, делаем технологию более “легкой”, менее требовательной к “железу”, менее энергоемкой. Это наш “зеленый AI” (зеленый не в смысле “незрелый”, а в смысле “экологичный”). Мы понимаем, что экологичность технологии — это тренд. И за этот тренд будут цепляться потенциальные заказчики в мире. И понимание этого тренда мы получили именно из участия в научных конференциях. Как говорится в скандинавской пословице, “когда валишь лес, не забывай вовремя точить топор”. Участие в научных конференциях для нас — это как раз процесс заточки топора. Технология не может вырасти на пустом месте, понимание того, как ее можно улучшить, появляется не сразу. Ученое сообщество устроено принципиально иначе, чем сообщество стартаперов, инвесторов, блокчейн-аналитиков и технологических визионеров. Здесь мало показать красивую презентацию. Если в ней нет мысли и новизны — заклюют. Съедят и закопают. Да и устроено на научных конференциях все немного по-другому. Мы показываем там не конечный результат, а то, что к нему приводит, описываем методы и подходы, вытаптываем себе поляну, предъявляя миру результаты собственных исследований. Мало показать, что ты сделал, необходимо объяснить, как это работает.

    Сейчас многие стартапы в области ИИ — это такие своеобразные автомастерские, где производят не починку автомобиля, а замену неисправных узлов. Что-то не работает — мы не чиним, мы сразу меняем модуль. Это проще, особенно когда не знаешь, как это все устроено, и что нужно делать, чтобы починить.

    Мы ученые, и достаточно уверенно показываем: технология в основе которой лежит глубокая фундаментальная наука работает лучше, быстрее, увереннее, надежнее той, где из всех технологий только красивая презентация. Она меньше ломается, потребляет меньше энергии, работает в снег, в жару, ночью и утром, так как мы знаем, какая неонка у нее “унутре”, в каком месте надо “дергануть за пимпочку” и ударить в бубен.

    У нас в компании работают более 50 разработчиков, каждый из которых разрушает тезис о невостребованности научного труда. В нашем коллективе есть как сложившихся учёные, так и те, кто только начинает путь в научной карьере. Особо подчеркнём — это не просто программисты, которые занимаются исключительно кодом. Каждый из них — самостоятельная научная единица, из которых формируется научный коллектив, обеспечивается гибкость и вариативность применяемых решений.

    А все потому, что мы ездим на научные конференции.



    На международной конференции по компьютерному зрению (ICMV) в Амстердаме, мы предложили свои принципиально новые подходы к развитию нейросетей и технологий распознавания, которые направлены на снижение углеродного следа и минимизацию ущерба окружающей среде от использования новых технологий. Основной упор был сделан на оптимизации применяемых в программно-аппаратных комплексах вычислительных алгоритмах, которые должны снизить энергозатраты на обучение и функционирование нейросетей в глобальном масштабе.

    Сегодня устойчивое развитие нашей планеты становится основной повесткой в докладах мировых организаций, беспокоящихся о будущем Земли. И это не только Грета Тунберг. Место человека на планете во многом зависит от того, насколько мы сможем соблюдать баланс между развитием технологий, связанными с ними растущими аппетитами глобальных корпораций и ответственным отношением к окружающей среде. Возможные пути минимизации вреда от бурно развивающихся технологий последнего десятилетия во многом связаны со снижением энергопотребления и нахождением наиболее оптимальных и энергоэффективных инструментов для решения современных технологических задач.

    В нашем арсенале есть нейросети и это наша, ученых, ответственность — заставить их работать быстро, эффективно, правильно решать возложенные на них задачи. С точки зрения “зеленого искусственного интеллекта”, вопрос прорыва заключается не в том, чтобы создать большую, мощную, огромную нейросеть — этакого синего кита с его удивительно большой нейросетью, а муху, с ее очень скромными “вычислительными” возможностями, но способностью быстро и энергетически эффективно решать необходимые задачи. Такая нейросеть должна обладать совершенно заоблачной удельной производительностью. Правильный выбор алгоритмов позволяют тратить на задачи распознавания образов в 1000 раз меньше ресурсов, чем заявляют сегодня отдельные производители оборудования.



    Сегодня мы понимаем, что в нашей области увеличение мощностей устройств для выполнения операций — это билет в один конец. И в задаче ученых сегодня (при ответственном отношении к разработкам) — сделать технологию такой, чтобы она как можно меньше нагружала устройства, не заставляла процессор греться до температуры кипятильника, не жрала энергию, как “кадавр желудочно неудовлетворенный”. И тогда эта технология становится user friendly и при этом высокотехнологичной.

    Для того, чтобы это стало реальностью, требуются совсем неочевидные “связки” совсем разных областей науки. Многим ли ясно, что переложение технологий глубинного обучения на тропическую алгебру позволяет резко сократить число транзисторов в нейропроцессорах при сохранении выразительной силы? Или что наличие радоновских слоев в нейросети позволяют ей экономно описывать проективные инварианты, которые, в свою очередь, определяют внутреннюю структуру изображений реального мира?

    Участие в научных конференциях это, прежде всего, возможность сверить часы с мировыми лидерами, увидеть своих реальных конкурентов (да, реальные конкуренты тоже ездят на научные конференции, потому что они тоже ученые), увидеть то, куда движутся технологии, из первых рук, а не в пересказе визионеров и евангелистов, которые в большинстве своём к реальной науке отношения не имеют, а только научились складывать модные слова в относительно грамотные предложения. Без этого понимания тенденций и трендов в фундаментальной науке невозможно никакое движение вперед. Технология без науки “не взлетит”, либо уже заранее окажется устаревшей.
    Smart Engines
    29,00
    Обработка изображений, распознавание в видеопотоке
    Поделиться публикацией

    Комментарии 16

      +6
      Ученые, ученые, научные конференции, ученые — вы столько раз это повторили, что в конце поста я ожидал увидеть ссылок 20 на научные публикации, желательно в серьезных журналах и список профессоров в вашем коллективе. А так текст больше похож сами знаете на что.
        +2
        Просто загуглите ген. директора и адрес компании.

        Ребятам писать статьи в корпоративный блог следует каждый раз с учетом новой аудитории, если выпуски не такие частые, как например у pvs-studio. Сейчас же это скорее для фанатов и своих. А так следует ссылаться немного на очевидное. Но и комментаторам тоже было бы неплохо за 10 секунд выгулить свои вопросы.

        SmartEngines хороший пример конвертирование мозгов в деньги, за отсутствие этого умения западные ученые и критиковали всю российскую и совесткую науку.
          0
          Погуглил. Но, извините не увидел ничего выдающегося. Распознавание документов? В потоке? Студенты на коленке соберут. Это не сегодняшний день.
            0
            Ну не знаю, не знаю https://ru.wikipedia.org/wiki/Арлазаров,_Владимир_Львович
            Ген директор член европейской академии наук. 20 лет изучал OCR. Теперь нейронки.
            Как по мне это довольно твердая почва.

            OCR не вчера изобрели — верно. Но студенты это на коленке не соберут))


            Разве это можно собрать на коленке, в такой тьме?

            Был такой продукт passport vision, уже собирали. Для лучшего продукта необходимо самим уметь писать эти библиотеки. А это большая математическая база. Плюс куча экспериментов и ресурсов. Если бы это было так просто, я бы видел множество хороших продуктов, но их очень очень мало.

            На первой фотографии видите в центре хитроулыбающегося господина в очках?

            Вот его лекции Zalina выкладывает в корпоративном блоге.
            habr.com/ru/company/yandex/blog/262735

            Другие делают расшифровки
            habr.com/ru/post/440550

              +1
              член европейской академии наук
              Все бы ничего, но не существует никакой «европейской академии наук». То есть, существует, и даже несколько. Хотите стать тоже членом? Это несложно и, думаю, относительно недорого. Только вот это типичный predator journal, но академия, а не что-то серьезное.
                0

                В 2019 вы хотите этим вызвать восхищение?!

                  +1
                  Если это не вызывает восхищения, об этом нельзя говорить? И чем этим? Тем что на видео? Это хорошо работающий продукт. Студенты на коленке это не соберут. Я уже писал о passport vission. Был интересный продукт, делали молодцы ребята, не студенты. Были клиенты. Но чпок, там баг, сям баг, там артефакт сям артфеакт -все встало, не смогли обеспечить качество для бизнеса — комманду расформировали. Очень сложно без бекграунда заниматься OCR ZlodeiBaal писал об этой проблеме

                  здесь
                  В 99% задач компьютерного зрения то представление о задаче, которое вы сформулировали у себя в голове, а тем более тот путь решения, который вы наметили, не имеет с реальностью ничего общего. Всегда будут возникать ситуации, про которые вы даже не могли подумать. Единственный способ сформулировать задачу — набрать базу примеров и работать с ней, учитывая как идеальные, так и самые плохие ситуации. Чем шире база-тем точнее поставлена задача. Без базы говорить о задаче нельзя.

                  Хоть это и очевидно, но каждый раз это приходится повторять, когда вспоминают студенов и бизнес задачи.
                  habr.com/ru/post/274725
          +2
          Первый абзац — да, согласен, так и есть.
          Дальше:
          Мы — ученые. Мы — ученые

          Сразу представились, планку задрали. Хорошо…
          После статьи: ну и где? Придумали что-то новое в нсетях? Архитектуры откуда тырите?
          На сайте у вас распознавание документов, и чо? Тоже так могу, я — ученый? Нет.

          на тропическую алгебру позволяет резко сократить число транзисторов в нейропроцессорах при сохранении выразительной силы? Или что наличие радоновских слоев в нейросети позволяют ей экономно описывать проективные инварианты, которые
          а… ну после этого сразу ученостью запахло

            +1
            Фотография с кучей пальцев вверх.
            Ну чё, конечно учёные, кто бы сомневался. :)

            P.S. Или всё таки инженеры?
            Особо подчеркнём — это не просто программисты, которые занимаются исключительно кодом. Каждый из них — самостоятельная научная единица, из которых формируется научный коллектив, обеспечивается гибкость и вариативность применяемых решений.
              +1
              Ваша статья это тот же пример «красивой упаковки» без какой-либо серьезной конкретики.
                +4
                Товарищи ученые! Доценты с кандидатами!
                Замучились вы с иксами, запутались в нулях!
                Сидите, разлагаете молекулы на атомы,
                Забыв, что разлагается картофель на полях.

                (С) ВВС
                  +2
                  Мы — ученые. Мы — ученые и совершенно этого не стесняемся.

                  Провести черту между наукой и технологией сложно. Серьезно, люди статьи пишут
                  об этом.

                  https://doi.org/10.1007/978-3-319-33717-3_6

                  Еще непросто найти границы между хорошим инженером, исследователем и ученым. Судя по реакциям комментаторов, ваше изложение о себе не сочетается с интуитивным представлением об ученом. С одной стороны патенты, PhD или выступления на конференциях не делают из специалиста ученого. С другой стороны, понятие ученого размывается — существует же термин data scientist.
                    0
                    А ещё иногда инженеры приезжают на научные конференции и видят там кучу сырого недоделанного материала, который доделывать никто никогда и не собирался, ведь важны публикации и наукометрия, а не реальная польза. Вот и сидят такие учёные десятилетиями в своих университетах и надувают щеки, какие они учёные, а настоящая жизнь и настоящий прогресс в это время происходят в совершенно других местах, где люди не называют себя учёными, зато постоянно совершенствуют свои продукты, а не свои навыки написания научных статей.
                      0
                      настоящая жизнь и настоящий прогресс

                      Кем-то движет любопытство, кем-то практическая польза, кем-то финансовая выгода. Почему это проблема? Почему Вы считаете, что совершенствовать продукты — это настоящая жизнь, а бороться, например, с проблемами Гильберта — щеконадувательство?
                        0
                        Я не это сказал. Я сказал, что множество инженеров двигает науку, а множество учёных просиживает штаны и проедает гранты. И те же научные конференции много для кого существуют не как места для обмена новым знанием, а как направления для туристических поездок за казённый счёт.

                        Ученые — это не сверхчеловеки и небожители, это такие же люди, как и все остальные, и среди них столько же бездарей и лентяев. А среди «неученых» столько же талантливых людей, двигающих науку и общество вперёд.
                          0
                          Полностью согласна, часто такое есть, что поездка на конференцию превращается в возможность откосить от офисной рутины. Это, конечно, к авторскому материалу не относится. Видно, что группа ездила сплоченная, достаточно мотивированная, чтобы впитывать зарубежный опыт и делиться своим, а не трескать пончики с кофе на ресепшене. Жаль, что для таких поездок нужно значительное финансирование. Сколько ребят просто не могут себе позволить посетить что-то значимое и просто остаются незамеченными. Когда уже в нашей стране поймут, что продвигать свои мозги нужно за государственный счет, а не с частного кармана.

                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                  Самое читаемое