MagisterLudi Mar 28 2017 at 09:23

Есть ли у России шансы на лидерство в «марафоне искусственного интеллекта»

5 min

12K

The future is hereArtificial IntelligencePopular science

Comments 49

QDeathNick Mar 28 2017 at 09:31

Жду, когда ИИ в президенты выдвинут.

fruit_cake Mar 28 2017 at 11:46

а потом при импичменте он будет расстреливать парламент из роботизированных танков

SerhiyKhomin Mar 28 2017 at 13:28

Менталитет то передаться от создателей

Structure Mar 28 2017 at 15:28

А что такого Президент делает, что нужно заменять на слабый ИИ?
Тут скорее нужно почти все отдавать в руки частного бизнеса и контролировать с помощью суперкомпьютеров.
Прозрачность системы + обработка жалоб с помощью ИИ — вот что нужно.

RiseOfDeath Mar 28 2017 at 09:36

А потом новости будут про коррупцию среди ИИ-чиновников, которые брали взятки процессорным временем и оперативкой.

upd.

Блин, промахнулся мимо нужной ветки.

Hidralisk Mar 28 2017 at 09:56

если представить что ты ответил человеку выше, то всё норм

artemart1 Mar 28 2017 at 10:06

Это все равно интереснее, чем он вам не ИИ))

AleCC Mar 28 2017 at 10:07

Если же русским (или российским — с недавнего времени озаботился данным, можно сказать философским вопросом) и удастся что либо разработать, способное конкурировать с мировым сообществом, то продадут в тот же США 100% как и любые разработки, вместе с разработчиками. Россия никогда не была в состоянии пожать плоды своих изобретений, да и не к чему они когда правительство думает о том повысить ли пенсию на 50 рублей или нет. Искусственный интеллект не для нашей реальности.

FirExpl Mar 28 2017 at 10:45

Вот для людей с нашим менталитетом ИИ как раз в самый раз)
Поставить его во главе правительства, чтобы он (оно?) принимал единоличные решения на благо государства и все будут только за. А где-нибудь в США народ возмущаться будет в такой ситуации :)

Endimeon Mar 28 2017 at 10:50

А как же «Суровость закона компенсируется необязательностью его выполнения» (с)? Тогда уж и робокопов с ИИ нужно.

jex Mar 28 2017 at 11:45

А где-нибудь в США народ возмущаться будет в такой ситуации

И зря. Для государства лучше придерживаться одной, но взвешенной позиции, одного направления. Выборы важнее для разрыва коррупционных связей и создания конкуренции. У ИИ таких проблем не должно быть.

ЗЫ да, я понимаю что коммент выше был в шутливой форме, но тема интересная)

LennoxRize Mar 28 2017 at 12:42

Верно говорите, но реальность, вернее, человеческая природа вносит коррективы. Так то в идеальном мире коммунизм вообще будет лучшей формой устройства общества.

nidheg666 Mar 28 2017 at 13:28

сначала погугли что такое коммунизм. ничего что коммунизм это отрицание всякой частной собственности.

LennoxRize Mar 28 2017 at 14:32

У меня сразу пара вопросов: причем тут частная собственность? С чего бы мне сходу что-то гуглить по совету левого рандома, который даже свою позицию пока не сформулировал?

nidheg666 Mar 28 2017 at 14:54

позиция проста — коммуннизм несостоятелен даже как идея. грезят о нём только те, кто даже толком не знают что он означает.

LennoxRize Mar 28 2017 at 17:05

Поскольку это недостотачно явно следовало из моего первого коммента, то поясняю: я не мечтаю о коммунизме и сам резкий антикоммунист. Я просто менее категоричен в оценках. Коммунизм вполне состоятелен как идея построения утопии. Но именно как «идея» и именно «утопии». Реализовать его на практике невозможно по огромному количеству причин, и человеческая природа, то есть психика — одна из них.

sticks Mar 29 2017 at 05:26

коммунизм это отрицание всякой частной собственности

Это откуда такие выводы? Всегда считал, что коммунизм — это общественная собственность на средства производства.

lexa1980 Mar 29 2017 at 12:21

а без частной собственности счастья не видать?
знаю многих кто был более счастлив в СССР чем сейчас.
хотя там частная собственность была сильно ограничена.

любая частная собственность это автоматическое деление на классы. богатый — бедный.
богатых много не бывает :)

Sormovich Mar 29 2017 at 09:51

«Вот для людей с нашим менталитетом ИИ как раз в самый раз)
Поставить его во главе правительства, чтобы он (оно?) принимал единоличные решения на благо государства и все будут только за. А где-нибудь в США народ возмущаться будет в такой ситуации :)»

Сальвадор Альенде пытался, наняв Стаффорда Бира. Проект «Киберсин». В результате в Чили к власти пришёл Пиночет.

«Мозг фирмы»

http://www.rulit.me/author/bir-stafford/mozg-firmy-download-free-58096.html

Проект Киберсин

http://biofile.ru/his/30045.html

Nikobraz Mar 28 2017 at 11:09

Нет. Пояснять надо?

AndyKorg Mar 28 2017 at 11:14

Много-много раз читал

«При значительной разнице в финансировании проектов, отечественные разработки не уступают, а где-то даже превосходят зарубежные аналоги»

и десять и двадцать лет назад. Могу ошибаться, но вот так на вскидку кроме Яндекса не могу вспомнить проектов вышедших на мировой рынок.
Отсюда вывод: Хотя «стартовые позиции в «марафоне искусственного интеллекта» у нашей страны неплохие, но „значительная разница в финансировании проектов“ приведут либо к миграции проектов за рубеж, либо к тихому умиранию.

APLe Mar 28 2017 at 11:43

Можно более старые отечественные разработки вспомнить, вроде БЭСМ-6. На мировой рынок они не вышли из-за железного занавеса, но были более чем конкурентоспособны.
Хотя количество таких разработок удручающе малО, да.

river-fall Mar 28 2017 at 13:22

Да и Яндекс в основном знают как компанию, вирусно распространяющую свой Яндекс.бар

EvilArcher Mar 28 2017 at 11:29

Какой-то наивный вопрос вынесен в заголовок статьи. Ответ на него, естественно, «Нет».
Вот, если его переформулировать так: «могут ли выходцы из России стать лидерами в «марафоне искусственного интеллекта»». Тогда ответ будет «Да». В России можно найти таланты, но работать и развивать ИИ в этой стране им не получится.

LonelyCruiser Mar 28 2017 at 14:32

Да, если вдруг что нибудь и появится, то охотники за головами быстренько выследят и вывезут голову, это придумавшую в теплые края (финансово).

BelBES Mar 28 2017 at 14:12

Что это было?

Другая российская разработка — платформа Brain2 компании “Когнитивные системы” — концентрируется на быстрой обработке bigdata в нейромодели знаний для систем ИИ. К примеру, нейромодель для оценки стоимости недвижимости (House Prices), обученная по 79 параметрам 1461 объектов недвижимости, способна предсказать стоимость объекта с незначительной ошибкой (RMSE=0,42), что равнозначно оценке опытного эксперта по недвижимости. При этом на обучение модели ушло всего 20 минут. Для сравнения, у опытного программиста-математика на решение подобной задачи с применением лучшей бесплатной библиотеки для машинного обучения Keras (TensorFlow) уйдет не менее 30 часов, а результат будет незначительно лучше (RMSE ≈ 0,32).

Почему автор сравнивает облачный сервис и фреймворк?
1) Сравнивайте тогда уж Brain2 с Google ML Cloud или MS Azure ML.
2) В рекламной презентации показывать результаты на MNIST'е в районе 81% точности и c местом во 2-й тысяче лидерборда

MNIST leaderboard Cognitive Systems

И местом в 5-й тысяче на оценке недвижимости

Им не стыдно за свой сервис?
3) Что за бред про 30 часов работы опытного программиста-математика?

Еще забавляет, что на их сайте, русская версия от английской отличается только языком меню, весь контент не зависимо от выбранного языка будет на русском языке.

Имхо, как-то подозрительно выглядят эти "Когнитивные технологии" — убийцы tensorflow...

MagisterLudi Mar 28 2017 at 16:39

Я пренаправил вопросы разрабам, они ответили:

Сравнивать надо сравнимое. Для оценки надо взять как минимум 2 параметра – удобство и результат (пока отбросим стоимость).

Мы протестировали основные сервисы

Google ML – это по сути TensorFlow с возможностью использовать ресурсы Google, отсюда и следует, что он для рядового пользователя также не удобен как TensorFlow, хотя конечно очень удобен для программиста. Поэтому, его оценку у него такая же как у TensorFlow.

Правильнее посмотреть другой сервис Google, который мы упомянули:
Так модель созданная в сервисе Google Prediction, для решения уже упомянутой задачи House Prices от Kaggle (сервиса для проведения конкурсов среди специалистов по машинному обучению) показывает RMSE = 7000, что в десятки тысяч раз хуже чем в Brain2.

Задачу MINST как представленная в виде демо в сервисе он решает хорошо – 0,92 точность, но вот другие, которые мы пытались решить увы не может.

2) В рекламной презентации показывать результаты на MNIST'е в районе 81% точности и c местом во 2-й тысяче лидерборда

Оценка должна быть справедливой, наш результат — за 2 минуты во 2-ой тысячи лидеров.
То есть мы не старались особо решать эту задачу «hello world», стать лидерами и тп.

Но мы специально потратили время, чтобы сравнения были объективными
В Google Prediction, со всем чтобы разобраться ушло 30минут, c MS Azure вечность, не хватило сил разбираться с весьма сложным интерфейсом. А вот Amazon порадовал, удобно и хороший результат.

Им не стыдно за свой сервис?
3) Что за бред про 30 часов работы опытного программиста-математика?

Другую задачку с House Prices, решили решать с использованием Кeras(theano) (for TensorFlow), на то чтобы разобраться с возможными решениями часов и выбрать лучшие по данным публикаций ушло примерно 13, подготовить данные (номализовать) обучить и протестировать ушло примерно 17 часов. А результат (0,32) полученный не многим лучше чем у Brain2 (0,42) где все создание моделей автоматизированно и заняло 30 минут!

Есть в лидерборде и варианты с результатом 0.0, но если почитать внимательнее будет понятно, что там была обнаружена уязвимость к выявлению, какие значения в test были неверно классифицированы/спрогнозированы.

Еще забавляет, что на их сайте, русская версия от английской отличается только языком меню, весь контент не зависимо от выбранного языка будет на русском языке.

Да, правда, но так ли это важно…
Отчего, Вы не обратили внимание, на то решение, над которым мы очень много работали Brain2Text. И то, что решения для синтеза предложения из слов пока ни у кого из лидеров рынка не представлено, не говоря об синтезе ответа?

P.S. Научная публикация по решению Brain2Text будет опубликована на arxiv.org месяца через 3

BelBES Mar 28 2017 at 17:57

Спасибо за ответы:-)
Хотя объем бреда, по моему, только увеличился:

Сравнивать надо сравнимое. Для оценки надо взять как минимум 2 параметра – удобство и результат (пока отбросим стоимость).

Совершенно не понятно, какой смысл вкладывается в критерий "Результат"… вроде как на любом из представленых фреймворков можно любую модель реализовать...

Задачу MINST как представленная в виде демо в сервисе он решает хорошо – 0,92 точность, но вот другие, которые мы пытались решить увы не может.

92% — это очень плохо. Тупая сетка из пары сверточных и полносвязных слоев натренируется до 97%… а 92 — это даже хуже, чем описаный мной пару лет назад unsupervised метод, дайющий 96%.

Оценка должна быть справедливой, наш результат — за 2 минуты во 2-ой тысячи лидеров.

2 минуты тренировки? Лень проверять, но LeNet на моей не самой топовой GPU тренируется 1-2 минуты до тех 97%.

Другую задачку с House Prices, решили решать с использованием Кeras(theano) (for TensorFlow), на то чтобы разобраться с возможными решениями часов и выбрать лучшие по данным публикаций ушло примерно 13, подготовить данные (номализовать) обучить и протестировать ушло примерно 17 часов. А результат (0,32) полученный не многим лучше чем у Brain2 (0,42) где все создание моделей автоматизированно и заняло 30 минут!

Даже не знаю что сказать:) Может стоит сначала изучать инструмент, а потом им пользоваться...

Отчего, Вы не обратили внимание, на то решение, над которым мы очень много работали Brain2Text. И то, что решения для синтеза предложения из слов пока ни у кого из лидеров рынка не представлено, не говоря об синтезе ответа?

А Siri то как работает?) Ну и там всякие цепочки LSTM'ов и все такое проче...

Никого не хочу обидеть, или оскорбить, но чет какой-то фэйспалм это всё :(

BelBES Mar 28 2017 at 20:33

Чтобы не быть голословным, забенчмаркал MNIST.
Вот такая сетка:

def LeNet5(x):
    net = tf.reshape(x, [-1, 28, 28, 1])
    with tf.variable_scope("conv1"):
        net = layers.conv2d_relu(net, [5, 5, 1, 20], [20])
    net = layers.maxpool2d(net)
    net = tf.contrib.layers.batch_norm(net)
    with tf.variable_scope("conv2"):
        net = layers.conv2d_relu(net, [5, 5, 20, 50], [50])
    net = layers.maxpool2d(net)
    net = tf.contrib.layers.batch_norm(net)
    fc_size = int(net.get_shape()[1] * net.get_shape()[2] * net.get_shape()[3])
    net = tf.reshape(net, [-1, fc_size])
    with tf.variable_scope("fc1"):
        net = layers.inner_product(net, [fc_size, 500])
    net = tf.contrib.layers.batch_norm(net)
    net = tf.nn.relu(net)
    with tf.variable_scope("fc2"):
        net = layers.inner_product(net, [500, 10])
    return net

За 500 итераций сходится к 99% точности. Время тренировки: 50 секунд на GTX980Ti...

BelBES Mar 28 2017 at 20:37

А при размере батча в 2048, за 20 секунд сошлось к тем-же цифрам...

MagisterLudi Mar 29 2017 at 13:48

Слово разработчикам:

«Сергей, спасибо, что пытаетесь вести конструктивный диалог. Дабы он был действительно конструктивным (и полезным читателям), необходимо, чтобы мы сравнивали решения в едином пространстве время-результат. Для этого давайте просто составим своеобразных акт сверки.

Время изучения вопроса, часов – время необходимое, чтобы посмотреть условия задачи, найти и реализовать решение.
С использованием Brain2, для типовых моделей – это значит — скачать данные и загрузить данные в систему Brain2, пометить что класс, а что признак, нажать кнопку «построить модель». Сервис Brain2 ставит задачу – дать возможность создавать нейромодели не программируя, в том числе, человеком, который вообще может не знать, что такое нейросети. Именно для этих целей мы протестировали работоспособность системы на MNIST и HousePrice. Мы не тратили вообще никакого времени, на предобработку и поиск «решения», лучшее решение, подбирала сама система Brain2. При этом мы не сомневаемся, в том, что потратив много больше времени чем 10 минут, могли бы достичь лучших результатов.

К примеру, сколько времени Вам понадобилось, чтобы отладить работу ESOINN для задачи MNIST (кстати интересный алгоритм). А много ли специалистов, кто может разобраться с подобным решением, а сколько стоимость часа специалиста такого уровня…

* Задача решаемая в Brain2Text. На основе естественного текста обучить модель(и) и создать алгоритм с их использованием для поиска набора ЛЕКСЕМ (унифицированных форм слов имеющих план содержания), из которых составить ответ на поставленный вопрос на естественном языке. Т.е. необходимо сначала понять какие слова относятся к ответу, а затем из них синтезировать предложение. Текст для обучения http://sb.brain2.online/files/cache/text_half.txt.

** У нас разработка Brain2Text потребовала 3 месяца для создания и отладки алгоритма и пяти многослойных моделей для возможности его работы: 2 – обработки вопроса, 1 – выбор слов, 1 – расстановки слов влево и вправо, 1 – правильного склонения слова слева и справа.

*** Точность определена, как число корректных предложении полученных на вопрос составленный из слов текста. Список 30 экспертных и 6000 технических вопросов для тестирования готовы предоставить.

Также, интересно получить ссылки на работы, где с применением LSTM составляют предложения из лемм (унифицированных слов) на русском языке. Если есть, то реальные примеры посмотреть как работает.

По поводу Siri, все же нам кажется она зачитывает найденные ответы из интернета, а не составляет их из «мешка слов». А ответы не из интернета выглядят как заготовленные формы с вариациями. В модели Brain2Text нет самого текста или шаблонов ответа, только связи слов!

P.S. Спасибо за найденные опечатки и сотрудничество.

supersonic_snail Mar 29 2017 at 15:24

Таблицы вы показываете очень странные — во-первых, почему это вы ставите конкуренту результат 0.96, если он 0.99? Я только что перепроверил (ну мало ли что) — таки 0.99.

Во-вторых, время на изучение не имеет значения вообще от слова совсем. ML на данный момент не черный ящик, а уж тем более нейронные сети, так что надо учить хотя бы основы. А то, что на какой-то задаче можно за вменяемое время получить результат автоматически, означает, что задача настолько простая, что она даже не стоит рассмотрения. Как конкретный пример — попробуйте хотя бы cifar10, и покажите, что выйдет. Я сомневаюсь, что вы вообще получите там вменяемый результат, разве что у вас есть заточенные под задачу предобученные алгоритмы.

В-третьих, в самой первой таблице у Amazon ML оценки 4 и 5, а интегральная 2.1, а у брейн2 4 и 5 и интегральная 2.8. Как так? Разве что вы не показали какой-то столбец, но тогда какой-вообще смысл так что-то сравнивать?

BelBES Mar 29 2017 at 18:50

1) Были уже всякие RapidMiner'ы и прочие тулы для автоматического построения моделей… у всех есть один главный недостаток: когда мы получили какую-то модель, а результат не можем объяснить, то смысла от этой модели никакого:

Вот получили мы 99% точности… а это точно хорошо, или это жуткий оверфит + плохая тестовая база? А если оверфит, то почему? Недостаточно данных для тренировки, плохие фичи, или слишком большая модель, которая умудрилась запомнить все образы?
А если ничего путного не натренировалось, то почему? Плохая тренировочная база, или может быть мы пытаемся линейно разделить данные, которые так просто не разделишь… а может быть у нас половина фич — это шум, который все портит? И т.д. и т.п.

И вот тут мы приходим к тому, что человек, который как умная обезьянка тычет по кнопкам, не понимая происходящего, может получить какой-то результат, но что с ним делать дальше — он не знает. Т.е. результат вроде бы есть, но на самом деле его нет.

Ну а в случае этого Barin2, даже результат странный — 81% на MNIST'е говорит о том, что даже на простейших модельных задачах автоматически как-то все не очень круто работает. Как правильно пишут выше: а давайте возьмем cifar10 и попробуем на нем запустить ту-же задачу… скорей всего там все рассыпется.

А если инструмент позиционируется как продвинутый калькулятор, то его корректней сравнивать с Excel, а не tensorflow или torch.

2) Обработкой текста на практике я не занимался почти, т.ч. тут могу ошибаться и, возможно, решение Brain2Text — это что-то прорывное, хотя результаты работы не впечатляют от слова совсем. Но всякие чат-боты — это вроде-бы довольно горячая тема последних пары лет и их лепят все кому не лень. Гугл выдает десятки репозиториев с различными решениями на рекурентных сетях.

BelBES Mar 28 2017 at 19:45

Кстати, в табличках не правильно указаны названия TensorFlow и Azure… там разработчики — это точно не пара студентов первого курса?)
Просто как-то нескучными обоями повеяло...

sergof Mar 28 2017 at 14:22

Обязательно. Как только в сельпо сметану завезут, ага.

Bas1l Mar 28 2017 at 14:23

Меня смущает, что автор ничего не пишет про исследования. Все коммерческие проекты—это же вершина айсберга. И даже в исследовательском отделе гугла и IBM многие ключевые люди из академии. Из университета Торонто, к примеру (достаточно посмотреть на то, откуда они публиковали статьи до того, как стали работать в гугле).

UFO landed and left these words here

artemart1 Mar 28 2017 at 17:52

Вот и ответ

)

artemart1 Mar 28 2017 at 17:57

Вот и ответ)

BelBES Mar 28 2017 at 18:10

А что не так с Россией?
Есть, наприер, success story у авторов Prism: ребята вовремя уловили тренд, вложили денег в high load сервис, способный deep learning тянуть с минимальной задержкой и стали лидерами в области стилизации фотографий.

Ну или findface — крутые ребята, которые сначала на MegaFace победили, и продвигают свою технологию распознавания лиц.

Туда же и Yandex можно отнести, вот уж кто серьезно рисерчем занимается в России.

Ну и по мелочи есть еще куча компаний, кто по большей части на аутсорс делают решения на основе машинного обучения и прочего data science.

Имхо, были бы знания и идеи, а остальные вопросы в этой области решаемы, даже в России.

nidheg666 Mar 31 2017 at 11:58

любой бизнес в россии является высоко — рисковым, за счёт коррупционной составляющей и нестабильной экономической ситуации. а высокорисковый бизнес требует больших расходов, менее привлекателен и следовательно реже инвестируется.

alexhott Mar 28 2017 at 17:28

одно но, пока все что называют ИИ это просто программа работающая по заданному алгоритму, способная по этому алгоритму анализировать огромное количество данных.
А саморазвития пока нету как такового.
А шансы у нас самые большие, только русский программер насинячившись до беспамятства может создать реальный ИИ.

st174 Mar 29 2017 at 12:23

… вдруг представил, что происходит война человека и ИИ. и внезапно ИИ выбрал в качестве оружия юмор: сделал что-то очень смешное, на что ни один человек не смог адекватно отреагировать… невероятно?

Igor_34_rus Apr 3 2017 at 11:34

В стратегии

В экономиках Казахстана и Турции преобладают позитивные тенденции. ВВП Казахстана в 2012
году увеличился на 5,1%, в ближайшие годы ожидается сохранение достигнутых темпов роста.
Замедление ВВП Турции в 2012 году до 2,2%, вероятнее всего, является временным, в
последующие годы можно прогнозировать повышение темпов роста до 4%.

задаю вопрос

ВВП Казахстана

темпы ВВП Казахстана

и прочих формулировках со словом казахстан, ответ всегда один:

есть замедление ввп турции в 2012 году до 2.2 проц вероятнее всего

Есть мнение, что ИИ хромает :)
Обычный парсер лучше отработает

UFO landed and left these words here