vlivashkin Apr 1 2020 at 12:14

Нейросетевой калькулятор для сложения и вычитания не очень больших чисел

5 min

24K

Яндекс corporate blogArtificial IntelligenceMachine learning*Image processing*

+55

Comments 47

sinc Apr 1 2020 at 13:32

Было бы круто, если бы цифры можно было перетаскивать из заданного набора (причем разных). А то так чет с кнопками не алё.

leshabirukov Apr 1 2020 at 17:25

Мышью рисовать!

sinc Apr 1 2020 at 19:03

Это не наш метод! Слишком просто. Взаимодействие с пользователем должно быть максимально невыносимым.

matsulenko Apr 1 2020 at 14:20

Когда считаю «10 — 10», он пишет "-0", немного странно.
Ох, а «99 — 99» он не может посчитать, неправильные ответы выдаёт. То 10, то 32.

vlivashkin Apr 1 2020 at 14:59

Кстати, можно нажимать на "=" несколько раз – тогда выражение будет оставаться тем же, но начертание символов выражения будет меняться. От этого будет немного меняться изображение ответа

victoriously Apr 1 2020 at 15:21

10-10=

BeeZONE Apr 1 2020 at 14:22

68-62=0, ок

Unicom Apr 1 2020 at 14:29

ага или -0
никогда Штирлиц не был так близко к провалу…

vlivashkin Apr 1 2020 at 14:45

Да, сетка иногда ошибается =) Все-таки она не вычисляет заданное выражение напрямую. Возможно, в этом примере начертания 2 и 8 были похожи, и сетка их перепутала

feech Apr 8 2020 at 16:07

она ошибается, когда идёт вычитание, а результат должен быть в диапазоне 1-9. Тогда 0 получается. 68-60, 91-23 и тд

feech Apr 8 2020 at 16:57

*91-83

mngr Apr 1 2020 at 14:53

Прикольно, но непонятен практический смысл этой работы. Я бы вам предложил попробовать собрать нейросеть для символьных вычислений, типа такой arxiv.org/abs/1912.01412. Может быть можно будет её развить до уровня, когда она сможет сама доказывать теоремы? :)

UFO just landed and posted this here

mishush Apr 1 2020 at 14:59

56 — 57

mrhru Apr 2 2020 at 22:15

Правильный ответ в оценке этого комментария? :)

defuz Apr 1 2020 at 15:09

Будущее здесь. Примерно так через 30 лет будет вычисляться операция a+b на устройствах. А мы, старики, будем неодумевать, почему никого не беспокоит такая грандиозная неэффективность.

И если вам кажется это бредом – предлагаю посчитать сколько времени тратится на вычисление a+b в Python и сравнить это с одной ассемблерной инструкцией.

Так что спасибо Яндекс что приоткрыл всем нам дорогу в ад.

Zanak Apr 2 2020 at 08:05

Будущее давно предсказано. У Айзека Азимова есть коротенький рассказ, называется "Чувство силы". По моему, как раз про это.

marperia Apr 2 2020 at 10:55

*гранциозная неэффективность
Вот, так гораздо легче продать.

commenter Apr 1 2020 at 15:10

Как я понимаю — натренировали сеть на распознавание всех комбинаций двузначных чисел (10000 комбинаций), каждой комбинации сопоставили ответ, далее выдают это за достижение.

А чем это достижение отличается от распознавания китайских иероглифов? Иероглифов больше, чем 10000.

Надо бы включать самокритику до публикации, а то вот приходится подключаться…

vrytov Apr 1 2020 at 15:54

Сегодня день такой, особенный.

Victor-ov Apr 1 2020 at 15:57

95+95=180

mrhru Apr 2 2020 at 22:17

Напоминает язык karasik с оператором "примерное присваивание"

shellenberg Apr 1 2020 at 16:08

Вопрос, нафига? Любому человеку, кто работает с нейросетями и так понятно что это возможно сделать, даже ради чистой науки.

sinc Apr 1 2020 at 17:14

ну уже не раз отвечали. посмотрите в календарь;)

shellenberg Apr 1 2020 at 17:19

), я как то со всей этой коронавирусной ист[о, е]рией совсем забыл что есть вещи над которыми можно улыбнуться

flx0 Apr 1 2020 at 16:36

30 — 30 выдает 10 с разной степенью стёртости единицы. Иногда ее почти не видно, и на выходе как бы 0, но в основном получается 10.

maxzh83 Apr 1 2020 at 16:36

Сначала подумал, что первоапрельская шутка.

Phillippko Apr 1 2020 at 18:23

Так это ж она и есть)

mapron Apr 2 2020 at 16:27

Ну сетка-то настоящая? В чем шутка? Ну, применение, конечно забавное, но это примерно как статьи из «ненормального программирования».

AC130 Apr 1 2020 at 17:03

Эх, всё прекрасно, но вот наличие у статьи лишь одного автора сильно бросается в глаза. Ещё и глаз спотыкается об эти «we».

andreyiq Apr 1 2020 at 17:28

Видимо невнимательно прочитал статью, не нашел информацию о точности

Arech Apr 1 2020 at 17:31

Первая же попытка на tfjs: 11-2=19. На /calc 11-2=0.
Мда.

AnthonyDS Apr 2 2020 at 15:38

33+33 = 86, 44+44=98. Мда…

AquiHostStrider Apr 10 2020 at 13:11

23+31=5?
Загогулина в числе «пятьдесят с чем-то» — то ли единица, то ли семёрка, то ли вопросительный знак.

Chugumoto Apr 1 2020 at 17:40

Заготовка для разгадывателя капч? :)
Вроде попадались где-то такие арифметические

AlexeyKachalov Apr 1 2020 at 18:51

С аугментацией данных явно проблем не было:-)

Fedorkov Apr 2 2020 at 01:19

Теперь на этом калькуляторе можно сэмулировать не очень большую нейронную сеть.

engine9 Apr 2 2020 at 10:59

Некоторые цифры напоминают ответы некоторых школьников у доски: если не можешь сосчитать нужно пробормотать под нос что-то невнятное типа «бырбырнадцать» :)

22-22=?

Заголовок спойлера

n0tal0ne Apr 2 2020 at 11:58

вызывает сомнение, что данный калькулятор действительно освоил арифметику с 2значными числами. более похоже, что он освоил какую картинку надо рисовать в ответ на другую картинку. освоить арифметику, это если бы он учился на двузначных числах, а в результате мог оперировать значительно более многозначными, со всякими высокоуровневыми правилами, типа сдвига разрядов и т д. а так — в нейросети в неявном виде хранятся просто все варианты. ее ведь так и учили, на куче сгенерированных картинок с правильными ответами.

vlivashkin Apr 2 2020 at 12:33

Хорошее замечание =)
Действительно, в этом случае она могла просто попытаться всё запомнить. Чтобы проверить знания арифметики, нужны примеры посложнее. Я пробовал учить сетку решать выражения вплоть до 9-значного входа (например «56789+456») – сетка обучается, но начинает чаще ошибаться в простых примерах, типа «2+2». Возможно, более правильные лоссы/перевзвешивание выборки могли бы помочь.

В работе arxiv.org/abs/1506.02264 коллегам удалось в более простой постановке задачи поддержать сложение и вычитание 7-значных чисел (с долей ошибок 2-3%). В то же время, авторам не удалось поддержать умножение (72% ошибок). Если бы сети хватало capacity просто запомнить все ответы, то разницы бы не было. Похоже, что сеть все-таки действительно может освоить сложение и вычитание просто из парных ответов. Если у кого-то получится поддержать умножение, то это потянет на настоящую научную работу)

n0tal0ne Apr 2 2020 at 13:24

Вот все комбинации семизначных чисел мне кажется она просто запомнить не сможет, и придется именно разбираться в правилах. хотя не ясно, почему появилась проблема с умножениями, ведь в результате умножений получается числа имеющие больше разрядов, чем исходные, как и в случае сложения. а в случае вычитания разрядов может стать меньше. не понимаю, почему сетке не без разницы. Почему правило сложения с ее точки зрения проще, чем правило умножения…
С другой стороны, мне кажется порочным путь, в которым мы учим сетку отдельно складывать однозначные, двузначные, трезначные, однозначные с двузначными, однозначные с трехначными. Подсовывая такие выборки может статься, что она вычленит именно правила например сложения двузначных с однозначными, а остальные (например, однозначные с однозначными) позабудет. Именно это, скорее всего вы и наблюдали, когда сетка стала ошибаться в простых примерах. То есть вы как бы переобучали ее на больших примерах вытесняя правила маленьких примеров. А общая логика, которая работала бы для любых примеров ею схвачена не была изначально. Может быть это можно решить увеличением количества слоев, или чем то в этом роде.

vlivashkin Apr 2 2020 at 12:30

del

Aidar717 Apr 2 2020 at 16:15

Что-то подобное есть в приложении Photomath для решения математических примеров, там распознавание рукописного ввода очень даже ничего.

n0tal0ne Apr 2 2020 at 17:24

Тут главное не распознавание как таковое, а сам принцип решения. Так то распознать цифры и классически решить все — вообще не проблема.

jottygroups Apr 2 2020 at 18:01

Сеть, бывают случаи, что просто наглухо не видит некоторые цифры.

Картинка №1

А перед нулём может, с чего-то, становиться + или -, а то и они оба…

PansOfLuck Apr 2 2020 at 21:29

77-11=-66

VPryadchenko Apr 8 2020 at 16:08

Мы взяли за основу UNet-подобную архитектуру,… убрали все skip-connections и добавили несколько полносвязных слоёв в ботлнек-модели. Это сделало модель больше не похожей на UNet.

— да это же… автоэнкодер! )