Comments / Profile of MaximKovalev / Habr

Ковалев Максим @MaximKovalev

Аналитик, программист

ProfileArticles6PostsNewsComments108

Упущенные возможности BigData

MaximKovalev May 24 2017 at 15:46

Все верно.

Look

Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Версия II

MaximKovalev May 16 2017 at 12:46

Возможно, что много. Мне кажется это субъективный фактор. А на счёт нераскрытых терминов-спасибо. Забыл убрать. Мне кажетсяэт отдельная тема, тем более с точки зрения программирования и алгоритмов вообще. Планируют дальше раскрыть эту тему.

Look

Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Версия II

MaximKovalev May 15 2017 at 18:37

На счет термина «искусственный» тут Вы конечно правы. Но я хотел подчеркнуть две вещи:
1. В вопросах обсуждения ИИ я трактовал искусственный не только как продукт размножения, но скорее в трактовке Канта о принципиальном отличии искусственного как законченного и ограниченного. Кроме того, не так долго ждать (условно конечно) возникновения искусственных живых существ. Будет ДНК и будет размножение. И наверное какие-то инстинкты. Биороботы по Чапеку или Херберту. Ведь то, что будет создано генетиками — в некотором роде природное… Граница стирается.
2. Наличие свободы воли полного ИИ может повлечь опасность или необходимость признания личности. Иначе возникнут коллизии. И тут снова может прийти в помощь Кант с его определением искусственного.

Хотя, конечно, все намного сложнее. В рамках статьи я не упоминал, например, законы робототехники Азимова. А ведь они преодолеваются. Например как преодолевается чувство самосохранения у человека и тяга к жертвенности или суициду. Когда внешние волевые цепочки по сути подавляют выводы «БИОСа» — инстинктивного вегетативного слоя… Но это уже тема отдельной статьи

Look

Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Версия II

MaximKovalev May 15 2017 at 14:54

На счет понятной формы, не Вы первый кто это заметил. Попробую переформулировать. Пока же могу сказать, что общий вывод такой:
То, что сейчас понимается под ИИ представляет собой не более чем «продвинутые» статистические модели.
те из всех проблем, связанных с дедукцией-индукцией-абдукцией в какой-то степени решен только вопрос дедукции.
С точки зрения полного ИИ и связанных сними вопросов познавательных способностей и, самое главное, способности ставить себе цели самостоятельно — не решен ни один.

Look

Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Версия II

MaximKovalev May 15 2017 at 11:23

В этом вопросе мне очень понравилась работа Матураны.

Look

Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Версия II

MaximKovalev May 15 2017 at 11:22

Совершенно точно. Такого рода вопросы и лежат в основе понимания того, как строить ИИ.

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 15 2017 at 12:27

Хотя вт замерили сегодня — с сервера у нас 30-50 милисекнд на сервере. Сам на себя наговорил. Тем не менее — концепция ввода строки «как есть» остается.

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 15 2017 at 11:59

Соглашусь. Нюансы есть. Сокращения, часто употребимые топонимы надо б коллекционировать.

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 15 2017 at 11:23

Согласен с коллегами, мы тоже придерживаемся в этом вопросе схожей идеологии. Хотя подбор домов добавили сразу.

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 15 2017 at 11:21

Нет, у нас не PHP и не MySQL. С точки зрения сложности — побуквенный ввод задача действительно довольно примитивная. Это может написать любой мало-мальски способный программист. Поэтому ее продажа как сервиса мне всегда была странной идеей. Проще самим написать. На месте заказчика — так бы и сделал. Цифры я приводил в один поток на виртуальной машине. Реально конечно многопочность, конечно в памяти и конечно хеши. На счет 20-30 милисекунд — это на сервере, а есть еще формирование выборки, ее вывод. Короче накладные. И не забывайте — выборка первой, она может и 5 мс, но дальше все зависит от массы условий, в том числе от методов сортировки, количестве записей на вывод, канал, тормозами скриптов клиентской части. Вот и выходит — что 10-300 мс. В среднем выливаются в 100. Да собственно, приведенная автором статистика это и подтверждает. От 20 на город, до 200 на улицу и еще на дом. Надо ж суммировать подбор по всем уровням. А еще учитывать, что человек пробует первым вводить — область или улицу или населенный пункт, сервис подсовывает свою приоритетность. Ну допустим мои написанные 400-500 — это максимум. Пусть от 200 до 500. Пусть в среднем и 300. Ну а реально нашу скорость — можно потестировать на IQDQ.RU.
Собственно, идеологически мне кажется лучше давать вводить в одну строку с ошибками и потом разбирать. Повторюсь, это мое частное мнение и оно как и любое другое может быть оспорено.

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 15 2017 at 11:00

Не только Дадата делает это. И индексы и качество. Поэтому «только» это мягко говоря — преувеличение. Зачем обманывать людей?

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 14 2017 at 19:55

И да, есть канальные задержки. Каковы бы ресурсы небыли. Скорость интерфейса, тормоза машины и браузера. В общем все равно 4 буквы — это 400-500 миллисекунд в сумме. А разбор пусть и грязной строки — 10-100 миллисекунд в среднем.

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 14 2017 at 19:51

Тогда прошу и нас попробовать. Что б была объективная оценка и нашего сервиса, а не мои предположения как заинтересованного лица.
Что касается ошибок, то я как раз и говорю. Пусть человек введет как может всю строку, с ОрджАникидзе или МоскАва. И после ввода разобрать всю! строку. А вот если нет однозначности — то да мы можем подсветить варианты. Нюанс в том, что имея всю строку — я резко сокращаю количество вариантов в случае неоднозначности. Оператору гораздо проще выбирать из двух-трех, чем в случае побуквенного ввода будет вываливаться полтора десятка.
Собственно, то что я сейчас говорю проверено на работе операторов. Через нас ежедневно проходят сотни тысяч адресов. И мы пробовали разные версии интерфейсов для работы операторов. Идею подсказок отмели. Так как оператор очень быстро устает выбирать из большого количества вариантов при побуквенном вводе. Да и в разных случаях нужна разная сортировка. Где-то сначала город, где-то улица, а где-то хотелось бы населенный пункт.
В общем при побуквенном вводе количество ошибок на порядок больше.

Что касается тех, кто медленно вводит, то где-то могу согласится, хотя сегодня большинство людей довольно уверенно работают с клавиатурой даже в телефоне. Но вопросы остаются: какую сортировку подразумевает пользователь? Что делать с неполнотой эталона? Что делать с латиницей?

Ну и технически: Надо понимать, что побуженный ввод это поисковый запрос к базе при вводе каждой новой буквы и сортировка! А это дорого. Даже с учетом хешей. А разбор строки целиком даже с учетом ошибок и опечаток — это один запрос.

Look

Хорошо ли подсказывают сервисы подсказок: измеряем полезность веб-сервисов автодополнения

MaximKovalev Mar 14 2017 at 17:42

Очень хорошая статья. Прямо бальзам на душу. Всегда и везде объясняем, что лучше дать пользователю ввести адрес сразу в одну строку, а потом проверить. И что побуквенный ввод имеет ряд принципиальных недостатков. К указанным выше я бы добавил:
1.Необратимость ошибок. Если пользователь выбрал не ту строку — то узнать что же имелось ввиду невозможно.
2.Что делать если нет такого элемента в КЛАДР/ФИАС.
3.Что делать с латиницей.
4.Совершенно нет никакой методики сортировки вывода, которая б удовлетворила всех.
Кстати почему не включили в сравнение наш сайт www.iqdq.ru? Хотя сразу скажу — у нас где-то 300-500 мс. В середнячки по подбору. Мы на разбор целой строки нацелены.

Look

Как сделать ЖКХ, чтобы оно было ГИС

MaximKovalev Feb 18 2017 at 11:20

Согласен с обоими высказываниями. И по поводу того, кто придумал ФИАС и по поводу того что альтернативы нет. Так что никуда не денешься: ФИАС к сожалению безальтернативен. Разработчикам деваться некуда. Законодательство.

Look

Как сделать ЖКХ, чтобы оно было ГИС

MaximKovalev Feb 17 2017 at 08:52

Я знаю, поэтому и спрашиваю. И вот тут проблема. Без автоматических средств — это сложно и по нашему опыту малоперспективно. Будут ошибки. Можем помочь.

Look

Как сделать ЖКХ, чтобы оно было ГИС

MaximKovalev Feb 17 2017 at 08:47

Вот как раз ГИС ЖКХ — это одна из точек, которая при правильном подходе и могла бы поспособствовать решению этой проблемы. Но для этого она должна быть озвучена, понята и принята. Собственно, что и пытаюсь сделать, написав эти замечания.

Look

Как сделать ЖКХ, чтобы оно было ГИС

MaximKovalev Feb 17 2017 at 08:33

Ок. Это вариант. А как валидируете? Там плохо с привязками. Там даже КЛАДРа нет, не то что ФИАС?

Look

Как сделать ЖКХ, чтобы оно было ГИС

MaximKovalev Feb 17 2017 at 08:28

Таких примеров масса. В любом случае это один объект недвижимости. Яндекс лепит дома как хочет. Я уже писал про пример с массово появившимися домами 23-34, хотя по ФИАС это 23/34. Как правило такие дома это Славная 35 и Ильина 20. Но отличить можно только по Росреестру, в котором тоже много ошибок. С какими-то придется мирится так как они прописаны в документах купли-продажи.
И, кстати, есть покварталтная застройка, когда вместо корпусов лепили дроби.

Look

Как сделать ЖКХ, чтобы оно было ГИС

MaximKovalev Feb 17 2017 at 07:57

Что касается «экспертного сообщества», то оно, деликатно скажем так, у нас не очень настроено на диалог.

Look

1 2 3

5 6