Как стать автором
Обновить
561.66

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Нейронки за 5 минут

Время на прочтение5 мин
Количество просмотров171K
Давайте я за 5-10 минут чтения и понимания коротенькой статьи добавлю вам в резюме строчки «машинное обучение» и «нейронные сети»? Тем, кто далек от программирования, я развею все мифы о сложности ИИ и покажу, что большая часть всех проектов на машинном обучении строится на предельно простых принципах. Поехали — у нас всего пять минут.

Рассмотрим самый базовый пример нейронных сетей — перцептроны; я сам только после этого примера полностью осознал, как работают нейронные сети, так что, если я не накосячу, и вы сможете понять. Помните: никакой магии здесь нет, простая математика уровня пятого класса средней школы.
Читать дальше →
Всего голосов 138: ↑111 и ↓27+84
Комментарии143

Как Яндекс применил технологии искусственного интеллекта для перевода веб-страниц

Время на прочтение8 мин
Количество просмотров21K
В современном интернете более 630 миллионов сайтов, но лишь 6% из них содержат русскоязычный контент. Языковой барьер – главная проблема распространения знаний между пользователями сети, и мы верим, что решать её нужно не только обучением иностранным языкам, но и с помощью автоматического машинного перевода в браузере.

Сегодня мы расскажем читателям Хабра о двух важных технологических изменениях в переводчике Яндекс.Браузера. Во-первых, перевод выделенных слов и фраз теперь использует гибридную модель, и мы напомним, чем этот подход отличается от применения исключительно нейросетей. Во-вторых, нейронные сети переводчика теперь учитывают структуру веб-страниц, об особенностях которой мы также расскажем под катом.


Читать дальше →
Всего голосов 59: ↑59 и ↓0+59
Комментарии31

Курс о Deep Learning на пальцах

Время на прочтение2 мин
Количество просмотров173K
Я все еще не до конца понял, как так получилось, но в прошлом году я слово за слово подписался прочитать курс по Deep Learning и вот, на удивление, прочитал. Обещал — выкладываю!

Курс не претендует на полноту, скорее это способ поиграться руками с основными областями, где deep learning устоялся как практический инструмент, и получить достаточную базу, чтобы свободно читать и понимать современные статьи.

Материалы курса были опробованы на студентах кафедры АФТИ Новосибирского Государственного Университета, поэтому есть шанс, что по ним действительно можно чему-то научиться.


Читать дальше →
Всего голосов 117: ↑117 и ↓0+117
Комментарии31

Яндекс.Станция. Как мы создавали первое устройство с Алисой

Время на прочтение8 мин
Количество просмотров107K


Несколько минут назад на конференции YaC 2018 мы впервые рассказали о Яндекс.Станции. Это первое мультимедийное устройство с Алисой, которое воспроизводит музыку и фильмы, рассказывает детям сказки, помогает в повседневных делах, а также поддерживает навыки от сторонних разработчиков.

Может показаться, что для создания подобных устройств достаточно взять голосового помощника, добавить к нему простой микрофон из смартфона и спрятать всё это в корпусе недорогой аудиоколонки. На практике перед разработчиками подобных систем стоят серьёзные технологические проблемы, о решении которых в Станции мы и расскажем сегодня читателям Хабра. Вы также узнаете, что именно представляет собой технологическая платформа Yandex.IO, на основе которой и создано устройство.
Читать дальше →
Всего голосов 184: ↑168 и ↓16+152
Комментарии598

Истории

Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке

Время на прочтение12 мин
Количество просмотров83K
В 2020 году библиотека Natasha значительно обновилась, на Хабре опубликована статья про актуальную версию. Чтобы использовать инструменты, описанные в этом тексте, установите старую версию библиотеки pip install natasha<1 yargy<0.13.

Раздел про Yargy-парсер актуален и сейчас.


Есть стандартная задача извлечения именованных сущностей из текста (NER). На входе текст, на выходе структурированные, нормализованные объекты, например, с именами, адресами, датами:



Задача старая и хорошо изученная, для английского языка существует масса коммерческих и открытых решений: Spacy, Stanford NER, OpenNLP, NLTK, MITIE, Google Natural Language API, ParallelDots, Aylien, Rosette, TextRazor. Для русского тоже есть хорошие решения, но они в основном закрытые: DaData, Pullenti, Abbyy Infoextractor, Dictum, Eureka, Promt, RCO, AOT, Ahunter. Из открытого мне известен только Томита-парсер и свежий Deepmipt NER.

Я занимаюсь анализом данных, задача обработки текстов одна из самых частых. На практике оказывается, что, например, извлечь имена из русского текста совсем непросто. Есть готовое решение в Томита-парсере, но там неудобная интеграция с Python. Недавно появилось решение от ребят из iPavlov, но там имена не приводятся к нормальной форме. Для извлечения, например, адресов («ул. 8 Марта, д.4», «Ленинский проезд, 15») открытых решений мне не известно, есть pypostal, но он чтобы парсить адреса, а не искать их в тексте. C нестандартными задачами типа извлечения ссылок на нормативные акты («ст. 11 ГК РФ», «п. 1 ст. 6 Закона № 122-ФЗ») вообще непонятно, что делать.

Год назад Дима Веселов начал проект Natasha. С тех пор код был значительно доработан. Natasha была использована в нескольких крупных проектах. Сейчас мы готовы рассказать о ней пользователям Хабра.
Natasha — это аналог Томита-парсера для Python (Yargy-парсер) плюс набор готовых правил для извлечения имён, адресов, дат, сумм денег и других сущностей.
В статье показано, как использовать готовые правила из Natasha и, самое главное, как добавлять свои с помощью Yargy-парсера.
Читать дальше →
Всего голосов 87: ↑86 и ↓1+85
Комментарии33

ИИ от Google обучил дочерний ИИ, который превосходит все ИИ, созданные человеком

Время на прочтение3 мин
Количество просмотров73K


В мае 2017 года исследователи из Google Brain представили проект AutoML, который автоматизирует проектирование моделей машинного обучения. Эксперименты с AutoML показали, что эта система может генерировать маленькие нейросети с очень хорошими показателями — вполне сравнимые с нейросетями, которые спроектированы и обучены экспертами-людьми. Однако поначалу возможности AutoML были ограничены маленькими научными наборами данных вроде CIFAR-10 и Penn Treebank.

Инженеры Google задумались — а что если поставить перед генератором ИИ более серьёзные задачи? Способна ли эта система ИИ сгенерировать другую ИИ, которая будет лучше созданного человеком ИИ в какой-нибудь важной задаче вроде классификации объектов из базы ImageNet — самого известного из крупномасштабных наборов данных в машинном зрении. Так появилась нейросеть NASNet, созданная практически без участия человека.
Читать дальше →
Всего голосов 68: ↑66 и ↓2+64
Комментарии271

PornHub внедряет систему машинного зрения для автоматического распознавания лиц, поз и других атрибутов видео

Время на прочтение3 мин
Количество просмотров51K

Классификация изображения по признакам и распознавание личности актрисы по лицу на кадре из видеоролика. Иллюстрация: PornHub

Порноиндустрия всегда была двигателем технологического прогресса. Продолжает такой оставаться и сейчас. Например, один из самых посещаемых в мире сайтов PornHub (суточная аудитория 80 млн человек) готовится внедрить систему машинного зрения, пишет TechCrunch. Система автоматически обрабатывает и распределяет по рубрикам миллионы видеороликов.

Для удобной навигации по сайту все видеоролики классифицированы по различным признакам, в том числе по имени актрисы, типу происходящего сюжета, тематике видеоролика и так далее. Раньше всю работу по классификации выполняли люди — модераторы. Но количество любительских и профессиональных видеороликов быстро увеличивается. И вот PornHub вместо того, чтобы нанять новых модераторов и платить им за просмотр NSFW, запускает систему машинного зрения, которая будет работать круглосуточно и не требует зарплату.
Читать дальше →
Всего голосов 60: ↑57 и ↓3+54
Комментарии268

Пропажа одиннадцатого числа месяца и других дат

Время на прочтение6 мин
Количество просмотров37K


В ноябре 2012 года Рэндал Монро опубликовал комикс xkcd с календарём, в котором размер чисел каждого месяца был пропорционален тому, как часто это число упоминается в книгах по своему имени (например, «14 октября») в базе данных Google Ngrams с 2000 года. Большинство крупных дат довольно очевидны: 4 июля, 25 декабря, первое число каждого месяца, последнее число почти всех месяцев, ну и 11 сентября, оставляющее всех позади. Не так уж много дней выглядит сильно меньше остальных. К примеру, 29 февраля – крохотная точка. Но если приглядеться, можно увидеть, что 11 число каждого месяца относительно маленькое. К комиксу шло примечание: «Во всех остальных, кроме сентября, месяцах, 11-е упоминается гораздо реже остальных дат. Так было и до 11 сентября [2001], и я не знаю, почему это так». Я покопался в данных, и думаю, что разобрался, почему.
Читать дальше →
Всего голосов 89: ↑85 и ↓4+81
Комментарии32

Как обучается ИИ

Время на прочтение27 мин
Количество просмотров69K

Источник изображения.

Есть ли связь между трехглазой жабой и нейронными сетями? Что общего у программы, выигрывающей в го, и приложением Prisma, перерисовывающим фотографии под стили картин известных художников? Как компьютеры одолели нарды, а затем покусились на святое — и выиграли у человека в “Космических захватчиков”?
Дадим ответы на все эти вопросы, а еще поговорим о революции, связанной с глубоким обучением, благодаря которому удалось добиться прорыва во многих областях.
Читать дальше →
Всего голосов 56: ↑54 и ↓2+52
Комментарии35

Искусственные нейронные сети простыми словами

Время на прочтение7 мин
Количество просмотров212K
image

Когда, за бутылкой пива, я заводил разговор о нейронных сетях — люди обычно начинали боязливо на меня смотреть, грустнели, иногда у них начинал дёргаться глаз, а в крайних случаях они залезали под стол. Но, на самом деле, эти сети просты и интуитивны. Да-да, именно так! И, позвольте, я вам это докажу!

Допустим, я знаю о девушке две вещи — симпатична она мне или нет, а также, есть ли о чём мне с ней поговорить. Если есть, то будем считать это единицей, если нет, то — нулём. Аналогичный принцип возьмем и для внешности. Вопрос: “В какую девушку я влюблюсь и почему?”


Можно подумать просто и бескомпромиссно: “Если симпатична и есть о чём поговорить, то влюблюсь. Если ни то и ни другое, то — увольте.”

Но что если дама мне симпатична, но с ней не о чем разговаривать? Или наоборот?
Всего голосов 60: ↑59 и ↓1+58
Комментарии92

Играть на уровне бога: как ИИ научился побеждать человека

Время на прочтение27 мин
Количество просмотров65K


В 16 играх машины одолели человека (в 17, если брать в расчет поражение Ли Седоля в го), но в будущем их ждут еще более впечатляющие достижения: решение самых ошеломляющих математических, физиологических и биологических проблем, победа над болезнями и старостью, ликвидация дорожных аварий, триумф в военных конфликтах и многое другое.

Мир изменился прямо на наших глазах, но не все заметили это. Когда и как программы научились играть безошибочно? Всегда ли проигрыш одного человека свидетельствует о поражении всего человечества? Обретет ли искусственный интеллект сознание?

Об авторе. Статья основана на лекции «Искусственный интеллект. История и перспективы», проведенной в московском офисе Mail.Ru Group Сергеем oulenspiegel Марковым. Сергей Марков занимается machine learning в «Сбербанке». В банковской сфере строят предиктивные модели для управления бизнес-процессом на основе достаточно больших обучающих выборок, которые могут включать несколько сотен миллионов кейсов. Среди своих хобби Сергей указывает шахматное программирование, ИИ для игр, минимаксные задачи. Программа SmarThink, созданная Сергеем Марковым, становилась чемпионом России (2004) и СНГ (2005) среди шахматных программ (2004), и сегодня входит в топ-30 сильнейших программ в мире. Также Сергей является основателем некоммерческого научно-просветительского портала 22 век.
Читать дальше →
Всего голосов 58: ↑55 и ↓3+52
Комментарии65

Автономные грузовики размажут наше общество по асфальту

Время на прочтение7 мин
Количество просмотров79K

Необходимо срочно вводить безусловный доход ввиду грядущего будущего робомобилей


В прошлом году мы с приятелем поехали на машине из Нового Орлеана (Луизиана) в Орландо (Флорида), и, проезжая город за городом, мы беседовали о потенциальном эффекте, который робомобили окажут не только на дальнобойщиков, но и на всю локальную экономику, зависящую от их зарплат. И когда ты начинаешь задумываться о последствиях такого удара под дых для Америки, ты понимаешь, что будущее не так уж радужно.

Экономики мелких городов ощутимо просядут – таких потрясений мы не знали с тех пор, как построили систему шоссейных дорог между штатами. Если вы считаете, что я преувеличиваю – позвольте мне рассказать вам вот что:

image
на карте отмечены самые популярные профессии в 2014 году

И это должно сразу сказать вам, как сильно американская экономика зависит от водителей грузовиков. Согласно информации американской ассоциации дальнобойщиков (ATA), в США их работает 3,5 миллиона, а ещё 5,2 миллиона человек работает в индустрии грузоперевозок не за рулём. В сумме получаем 8,7 миллиона человек, чья работа связана с грузовиками.
Читать дальше →
Всего голосов 73: ↑63 и ↓10+53
Комментарии499

Знаменитый хакер Geohot собрал беспилотный автомобиль у себя в гараже

Время на прочтение4 мин
Количество просмотров56K


Американский хакер Джордж Хоц, более известный под ником Geohot, прославился, когда выпустил первый в истории джейлбрейк для iPhone. Семнадцатилетний школьник взломал iPhone в 2007 году, а спустя три года стал автором джейлбрейка Sony PlayStation 3.

Сейчас у Джорджа новый мега-проект: самодельный беспилотный автомобиль. Парень отверг предложение о работе в Tesla с многомиллионным бонусом. Он всё делает самостоятельно.
Читать дальше →
Всего голосов 68: ↑63 и ↓5+58
Комментарии77

Ближайшие события

После Каспарова. Компьютерные шахматы — итоги и перспективы

Время на прочтение6 мин
Количество просмотров21K
Заключительная статья из цикла о противостоянии Каспарова с шахматными машинами

Матч с X3D стал последним сражением Гарри Кимовича с машиной – больше он никогда не играл с компьютерами публично. Впрочем, и его соперничество с людьми тоже продолжалось недолго. Пару лет он ещё играл в обычных турнирах, но в 2005 году решил завершить свою шахматную карьеру. Отныне шахматы стали для него всего лишь хобби.

После ухода Каспарова, в шахматах не осталось явного лидера. На протяжении нескольких лет шахматную корону оспаривало сразу несколько примерно равных по силе гроссмейстеров. Но в 2013 году на вершину поднялся молодой норвежец Магнус Карлсен. Сегодня он чемпион мира и безусловный лидер мировых шахмат.
Читать дальше →
Всего голосов 59: ↑59 и ↓0+59
Комментарии25

ИИ от Google самостоятельно освоил 49 старых игр Atari

Время на прочтение2 мин
Количество просмотров49K


Компания Google создала систему искусственного интеллекта, которая играет лучше человека во многие аркадные игры. Программа научилась играть, не зная правил и не имея доступа к коду, а просто наблюдая за картинкой на экране.
Читать дальше →
Всего голосов 59: ↑55 и ↓4+51
Комментарии75

Каспаров против Deep Blue. Часть IV: Нью-Йоркские тайны

Время на прочтение10 мин
Количество просмотров24K

После более чем годовой подготовки начался эпохальный матч, который стал важной вехой в истории шахмат.

Ни до, ни после 1997 года поединки между компьютером и человеком не привлекали к себе такого общественного внимания.

Ошеломительный результат воспринялся широкой общественностью как начало эры новых чемпионов.
Ведь новыми чемпионами были уже не люди, а другие, более совершенные существа
Всего голосов 75: ↑75 и ↓0+75
Комментарии15

Революция в области искусственного разума. Часть первая: путь к Сверхразуму

Время на прочтение24 мин
Количество просмотров58K
Вторая часть
Примечание переводчика: Данная статья является переводом публикации «The AI Revolution: The Road to Superintelligence». Оригинальная статья была написана для широкой аудитории, поэтому многие термины использованные в ней могут быть не точными или вообще не научными. При переводе я старался сохранить непринуждённый дух статьи и юмор, с которым был написан оригинал. К сожалению, это не всегда получалось. Переводчик согласен не со всем, что написано в данной статье, но правки к фактам и своё мнение не были добавлены даже в виде примечаний или комментариев. В тексте могут быть ошибки и опечатки, сообщайте о них, пожалуйста, в личные сообщения, буду стараться исправлять всё максимально быстро. Все ссылки в тексте скопированы из оригинальной статьи и ведут на англоязычные ресурсы.

We are on the edge of change comparable to the rise of human life on Earth. — Vernor Vinge

Мы стоим на пороге перемен сравнимых, разве что с самим рождением человечества. Вернор Виндж.

Каково это находиться здесь?


Читать дальше →
Всего голосов 60: ↑55 и ↓5+50
Комментарии130

Каспаров против Deep Blue. Часть III: Междуматчье

Время на прочтение6 мин
Количество просмотров18K

Первый серьёзный шахматный матч человека и машины закончился в пользу нашего вида, но, как уже знаем, это была всего лишь прелюдия к более захватывающим событиям.

Прежде чем продолжить увлекательное чтиво о битве шахматных титанов, представляющих разные «формы жизни», спешу сообщить что мой соавтор Роман Жуков, он же Rom77, объявился и жив-здоров. К сожалению, у него нет времени и интереса для участия в создании новых эпизодов, однако он предоставил неоценимую помощь, которая будет оказывать существеннейшее влияние на написание этой (да и следующей) статьи. В своё время Роман много изучал перипетии этого противостояния, используя в том числе один источник, очень малоизвестный в русскоговорящей среде.
Дело в том, что он перевёл книгу главного создателя Deep Blue
Всего голосов 67: ↑65 и ↓2+63
Комментарии7

Каспаров против Deep Blue. Часть II: Филадельфийский эксперимент

Время на прочтение7 мин
Количество просмотров21K

После некоторого перерыва, продолжаю серию статей (а также обещаю в ближайшее время её закончить) про многолетнюю шахматную борьбу двух миров – человеческого и компьютерного. Планировалось, что Rom77 напишет статьи про обе битвы Каспарова с Deep Blue, но, к сожалению, мой соавтор, написавший отличное начало, не выходит на связь. Мне иногда приходят письма от благодарных читателей с вопросом почему же до сих пор нет продолжения, поэтому, вновь берусь за перо сажусь за клавиатуру, дабы продолжить прервавшееся повествование про приключения Гарри и его кремниевых друзей. Помимо разрозненных сведений о событиях тех лет, в статье также решил использовать, оказавшиеся в моём распоряжении, черновые наброски Романа про матч 1996 года.
Название статьи, кстати, тоже придумал он
Всего голосов 56: ↑56 и ↓0+56
Комментарии6

Первые обидчики. Fritz и Genius

Время на прочтение6 мин
Количество просмотров15K

Вторая серия о многолетней борьбе Каспарова с армадой терминаторов. Первую статью из цикла читайте здесь.

Шахматные программы считали с каждым годом всё быстрее и всё адекватнее оценивали позиции, в том числе и не изобилующими тактическими ударами. Алгоритмы совершенствовались и боты достигли успехов, выигрывая не только в комбинационном, но и в позиционном ключе. Компьютерные игроки почти излечились от жадности и если люди жертвовали материал, то роботы, ради восстановления игрового баланса, троянских коней с легким сердцем отправляли обратно.

Участие компьютеров в человеческих соревнованиях вошло в моду. IT-компании охотно и щедро спонсировали мероприятия, с непременным условием – роботы играют на тех же правах, что и люди. Особенно интересен 1994 год, в которых произошли несколько знаковых событий, когда внезапно компьютеры начали регулярно наносить людям чувствительные поражения.
Причём досталось и чемпиону мира
Всего голосов 55: ↑55 и ↓0+55
Комментарии11