How to become an author

Владимир @Caracat

Пользователь

Profile Publications Comments 287Bookmarks 356

Kouki_RUS Feb 6 2020 at 17:09

Transformer в картинках

14 min

113K

Machine learning*

Translation

В прошлой статье мы рассматривали механизм внимания (attention) – чрезвычайно распространенный метод в современных моделях глубокого обучения, позволяющий улучшить показатели эффективности приложений нейронного машинного перевода. В данной статье мы рассмотрим Трансформер (Transformer) – модель, которая использует механизм внимания для повышения скорости обучения. Более того, для ряда задач Трансформеры превосходят модель нейронного машинного перевода от Google. Однако самое большое преимущество Трансформеров заключается в их высокой эффективности в условиях параллелизации (parallelization). Даже Google Cloud рекомендует использовать Трансформер в качестве модели при работе на Cloud TPU. Попробуем разобраться, из чего состоит модель и какие функции выполняет.

Впервые модель Трансформера была предложена в статье Attention is All You Need. Реализация на TensorFlow доступна как часть пакета Tensor2Tensor, кроме того, группа NLP-исследователей из Гарварда создали гид-аннотацию статьи с реализацией на PyTorch. В данном же руководстве мы попробуем максимально просто и последовательно изложить основные идеи и понятия, что, надеемся, поможет людям, не обладающим глубоким знанием предметной области, понять данную модель.

Читать дальше →

+16

Wentura Feb 6 2020 at 10:55

Как настроить Elasticsearch, чтобы не было утечек

5 min

14K

Information Security*IT Infrastructure*DataLine corporate blogDatabase Administration*

За последний год возникало много утечек из баз Elasticsearch (вот, вот и вот). Во многих случаях в базе хранились персональные данные. Этих утечек можно было избежать, если бы после разворачивания базы администраторы потрудились проверить несколько несложных настроек. Сегодня о них и поговорим.

Сразу оговоримся, что в своей практике используем Elasticsearch для хранения логов и анализа журналов средств защиты информации, ОС и ПО в нашей IaaS-платформе, соответствующей требования 152-ФЗ, Cloud-152.

Читать дальше →

+15

frii_fond May 28 2015 at 19:00

Психология ценообразования: 10 стратегий и 29 тактик

30 min

63K

Фонд развития интернет-инициатив corporate blogGrowth Hacking*Internet marketing*

Translation

Добро пожаловать! Это длинный список стратегий ценообразования, учитывающих психологические факторы.

Неважно, запускаете ли вы новый продукт, продаете что-либо на eBay или же заключаете сделку о продаже дома – вы научитесь устанавливать цены, которые максимизируют вашу прибыль.

Читать дальше →

+26

Fagot78 Feb 5 2020 at 14:13

Моделирование бизнес-процессов как часть проекта по внедрению ERP-системы

8 min

13K

ERP-systems*Project management*

Перед началом очередного проекта по внедрению информационной системы, охватывающей большинство участков функционирования предприятия я решил написать ряд статей со своими соображениями по обоснованию того факта, что на крупных промышленных предприятиях, особенно на предприятиях старых, ведущих свою деятельность десятки лет, больше половины ERP-проектов «не взлетают». Буду писать эти статьи больше для себя в качестве «склерозника» для формирования бесед с топ-менеджерами предприятия и структурирования тех соображений, которые я вынес на основе своего опыта.

Эти статьи не несут собой целью рассказать миру о том, какой я крутой реализатор или о том, что я лучше всех знаю как надо реализовывать такие проекты. Если вы скажете, что это «очередная статья неудачника, который ну прямо все понимает неправильно» — это тоже будет для меня ценностью, так как ожидаю, что кто-то поделится своими соображениями в комментариях.

Читать дальше →

+5

lws0954 Feb 2 2020 at 14:30

Модель параллельных вычислений

16 min

7.6K

C++*Qt*Concurrent computing*Matlab*

1. Введение. Конкурентный корутинизм

Предыдущие статьи на тему автоматного программирования были всего лишь «цветочками». «Ягодкой» автоматного программирования, т.е. ради чего нужно им заниматься, является модель параллельных вычислений на базе модели конечных автоматов. Итак, поехали…

Стандарт С++ включил в свой состав долгожданную поддержку многопоточности [1]. Но не будем ни восхищаться этим, ни критиковать сей факт, т.к. работа с потоками отягощена таким множеством условий, оговорок и особенностей, что без реальных примеров, выявляющих проблемы многопоточности, обсуждение многопоточного программирования будет не только поспешным, но и достаточно предвзятым. Поэтому далее в основном не о потоках, а об автоматах, имея в виду, конечно, и первые.

Читать дальше →

+2

flancer Jan 30 2020 at 23:28

Vue Storefront: оформление заказа

4 min

5.6K

ERP-systems*Development for e-commerce*E-commerce management*VueJS*

Пятый и завершающий пост о моём знакомстве с Vue Storefront. IMHO, самым современным с технической точки зрения решением в сфере e-commerce на данный момент. Ссылки на предыдущие посты:

Под катом краткое описание особенностей этого этапа и итоговое резюме.

Читать дальше →

+3

IgorLuzhanskiy Jan 29 2020 at 10:28

Как стать дизайнером диалогов

5 min

3.4K

IT Standards*Game design*The future is hereNatural Language Processing*

Я предлагаю вам вперевод и выжимку со статьи моего пратнера Ханса ван Дама о том, как разрабатывать дизайн диалогов. Авторство статьи принадлежит Гансу. Я ему помогаю поделиться этими уникальными знаниями с будущими разработчиками и дизайнерами диалогов.

Если люди и ИИ будут жить и работать вместе, им необходимо общаться друг с другом. Именно тут в игру вступают дизайнеры диалогов.

Дизайнеры диалогов являются создателями текстов, которые помогают чат ботам и голосовым помощникам быть более полезными, естественными и убедительными. Они создают доверие между людьми и ИИ, а также способствуют тому, чтобы компании могли по-настоящему раскрыть коммуникационный потенциал ИИ. Если Вы посмотрите на сегодняшнюю технологическую среду в целом, Вы поймете, что дизайн виртуальных диалогов становится все более важной задачей. Поэтому, давайте рассмотрим те вопросы, о которых Вам стоит задуматься перед началом работы.

Ниже приведены 7 вопросов для обдумывания.

Читать дальше →

+3

SLY_G Jan 27 2020 at 12:50

Идея, взятая из физики, помогает ИИ работать в высших измерениях

11 min

11K

Artificial IntelligencePhysics

Translation

Законы физики не меняются от смены точки зрения. Однако эта идея помогает компьютерам распознавать определённые особенности в искривлённом пространстве высших измерений.

Компьютеры учатся водить автомобили, обыгрывают чемпионов мира в настольные игры, и даже пишут прозу. По большей части революция ИИ зиждется на возможностях одного типа искусственной нейронной сети, схема работы которой вдохновлена связанными друг с другом слоями нейронов в зрительной коре мозга млекопитающих. Так называемые «свёрточные нейронные сети» (СНС) оказались удивительно хорошо приспособленными к поиску закономерностей в двумерных данных – особенно в таких задачах компьютерного зрения, как распознавание рукописных слов или объектов на цифровых изображениях.

Но в применении к наборам данных, не сводимых к геометрии на плоскости – к примеру, к моделям неправильных форм, используемых в трёхмерной компьютерной анимации, к облакам точек, генерируемых робомобилями для разметки окружающего их мира – эта эффективная архитектура машинного обучения (МО) уже не так хорошо работает. В 2016 году появилась новая дисциплина, геометрическое глубокое обучение (ГГО), целью которой стало вывести СНС за пределы плоскости.

Читать дальше →

+13

Fixique Jan 23 2020 at 13:37

Проблемы архитектуры в больших проектах

7 min

8.3K

Development for iOS*Development of mobile applications*Designing and refactoring*Swift*Surf corporate blog

Разработка мобильных приложений кажется достаточно простым занятием. Казалось бы, что там делать? Накидал парочку вьюх, помазал это какой-нибудь архитектурой, и все, проект готов, можно отправлять приложение в стор. В цикле статей я поделюсь особенностями, с которыми мы столкнулись при разработке приложения для большого банка.

Рассмотрим 5 важных тем. Конечно, большинство из них не раз обсуждались в сообществе, но за каждой из тем стоят боль, слезы, потерянное время и, самое главное, опыт, который оказался полезен для нас, и надеюсь, будет полезен и вам.

Читать дальше →

+7

JetHabr Jan 23 2020 at 17:58

Автоматическое машинное обучение: когда data scientist’ы будут не нужны

7 min

8.9K

Algorithms*Инфосистемы Джет corporate blogMachine learning*

Уже третий год мы проводим форум по искусственному интеллекту RAIF (Russian Artificial Intelligence Forum), на котором спикеры из мира бизнеса и науки рассказывают о своей работе. Самыми интересными докладами мы решили поделиться. В этом посте Андрей Фильченков, руководитель лаборатории машинного обучения ИТМО, рассказывает всю правду об AutoML.

В рамках прошедшего в Сколково форума RAIF 2019, организованного «Инфосистемы Джет», я выступил с докладом, в котором рассказал об AutoML и перспективах его использования. Поскольку я ученый, мне не так уж часто приходится выступать на подобных мероприятиях: обычно я участвую в научных конференциях.

Одной из основных областей, которой мы занимаемся, является AutoML. Кроме того, я являюсь техническим директором двух небольших стартапов. Один из них – Statanly technologies – создает сервисы AutoML и занимается анализом данных. Фактически я являюсь тем человеком, который придумывает алгоритмы, внедряет их и пользуется ими. Наверное, я единственный человек, который может рассказать про AutoML со всех трех возможных позиций.

Читать дальше →

+16

alexey_nichnikov Jan 20 2020 at 13:16

Перевод книги Эндрю Ына «Страсть к машинному обучению» Глава 33

3 min

4.9K

Machine learning*

предыдущие главы

Сравнение с качеством, доступным человеку

33. Зачем сравнивать с уровнем качества, доступным человеку

Многие системы, использующие машинное обучение, преследуют цель автоматизировать задачи, с которыми люди хорошо справляются. В качестве примера можно привести распознавание изображений, распознавание речи, классификация спама в электронной почте. Обучающиеся алгоритмы настолько улучшились, что им удается превзойти человека на все большем и большем количестве таких задач.

Кроме того, есть несколько причин, исходя из которых построение систем машинного обучения упрощается, если вы пытаетесь выполнить с их помощью задачу, с которой хорошо справляются люди:

Читать дальше →

+3

MaxRokatansky Jan 17 2020 at 16:56

Алгоритм Беллмана-Форда

5 min

74K

Algorithms*OTUS corporate blog

Translation

В преддверии старта курса «Алгоритмы для разработчиков» подготовили очередной перевод интересной статьи.

Задача: Дан граф и начальная вершина src в графе, необходимо найти кратчайшие пути от src до всех вершин в данном графе. В графе могут присутствовать ребра с отрицательными весами.

Мы уже обсуждали алгоритм Дейкстры в качестве способа решения этой задачи. Алгоритм Дейкстры является жадным алгоритмом, а его сложность равна O(VLogV) (с использованием кучи Фибоначчи). Однако Дейкстра не работает для графов с отрицательными весами ребер, тогда как Беллман-Форд — вполне. Алгоритм Беллмана-Форда даже проще, чем алгоритм Дейкстры, и хорошо подходит для распределенных систем. В то же время сложность его равна O(VE), что больше, чем показатель для алгоритма Дейкстры.

Рекомендация: Прежде, чем двигаться к просмотру решения, попробуйте попрактиковаться самостоятельно.

Читать дальше →

+10

MaxRokatansky Jan 16 2020 at 17:44

Машинное обучение столкнулось с нерешенной математической проблемой

4 min

27K

Mathematics*Machine learning*OTUS corporate blog

Translation

Салют, хабровчане! В преддверии запуска новых потоков по продвинутому и базовому курсам «Математика для Data Science» хотим поделиться с вами достаточно интересным переводом. В этой статье не будет практики, но материал интересен для общего развития и обсуждения.

Группа исследователей столкнулась с открытой математической проблемой, связанной с рядом логических парадоксов, которые были открыты знаменитым австрийским математиком Куртом Гёделем еще в 1930-х годах.

Математики, работавшие над проблемами машинного обучения, доказали, что возможность «обучаемости», то есть то, может ли алгоритм извлечь паттерн из ограниченных данных, тесно связана с парадоксом, известным как гипотеза континуума. Гедель говорил о том, что с помощью стандартных возможностей математического языка гипотезу нельзя ни подтвердить, ни опровергнуть. Последние результаты исследований на эту тему были опубликованы в Nature Machine Intelligence от 7 января.

Читать дальше →

+17

SLY_G Jan 13 2020 at 10:00

Как работают двоичные нейронные сети, и почему они будут популярными в 2020-м

4 min

17K

Machine learning*Artificial Intelligence

Translation

Нейросети – штука классная, однако их потенциал до сих пор ограничивают стоимость и энергия; с этим, возможно, помогут справиться двоичные нейросети

Концепция нейросетей впервые появилась более 40 лет назад, когда учёные экспериментировали с математическим моделированием функций мозга. Они придумали, как сделать механическую реализацию нейросети, которую можно обучить распознаванию закономерностей и классификации данных – к примеру, распознавать, есть ли на видео кошка или собака.

За последнее десятилетие сложность и способности нейросетей значительно выросли. Совместно с беспрецедентным ростом мощностей недорогих и доступных суперкомпьютеров и графических процессоров (GPU) они вышли на передний план в качестве метода по умолчанию для решения задач, распознавания закономерностей и обнаружения аномалий. Сегодня организации используют их для составления прогнозов, исследования предпочтений пользователей, подтверждения данных и управления риском.

Читать дальше →

+15

Ariez Jan 10 2020 at 11:08

Мениски в коленном суставе — что это, зачем это, как это лечится если повредилось?

7 min

76K

Решил сегодня поделиться с сообществом небольшой статьей, продолжающей знакомство с ортопедией и биомеханикой. Тема разговора – мениски коленного сустава. Что это такое, зачем они нужны, почему они такие важные и какие современные тенденции в лечении повреждений менисков.

Цель данной статьи – информированность людей.

Кому интересно – заходим под кат.

+41

FaryaRos Jan 8 2020 at 08:13

Обсуждаем цифровые двойники и имитационное моделирование с основателем консалтинговой компании

6 min

4.9K

System Analysis and Design*Industrial Programming*Project management*Research and forecasts in IT*IT career

Основатель NFP Сергей Ложкин рассказал мне, что такое имитационное моделирование, цифровые двойники, почему для Европы наши разработчики дешевые и крутые, и почему в России высокий уровень цифровизации.

Заходите, если хотите узнать, как это работает, кому нужны в России Digital Twin, сколько стоит проект и как этому научиться.

Читать дальше →

+3

Dartess Jan 3 2020 at 20:03

Прогрессивные веб-приложения в 2020

17 min

28K

JavaScript*Development of mobile applications*Browsers

Translation

На КДПВ — стикер, созданный командой браузера Samsung Internet

Больше 12 лет прошло с тех пор, как Стив Джобс впервые представил идею веб-приложений, «которые выглядят и ведут себя точно так же, как и нативные приложения». Больше 4 лет прошло с момента появления термина «PWA». Что из себя представляют прогрессивные веб-приложения в начале 2020 года? Что из того, что было добавлено в экосистему в 2019 году, вы могли упустить? Давайте выясним.

Читать дальше →

+21

SLY_G Jan 3 2020 at 14:00

Учёные автоматизируют исследования поведения животных, чтобы декодировать работу мозга

13 min

4.7K

Machine learning*Popular science

Translation

Машинное обучение и глубокие нейросети способны распознать и анализировать «язык поведения» животных способами, находящимися за пределами человеческих возможностей

Для отслеживания движений животных в природной среде учёные всё чаще обращаются к методам машинного обучения (МО). На этом видео алгоритм DeepPoseKit отслеживает движение и ориентацию пустынной саранчи в замкнутом пространстве, чтобы снабдить исследователей данными по совместному поведению насекомых.

В попытках понять, что происходит в головах у животных, отправляли нейробиологов по неожиданным путям: от подглядывания непосредственно в живой мозг до управления нейронами при помощи световых вспышек, создания сложных устройств и виртуальных окружений.

В 2013 году это привело нейробиолога Боба Датту вместе с коллегами из Гарвардской медицинской школы в супермаркет Best Buy, находящийся на той же улице, что и их лаборатория.

+15

Data_center_MIRAN Jan 3 2020 at 17:22

Rhasspy — опенсорсный и полностью офлайновый речевой тулкит. Распознавание русского языка. Никаких утечек в облако

3 min

35K

Open source*Дата-центр «Миран» corporate blogDevelopment for Raspberry Pi*DIYSound

Фото из сравнения микрофонных массивов для DIY-устройств типа самодельной умной колонки

Системы вроде Amazon Echo передают в облако для хранения ваши конфиденциальные разговоры (даже записанные случайно). В некоторых случаях записи прослушиваются живыми операторами. Это не просто потеря конфиденциальности. Это как добровольно впустить в свою квартиру «товарища майора», который стоит рядом 24 часа в сутки, слушает и внимательно записывает, притворяясь услужливым ассистентом.

Вместо покупки коммерческой системы у корпораций типа Google, Amazon или «Яндекс», вы можете собрать аналогичную опенсорсную систему на базе Raspberry Pi 2-3 B/B+, персонального компьютера или ноутбука.

Rhasspy — безопасный голосовой помощник, который работает автономно. Он ничего не передаёт на удалённые сервисы, при этом успешно справлятся с распознаванием речи и голосовых команд.

Читать дальше →

+40

SLY_G Jan 3 2020 at 10:00

Я создал свой собственный дипфейк за две недели и $552

15 min

42K

Information Security*Working with video*Machine learning*Artificial Intelligence

Translation

Создавая это видео, я научился многому

Технология дипфейков использует глубокие нейронные сети для убедительной замены на видео одного лица другим. У этой технологии есть очевидный потенциал для злонамеренного использования, и она становится всё более распространённой. По поводу социальных и политических последствий этого тренда было написано уже много хороших статей.

И это не одна из них. Вместо этого я сам поближе ознакомлюсь с этой технологией: как работает ПО для дипфейков? Насколько сложно их создавать, и насколько хорошими получаются результаты?

Я решил, что лучше всего ответить на эти вопросы, создав собственное дипфейк-видео. Редакция выделила мне несколько дней на то, чтобы поиграться с ПО и $1000 на оплату облачных вычислений. Через пару недель я получил результат, представленный на видео в начале статьи. Начал я с видео Марка Цукерберга, выступающего перед конгрессом, и заменил его лицо на лейтенант-коммандера Дейту (Брента Спайнера) из фильма «Звёздный путь: следующее поколение». Всего было потрачено $552.

+20

3

4 5 ...