How to become an author

hellmonkey @HellMonkey

Software Engineer

Profile Publications Comments 99Bookmarks 213

KvanTTT May 4 2016 at 11:00

Обработка древовидных структур и унифицированное AST

11 min

18K

Programming*Compilers*Positive Technologies corporate blog

Предыдущая статья серии была посвящена теории парсинга исходников с использованием ANTLR и Roslyn. В ней было отмечено, что процесс сигнатурного анализа кода в нашем проекте PT Application Inspector разбит на следующие этапы:

парсинг в зависимое от языка представление (abstract syntax tree, AST);
преобразование AST в независимый от языка унифицированный формат (Unified AST, UAST);
непосредственное сопоставление с шаблонами, описанными на DSL.

Данная статья посвящена второму этапу, а именно: обработке AST с помощью стратегий Visitor и Listener, преобразованию AST в унифицированный формат, упрощению AST, а также алгоритму сопоставления древовидных структур.

Содержание

Обход AST
Типы узлов унифицированного AST
Тестирование конвертеров
Упрощение UAST
Алгоритм сопоставления древовидных структур
Заключение

Читать дальше →

+13

KvanTTT Mar 3 2016 at 16:39

Теория и практика парсинга исходников с помощью ANTLR и Roslyn

23 min

40K

Programming*.NET*Compilers*Positive Technologies corporate blog

В нашем проекте PT Application Inspector реализовано несколько подходов к анализу исходного кода на различных языках программирования:

поиск по сигнатурам;
исследование свойств математических моделей, полученных в результате статической абстрактной интерпретации кода;
динамический анализ развернутого приложения и верификация на нем результатов статического анализа.

Наш цикл статей посвящен структуре и принципам работы модуля сигнатурного поиска (PM, pattern matching). Преимущества такого анализатора — скорость работы, простота описания шаблонов и масштабируемость на другие языки. Среди недостатков можно выделить то, что модуль не в состоянии анализировать сложные уязвимости, требующие построения высокоуровневых моделей выполнения кода.

К разрабатываемому модулю были, в числе прочих, сформулированы следующие требования:

поддержка нескольких языков программирования и простое добавление новых;
поддержка анализа кода, содержащего синтаксические и семантические ошибки;
возможность описания шаблонов на универсальном языке (DSL, domain specific language).

В нашем случае все шаблоны описывают какие-либо уязвимости или недостатки в исходном коде.

Весь процесс анализа кода может быть разбит на следующие этапы:

парсинг в зависимое от языка представление (abstract syntax tree, AST);
преобразование AST в независимый от языка унифицированный формат;
непосредственное сопоставление с шаблонами, описанными на DSL.

Данная статья посвящена первому этапу, а именно: парсингу, сравнению функциональных возможностей и особенностей различных парсеров, применению теории на практике на примере грамматик Java, PHP, PLSQL, TSQL и даже C#. Остальные этапы будут рассмотрены в следующих публикациях.

Читать дальше →

+31

freetonik Sep 8 2016 at 14:50

Что такое свёрточная нейронная сеть

13 min

264K

Programming*Image processing*Machine learning*

Translation

Введение

Свёрточные нейронные сети (СНС). Звучит как странное сочетание биологии и математики с примесью информатики, но как бы оно не звучало, эти сети — одни из самых влиятельных инноваций в области компьютерного зрения. Впервые нейронные сети привлекли всеобщее внимание в 2012 году, когда Алекс Крижевски благодаря им выиграл конкурс ImageNet (грубо говоря, это ежегодная олимпиада по машинному зрению), снизив рекорд ошибок классификации с 26% до 15%, что тогда стало прорывом. Сегодня глубинное обучения лежит в основе услуг многих компаний: Facebook использует нейронные сети для алгоритмов автоматического проставления тегов, Google — для поиска среди фотографий пользователя, Amazon — для генерации рекомендаций товаров, Pinterest — для персонализации домашней страницы пользователя, а Instagram — для поисковой инфраструктуры.

Но классический, и, возможно, самый популярный вариант использования сетей это обработка изображений. Давайте посмотрим, как СНС используются для классификации изображений.

Задача

Задача классификации изображений — это приём начального изображения и вывод его класса (кошка, собака и т.д.) или группы вероятных классов, которая лучше всего характеризует изображение. Для людей это один из первых навыков, который они начинают осваивать с рождения.

Читать дальше →

+91

Leono Nov 6 2016 at 13:47

Синтез изображений с помощью глубоких нейросетей. Лекция в Яндексе

15 min

48K

Entertaining tasksЯндекс corporate blogAlgorithms*Image processing*

Пусть в блоге Яндекса на Хабрахабре эта неделя пройдет под знаком нейронных сетей. Как мы видим, нейросети сейчас начинают использоваться в очень многих областях, включая поиск. Кажется, что «модно» искать для них новые сферы применения, а в тех сферах, где они работают уже какое-то время, процессы не такие интересные.

Однако события в мире синтеза визуальных образов доказывают обратное. Да, компании еще несколько лет назад начали использовать нейросети для операций с изображениями — но это был не конец пути, а его начало. Недавно руководитель группы компьютерного зрения «Сколтеха» и большой друг Яндекса и ШАДа Виктор Лемпицкий рассказал о нескольких новых способах применения сетей к изображениям. Поскольку сегодняшняя лекция — про картинки, то она очень наглядная.

Под катом — расшифровка и большинство слайдов.

+81

bocharov Oct 22 2012 at 12:19

«Он видел их семью своими глазами»

6 min

65K

Можешь выбрать подходящую к заголовку поста картинку?

Тогда научи робота! Он тоже хочет.

Команда проекта Открытый корпус просит хабралюдей помочь разметить свободно доступный (CC-BY-SA) корпус текстов. Под катом мы расскажем о том, что такое корпус, зачем он нужен, как обстоят дела с корпусами в России и за рубежом, почему так плохо и какой у нас план.

Читать дальше →

+145

Oroszorszag Oct 5 2015 at 11:47

Живёт ли кракен в Море Кракена? Какие формы жизни мы могли бы найти на Титане?

10 min

31K

Popular scienceChemistry

Это перевод статьи Пола Паттона, опубликованной на сайте www.universetoday.com.

В левой части изображения можно видеть мозаику из снимков, сделанных космическим аппаратом Кассини в ближнем инфракрасном диапазоне. На снимке видны полярные моря и отражающийся от их поверхности солнечный свет. Отражение расположено в южной части Моря Кракена, самого крупного водоема на Титане. Заполнен этот водоем вовсе не водой, а жидким метаном и смесью других углеводородов. В правой части изображения можно видеть снимки Моря Кракена, сделанные радаром Кассини. Кракен – это имя мифического чудовища, обитавшего в северных морях. Такое название как бы намекает на то, какие надежды связывают астробиологи с этим загадочным инопланетным морем.

Может ли на большом спутнике Сатурна, Титане, существовать жизнь?

Читать дальше →

+78

marks May 13 2015 at 12:50

Видео Луны в 4K: ролик, который стоит посмотреть на большом ТВ

1 min

19K

Working with video*Popular scienceAstronautics

Команда астрономов из обсерватории Маунт Джон, Новая Зеландия, направила объектив мощного телескопа с 61-см рефлектором на естественный спутник Земли. При этом все, что «видел» телескоп, снималось на видео в качестве 4К.

Видеоролик продолжительностью в 5 минут ученые выложили в Сеть. На этом видео очень хорошо видны все особенности поверхности Луны, включая кратеры и прочие объекты.

Читать дальше →

+16

Kpyto Feb 20 2015 at 07:02

Что я узнал о будущем после прочтения 100 научно-фантастических книг

10 min

55K

GadgetsCyberpunkPopular scienceArtificial IntelligenceScience fiction

Translation

Что я узнал о будущем после прочтения 100 научно-фантастических книг

За последние два года я прочитал более сотни научно-фантастических книг, в среднем около одной в неделю. Полный список можно посмотреть здесь, я даже отметил свои любимые.

Я начал читать научную фантастику, просто чтобы скоротать время. У меня остались хорошие воспоминания о прочтении «Парк Юрского периода» в детстве. Я продолжил читать, потому что я заметил, что эта книга дала мне кое-что: сильное воображение, нелюбовь к обыденности.

Я поймал себя на том, что мои идеи отличаются от тех, которые множество черпают из тех же статей TechCrunch, Hacker News, Хабрахабра и других «ежедневных» сайтов жителей Силиконовой (Кремниевой) долины. Мой бизнес — это продажа идей, а эти книги одновременно настоящее сокровище и мой инструментарий.

Как говорит футуролог Джейсон Сильва:

«Воображение позволяет нам ощущать восхитительные будущие возможности, выбрать наиболее удивительную, и двигать настоящее вперед, чтобы в конце-концов встретить её.»

Я думаю, что чтение этих книг помогло мне и в создании идеи и в движении к ней.

Каждая хорошая научная фантастика, по сути, это мысленный эксперимент, и я хотел бы запустить свой собственный прямо сейчас:

Ещё две тысячи слов

+40

blackcat87 Sep 25 2014 at 17:05

Анализ существующих подходов к распознаванию лиц

14 min

149K

Working with video*Синезис corporate blog

С завидной регулярностью на Хабре появляются статьи, рассказывающие о тех или иных методах распознавания лиц. Мы решили не просто поддержать эту замечательную тему, но выложить наш внутренний документ, который освещает пусть и не все, но многие подходы к распознаванию лиц, их сильные и слабые места. Он был составлен Андреем Гусаком, нашим инженером, для молодых сотрудников отдела машинного зрения, в образовательных, так сказать, целях. Сегодня предлагаем его все желающим. В конце статьи – впечатляющих размеров список литературы для самых любознательных.

Читать дальше →

+48

SLY_G Feb 10 2015 at 18:33

В Швейцарии нашли способ хранить информацию в ДНК миллион лет

1 min

10K

Popular scienceData storaging

Группа учёных из швейцарской высшей технической школы Цюриха предложила способ хранения цифровых данных в ДНК, который, предположительно, позволить извлечь закодированную информацию даже через миллион лет. Для этого исследователи поместили молекулярные цепочки в шарики кварца.

Читать дальше →

+14

rocknrollnerd Feb 9 2015 at 11:01

Чтобы распознавать картинки, не нужно распознавать картинки

18 min

236K

Image processing*

Посмотрите на это фото.

Это совершенно обычная фотография, найденная в Гугле по запросу «железная дорога». И сама дорога тоже ничем особенным не отличается.

Что будет, если убрать это фото и попросить вас нарисовать железную дорогу по памяти?

Если вы ребенок лет семи, и никогда раньше не учились рисовать, то очень может быть, что у вас получится что-то такое:

Осторожно, тяжелые гифки

+253

iva2000 Feb 2 2015 at 11:47

Визуализация архитектурного освещения

3 min

26K

Tutorial

Простой метод, рассказанный в школе светодизайна LiDS, позволяющий из дневной фотографии здания сделать его вечерний вид и создать архитектурное освещение. Этот метод визуализации применяют студенты-архитекторы для своих работ, но его можно использовать любому человеку, который захочет придумать освещение, например, для своей дачи.

Читать дальше →

+15

marks Feb 2 2015 at 19:46

Искусственный интеллект не уничтожит мир, но может забрать вашу работу

2 min

22K

RoboticsArtificial Intelligence

Дискуссии об искусственном интеллекте и его возможной роли или модели поведения в этом мире не утихают. Чем ближе человек подходит к возможности создания ИИ, тем больше специалистов втягиваются в обсуждение. К примеру, Стивен Хокинг и Илон Маск считают, что ИИ может стать концом нашей цивилизации. Примерно так же думает и Билл Гейтс.

Но один из лучших специалистов мира по ИИ Эндрю Ын, работающий сейчас в Baidu, считает, что искусственный интеллект не угрожает жизни и здоровью человека, а также всей нашей цивилизации. По мнению Эндрю, переживать стоит не из-за возможного появления Терминатора, больше внимания стоит уделять таким устройствам, как роботизированные грузовики. Справедливости ради нужно отметить, что проблема, которая обсуждается ниже, касается не «чистого ИИ», то есть действительно машинного разума, а, скорее, умных устройств с элементами искусственного интеллекта.

Читать дальше →

+20

HomoLuden Dec 28 2010 at 11:57

Ход «Voronoi»

9 min

27K

Вместо предисловия

Урок русского языка в ~~грузинской~~ нерусской школе.
Учительница:
— Дэти, это нэльзя понять, это надо запомнить: ОТ ВАС пишется раздельно, а
КВАС — вместе.

Анекдот взят тут.

Введение

На написание статьи вдохновила игра «Wesnoth» — пошаговая стратегия с элементами RPG. В этой игре персонажи перемещаются по карте, состоящей из шестиугольных полигонов. Таким образом, окруженный со всех сторон персонаж может быть атакован шестью вражескими. По этой причине тактическая составляющая в игре очень важна. Возник вопрос: как повлияет на игровой процесс переход от карты с фиксированной геометрией полигонов на карту с произвольной геометрией?

Читать дальше →

+50

Cord Oct 9 2012 at 03:40

Могут ли нейронные сети помочь скопировать мозг?

2 min

26K

Artificial IntelligenceBrain

Жаль только — жить в эту пору прекрасную уж не придется — ни мне, ни тебе. Н.Некрасов.

Говорят, что мозг-де можно смоделировать на компьютере, нейронные сети есть модель мозга, можно скопировать сознание человека.

Вообще-то, это совсем не так. К сожалению, в мозге сигналы передаются электрохимическим путем. Каждый нейрон при этом содержит от тысячи и до сотен тысяч связей. В течение дня тысячи связи разрушаются, при этом образуются новые.

Но и это еще не все! Сами по себе электрические импульсы лишь побуждают нейрон к определенной реакции.
Дело в том, что электрохимический способ передачи информации говорит о том, что в передаче информации в мозге используются специальные химические реакции. Механизм достаточно детально описан в этом посте.

В целом добавим, что нейронов в мозге до 100 миллиардов, и получается такая комбинация вариантов, что смоделировать эту систему нельзя на данном этапе развития человека.

Читать дальше →

0

mbait Jun 3 2014 at 19:19

Что скрывают нейронные сети?

5 min

115K

Artificial Intelligence

Статья является вольным переводом The Flaw Lurking In Every Deep Neural Net.

Недавно опубликованная статья с безобидным заголовком является, вероятно, самый большой новостью в мире нейронных сетей с момента изобретения алгоритма обратного распространения. Но что же в ней написано?

В статье "Интригующие свойства нейронных сетей" за авторством Christian Szegedy, Wojciech Zaremba, Ilya Sutskever, Joan Bruna, Dumitru Erhan, Ian Goodfellow and Rob Fergus, команды, включающей авторов из проекта Google по глубокому обучению, кратко описываются два открытия в поведении нейронных сетей, противоречащие тому, что мы думали прежде. И одно из них, честно говоря, поражает.

Читать дальше →

+93

navff Jan 16 2015 at 12:06

Выжимки из «Психбольницы в руках пациентов»

4 min

86K

Website development*Professional literature*

Недавно я прочитал книгу Алана Купера «Психбольница в руках пациентов». Из нее мне удалось почерпнуть ряд идей на тему «как улучшить разработку». Ниже ряд рекомендаций из книги, которые я беру на вооружение.
Вдохновил меня Milfgard вот этим постом. Попробую прочитать все интересные для меня книги из этого списка.

Читать дальше →

+21

SLY_G Jan 9 2015 at 19:50

Имплантат способен восстановить функции повреждённого спинного мозга

2 min

18K

Popular scienceHealth

Учёные и инженеры из Федеральной политехнической школы Лозанны и швейцарского исследовательского центра NCCR Robotics создали не имеющий аналогов имплантат, который может привести к революции в протезировании. Имплантат, названный e-dura, позволяет «чинить» повреждения спинного мозга и уже успешно проявил себя в многомесячных опытах на животных. Сейчас исследователи готовятся к опытам на людях и готовят прототип к выходу на рынок. Об этом сообщает ресурс Robohub.

Читать дальше →

+28

Ahiin Dec 25 2014 at 11:51

Откуда есть пошло комплексное число

3 min

150K

В современной математике комплексное число является одним из фундаментальнейших понятий, находящее применение и в «чистой науке», и в прикладных областях. Понятно, что так было далеко не всегда. В далекие времена, когда даже обычные отрицательные числа казались странным и сомнительным нововведением, необходимость расширения на них операции извлечения квадратного корня была вовсе неочевидной. Тем не менее, в середине XVI века математик Рафаэль Бомбелли вводит комплексные (в данном случае точнее сказать, мнимые) числа в оборот. Собственно, предлагаю посмотреть, в чем была суть затруднений, доведших в итоге солидного итальянца до подобных крайностей.

Читать дальше →

+134

GoldKeeper Apr 23 2012 at 11:41

Шум Перлина (Perlin Noise)

10 min

71K

Game development*Algorithms*

Доброго времени суток. Предлагаю Вашему вниманию перевод статьи про шум Перлина (вот этой). Ссылки на эту статью уже мелькали на хабре (тут), но перевод статьи мне не попался. Так что надеюсь кому-либо он может оказаться полезен.

Многим людям приходилось использовать генератор случайных чисел в программах для создания непредсказуемости, чтобы сделать движение и поведение объектов более натуральным или генерировать текстуры. Генераторы случайных чисел, конечно, имеют свои области применения, но иногда их выход может быть слишком «жесткий», чтобы казаться естественным. В этой статье мы представляем функцию, которая имеет очень широкий спектр применения, больше, чем я мог бы думать, но в основном везде, где вам нужно чтобы что-то выглядело естественного происхождения. К тому же вывод может быть легко настроен под ваши нужды.

Если посмотреть на многие вещи в природе, вы заметите, что они являются фрактальными. Они имеют различные уровни детализации. Типичным примером является очертание горного хребта. Оно содержит значительные различия в высоте (горы), средние изменения (холмы), небольшие вариации (валуны), крошечные изменения (камни) и так далее. Посмотрите на что угодно: распространение пятен травы на поле, волн в море, движение муравьев, движение ветвей дерева, узоры из мрамора, ветра. Все эти явления поддаются той же схеме, в больших и малых вариациях. Функция шума Перлина воссоздает это, просто складывая функции шума в различных масштабах.

Для создания функции шума Перлина, вам нужны две вещи, функции шума и функция интерполяции.

Читать дальше →

+37

1

2 3 ...