Георгий @ArXen42

Пользователь

ntz Mar 9 2011 at 15:47

Нечёткий поиск в тексте и словаре

13 min

270K

Введение

Алгоритмы нечеткого поиска (также известного как поиск по сходству или fuzzy string search) являются основой систем проверки орфографии и полноценных поисковых систем вроде Google или Yandex. Например, такие алгоритмы используются для функций наподобие «Возможно вы имели в виду …» в тех же поисковых системах.

В этой обзорной статье я рассмотрю следующие понятия, методы и алгоритмы:

Расстояние Левенштейна
Расстояние Дамерау-Левенштейна
Алгоритм Bitap с модификациями от Wu и Manber
Алгоритм расширения выборки
Метод N-грамм
Хеширование по сигнатуре
BK-деревья

А также проведу сравнительное тестирование качества и производительности алгоритмов.

Читать дальше →

+169

sidristij Aug 13 2018 at 12:40

[DotNetBook] Span, Memory и ReadOnlyMemory

6 min

14K

Seminars by Stanislav Sidristy corporate blog.NET*C#*

Tutorial

Этой статьей я продолжаю публиковать целую серию статей, результатом которой будет книга по работе .NET CLR, и .NET в целом. За ссылками — добро пожаловать под кат.

Memory<T> и ReadOnlyMemory<T>

Визуальных отличий Memory<T> от Span<T> два. Первое — тип Memory<T> не содержит ограничения ref в заголовке типа. Т.е., другими словами, тип Memory<T> имеет право находиться не только на стеке, являясь либо локальной переменной либо параметром метода либо его возвращаемым значением, но и находиться в куче, ссылаясь оттуда на некоторые данные в памяти. Однако эта маленькая разница создает огромную разницу в поведении и возможностях Memory<T> в сравнении с Span<T>. В отличии от Span<T>, который представляет собой средство пользования неким буфером данных для некоторых методов, тип Memory<T> предназначен для хранения информации о буфере, а не для работы с ним.

Примечание

Глава, опубликованная на Хабре не обновляется и возможно, уже несколько устарела. А потому, прошу обратиться за более свежим текстом к оригиналу:

CLR Book: GitHub, оглавление

CLR Book: GitHub, глава

Релиз 0.5.2 книги, PDF: GitHub Release

Читать дальше →

+38

ValeriaKhokha Jul 31 2018 at 08:40

Akka Streams для простых смертных

27 min

24K

JUG Ru Group corporate blogProgramming*C#*.NET*

Как можно несколькими строками кода распечатать непрерывный поток сообщений из Твиттера, добавив в него данные о погоде в местах проживания их авторов? И как при этом ограничить скорость запросов к провайдеру метеоусловий, чтобы они не внесли нас в черный список?

Расскажем вам сегодня, как это сделать, но сначала познакомимся с технологией Akka Streams, позволяющей работать с потоками данных в реальном времени так же просто, как программисты работают с LINQ-выражениями, не требуя при этом ручной реализации ни отдельных акторов, ни интерфейсов Reactive Streams.

В основе статьи — расшифровка доклада Вагифа Абилова с нашей декабрьской конференции DotNext 2017 Moscow.

Читать дальше →

+34

devpony Jan 23 2017 at 08:20

Ищем знакомые лица

15 min

65K

Python*Mathematics*Machine learning*

В статье я хочу познакомить читателя с задачей идентификации: пройтись от основных определений до реализации одной из недавних статей в данной области. Итогом должно стать приложение, способное искать одинаковых людей на фотографиях и, что самое главное, понимание того, как оно работает.

Wake up, Neo

+69

foo52ru Jul 29 2018 at 10:35

Создание «искусственной жизни» на компьютере

10 min

112K

Programming*Abnormal programming*Popular scienceBiotechnologiesAlgorithms*

Tutorial

Всем привет. В статье хочу описать свой эксперимент по созданию «искусственной жизни» на компьютере.

Как это выглядит?

картинка кликабельна

На компьютере создаётся виртуальная среда со своими правилами и выпускается первая простейшая живность. Буду называть их ботами. Боты могут погибнуть или выжить и дать потомство. Потомок может слегка отличаться от предка.

Ну а дальше за работу принимается эволюция и естественный отбор.

А мне остаётся только наблюдать за развитием мира.

Чем неожиданнее для создателя и многообразней будут варианты развития мира, тем более удачным можно считать эксперимент.

Поведением ботов управляет код, записанный в них.

Именно код и является геномом, который отвечает за поведение бота и который будет изменяться в процессе эволюции.

Внутреннее устройство кода — это самое интересное в проекте.

Код должен быть простым и выдерживать различные модификации (случайное изменение любого элемента в коде) над собой без синтаксических ошибок.

Читать дальше →

+204

393

24Alex24 Jun 23 2018 at 12:34

Расширение процесса сборки с помощью MSBuild

7 min

30K

.NET*DevOps*

From sandbox

Цель статьи — рассказать немного о MSBuild, показать что такое таргеты и таски в MSBuild, научить работать с файлом .csproj, дать полезные ссылки. Если у вас будет более подходящее название для статьи, то буду рад обсудить в комментариях.

Основные понятия — что такое target и task в MSBuild
Жизненный цикл сборки MSBuild — какая последовательность вызова таргетов
Подготовка окружения для примеров
Таргеты в MSBuild — пример использования некоторых таргетов MSBuild
Создание собственного таргета MSBuild
Таски в MSBuild — пример использования некоторых тасков MSBuild
Переменные и макросы в .csproj
Ссылки

Читать дальше →

+20

MadBanny Jun 3 2018 at 18:30

Перевод вики проекта Svelto.ECS. ECS фреймворк для Unity3D

27 min

8.4K

Game development*Unity3D*C#*

From sandbox

Recovery Mode

Оглавление

Привет, Хабр! Представляю вашему вниманию перевод вики проекта Svelto.ECS, написанного Себастьяно Мандала (Sebastiano Mandalà).

Svelto.ECS — результат многолетних исследований и применения принципов SOLID в разработке игр на Unity. Это одна из многих реализаций паттерна ECS, доступная для C# с различными уникальными функциями, введенными для устранения недостатков самого паттерна.

Читать дальше →

+16

mopsicus May 8 2018 at 15:30

Unity, ECS и все-все-все

7 min

111K

Unity3D*Programming*Game development*

Сколько уже было мануалов "Как сделать игру на Unity за 3 часа", "Делаем Counter-Strike за вечер" и т.п.? Низкий порог входа — это, несомненно, главный плюс и минус Unity. Действительно, можно накидать “ассетов”, дописать несколько простых “скриптов”, обмотать синей изолентой и это даже будет как-то работать. Но когда проект обрастает игровыми механиками, сложной логикой поведения, то проблемы при подобном подходе нарастают как снежный ком. Для внедрения новых механик требуется переписывание кода во многих местах, постоянная проверка и переделывание префабов из-за побившихся ссылок на компоненты логики, не говоря уже об оптимизации и тестировании всего этого. Разумеется, архитектуру можно продумать изначально, но на практике это всегда недостижимая цель — дизайн-документ довольно часто меняется, какие-то части выкидываются, добавляются абсолютно новые и никак не связанные со старой логикой поведения. Компоненты в Unity — это шаг в правильном направлении в виде декомпозиции кода на изолированные блоки, но особенности реализации не позволяют достичь необходимой гибкости, а самое главное, производительности. Разработчики придумывают свои фреймворки и велосипеды, но чаще всего останавливаются на ECS (Entity Component System). ECS – одно из решений, продолжающее идею компонентной модели Unity, но придающее ей ещё больше гибкости и сильно упрощающее рефакторинг и дальнейшее расширение приложения новым функционалом без кардинальных изменений в текущем коде.

Читать дальше →

+25

PatientZero May 8 2018 at 07:40

Трассировка лучей на GPU в Unity

16 min

22K

Working with 3D-graphics*Unity3D*Game development*

Translation

Для трассировки лучей (ray tracing) настали удивительные времена. Компания NVIDIA реализует ускоренное с помощью ИИ шумоподавление, Microsoft объявляет о нативной поддержке в DirectX 12, а Питер Ширли продаёт свои книги по свободной цене (pay what you want). Похоже, что трассировка лучей наконец получила шанс быть принятой при дворе. Возможно, говорить о начале революции ещё слишком рано, но уже определённо стоит начать изучать и накапливать знания в этой области.

В этой статье мы напишем с нуля в Unity очень простой трассировщик лучей с помощью compute shaders. Скрипты мы будем писать на C#, а шейдеры — на HLSL. Весь код выложен на Bitbucket.

В результате у нас получится отрендерить нечто подобное:

Читать дальше →

+38

tangro Apr 24 2018 at 10:58

Как передать полиморфный объект в алгоритм STL

4 min

11K

Инфопульс Украина corporate blogProgramming*C++*Compilers*

Translation

Как мы можем прочесть в первой главе книги Effective C++, язык С++ является по сути своей объединением 4 разных частей:

Процедурная часть, доставшаяся в наследство от языка С
Объектно-ориентировання часть
STL, пытающийся следовать функциональной парадигме
Шаблоны

Эти четыре, по сути, подъязыка составляют то, что мы называем единым языком С++. Поскольку все они объединены в одном языке, то это даёт им возможность взаимодействовать. Это взаимодействие порой порождает интересные ситуации. Сегодня мы рассмотрим одну из них — взаимодействие объектно-ориентированной модели и STL. Оно может принимать разнообразные формы и в данной статье мы рассмотрим передачу полиморфных функциональных объектов в алгоритмы STL. Эти два мира не всегда хорошо контачат, но мы можем построить между ними достаточно неплохой мостик.

Читать дальше →

+32

UberSchlag Apr 7 2018 at 08:54

Learn OpenGL. Урок 4.11 — Сглаживание

11 min

31K

C++*Game development*Programming*

Tutorial

Translation

Сглаживание

В своих изысканиях, посвященных трехмерному рендеру вы наверняка сталкивались с появлением пикселизованных зазубрин по краям отрисовываемых моделей. Эти отметины неизбежно появляются из-за принципа преобразования вершинных данных в экранные фрагменты растеризатором где-то в глубине пайплайна OpenGL. К примеру, даже на такой простой фигуре как куб уже заметны эти артефакты:

Беглый взгляд, возможно, и не заметит ничего, но стоит посмотреть внимательней и на гранях куба проявятся означенные зазубрины. Попробуем увеличить изображение:

Нет, это никуда не годится. Разве такое качество изображения хочется видеть в релизной версии своего приложения?

Читать дальше →

+39

rwm Apr 3 2018 at 18:42

Continuous Integration для новичков

8 min

149K

JavaScript*Node.JS*ReactJS*

Tutorial

Что такое CI

Continuous Integration — это практика разработки программного обеспечения, которая заключается в слиянии рабочих копий в общую основную ветвь разработки несколько раз в день и выполнении частых автоматизированных сборок проекта для скорейшего выявления потенциальных дефектов и решения интеграционных проблем. В обычном проекте, где над разными частями системы разработчики трудятся независимо, стадия интеграции является заключительной. Она может непредсказуемо задержать окончание работ. Переход к непрерывной интеграции позволяет снизить трудоёмкость интеграции и сделать её более предсказуемой за счет раннего обнаружения и устранения ошибок и противоречий. Основным преимуществом является сокращение стоимости исправления дефекта, за счёт раннего его выявления.

Если вы не знаете как настроить CI в своем проекте, я приглашаю вас "под кат"

Читать дальше →

+41

e_finkel Mar 30 2018 at 06:00

C++ велосипедостроение для профессионалов

36 min

50K

Конференции Олега Бунина (Онтико) corporate blogC++*IT Standards*Compilers*Programming*

Классы, которые люди самостоятельно пишут, а потом копируют из одного проекта в другой, хотя они уже есть в стандартных библиотеках, в простонародье называются велосипедами. Первый вопрос, который возникает при встрече с таким «велосипедом» — зачем люди переписывают что-то заново? Вариантов может быть несколько.

Некоторые делают это для самообучения: берут класс стандартной библиотеки, пишут его сами с нуля, сравнивают то, что получилось, с тем, что есть в стандартной библиотеке — в процессе узнают для себя что-то новое.
Некоторые проекты имеют особое требования к коду. В embedded-разработке принято работать без RTTI и без exception, поэтому части стандартной библиотеки, которые используют RTTI и exception, необходимо переписать без них.
Редко, но бывает, когда велосипед пишут, потому что могут написать лучше, чем в стандартной библиотеке. Как правило, такие нововведения рано или поздно попадают в стандартную библиотеку.
Другим только кажется, что они могут написать лучше, и таких людей больше. Но в процессе они обучаются, выясняют для себя что-то новое и что-то интересное открывают.
Могут быть другие причины.

Сегодня мы не будем говорить о том, что велосипеды — это плохо, это не обязательно так. Мы поговорим о том, что действительно плохо:

бездумно переносить устаревшие технологии 20-30-летней давности в современные проекты;
пользоваться «вредными» бенчмарками и оптимизациями.

А также затронем «вредные» советы, обсудим новейшие практики программирования (C++ 11 и позднее), подумаем, что делать с «идеальным» велосипедом.

+76

102

R4UAB Mar 26 2018 at 10:56

Как идентифицировать спутник на орбите

4 min

30K

Popular scienceAstronautics

Во время поисков сигналов от российских спутников МКА-Н, был обнаружен сигнал неопознанного спутника, которого у меня нет в каталоге. Напомню аппараты МКА-Н №1 и №2 были запущены 14 июля 2017 года с космодрома Байконур и не вышли на связь. По неофициальной причине — из-за аварии с разгонным блоком «Фрегат», хотя «Роскосмос» не признаёт это. Изготовителем этих двух аппаратов является частная российская компания «Dauria Aerospace». Теперь «Роскосмос» требует со стартапа 290 миллионов рублей за неработающие космические аппараты (источник). После 3 дней поисков сигналов, они так и не были обнаружены. Зато был обнаружен другой любопытный сигнал. Этого аппарата у меня нет в каталоге, значит его надо идентифицировать и занести в свой каталог.

+87

PatientZero Feb 26 2018 at 07:49

Система типов в математике

11 min

16K

Mathematics*Programming*

Translation

Время от времени мне встречаются вопросы по математике, которые в каком-то смысле можно назвать «грамматически неверными».

Пример. «Интервал

$inline$ является замкнутым или открытым?»
Пример. «Является ли

$\{ 1, 2, 3 \}$ группой?»
Пример. «Каков ряд Фурье для

$\sin x + \sin \pi x$ ?»

А вот ещё более глупые примеры.

Пример. «Является ли прямоугольник простым?»
Пример. "

$17 \in 3$ ?"
Пример. «Каков ряд Фурье для пустого множества?»

Объединяет все эти примеры то, что они являются ошибками типизации: это попытки применения некого математического процесса к математическому объекту, который никак не может быть входными данными для него. Если для ответа на эти вопросы вы попытаетесь написать программу на каком-нибудь высоко математическом языке программирования, то она (я надеюсь!) не скомпилируется.

Математические объекты обычно не воспринимаются явно как имеющие типы в том же смысле, что и объекты в языках программирования с системой типов. Предполагается, что обычная математика должна формализироваться в системе Цермело — Френкеля (ZF), возможно, с аксиомой выбора, а в ZF каждый математический объект конструируется как множество. В этом смысле все эти объекты имеют одинаковый тип. (В частности, вопрос "

$17 \in 3$ " вполне логичен в ZF! И это одна из причин, по которой стоит не любить ZF в качестве основы для математики.) Однако, мне кажется, что на практике математические объекты неявно воспринимаются, как имеющие типы, и такой образ мышления математики усваивают, но не часто обсуждают.

Читать дальше →

+40

fedchin Jan 30 2018 at 13:23

Лекции Технополиса. Проектирование высоконагруженных систем (осень 2017)

5 min

52K

ОК corporate blogSystem Analysis and Design*High performance*Studying in IT

Мы начинаем публиковать курсы лекций Технополиса — образовательного проекта команды Одноклассников в Санкт-Петербургском Политехническом университете Петра Великого. Создание высоконагруженных приложений — это не только проектирование и написание кода, но и огромное количество других аспектов на всём протяжении жизненного цикла продукта. Мы пройдём по всему процессу создания и использования высоконагруженной системы. Особое внимание будет уделено особенностям эксплуатации, сетям, балансировке нагрузки, иерархии памяти, повседневным инструментам. Также поговорим о мониторинге, аудите и многом другом. Лекции курса читает команда экспертов под руководством ведущего разработчика в Одноклассниках Вадима Цесько.

Список лекций:

Введение (Вадим Цесько incubos)
Типовые архитектуры (Александр Христофоров)
Эксплуатация (Илья Щаников)
Сетевой стек (Дмитрий Самсонов dmitrysamsonov)
Балансировка (Андрей Домась)
Процессоры и память (Алексей Горбов)
Хранилища данных (Сергей Егоричев)
JVM (Андрей Паньгин apangin)
Мониторинг (Сергей Шарапов Sharapoff)
Облака (Леонид Талалаев)

+73

Skapix Jan 27 2018 at 10:32

Эволюция системных вызовов архитектуры x86

13 min

46K

Assembler*System Programming*

Про системные вызовы уже много было сказано, например здесь или здесь. Наверняка вам уже известно, что системный вызов — это способ вызова функции ядра ОС. Мне же захотелось копнуть глубже и узнать, что особенного в этом системном вызове, какие существуют реализации и какова их производительность на примере архитектуры x86-64. Если вам также интересны ответы на данные вопросы, добро пожаловать под кат.

Читать дальше →

+77

specblog Dec 15 2017 at 16:47

Нехватка оперативной памяти в Linux на рабочем ПК: оптимизация и действия при зависании

5 min

90K

*nix*Configuring Linux*System administration*

На любой операционной системе часто не хватает оперативной памяти. Рассмотрим, как и сэкономить на увеличении аппаратных ресурсов машины с Linux, и продолжить более-менее комфортно пользоваться компьютером с Linux в условиях нехватки памяти.

Читать дальше →

+39

Neuyazvimy1 Nov 18 2017 at 12:30

UniRx — Rx для Unity3d

7 min

80K

.NET*C#*Unity3D*Designing and refactoring*Game development*

From sandbox

Всем привет! Давно уже хотел написать статью о UniRx на Unity3d. Начнем с небольшой философии RX программирования. Например, разрабатывая игру, мы создаем кнопку, наблюдаем событие клика этой кнопки и реагируем на это каким нибудь кодом.

Реактивное программирование — это всё то же самое, только на стероидах, то есть мы можем создавать потоки данных всего. И также наблюдать за ними и реагировать. Update, OnCollisionEnter, Coroutine, Event, Mouse input, Keyboard input, Joystick input — все это потоки.
Все что нас окружает это потоки.

Читать дальше →

+14

PatientZero Aug 9 2017 at 09:46

Введение в октодеревья

31 min

40K

Algorithms*Game development*

Translation

Что такое октодеревья? Если вам совершенно неизвестно это понятие, то рекомендую прочитать статью в Википедии (это займёт около пяти минут). Она даёт достаточное представление, но едва ли её будет достаточно, чтобы понять, для чего они используются и как их реализовать.

В этой статье я постараюсь рассказать обо всех этапах, необходимых для создания структуры данных октодеревьев, на примере объяснения концепций, иллюстраций и кода. Также я опишу свои решения, которые принимал на каждом из этапов. Не думайте, что эта статья будет единственно верным руководством к реализации октодеревьев, но она должна дать вам хороший фундамент и её можно использовать для справки.

Читать дальше →

+49

3 4 ...

9 10

Нечёткий поиск в тексте и словаре

Введение

[DotNetBook] Span, Memory и ReadOnlyMemory

Memory<T> и ReadOnlyMemory<T>

Примечание

Akka Streams для простых смертных

Ищем знакомые лица

Создание «искусственной жизни» на компьютере

Расширение процесса сборки с помощью MSBuild

Меню

Перевод вики проекта Svelto.ECS. ECS фреймворк для Unity3D

ОГЛАВЛЕНИЕ

Unity, ECS и все-все-все

Трассировка лучей на GPU в Unity

Как передать полиморфный объект в алгоритм STL

Learn OpenGL. Урок 4.11 — Сглаживание

Сглаживание

Continuous Integration для новичков

Что такое CI

C++ велосипедостроение для профессионалов

Как идентифицировать спутник на орбите

Система типов в математике

Лекции Технополиса. Проектирование высоконагруженных систем (осень 2017)

Эволюция системных вызовов архитектуры x86

Нехватка оперативной памяти в Linux на рабочем ПК: оптимизация и действия при зависании

UniRx — Rx для Unity3d

Введение в октодеревья

Information