Алгоритмы *

Все об алгоритмах

СтатьиПостыНовостиАвторыКомпании

Gridmi 14 июн 2021 в 21:37

Как синхронизировать сценарий без транзакций? Штатными средствами Java

2 мин

3.5K

ООП * Проектирование API * Алгоритмы * Java * Браузеры

Туториал

Давайте представим, что вы параноик, и параноик вдвойне, когда дело касается многопоточности. Предположим, что вы делаете backend некого функционала приложения, а приложение переодически дергает на вашем серверы какие-то методы. Все вроде хорошо, но есть одно но. Что если ваш функционал напрямую зависит от каких-либо других данных, того же банального профиля например? Встает вопрос, как гарантировать то, что сценарий отработает именно так, как вы планировали и не будет каких-либо сюрпризов? Транзакции? Да это можно использовать, но что если Вы фантастический параноик и уже представляете как к вам на сервер летит 10 запросов к одному методу от разных клиентов и все строго в одно время. А в этот момент бизнес-логика данного метода завязана на 100500 разных данных. Как всем этим управлять? Можно просто синхронизировать метод и все. Но что если летят еще и те запросы, держать которые нет смысла? Тут уже начинаются костыли. Я пару раз уже задавался подобным вопросом, и были интересно, ведь задача до абсурда простая и повседневная (если вы заботитесь о том, чтобы не было логических багов конечно же ). Сегодня решил подумать, как это можно очень просто и без костылей реализовать. И решение вышло буквально на 100 строк кода.

Немного наглядного примера

Давайте предположим, что есть водитель и есть пассажир. Водитель не может менять машину до тех пор, пока клиент, например подтверждает поездку. Это что получается, клиент соглашался на поездку с одними характеристиками машины, а по факту у водителя другая машина? Не дела! Можно организовать что-то подобное:

-7

ngis 14 июн 2021 в 13:09

Корни разные нужны, корни разные важны

15 мин

3.7K

Алгоритмы * C * Программирование микроконтроллеров *

В статье наблюдение комплексного влияния параметров сборки и целевой аппаратной платформы на итоговую производительность, применительно к одному и тому же исходному коду.

Исходный код содержит решение одной задачи разными алгоритмами.

+10

RussianDragon 13 июн 2021 в 16:26

MEX (Minimum EXcluded) Алгоритм поиска минимального отсутствующего числа

9 мин

15K

.NET * Big Data * C# * Алгоритмы * Математика *

Добрый день. Сегодня хочется поговорить о том, как найти MEX (минимальное отсутствующие число во множестве).

Мы разберем три алгоритма и посмотрим на их производительность.

Добро пожаловать под cut

Читать дальше →

-4

101

AlexanderYurev 13 июн 2021 в 11:30

Проецирование положения объектов с камеры видеонаблюдения на карту, используя лишь школьную геометрию

4 мин

13K

Блог компании SingularisPython * Алгоритмы * Обработка изображений * Математика *

Технотекст 2021

Возможно ли превратить координаты на изображении в конкретные географические координаты? Несмотря на то, что это звучит несколько необычно, такая конвертация вполне возможна.

Сегодня я расскажу о том, как можно спроецировать координаты с плоского изображения на карту. Эта короткая статья будет своеобразным продолжением первой статьи, в которой я рассказывал о базовых возможностях Mask R-CNN.

Начать конвертацию

SSul 11 июн 2021 в 05:02

Распознаем номера автомобилей. Разработка multihead-модели в Catalyst

5 мин

6.7K

Блог компании SimbirSoftPython * Алгоритмы * Обработка изображений * Машинное обучение *

Фиксация различных нарушений, контроль доступа, розыск и отслеживание автомобилей – лишь часть задач, для которых требуется по фотографии определить номер автомобиля (государственный регистрационный знак или ГРЗ).

В этой статье мы рассмотрим создание модели для распознавания с помощью Catalyst – одного из самых популярных высокоуровневых фреймворков для Pytorch. Он позволяет избавиться от большого количества повторяющегося из проекта в проект кода – цикла обучения, расчёта метрик, создания чекпоинтов моделей и другого – и сосредоточиться непосредственно на эксперименте.

Сделать модель для распознавания можно с помощью разных подходов, например, путем поиска и определения отдельных символов, или в виде задачи image-to-text. Мы рассмотрим модель с несколькими выходами (multihead-модель). В качестве датасета возьмём датасет с российскими номерами от проекта Nomeroff Net. Примеры изображений из датасета представлены на рис. 1.

m31 10 июн 2021 в 10:52

DataScience Digest — 10.06.21

3 мин

2.1K

Python * Алгоритмы * Big Data * Машинное обучение * Искусственный интеллект

Приветствую всех!

На протяжении долгого времени я не публиковал свежих выпусков Data Science Digest, а сейчас пришло время его возродить. Выходить дайджест будет еженедельно по четвергам.

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning и не забывайте подписываться на наш Telegram-канал.

Читать дальше →

psyson 10 июн 2021 в 08:52

Психотронная тюрьма риторики: история о том, что мешает нам мыслить здраво

13 мин

74K

Блог компании RUVDS.comАлгоритмы * Научно-популярноеСоциальные сетиЧитальный зал

Аристотель придумал, что в риторике есть четыре главных способа убеждения. Пафос — через эмоции и повествование. Логос — через факты и логику. Этос — через авторитет того, что убеждает. Есть еще кайрос, фактор контекста: того, когда вас пытаются убедить и при каких условиях.

Познакомился я с ними, когда работал академконсультантом в США: помогал получать высшее образование так, чтобы иметь хорошие оценки и не тратить слишком много денег. В колледжах США риторику изучают все гуманитарии на первом курсе, иногда даже технари. И так как всю риторику сводили именно к способам убеждения, мои клиенты из Ближнего Востока и Китая часто этим возмущались. И спрашивали меня, какой скрытый смысл в том, чтобы изучать такие очевидные вещи.

Что же, ответ у меня есть. Я считаю, что этос — это бич мыслящего человека. Кайрос — кандалы, который выковал информационный век. А понимание того, как работает риторика — базовый инструмент критического мышления. Особенно для IT-специалиста.

Я так много рассказывал об этом на кухнях и в чатах, что решил написать статью. А получился лонгрид с научными исследованиями, разбором влияния алгоритмических новостных лент, и безумным комиксом из мемов, который я делал 4 часа в Фигме. Поехали!

UPD Большое спасибо всем тем людям, что помогли мне исправить ошибки и очепятки! Только на Хабре так стремятся помочь, и это неоценимо.

Читать дальше →

+166

353

BarakAdama 10 июн 2021 в 08:00

Как Яндекс применил генеративные нейросети для поиска ответов

11 мин

71K

Блог компании ЯндексПоисковые технологии * Машинное обучение * Алгоритмы * Natural Language Processing *

Только что мы представили новую версию поиска Y1. Она включает в себя комплекс технологических изменений. В том числе улучшения в ранжировании за счёт более глубокого применения трансформеров. Подробнее об этом направлении мой коллега Саша Готманов уже рассказывал в нашем блоге. В новой версии модель стала мощнее: количество параметров возросло в 4 раза. Но сегодня мы поговорим о других изменениях.

Когда человек вводит запрос в поисковик, он ищет информацию или способ решения своей задачи. Наша глобальная цель — помогать находить такие ответы, причём сразу в наиболее ёмком виде, чтобы сэкономить людям время. Этот тренд на ускорение решения пользовательских задач особенно заметен в последние годы. К примеру, теперь многие пользователи задают свои вопросы не текстом в поиске, а голосовому помощнику. И тут нам на помощь пришли огромные генеративные нейросети, которые способны перерабатывать, суммаризировать и представлять в ёмком виде тексты на естественном языке. Пожалуй, самой неожиданной особенностью таких сетей стала возможность быстро обучаться на всё новые задачи без необходимости собирать большие датасеты.

Сегодня мы поделимся опытом создания и внедрения технологии YaLM (Yet another Language Model), которая теперь готовит ответы для Поиска и Алисы. В этом мне помогут её создатели — Алексей Петров petrovlesha и Николай Зинов nzinov. Эта история основана на их докладе с Data Fest 2021 и описывает опыт внедрения модели в реальные продукты, поэтому будет полезна и другим специалистам в области NLP. Передаю слово Алексею и Николаю.

+66

ai_borisov 10 июн 2021 в 04:25

Что такое алгоритм?? Part three and a quarter. «Язык»

19 мин

2.9K

Natural Language Processing * Алгоритмы * Мозг

И у нас есть организмы, а называем мы их странным именем — "Алгоритмы". И если есть у нас близко два таких "Алгоритма", то может стать полезным их взаимодействие. И если оно полезно самим организмам, то в свою очередь становится полезно и нам. Ведь это тот редкий момент, в который можно, наблюдая, разобраться, как предстало на свет "Слово" из того, что есть "Логос". Ибо абсолютно, совершенно, неоспоримо и уже написано то, к чему нечего добавить.

Ἐν ἀρχῇ ἦν ὁ Λόγος.

Title

Читать дальше →

atemik 3 июн 2021 в 23:58

Процессор, эмулирующий сам себя — может быть быстрее самого себя

1 мин

38K

*nix * Assembler * Алгоритмы * История ITПрограммирование *

Современный мир ПО содержит настолько много слоёв, что оптимизации могут быть в самых неожиданных местах. Знакомьтесь - год 2000, проект HP Dynamo. Это эмулятор процессора PA-8000, работающий на этом же процессоре PA-8000, но с технологией JIT. И реальные программы, запускающиеся в эмуляторе - в итоге работают быстрее, чем на голом процессоре.

td;dr - всё сказано в заголовке

+64

PatientZero 3 июн 2021 в 06:48

Сетки из треугольников в играх

6 мин

7.8K

Алгоритмы * Математика * Разработка игр *

Перевод

Поговорим о сетках треугольников. Сетки квадратов используются практически повсюду, от пикселей изображения до расположения домов в квартале. Сетки шестиугольников представлены тоже довольно широко, особенно в настольных играх. Однако сетки треугольников (равномерное заполнение 2D-плоскости равносторонними треугольниками) почему-то не очень популярны. Я встречал заявления, что они бесполезны, или что у них сложная математика. Но этой статьёй я докажу, что оба заявления ошибочны: вычисления на самом деле проще, чем при работе с шестиугольниками, к тому же треугольники обладают множеством преимуществ.

Все вычисления я выполнил в своём коде на github, однако стоит объяснить, как и зачем нужно использовать такие сетки.

Что такое «сетка треугольников»

Когда я говорю о сетке треугольников, то подразумеваю тайловую карту, в которой все тайлы являются одинаковыми равносторонними треугольниками, выстроенными в переменные строки (или столбцы).

Важно здесь то, что каждая ячейка имеет ровно трёх соседей. Иногда встречаются игры, где отрисована сетка треугольников, но на самом деле фигуры расположены в углах. Каждый угол соединяется с шестью другими, то есть на самом деле это сетка не треугольников, а шестиугольников.

+21

YuraPlusEV 2 июн 2021 в 13:46

2500 дней создания AI без использования нейронных сетей или покерный бот, который дороже $50к

12 мин

29K

Информационная безопасность * Программирование * Алгоритмы * C# * Искусственный интеллект

Технотекст 2021

Давно хотел написать статью про своё хобби, которое стало нечто большим для меня.

Я закончил математический факультет(ТвГУ) в 2012г. В период учёбы я профессионально играл в покер, как вживую, так и онлайн(yura_$198802,основной аккаунт PS). Не могу сказать, что был супер успешен, но для студента вполне себе подработка. Уже с 2011 года я начал карьеру программиста и продолжаю её по сей день. Это мой основной источник заработка. Но где-то в 2014 я серьёзно решил заняться написание покерного бота, для онлайн площадок. На данный момент “я” превратился в команду энтузиастов, которая двигает этот проект вперёд! Еще в университете довольно таки плотно был знаком с Байесовским классификатором, а также имел базовые представления по нейронным сетям. Сейчас стало "мейнстримом" считать, что если вы нашли релевантные данные и корректно обучили сетку с использованием (ML,CatBoost,TensorFlow и т.д.), то вы сделали что-то похожее на “искусственный интеллект”(далее AI). Я решил ,что если раскрою верхнеуровневую архитектуру своего проекта, это может кого-то удивить тем, что AI - это нечто большое.(~~только не профессионалов в этой области~~) И даже в такой игре как покер, где казалась бы не обойтись без нейронных сетей(на самом деле это действительно так), до момента органического встраивания их в продукт, лично у меня прошло примерно 2500 дней. Сразу хочу отметить, что способ, когда ты знаешь всю информацию обо всех участниках и играешь с одними и теми же, где можно просто собрать модель и обучить её по лучшим и быть в их числе, не подходит для так называемого реального онлайн покера. Тут нужно делать изначально экспертную систему, которую уже можно бесконечно долго улучшать и модифицировать.

+17

sunman 1 июн 2021 в 13:55

Как в PHP улучшить читаемость регулярных выражений

11 мин

8.3K

Блог компании VKPHP * Алгоритмы * Регулярные выражения *

Туториал

Перевод

Регулярные выражения — очень мощный инструмент, однако согласно общепринятому мнению, после того как они написаны, их очень трудно понять, поэтому их поддержка — не самое приятное занятие. Здесь собраны советы, которые помогут сделать из более читаемыми.

PHP использует диалект регулярных выражений PCRE — до версии PHP 7.3, и PCRE2 — в более новых версиях. Поэтому в PHP можно использовать различные продвинутые приемы, помогающие писать читаемые, самодокументируемые и поддерживаемые регулярные выражения. При этом не надо также забывать и о наличии в PHP функций фильтрации переменных, а также семейства функций ctype*, позволяющих валидировать такие распространенные значения как url-ссылки, адреса электронной почты и строки из букв и цифр — вообще без использований регулярный выражений. Во многих IDE есть подсветка регулярных выражений, помогающая их читать, а иногда даже и проверка выражений, с подсказками по их улучшению.

+35

host_m 1 июн 2021 в 06:25

Каждый браузер видит цвета видео по-разному

10 мин

11K

Блог компании VDSina.ruРабота с видео * БраузерыАлгоритмы *

Перевод

Большинство людей знает основы теории цвета. Сочетая яркости нескольких основных цветов, можно воссоздать любой видимый человеку цвет. Многие люди знают, что отдельные цвета — это просто длины волн электромагнитного спектра. Но чего многие не осознают, так это того, насколько сложной становится ситуация, когда мы стремимся точным образом записать и воспроизвести цвет.

В преобразовании значения RGB-триплета в конкретную длину волны света задействовано множество систем. Это преобразование должно быть стандартизовано, чтобы всё ПО, все декодеры видео, видеокарты и мониторы (даже изготовленные разными производителями в разные десятилетия) могли создавать одинаковые результаты по одинаковым входным данным. Для решения этой задачи были разработаны цветовые стандарты. Однако со временем дисплеи и другие технологии развивались. Телевидение стало цифровым, начали применять сжатие, а мы отказались от ЭЛТ в пользу LCD и OLED. Новое оборудование было способно отображать больше цветов при большей яркости, но получаемые им сигналы по-прежнему были адаптированы под возможности старых дисплеев.

Читать дальше →

+44

Orazbek_B 31 мая 2021 в 14:29

Альтернативный способ заполнения «спиральной матрицы»

10 мин

44K

Алгоритмы * Лайфхаки для гиковМатематика *

Из песочницы

Технотекст 2021

В процессе изучения основ алгоритмизации и программирования в качестве студента еще в середине 2000х мне попалась довольно известная всем задача по заполнению «спиральной» матрицы. Суть состоит в том, начиная с позиции [1, 1], продвигаясь по часовой стрелке, заполнить квадратную матрицу заданной величины числами в возрастающем порядке. На ее решение было потрачено около двух часов.

Sat_AT_000 31 мая 2021 в 08:02

Анализ результатов работы архитектуры YoloV3 на медицинских снимках

10 мин

Python * Алгоритмы * Искусственный интеллект

Из песочницы

Перевод

Данная статья представляет собой обзор на оригинальную статью на Medium (эксперименты проводятся с изменениями некоторых условий =).

Область применения нейронных сетей в медицине бурно развивается. В этой области решаются задачи, которые облегчают работу врачей. В частности, одной из востребованных задач в этой области является детекция объектов на медицинских снимках (это когда на картинку накладывается прямоугольник, который ограничивает область, в которой предположительно есть некоторый объект). Пример такого изображения представлен ниже.

m1el 30 мая 2021 в 11:20

Решаем вопрос сортировки в JavaScript раз и навсегда

9 мин

46K

JavaScript * Программирование * Алгоритмы * Функциональное программирование *

Многим JavaScript разработчикам доводилось сортировать данные на стороне клиента. К сожалению, существующие библиотеки имеют мелкие недостатки. Но эти недостатки складываются и ограничивают то как программисты думают о сортировке. Чтобы преодолеть эти ограничения, давайте рассмотрим сортировку в разных языках. Вооруженные этими знаниями, мы сможем выбрать наиболее удобный и строгий интерфейс.

+15

itmo_nsslab 30 мая 2021 в 10:17

Прогнозирование временных рядов с помощью AutoML

16 мин

27K

Машинное обучение * Искусственный интеллектАлгоритмы * Python * Open source *

Хабр, привет!

В лаборатории моделирования природных систем Национального центра когнитивных разработок Университета ИТМО мы активно исследуем вопросы применения автоматического машинного обучения для различных задач. В этой статье мы хотим рассказать о применении AutoML для эффективного прогнозирования временных рядов, а также о том, как это реализовано в рамках open-source фреймворка FEDOT. Это вторая статья из серии публикаций, посвященной данной разработке (с первой из них можно ознакомиться по ссылке).

Все подробности — под катом!

Читать дальше →

polybook 29 мая 2021 в 16:05

В аквариуме: вычислительная генетика на Python и Mathcad (часть 1)

3 мин

4.5K

Занимательные задачкиPython * Алгоритмы * Математика *

Начнем моделировать генетику популяции при помощи методов Монте-Карло, на примере рыбок в аквариуме, задавая генотип исходной популяции и пересчитывая его изменение от поколения к поколению. Эта статья — первая из серии, в которой мы рассчитаем цвет рыбок в зависимости от генетического кода, который они несут.

AloneCoder 28 мая 2021 в 13:10

Развеиваем мифы об управлении памятью в JVM

9 мин

24K

Блог компании VKJava * Алгоритмы * Анализ и проектирование систем * Высоконагруженные системы *

Перевод

В серии статей я хочу опровергнуть заблуждения, связанные с управлением памятью, и глубже рассмотреть её устройство в некоторых современных языках программирования — Java, Kotlin, Scala, Groovy и Clojure. Надеюсь, эта статья поможет вам разобраться, что происходит под капотом этих языков. Сначала мы рассмотрим управление памятью в виртуальной машине Java (JVM), которая используется в Java, Kotlin, Scala, Clojure, Groovy и других языках. В первой статье я рассказал и разнице между стеком и кучей, что полезно для понимания этой статьи.

Читать дальше →

+22

1 2 ...

111 112

113

114 115 ...

318 319

Алгоритмы *

Как синхронизировать сценарий без транзакций? Штатными средствами Java

Корни разные нужны, корни разные важны

MEX (Minimum EXcluded) Алгоритм поиска минимального отсутствующего числа

Проецирование положения объектов с камеры видеонаблюдения на карту, используя лишь школьную геометрию

Распознаем номера автомобилей. Разработка multihead-модели в Catalyst

DataScience Digest — 10.06.21

Психотронная тюрьма риторики: история о том, что мешает нам мыслить здраво

Как Яндекс применил генеративные нейросети для поиска ответов

Что такое алгоритм?? Part three and a quarter. «Язык»

Процессор, эмулирующий сам себя — может быть быстрее самого себя

Сетки из треугольников в играх

Что такое «сетка треугольников»

2500 дней создания AI без использования нейронных сетей или покерный бот, который дороже $50к

Как в PHP улучшить читаемость регулярных выражений

Ближайшие события

Каждый браузер видит цвета видео по-разному

Альтернативный способ заполнения «спиральной матрицы»

Анализ результатов работы архитектуры YoloV3 на медицинских снимках

Решаем вопрос сортировки в JavaScript раз и навсегда

Прогнозирование временных рядов с помощью AutoML

В аквариуме: вычислительная генетика на Python и Mathcad (часть 1)

Развеиваем мифы об управлении памятью в JVM

Вклад авторов