@Flux^{read⁠-⁠only}

ML engineer

tuxxon Apr 14 2020 at 07:37

Сотни тысяч маршрутов в секунду на ядро. Опыт Яндекс.Маршрутизации

5 min

15K

Яндекс corporate blogAlgorithms*Geoinformation services*Server optimization*Transport

Пару недель назад Даня Тарарухин рассказал на Хабре, как появился наш сервис, Яндекс.Маршрутизация, и как он помогает компаниям с логистикой. Создавая платформу, мы решили несколько интересных проблем, одной из которых и посвящён сегодняшний пост. Я хочу поговорить о самом планировании маршрутов и необходимых для этого ресурсах.

Читать дальше →

+29

Dmytro_Kikot Apr 3 2020 at 06:50

Омоложение клеток человека за счет их перепрограммирования

13 min

8.9K

ua-hosting.company corporate blogChemistryPopular scienceHealthBiotechnologies

Говорят, что жизнь это один сплошной процесс старения, который неминуемо заканчивается смертью. Это может звучать не очень оптимистично, но таковы законы природы. Старение и смерть являются одними из важнейших регуляторов популяции какого-либо вида на планете, а бессмертие в биологическом смысле этого слова существует только в книгах и кино. Та же ситуация обстоит и с «вечной» молодостью. В книгах у нас есть Дориан Грей — вечно молодой и красивый юноша с сильнейшей антипатией к определенному произведению изобразительного искусства; Эдвард Каллен — вечно молодой вампир с дефицитом витамина D и повышенной отражательной способностью кожи и т.д. В реальности же вечная или хотя бы продленная молодость недостижима. По крайней мере, если в процесс не вмешиваются ученые. Сегодня мы с вами познакомимся с исследованием, в котором ученые из Стэнфордского университета смогли достичь омоложения старых клеток человека за счет определенных белков, участвующих в процессе эмбрионального развития. Какие именно вещества использовались, насколько помолодели старые клетки и насколько продолжительным был эффект? Об этом мы узнаем из доклада исследовательской группы. Поехали.

+19

adamant Mar 25 2020 at 12:44

Как сократить расходы в AWS

7 min

9.7K

Битрикс24 corporate blogAmazon Web Services*Website development*System administration*

Мир кардинально меняется. Многие компании ищут любые способы для сокращения расходов, просто для того, чтобы выжить. При этом усиливается нагрузка на онлайн-сервисы — особенно те, которые связаны с организацией удалённой работы, проведением видео-конференций, онлайн-обучением.

В этих условиях крайне важно с одной стороны — обеспечить надежность и масштабирование вашей инфраструктуры. С другой — не вылететь в трубу с закупкой серверов, дисков, оплатой траффика.

Мы в «Битрикс24» очень активно используем Amazon Web Services, и в этой статье я расскажу о нескольких возможностях AWS, которые помогут вам сократить ваши расходы.

Читать дальше →

+22

JIeM Mar 17 2020 at 08:09

Тестостерон, зачем он мужчинам и как сохранить силу к старости

12 min

77K

Lifext corporate blogHealthBrain

Статья посвящена такому важному гормону, как тестостерон, и объяснению, почему именно он делает мужчин мужчинами. Также cтатья будет интересна к прочтению прекрасным полом.

Содержание:

История открытия
Что такое тестостерон и как он работает в организме
Нормы тестостерона, диагностика, а также немного о заместительной терапии Т
Риски избытка и недостатка тестостерона
Пища для поднятия уровня тестостерона

+14

extropia Mar 11 2020 at 07:42

Витамин B12: как узнать свой уровень и причем здесь старение мозга

14 min

79K

Lifext corporate blogBrainHealth

Сегодня команда Lifext расскажет:

Как был открыт витамин B12;
Что ради этого пришлось пережить первым пациентам;
Что он из себя представляет и откуда берется;
Какую роль играет в старении и когнитивном здоровье человека;
Почему наш организм не усваивает тот, что синтезирован внутри;
В каких случаях нужно сдавать анализы;
Какие продукты есть и нужно ли принимать добавки;

Приятного чтения!

Читать дальше →

+23

Takagi Feb 28 2020 at 15:49

Новостной агрегатор за две недели

8 min

19K

Machine learning*Python*C++*

18 ноября Telegram запустил соревнование по кластеризации данных: Data Clustering Contest. Нужно было за две недели сделать свой новостной агрегатор. Ограничения, которые были установлены в этом соревновании отпугнули кучу людей, но не меня и моих коллег. Я расскажу от том, каким путём мы прошли, какие выборы сделали и с какими сложностями столкнулись. Решение, которое мы заслали в соревнование обрабатывало 1000 документов за 3,5 секунды, занимало 150 Мб, заняло 6 место на публичном голосовании и 3 место в итоговых результатах. Мы допустили много ошибок, из-за которых не заняли место повыше, большинство из них сейчас исправлены. Весь код и все модели можно найти в репозитории. Все скрипты для обучения моделек перенесены на Colab.

Топ из публичного голосования

Читать дальше →

+17

Ariez Jan 10 2020 at 08:08

Мениски в коленном суставе — что это, зачем это, как это лечится если повредилось?

7 min

78K

Health

Решил сегодня поделиться с сообществом небольшой статьей, продолжающей знакомство с ортопедией и биомеханикой. Тема разговора – мениски коленного сустава. Что это такое, зачем они нужны, почему они такие важные и какие современные тенденции в лечении повреждений менисков.

Цель данной статьи – информированность людей.

Кому интересно – заходим под кат.

+41

108

alconost Dec 26 2019 at 12:32

Пять привычек, которые помогут сохранить эффективность работы мозга

5 min

54K

Alconost corporate blogBrainLifehacks for geeksHealthPopular science

Translation

Тренируйте мозг, изменяйте нейронные связи

Наш мозг на удивление динамичен и постоянно меняется. Он умеет приспосабливаться, лечиться, обновляться и изменять нейронные связи.

Наши ежедневные действия (и бездействие) буквально меняют мозг в лучшую (или худшую) сторону. Но еще не поздно омолодить, переделать и изменить мозг так, чтобы оставаться в лучшей форме.

Эксперименты по нейропластичности (это способность мозга изменяться в ответ на получаемый опыт) показали, что мозг умеет меняться — изменяя свою структуру, биохимию, увеличиваясь и уменьшаясь в размерах.

Можно ли физически изменить мозг — в любом возрасте? Да, но в определенных пределах. И начать можно с того, о чем я сейчас расскажу.

Переведено в Alconost

Читать дальше →

+27

Shevev Sep 24 2019 at 13:02

А не пора ли купить ирригатор?

6 min

43K

Medgadgets corporate blog

О здоровье зубов всегда начинаешь задумываться скорее поздно, чем рано, и в результате теряешь время, деньги, хорошее настроение. И зубы, как правило.

По телевизору логично никто ничему не учит: там 9 из 10 стоматологов в очередной раз рекомендуют улучшенную зубную пасту или на худой конец щетку, которая убивает 99% микробов.

В то же время грамотный уход за полостью рта — хорошая инвестиция в долговечность зубов. Один из домашних гаджетов, который призван в этом помочь — ирригатор. О нем и пойдет речь.

Читать дальше →

+14

m1rko Sep 11 2019 at 19:49

Как используется странная инструкция popcount в современных процессорах

4 min

29K

CPUCryptography*Compilers*Algorithms*

Translation

Это псевдорасшифровка моей презентации на !!Con 2019.

В большинстве используемых сегодня процессорных архитектур есть инструкция под названием popcount, сокращённо от 'population count'. Она делает следующее: подсчитывает количество установленных битов в машинном слове. Например (возьмём 8-битные слова для простоты), popcount(00100110) равно 3, а popcount(01100000) равно 2.

Вас это может сильно удивить, как и меня, но это всё, что она делает! Кажется не очень полезным, правда?

Читать дальше →

+65

ErmIg Mar 14 2019 at 10:48

Умножение матриц: эффективная реализация шаг за шагом

14 min

112K

C++*Algorithms*Machine learning*Image processing*

Введение

Умножение матриц — это один из базовых алгоритмов, который широко применяется в различных численных методах, и в частности в алгоритмах машинного обучения. Многие реализации прямого и обратного распространения сигнала в сверточных слоях неронной сети базируются на этой операции. Так порой до 90-95% всего времени, затрачиваемого на машинное обучение, приходится именно на эту операцию. Почему так происходит? Ответ кроется в очень эффективной реализации этого алгоритма для процессоров, графических ускорителей (а в последнее время и специальных ускорителей матричного умножения). Матричное умножение — один из немногих алгоритмов, которые позволяет эффективно задействовать все вычислительные ресурсы современных процессоров и графических ускорителей. Поэтому не удивительно, что многие алгоритмы стараются свести к матричному умножению — дополнительная расходы, связанные с подготовкой данных, как правило с лихвой окупаются общим ускорением алгоритмов.

Так как реализован алгоритм матричного умножения? Хотя сейчас существуют множество реализаций данного алгоритма, в том числе и в открытых исходных кодах. Но к сожалению, код данных реализаций (большей частью на ассемблере) весьма сложен. Существует хорошая англоязычная статья, подробно описывающая эти алгоритмы. К моему удивлению, я не обнаружил аналогов на Хабре. Как по мне, этого повода вполне достаточно, чтобы написать собственную статью. С целью ограничить объем изложения, я ограничился описанием однопоточного алгоритма для обычных процессоров. Тема многопоточности и алгоритмов для графических ускорителей явно заслуживает отдельной статьи.

Процесс изложения будет вестись ввиде шагов с примерами по последовательному ускорению алгоритма. Я старался писать максимально упрощая задачу, но не более того. Надеюсь у меня получилось…

Читать дальше →

+90

m1rko Nov 28 2018 at 14:20

Схема разделения секрета Шамира

7 min

55K

Algorithms*Information Security*Cryptography*Mathematics*

Translation

Рассмотрим сценарий, когда необходимо обеспечить безопасность банковского хранилища. Оно считается абсолютно неприступным без ключа, который вам выдают в первый же день работы. Ваша цель — надёжно сохранить ключ.

Предположим, вы решили всё время хранить ключ при себе, предоставляя доступ к хранилищу по мере необходимости. Но вы быстро поймёте, что такое решение на практике нормально не масштабируется, потому что всякий раз для открытия хранилища требуется ваше физическое присутствие. А как насчёт отпуска, которые вам обещали? Кроме того ещё более пугает вопрос: а что если вы потеряли единственный ключ?

С мыслью об отпуске вы решили сделать копию ключа и доверить её другому сотруднику. Однако вы понимаете, что это тоже не идеально. Удваивая количество ключей, вы также удвоили возможности кражи ключа.

Отчаявшись, вы уничтожаете дубликат и решаете разделить исходный ключ пополам. Теперь, вы думаете, два доверенных человека с фрагментами ключей должны физически присутствовать, чтобы собрать ключ и открыть хранилище. Это означает, что вору необходимо украсть два фрагмента, что вдвое труднее кражи одного ключа. Однако вскоре вы понимаете, что эта схема ненамного лучше, чем просто один ключ, потому что если кто-то потеряет половину ключа, полный ключ нельзя восстановить.

Читать дальше →

+72

elena_pastukhova Jun 19 2018 at 06:58

Д-пантенол: препарат для добра

4 min

29K

Гельтек-Медика corporate blogBiotechnologiesHealth

Знакомьтесь — декспантенол. Декспантенол получает уже пятое дыхание в медицине. Для нас важно, что он значительно стимулирует процессы регенерации в повреждённых слизистых оболочках и коже, плюс делает ещё много чего полезного. Такой эффект получается из-за универсальности тех биохимических процессов, на которые он влияет.

Сейчас расскажу, почему его так любят косметологи.

Читать дальше →

+33

PatientZero May 18 2018 at 16:18

Инверсная кинематика в двухмерном пространстве

7 min

20K

Algorithms*Mathematics*Game development*

Translation

Часть 1. Математика

Введение

Мы так привыкли к взаимодействию с окружающим нас миром, что не задумываемся о том, насколько сложно двигаются наши руки и ноги. В академической литературе задача управления манипулятором робота называется инверсной кинематикой. Кинематика обозначает "движения", а понятие "инверсная" связано с тем, что обычно мы не управляем самой рукой. Мы управляем «двигателями», поворачивающими каждую отдельную часть. Инверсная кинематика — это задача определения того, как перемещать эти двигатели, чтобы сдвинуть руку в конкретную точку. И в своём общем виде эта задача чрезвычайно сложна. Чтобы вы понимали, насколько она сложна, то можете вспомнить о таких играх, как QWOP, GIRP или даже Lunar Lander, в которой вы выбираете не куда двигаться, а какие мускулы (или ускорители) приводить в действие.

Задача управления подвижными приводами распостраняется даже на область робототехники. Вас не должно удивлять то, что на протяжении веков математики и инженеры смогли разработать множество решений. В большинстве 3D-редакторов и игровых движков (в том числе и в Unity) есть наборы инструментов, позволяющих выполнять риггинг человекоподобных и звероподобных существ. Для различных схем (манипуляторов роботов, хвостов, щупалец, крыльев и т.д.) встроенных решений обычно не существует.

Читать дальше →

+36

e_finkel Mar 30 2018 at 06:00

C++ велосипедостроение для профессионалов

36 min

50K

Конференции Олега Бунина (Онтико) corporate blogC++*IT Standards*Compilers*Programming*

Классы, которые люди самостоятельно пишут, а потом копируют из одного проекта в другой, хотя они уже есть в стандартных библиотеках, в простонародье называются велосипедами. Первый вопрос, который возникает при встрече с таким «велосипедом» — зачем люди переписывают что-то заново? Вариантов может быть несколько.

Некоторые делают это для самообучения: берут класс стандартной библиотеки, пишут его сами с нуля, сравнивают то, что получилось, с тем, что есть в стандартной библиотеке — в процессе узнают для себя что-то новое.
Некоторые проекты имеют особое требования к коду. В embedded-разработке принято работать без RTTI и без exception, поэтому части стандартной библиотеки, которые используют RTTI и exception, необходимо переписать без них.
Редко, но бывает, когда велосипед пишут, потому что могут написать лучше, чем в стандартной библиотеке. Как правило, такие нововведения рано или поздно попадают в стандартную библиотеку.
Другим только кажется, что они могут написать лучше, и таких людей больше. Но в процессе они обучаются, выясняют для себя что-то новое и что-то интересное открывают.
Могут быть другие причины.

Сегодня мы не будем говорить о том, что велосипеды — это плохо, это не обязательно так. Мы поговорим о том, что действительно плохо:

бездумно переносить устаревшие технологии 20-30-летней давности в современные проекты;
пользоваться «вредными» бенчмарками и оптимизациями.

А также затронем «вредные» советы, обсудим новейшие практики программирования (C++ 11 и позднее), подумаем, что делать с «идеальным» велосипедом.

+76

102

PatientZero Feb 14 2018 at 08:46

Регулярные выражения: никакой магии

13 min

37K

Scala*Algorithms*Regular expressions*

Translation

Код этого поста, как и сам пост, выложен на github.

До недавнего времени регулярные выражения казались мне какой-то магией. Я никак не мог понять, как можно определить, соответствует ли строка заданному регулярному выражению. А теперь я это понял! Ниже представлена реализация простого движка регулярных выражений менее чем в 200 строках кода.

Часть 1: Парсинг

Спецификация

Реализация регулярных выражений полностью — довольно сложная задача; хуже того, она мало чему вас научит. Реализуемой нами версии достаточно для того, чтобы изучить тему, не скатываясь в рутину. Наш язык регулярных выражений будет поддерживать следующее:

. — соответствие любому символу
| — соответствие abc или cde
+ — соответствие одному или более предыдущего паттерна
* — соответствие 0 или более предыдущего паттерна
( и ) — для группировки

Хотя набор опций невелик, с его помощью можно создать интересные regex-ы, например, m (t|n| ) | b позволяющий найти субтитры к Star Wars без субтитров к Star Trek, или (..)* для нахождения множества всех строк чётной длины.

План атаки

Мы будем анализировать регулярные выражения в три этапа:

Парсинг (синтаксический анализ) регулярного выражения в синтаксическое дерево
Преобразование синтаксического дерева в конечный автомат
Анализ конечного автомата для нашей строки

Для анализа регулярных выражений (подробнее об этом ниже) мы будем использовать конечный автомат под названием NFA. На высоком уровне NFA будет представлять наш regex. При получении входных данных мы будем перемещаться в NFA от состояния к состоянию. Если мы придём в точку, из которой невозможно совершить допустимого перехода, то регулярное выражение не соответствует строке.

Читать дальше →

+27

m1rko Jan 6 2018 at 11:07

Итоги развития компьютерного зрения за один год

12 min

29K

Working with video*Image processing*Machine learning*Algorithms*

Translation

Часть первая. Классификация/локализация, обнаружение объектов и слежение за объектом

Этот фрагмент взят из недавней публикации, которую составила наша научно-исследовательская группа в области компьютерного зрения. В ближайшие месяцы мы опубликуем работы на разные темы исследований в области Искусственного Интеллекта — о его экономических, технологических и социальных приложениях — с целью предоставить образовательные ресурсы для тех, кто желает больше узнать об этой удивительной технологии и её текущем состоянии. Наш проект надеется внести свой вклад в растущую массу работ, которые обеспечивают всех исследователей информацией о самых современных разработках ИИ.

Введение

Компьютерным зрением обычно называют научную дисциплину, которая даёт машинам способность видеть, или более красочно, позволяя машинам визуально анализировать своё окружение и стимулы в нём. Этот процесс обычно включает в себя оценку одного или нескольких изображений или видео. Британская ассоциация машинного зрения (BMVA) определяет компьютерное зрение как «автоматическое извлечение, анализ и понимание полезной информации из изображения или их последовательности».

Термин понимание интересно выделяется на фоне механического определения зрения — и демонстрирует одновременно и значимость, и сложность области компьютерного зрения. Истинное понимание нашего окружения достигается не только через визуальное представление. На самом деле визуальные сигналы проходят через оптический нерв в первичную зрительную кору и осмысливаются мозгом в сильно стилизованном смысле. Интерпретация этой сенсорной информации охватывает почти всю совокупность наших естественных встроенных программ и субъективного опыта, то есть как эволюция запрограммировала нас на выживание и что мы узнали о мире в течение жизни.

Читать дальше →

+19

Monnoroch Dec 4 2017 at 13:17

Вероятностная интерпретация классических моделей машинного обучения

8 min

32K

Algorithms*Mathematics*Machine learning*

Translation

Этой статьей я начинаю серию, посвященную генеративным моделям в машинном обучении. Мы посмотрим на классические задачи машинного обучения, определим, что такое генеративное моделирование, посмотрим на его отличия от классических задач машинного обучения, взглянем на существующие подходы к решению этой задачи и погрузимся в детали тех из них, что основаны на обучении глубоких нейронных сетей. Но прежде, в качестве введения, мы посмотрим на классические задачи машинного обучения в их вероятностной постановке.

Читать дальше →

+24

jandevel Nov 1 2017 at 08:10

Настраиваем VM Instance Google Cloud для задач машинного обучения

4 min

41K

Google Cloud Platform*Virtualization*High performance*Machine learning*Cloud computing*

From sandbox

Решение тяжёлых задач машинного обучения на стационарных компьютерах дело неблагодарное и малоприятное. Представьте, что вы на домашнем ноутбуке делаете ансамбль из N нейронных сетей для изучения лесов Амазонки на ноутбуке. Сомнительное удовольствие, тем более, что сейчас есть прекрасный выбор облачных сервисов для этих целей — Amazon Web Services, Google Cloud Platform, Microsoft Azure и прочие. Некоторые даже относительно бесплатны и предоставляют видеокарты.

Мы будем настраивать VM на Google Cloud Platform с нуля. Бонусом — стартовые 300$ на год на один gmail аккаунт. Поехали.

Создание и настройка Virtual Machine Instances
Настройка сетевых параметров
Установка Anaconda и дополнительных пакетов
Настройка Jupyter Notebook
Настройка File Transfer

Читать дальше →

+14

Flux May 29 2012 at 07:59

Ropes — быстрые строки

5 min

26K

Algorithms*

From sandbox

Здравствуй, Хабр.
Большинство из нас так или иначе работает со строками. Этого не избежать — если ты пишешь код, ты обречен каждый день складывать строки, разбивать их на составные части и обращаться к отдельным символам по индексу. Мы давно привыкли что строки — это массивы символов фиксированной длины, а это влечет за собой соответствующие ограничения в работе с ними.
Так, мы не можем быстро объединить две строки — для этого нам потребуется сначала выделить необходимое количество памяти, а потом скопировать туда данные из конкатенируемых строк. Очевидно, что такая операция имеет сложность порядка О(n), где n — суммарная длина строк.
Именно поэтому код

string s = "";
for (int i = 0; i < 100000; i++) s += "a";

работает так медленно.

Хочешь выполнять конкатенацию гигантских строк быстро? Не нравится, что строка требует для хранения непрерывную область памяти? Надоело использовать буферы для построения строк?

Хватит это терпеть!

+79

1 2

4 5 6