Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

apelsyn 24 дек 2021 в 03:42

Распознавание номерных знаков. Как все ускорить

8 мин

28K

Машинное обучение * Искусственный интеллектPython *

Nomeroff Net. Как ускорить распознавние номерных знаков.

После запуска моделей на прод рано или поздно приходит понимание того, что Ваши сервисы популярны и что KPI растут. Вместе с популярностью приходят тормоза и нестабильность. В этой статье речь пойдет о прикладном аспекте оптимизации быстродействия алгоритмов/моделей на примере движка распознавания автомобильных номеров “Nomeroff Net”. Буду делиться опытом, полученным на протяжении 2-х летней разработки. Если коротко: нам удалось ускорить время распознавания 1 фото более чем в 10 раз.

“Чел догадался в свой сервер вставить RTX 3090” подумаете Вы… Приблизительно так и было, только если взять замеры до установки GPU то все ускорили в 100+ раз :).
Не будет детального описания архитектуры моделей (они давно известны в узких кругах), хочу поделиться важными моментами, на которые стоит обратить внимание при оптимизации ваших ML-сервисов.

Читать дальше →

+20

krukov_dima 23 дек 2021 в 14:46

Кэш в асинхронных python приложениях

8 мин

23K

Python *

Из песочницы

Всем привет! Кэш один из "слонов" современного веба. Так почему мы так мало его используем на уровне приложения, нашего кода? Тому, кто хочет восполнить этот пробел и не хочет ударить в грязь лицом при написании очередного декоратора - добро пожаловать под кат

+22

Nenash 23 дек 2021 в 07:18

Управление и мониторинг сервера через Telegram-бота

3 мин

25K

Системное администрирование * Python * Сетевые технологии * Серверное администрирование * Windows *

Являюсь разработчиком в фирме которая занимается автоматизацией и телемеханизацией промышленных объектов. В мои обязанности входит разработка и поддержка ПО верхнего уровня, администрирование сервера и обеспечение его бесперебойной работы. Обычно ПО работает стабильно, но временами бывают сбои (по причинам не зависящим от нашего софта), о которых я иногда узнаю с большим опозданием. Было решено, что нужна система мониторинга, которая будет оповещать меня и руководство о проблемах, для возможности их быстрого устранения. Кроме того хотелось бы иметь возможность оперативно устранить проблему, даже если «под рукой» нет ПК.

vladpen 23 дек 2021 в 06:08

Удаленный доступ к IP камерам, теперь на Python

19 мин

68K

Работа с видео * Python * Программирование *

Удивительно, что в 2021-м все еще можно обсуждать такую избитую тему. Однако, мне пришлось пройти довольно длинный путь от покупки охранных камер до готового решения, покрывающего мои, довольно нехитрые, задачи. Под катом вы найдете скрипт, который показался мне достаточно удачным, чтобы опубликовать его на Хабре, и некоторые пояснения к нему. Надеюсь, кому-то поможет.

+17

NewTechAudit 23 дек 2021 в 03:28

Предсказание количества лайков у комментария в YouTube

7 мин

2.7K

Python * Программирование * Проектирование API * Машинное обучение *

Наверняка у каждого хотя бы раз было такое желание, чтоб написать комментарий и получить массу лайков за него. Как никак, человек существо социальное и одобрение этого самого социума порой очень хочется. Но тут возникает вопрос: а что нужно написать, чтобы получить максимальное количество лайков? И для этого можно использовать машинное обучение! В любой непонятной ситуации применяй машинное обучение.

На самом деле, это довольно непростая задача, требующая не только обработки комментариев, но и определения контекста, в котором он размещён. Но никто же не заставляет нас собирать квантовый суперкомпьютер, верно? Для простого обзора можно обойтись и более простыми инструментами.

Итак, для начала нужно собрать данные для обучения. В качестве источника таковых возьмём площадку YouTube. Уж где где, а на YouTube полно самых различных комментариев. К тому же в сообществах популярных каналов очень распространены локальные мемы, то есть некоторые слова и словосочетания, имеющие некий знаковый символ в этом сообществе. Употребление таких локальных мемов при написании комментариев, теоретически, должно увеличивать количество лайков, а значит несколько упрощать нам задачу.

Ключевым параметром будет выступать, естественно, количество лайков комментария, а признаками будут, во-первых, сам текст комментария, а во-вторых, разница между датой публикацией видео и комментария, так как очевидно, что чем позже от даты выхода видео размещён комментарий, то тем меньше лайков он соберёт. По второму признаку могут быть исключения в виде видео годовалой или более давности, которые по какой-то причине YouTube начал выдавать в рекомендациях у пользователей, после чего в комментариях к оным видео начинается активность, но мы подобные брать не будем.

vvmax 22 дек 2021 в 14:06

Переиграй школьников в YOUNG CODERS PARTY

5 мин

2.4K

Блог компании SuperJobХакатоныPython * Занимательные задачкиPHP *

В этом году SuperJob вместе с CODDY и Codenrock организовали хакатон YOUNG CODERS PARTY, для юных кодеров от 14 до 18 лет, в итоге самые сильные участники получили свои крутые призы.

Предлагаем вам немного размяться и почувствовать себя на месте юных программистов.

Под катом серия предложенных участникам YOUNG CODERS PARTY задач (лишь слегка доработанных — чтобы вам было тоже интересно!). Присылайте свои решения до 28 декабря включительно; мы постараемся подвести итоги конкурса до Нового Года. Победители получат от нас призы — теплые толстовки, маски с принтами и стикерпаки!

ilgrad 22 дек 2021 в 11:15

Как мы распознаем фото документов пользователей. Часть I

7 мин

18K

Блог компании inDrive.TechPython * Обработка изображений * Машинное обучение *

Привет, Хабр! Я Илья, Junior Data Scientist в inDriver. В работе нам часто приходится распознавать документы водителей или пассажиров для их верификации в приложении. Наша команда выработала свой подход к идентификации текста и фото документов, которым мы хотели бы поделиться. Ждем вас под катом. Приятного чтения!

+18

Babayko 21 дек 2021 в 08:13

Наш опыт создания «Интенсива», или почему избежать ошибок не удастся

6 мин

4.1K

Блог компании БАРС ГрупPython * Программирование * Django * Карьера в IT-индустрии

Всем привет! Меня зовут Дмитрий Чернышов, я руководитель группы разработки системы «БАРС.Бюджет-Бухгалтерия». Сегодня я поделюсь своим опытом создания обучающего курса для разработчиков.

Lol4t0 21 дек 2021 в 08:07

Как работает цикл заказа такси в Яндекс Go. История вопроса

9 мин

40K

Блог компании ЯндексГеоинформационные сервисы * Анализ и проектирование систем * Python *

Меня зовут Илья, я отвечаю за инфраструктуру пользовательских продуктов в Яндекс Go. Мы строим цикл заказа такси — процессы, происходящие под капотом после того, как пользователь нажимает «Заказать». Поиск машины, назначение водителя, изменение адреса, оплата поездки — всё это части цикла. Ещё мы делаем инфраструктуру создания циклов, которая используется в Еде, Лавке, Доставке и других направлениях внутри Яндекса.

Но обо всём по порядку. Давайте расскажу историю того, как мы развивали механизм обработки заказа, адаптировали его под нужды пользователей и старались исключить ошибки, а главное, почему мы используем такую архитектуру сейчас. Если у вас на бэкенде тоже выполняются последовательности зависящих друг от друга действий, и не оставляет желание оптимизировать логику — то тем более добро пожаловать под кат.

Как всё начиналось

В 2011 году мы запустили сервис заказа такси. В первой реализации в бэкенде был endpoint /create-order, внутри которого мы создавали заказ, искали ближайшую машину и отправляли заказ водителю (кстати, если вы не знали о том, как устроен поиск водителя, то обязательно почитайте).

Читать дальше →

+32

Takagi 21 дек 2021 в 07:31

Секреты генерирующего реферирования текстов

11 мин

15K

Программирование * Машинное обучение * Искусственный интеллектPython * Natural Language Processing *

Эта статья посвящена основным современным моделям для генерирующего реферирования и генерации текста в целом: BertSumAbs, GPT, BART, T5 и PEGASUS, и их использованию для русского языка.

В отличие от извлекающих моделей, которые рассмотрены в предыдущих двух статьях, эти модели создают новые тексты, а не только выделяют предложения из оригинального документа. Из-за этого они могут нетривиально изменять исходный текст: удалять слова или заменять их на синонимы, сливать и упрощать предложения, а значит делать ровно то, что делают люди при составлении рефератов.

Ещё десять лет назад методы из этой категории казались фантастикой. Развитие систем нейросетевого машинного перевода сделало генерирующее автоматическое реферирование намного более лёгкой задачей.

Серьёзные методы оценки качества реферирования будут в следующих частях цикла. Сейчас же для наглядности мы испытаем алгоритмы на одной конкретной новости про секвенирование РНК клеток коры головного мозга. Это свежая новость, то есть модели заведомо не могли её видеть. К тому же она довольно сложная: 5.7 баллов по шкале N+1.

Кстати говоря, заголовок к этой статье написан одной из описываемых моделей.

Читать дальше →

+15

MaksimSidorov 20 дек 2021 в 13:14

Война или мир: используем MATLAB и Python вместе

8 мин

17K

Блог компании ЦИТМ ЭкспонентаИнженерные системы * Искусственный интеллектМашинное обучение * Python *

Перевод

Если вы студент, работаете в академической сфере или на производстве, вы, вероятно, сталкивались с ситуациями, когда вам нужно было объединить работу с более чем одного языка программирования. Это обычное дело в инженерных и научных приложениях, особенно когда они связаны с несколькими командами и нуждаются в общем оборудовании. В этом материале хочу поделиться некоторыми полезными советами, которые помогут эффективно использовать MATLAB и Python вместе.

vnkama 20 дек 2021 в 12:34

Тестируем быстродействие трех библиотек Python

3 мин

9.6K

Python *

Из песочницы

Передо мной стояла задача выбрать библиотеку для расчета на Python, использующего операции над матрицами. Я выбрал и протестировал несколько вариантов, как использующих видеокарту (GPU), так и работающие только на процессоре.

Использовал три библиотеки: Numpy, Pytorch и Numba.

+14

kimmhhed 20 дек 2021 в 08:21

Распределенные сервисы с применением gRPC

12 мин

34K

Блог компании Издательский дом «Питер»Python * Программирование * .NET * Профессиональная литература *

Перевод

Часто бывает так, что эффективная коммуникация – один из основных движущих факторов в современных программных системах, даже в мире, живущем по законам микросервисной архитектуры. Технология gRPC может справляться с этими требованиями. В этой статье будут рассмотрены некоторые основы gRPC, а еще мы реализуем первое клиент-серверное приложение с применением .NET. Кроме того, клиент на основе Python демонстрирует, насколько эффективной может быть коммуникация между различными сервисами.

PatientZero 20 дек 2021 в 07:25

Странный мир Python, используемого крупными инвестиционными банками

15 мин

18K

Python * Системы управления версиями * Управление продуктом * Финансы в IT

Перевод

Мир больших финансов — это чужая страна; всё в ней происходит иначе

Сегодня мы сквозь замочную скважину взглянем на группу программных систем, о которой общество знает очень мало. Я называю её «банковским Python». Реализации банковского Python, по сути, являются проприетарными форками всей экосистемы Python, которые используются во многих (но не во всех) крупнейших инвестиционных банках. Банковский Python сильно отличается от обычной разновидности Python, которую любят (или ненавидят) большинство людей.

Тысячи людей работают над этими системами (или, скорее, внутри них), но в открытом вебе о них есть не так много информации. Когда я пытался объяснять в разговорах, что такое банковский Python, люди часто высмеивали мои рассказы, как бред лунатика. Всё это кажется слишком эксцентричным.

Я расскажу о вымышленной, объединившей в себе черты многих, воображаемой системе банковского Python под названием «Минерва». Названия подсистем будут изменены, и хотя я попытаюсь быть точным, некоторые подробности придётся стилизовать; кроме того, мне неизвестны все детали. Возможно, я даже допущу случайную ошибку. Но, надеюсь, общая картина будет правдивой.

Читать дальше →

+25

i_shutov 17 дек 2021 в 19:27

О бедном бите замолвите слово

4 мин

4.9K

R * Python * Data Mining * Big Data *

Н. Кобринский, В. Пекелис «Быстрее мысли» — Молодая гвардия, 1959

Когда все вокруг измеряют Гигабайтами, Петабайтами, Зетабайтами и т.д., все компании гордятся своей БигДатой, вспоминать о битах в приличном обществе воспринимается как моветон. Однако и биты иногда бывают полезны. Темой для разговора послужила одна типовая классическая задачка, лежащая в области опросов.

Является продолжением серии предыдущих публикаций.

Читать дальше →

MaxRokatansky 17 дек 2021 в 15:49

Эмуляторы и симуляторы vs реальные устройства для автоматизации тестирования

5 мин

45K

Блог компании OTUSТестирование веб-сервисов * Python *

Перевод

В этой статье рассмотрим особенности тестирования мобильных приложений с помощью эмуляторов/симуляторов и на реальных устройствах.

Содержание:

Что такое мобильные эмуляторы и симуляторы;

Типы мобильных тестов;

Инструменты/фреймворки автоматизации мобильного тестирования;

Когда можно использовать эмуляторы/симуляторы, а а когда — стоит тестировать на реальных устройствах.

X5Tech 17 дек 2021 в 14:55

Стратификация. Как разбиение выборки повышает чувствительность A/B теста

15 мин

71K

Блог компании X5 TechPython * Математика * Статистика в IT

Всем привет! На связи команда ad-hoc аналитики X5 Tech.

Сегодня подробно обсудим применение стратификации для повышения чувствительности оценки AB экспериментов.

technokratiya 17 дек 2021 в 12:28

Как сделать telegram-бота для игры в Тайного Санту

5 мин

12K

Python * PostgreSQL *

Перед Новым годом мы организовали тайного санту. Для упрощения процесса задумались о боте. Да, мы нашли на просторах гитхаба различные варианты, но решили не лишать себя праздничного веселья от создания бота на коленке. Меня зовут Вильданов Ринат, я python-разработчик в Технократии, и я расскажу, что мы наделали. Возможно, описание нашего пути поможет и вам.

selesnow 17 дек 2021 в 08:50

Заметки по языку R | Часть 2: Используем синтаксический сахар и приёмы Python в R

7 мин

5.2K

Python * Data Mining * Big Data * R * Data Engineering *

Заметки по языку R - это серия статей, в которых я собираю наиболее интересные публикации канала R4marketing из рубрики "#заметки_по_R".

В прошлый раз мы говорили о нетипичных визуализациях, сегодняшняя подборка состоит из описания приёмов, которые свойственны и горячо любимы пользователям Python, но большинство пользователей R о них не знают.

Для пользователей Python эта статья будет полезна тем, что они найдут реализацию своих любимых приёмов в другом языке, для пользователей R статья будет полезна тем, что они откроют для себя изящные приёмы Python, и смогут перенести их в свои R проекты.

dustalov 17 дек 2021 в 08:09

Агрегация ответов в краудсорсинге. Пример с открытой библиотекой Яндекса

4 мин

3.9K

Блог компании ЯндексPython * КраудсорсингМашинное обучение *

Туториал

Краудсорсинг позволяет размечать данные для разных задач, но популярнее всего, конечно, задачи классификации объектов — текстов и картинок. Обычно в краудсорсинге несколько человек размечают каждый объект, что требует агрегации — выбора верного ответа из представленных. Под катом я покажу, как агрегировать результат разметки с помощью двух алгоритмов: голоса большинства и алгоритма Дэвида-Скина.

Я буду использовать Crowd-Kit — нашу открытую библиотеку вычислительных методов контроля качества в краудсорсинге, которая предлагает реализации разных методов агрегации ответов, оценки неопределённости и согласованности ответов и т. д. Но вы можете воспользоваться альтернативами: spark-crowd (использует Scala вместо Python), CEKA (Java вместо Python) или Truth Inference (использует Python, но предоставляет только категориальные и числовые ответы).

Читать дальше →

+16

1 2 ...

241 242

243

244 245 ...

486 487

Python *

Распознавание номерных знаков. Как все ускорить

Кэш в асинхронных python приложениях

Управление и мониторинг сервера через Telegram-бота

Удаленный доступ к IP камерам, теперь на Python

Предсказание количества лайков у комментария в YouTube

Переиграй школьников в YOUNG CODERS PARTY

Как мы распознаем фото документов пользователей. Часть I

Наш опыт создания «Интенсива», или почему избежать ошибок не удастся

Как работает цикл заказа такси в Яндекс Go. История вопроса

Как всё начиналось

Секреты генерирующего реферирования текстов

Война или мир: используем MATLAB и Python вместе

Тестируем быстродействие трех библиотек Python

Распределенные сервисы с применением gRPC

Ближайшие события

Странный мир Python, используемого крупными инвестиционными банками

О бедном бите замолвите слово

Эмуляторы и симуляторы vs реальные устройства для автоматизации тестирования

Стратификация. Как разбиение выборки повышает чувствительность A/B теста

Как сделать telegram-бота для игры в Тайного Санту

Заметки по языку R | Часть 2: Используем синтаксический сахар и приёмы Python в R

Агрегация ответов в краудсорсинге. Пример с открытой библиотекой Яндекса

Вклад авторов