Python *

Высокоуровневый язык программирования

669,99

Рейтинг

СтатьиПостыНовостиАвторыКомпании

i_pomerantsev 18 мая 2023 в 15:06

Проектирование ML-сервиса для прогнозирования котировок акций (для Advisors’ Axiom от Росбанка)

Средний

6 мин

3.9K

Python * Django * IT-инфраструктура * Машинное обучение *

Из песочницы

Привет, меня зовут Илья Померанцев, я руководитель ML-направления в Globus IT. Расскажу, как мы разработали нейросеть для оценки тональности новостей для инвестиционной платформы Advisors’ Axiom от Росбанка.

О проекте

Инвестиционная платформа Advisors’ Axiom — это площадка для совместной работы инвесторов сегмента Premium и VIP, инвестиционных консультантов и финансовых экспертов, разработанная ПАО «Росбанк».

Для проекта была разработана нейросеть для прогнозирования котировок акций в зависимости от тональности финансовых новостей. Полученная информация поможет клиентам, инвестиционным консультантам и финансовым экспертам более эффективно инвестировать денежные средства в ценные бумаги компаний. Вот о ее разработке мы и расскажем подробнее.

Задача

Задача сервиса — получение, оценка (классификация) финансово-экономических новостей на основе машинного обучения модели нейронной сети для классификации текстов финансово-экономической направленности по трем видам тональностей.

+18

Alviner 18 мая 2023 в 10:20

Как заставить бэкендера писать фронтенд

Простой

10 мин

18K

Блог компании ЯндексPython * VueJS * Программирование * Веб-разработка *

Всем привет! Меня зовут Иван Ситкин, я бэкенд-разработчик в Едадиле. Сегодня я хочу поделиться с вами историей написания очередной панели администрирования и как из этого мы собрали подходящие подходы и практики.

Для начала давайте вспомним, что же это за панели. Панель администрирования (или админка) — это приложение, которое используется для управления и настройки приложения. То есть это такой продукт для продукта. Панели администрирования нужны для различных целей, например, для создания и редактирования контента, настройки параметров продукта или управления пользователями.

Но иногда в проектах важна скорость и ресурсов на создание админки с привлечением команды фронтенда откровенно не хватает. И тогда бэкендеру приходится брать процесс в свои руки.

А теперь вы готовы погрузиться в эту кроличью нору.

+23

ptsecurity 18 мая 2023 в 08:21

(Не)безопасная разработка, часть 2: заимствование метаданных популярных пакетов для подделки рейтинга Python-проектов

9 мин

2.3K

Блог компании Positive TechnologiesПрограммирование * Python * Open source * Информационная безопасность *

✏️ Технотекст 2023

Недавно мы опубликовали статью о выявлении вредоносных пакетов в Python Package Index и с тех пор активно используем разработанный нами сервис для анализа проектов. Сегодня хотим поделиться с вами интересным наблюдением, связанным с накруткой репутационной статистики в проектах. Как нечаянно улучшить репутацию своего проекта, насколько распространена эта проблема и как в автоматическом режиме обнаружить подобные манипуляции — читайте под катом.

Подробнее

RaccoonSecurity 18 мая 2023 в 06:50

Восстановить удаленную фотографию с флешки? Искусственный интеллект в помощь

Средний

9 мин

8.8K

Блог компании НТЦ ВулканPython * Обработка изображений * Восстановление данных * Искусственный интеллект

Кейс

Привет, Хабр! В статье хотел бы поделиться своим опытом восстановления данных (на самом деле, всего одной фотографии), который перерос в любопытный кейс применения методов машинного обучения для решения задачи реконструкции файлов изображений. Думаю, что проблема с восстановлением удаленной информации с носителей весьма актуальна для читателей Хабра (и обычных юзеров, и целых компаний), поэтому поделюсь некоторыми наработками. Все это - под катом.

+41

ph_piter 17 мая 2023 в 13:34

Книга «Python для финансистов»

8 мин

12K

Блог компании Издательский дом «Питер»Python * Профессиональная литература * Финансы в IT

Как дела, Хаброжители?

Программирование, математика и финансы неразрывно связаны между собой. Ив Хилпиш, автор бестселлера «Python для финансовых расчетов», объясняет базовые концепции и дает в ваши руки все необходимые инструменты для работы в мире финансовой инженерии.

В этой книге вы:
• изучите основы программирования на Python и познакомитесь с теорией финансов через математику;
• узнаете о моделировании данных и использовании Python в финансовой инженерии;
• научитесь статическому и динамическому моделированию финансовых задач: ценообразование, принятие решений и распределение активов;
• получите общее представление о необходимый библиотеках Python: NumPy, SciPy, Matplotlib и SymPy.

Читать дальше →

Seleditor 17 мая 2023 в 12:44

Создаем блог на Django с опросами и тестами. Краткая инструкция. Часть 1

7 мин

27K

Блог компании SelectelDjango * Python * Веб-разработка *

Туториал

Самый действенный способ изучить фреймворк — написать пет-проект. Например, свою социальную платформу на Django. Во время реализации можно попрактиковаться в работе с формами, представлениями, сигналами и SMTP.

В Proglib собрали небольшой шаблон, на базе которого можно создать свой блог на Django, а после — задеплоить на виртуальный сервер. Материал будет полезен новичкам, которые знакомы с базовыми концепциями фреймворка и хотят закрепить знания. Подробности под катом!

Читать дальше →

+46

MrFedko 17 мая 2023 в 05:35

Что нового в SQLAlchemy 2.0?

Средний

7 мин

41K

Python * SQL *

Из песочницы

Перевод

Эта статья является переводом статьи Мигеля Гринберга.

Возможно, вы слышали, что основная версия SQLAlchemy 2.0, была выпущена в январе 2023 года. Или, может быть, вы пропустили объявление и это новость для вас. В любом случае, я подумал, что вам будет интересно узнать, что в нем нового, стоит ли его обновлять и насколько сложно это сделать.

Как и в предыдущих обзорах программного обеспечения, это будет субъективный обзор. Я давно использую SQLAlchemy ORM в веб-проектах, поэтому в этой статье я расскажу о функциях, которые влияют на мою собственную работу, как в положительную, так и в отрицательную сторону. Если вместо этого вам интересно увидеть список всех изменений, внесенных в этот новый релиз, то официальный журнал изменений — это то что вам нужно.

Читать далее →

+21

gist59 16 мая 2023 в 13:45

Адаптация языковой модели vosk

Простой

3 мин

34K

Open source * Python * Голосовые интерфейсы *

Туториал

Из песочницы

Приветствую, Хабр. В данной статье хочу рассмотреть процесс добавления слов в языковую модель vosk'а (vosk - библиотека для распознавания речи, в основе которой kaldi).

+11

NeGoy 16 мая 2023 в 09:22

Автоматическая рассылка сообщений WhatsApp

Простой

7 мин

28K

Google ChromeПроектирование API * Action Script * Python *

Из песочницы

Шалом, Хабр! Сегодня разберём такую тему, как автоматическая рассылка сообщений WhatsApp при помощи библиотеки Selenium на языке программирования Python и поговорим о том, почему же это не так просто, как запарсить Википедию.

P.S. На самом деле это не намного сложнее, чем запарсить Википедию, просто нужно знать об одной очень полезной фиче Selenium'а.

-1

Firemoon 16 мая 2023 в 09:11

Когда типизация делает тебе больно: как у нас появился статический анализатор

10 мин

9.3K

Блог компании SelectelIT-инфраструктура * Python * Программирование *

Удобство процесса разработки напрямую влияет на скорость работы и на количество ошибок при написании кода. Что делать, если среда разработки почему-то отказывается использовать автодополнение во всю силу? Правильно, искать обходные пути и изобретать велосипеды.

Язык программирования Python в силу своей динамичности может легко создать ситуацию, когда статический анализатор не может вывести типы и, как следствие, часть проверок отключается. В статье я подробно расскажу о проблеме в разработке системы управления выделенными серверами, которую мы сами себе создали, а затем героически решили. В примерах используется интерпретатор Python 3.10, а средой разработки выступает PyCharm 2022.2.4.

Текст будет интересен тем, кто хочет узнать новые стороны Python, и кому любопытно, с какими проблемами можно столкнуться, если ~~использовать все модные фичи языка~~.

Читать дальше →

+57

CodeShaman 16 мая 2023 в 08:00

Тебе не нужно классическое ООП в твоём бэкенд микросервисе

24 мин

22K

Блог компании ДомкликPython * Проектирование и рефакторинг * ООП * Функциональное программирование *

✏️ Технотекст 2023

Заявление звучит довольно громко и, я бы даже сказал, провокационно. Но в последние годы я всё больше и больше считаю, что это утверждение действительно верно, и хочу подробно объяснить, почему.

+42

bitxzibit3 16 мая 2023 в 07:40

Как нейросеть достопримечательности на фотокарточках распознавала

Средний

7 мин

2.2K

Машинное обучение * Программирование * Python *

Из песочницы

И снова машинное обучение, и все еще классификация изображений.

Поговорим о том, как можно подойти к задаче распознавания достопримечательностей, используя нейросети и совсем чуть-чуть собственных догадок по этому поводу.

Преисполниться

kath_vyunova 16 мая 2023 в 07:13

Точечные фильтры: алгоритмы и их реализация

Простой

9 мин

6.6K

Python * Алгоритмы * Обработка изображений *

Туториал

Фильтры играют важную роль в обработке изображений и сигналов, позволяя улучшить качество изображения, удалить шум, выделить интересующие области и многое другое. Существует несколько типов фильтров, используемых в цифровой обработке сигналов и компьютерном зрении. В этой статье мы рассмотрим точечные фильтры и изучим принципы их работы.

Для начала импортируем модули для дальнейшей работы с изображениями.

wiseplat 15 мая 2023 в 18:43

ChatGPT — помощник для программиста? Пример реальной задачи: распознавание квадратов Нейросетью

Простой

14 мин

9.6K

Будущее здесьИскусственный интеллектМашинное обучение * Программирование * Python *

Туториал

Как ни крути, но языковая модель ChatGPT никогда не может полностью заменить программиста, так как только около 1/10 от общего времени процесса разработки занимает написание кода. Однако ChatGPT великолепно помогает в различных аспектах программирования. Чем больше навыков и опыта у программиста, тем больше пользы он может извлечь от "помощника".

Разберем практическое применение ChatGPT в написании кода на Python на примере использования нейросети для распознавания квадратов.

-4

NewTechAudit 15 мая 2023 в 09:08

Координатный квест: как найти координаты и расстояния без регистраций и смс

Средний

11 мин

13K

Python * Визуализация данных * Алгоритмы *

Кейс

Привет, Хабр!

С вами участник профессионального сообщества NTA Алексей Майка.

Хочу поделиться своим опытом решения одной интересной задачки и описать весь проделанный путь.

Был обычный денёк, сидел я на работе и занимался своими айтишными делами. Ко мне пришел руководитель и сказал: «Нужно рассчитать дистанцию до границы регионов для этих адресов». При этом без всяких платных сервисов и API онлайн карт, и своими усилиями. Айтишник понял, айтишник принял, айтишник получил свою заветную эксельку и пошёл работать.

Узнать результаты

einhorn 14 мая 2023 в 15:43

PromptGPT: оптимизируем промт для GPT-4

Средний

14 мин

16K

Python * Визуализация данных * Машинное обучение * Искусственный интеллектNatural Language Processing *

Туториал

Допустим, нам нужно решить задачу NLP, в которой мы принимаем и возвращаем текст (seq2seq). Существует великое множество таких задач, например: генерация текста/кода, перевод/стилизация, суммаризация, коррекция текста, распознавание именованных сущностей, даже классификацию текста можно свести к seq2seq.

Если нам нужно очень быстро написать высококачественное решение и у нас есть возможность платить за API, тогда нам подойдет использование GPT-4 API.

При решении seq2seq-задачи с использованием GPT-4 API нам нужно будет составить промт, который состоит из системного сообщения и набора примеров для модели (few-shot learning). Туториал по GPT-4 API можно найти в моей предыдущей статье.

Далее возникает задача измерения качества модели и оптимизации промта:

1. Непонятно, как изменение системного сообщения влияет на результат

2. Неясно, как подбирать примеры

3. Чем длиннее промт, тем дороже использование модели. Хочется найти минимальную длину промта, при которой качество нас устраивает

Вдобавок, можно использовать либо GPT-3.5, либо GPT-4 (если у вас есть к ней доступ). GPT-4 гораздо дороже. Хочется понять, даст ли GPT-4 достаточный буст к качеству, который оправдает ее цену.

Я написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный: https://github.com/einhornus/prompt_gpt. В этой статье я сначала расскажу, как он работает, а потом покажу процесс оптимизации промта на конкретном примере - на задаче коррекции грамматики из своей предыдущей статьи.

rasperepodvipodvert 14 мая 2023 в 07:15

Снепшот как бэкап для сайтов на VPS

Средний

3 мин

Python * DevOps * Восстановление данных *

Обзор

Recovery Mode

Сегодня я хотел бы рассказать вам о небольшой, но полезной утилите под названием «regru‑snapshoter».

Это инструмент, который позволяет создавать снимки виртуальных машин на платформе REG.RU.

-1

Santelley 13 мая 2023 в 07:43

Повышение точности решения плохо обусловленных СЛАУ методом Гаусса

Средний

4 мин

10K

Python * Алгоритмы * Математика *

Из песочницы

Большинство задач вычислительной математики в конечном итоге сводятся к решению систем линейных уравнений. На данный момент существует огромное количество алгоритмов для решения таких систем. Их разделяют на две большие группы: итерационные и прямые. Прямые методы позволяют получить точные значения неизвестных, если вычисления проводятся точно. Далее будем рассматривать метод Гаусса.

+11

AlexAleskin 12 мая 2023 в 15:15

Telegram Django Bot за пару строк

7 мин

40K

Python * Django *

Из песочницы

На Хабре много статей про разработку Телеграм ботов на Python, в том числе при помощи Django. Однако, большинство из них направлено на первичное ознакомление с API Телеграм.

В этой статье я хочу рассказать как можно упростить разработку ботов, сократив количество кода в разы, и не создавать велосипед.

Dmitry89 12 мая 2023 в 12:30

Python. Выражения в методах и индексаторах

Простой

8 мин

5.9K

Блог компании OTUSPython *

Туториал

Если вам когда-нибудь приходилось работать с NumPy, то вы скорее всего знаете, что в индексатор массива можно передать не только индексы начала, конца, и шага. Потрясающая возможность - получить срез массива по некоторому условию, в виде data[data > 0] предает массивам NumPy некоторое сходство с СУБД.

Тут же можно вспомнить про SqlAlchemy и возможность передать в функцию filter некоторое условие для отбора записей session.query(MyModel).filter(MyModel.field == 10).

Отличные, в общем-то возможности, не так ли? Не возникало ли у вас вопроса как они работают внутри? data > 0 и MyModel.field == 10 с точки зрения грамматики языка являются выражениями, и при передаче куда-либо Python попытается вычислить их значения. Попробуем разобраться как это работает.

+15

1 2 ...

205 206

207

208 209 ...

519 520