Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

pestich 20 окт 2023 в 11:41

Классификация текстов в spaCy: пошаговая инструкция

Простой

5 мин

9.1K

Python * Машинное обучение *

Из песочницы

Вы узнаете, как реализовать классификатор текстов при помощи библиотеки spaCy, а также несколько полезных лайфхаков, которые помогут ускорить обработку данных.

flaton 20 окт 2023 в 08:40

Как создать черный список для токенов JWT в Django

Средний

9 мин

5.1K

Python * Django *

Из песочницы

Привет! Недавно нам в одном из проектов было необходимо обеспечить пользователю смену пароля, чтобы при этом происходил выход со всех остальных устройств. Т.к. аутентификация была сделана на JWT токенах, то проблемой стало то, что невозможно вручную истечь токен после создания, он не имеет состояния и храниться на стороне клиента. В этой статье мы разберем генерацию JWT токена с возможностью занесения его в черный список на примере пустого проекта, а также протестируем, полученный результат с помощью Postman.

-3

vladimir_lov 20 окт 2023 в 08:23

API от А до Я (теория и практика)

Простой

11 мин

169K

Проектирование API * Python *

Туториал

Я работаю с совершенно разными проектами и встречаюсь с разными технологиями: графы, пространственные данные, риалтайм обработка, ML и NER сервисы и т.п., но есть классические основы, которые должен знать каждый в ИТ от аналитиков до руководителей, так называемый фундамент без которого построить хорошую карьеру специалиста сложно. Так как я долго занимал различные аналитические должности, то прошу не обижаться, так как буду часто говорить о том для чего это аналитику.

AnatolyBelov 20 окт 2023 в 07:56

Распознавание речи (транскрибация) по аудиозаписям диалогов. Whisper. Личный опыт

5 мин

37K

Python * Искусственный интеллектNatural Language Processing * Голосовые интерфейсы *

Распознаем речь по аудиозаписям диалогов сотрудников и клиентов.
Сохраняем по разным дорожкам, в тексте и с таймингом.
Модель Whisper, работаем в Colab.
Личный опыт.

denis_afanasyev 19 окт 2023 в 14:25

Решение школьных задач по химии в Python

Простой

5 мин

16K

Python * Химия

Туториал

^{Изображение от rawpixel.com}^{на Freepik}

Я попробовал решить несколько простых школьных задач по химии в Python с помощью библиотек mendeleev, chemlib и chempy, в том числе несколько заданий из ОГЭ и ЕГЭ.

к задачам

+15

Lithium_vn 19 окт 2023 в 09:00

Как Guidance выводит ИИ на новый уровень: инструмент для эффективного управления моделями

Средний

5 мин

3.8K

Блог компании BotHubВеб-разработка * Python * Программирование * Машинное обучение *

Обзор

В последнее время наблюдается стремительный прогресс в сфере обработки естественного языка. Появление мощных языковых моделей вроде GPT и Bard действительно открыло новые возможности для создания интеллектуальных приложений. Однако вместе с тем мы столкнулись с необходимостью более совершенных инструментов для эффективной интеграции и управления такими моделями.

И вот недавно компания Microsoft представила Guidance - язык управления, предназначенный для контроля над большими языковыми моделями. По нашему мнению, этот инструмент может существенно изменить процесс разработки приложений на основе возможностей AI.

В данной статье мы хотели бы поближе познакомиться с его особенностями и разобраться, что же это за "зверь". Надеемся, эта информация будет полезна для разработчиков, исследователей и организаций, которые активно работают над совершенствованием контроля поведения LLM.

Приглашаем к прочтению!

Stormwalker 18 окт 2023 в 12:54

Упрощаем подключение линтеров в пайплайны Gitlab CI

Простой

4 мин

12K

Блог компании Точка БанкPython * Программирование *

Туториал

Всем привет! Меня зовут Юра, я Python-разработчик в Точке. В статье я покажу, как написать шаблон с линтером для Gitlab CI, чтобы при старте нового проекта (или уже запущенного) было легко добавить линтер в пайплайны.

А ну-ка

badcasedaily1 18 окт 2023 в 12:01

Разработка высокопроизводительного кеш-слоя на основе Redis в телеграм-боте

Средний

14 мин

11K

Блог компании OTUSСерверная оптимизация * Программирование * Python * Мессенджеры *

Обзор

Мгновенность процессов стала золотым стандартом. Пользователи требуют мгновенных результатов, и телеграм-боты не являются исключением. Без кеширования данных, боты могут столкнуться с серьезными задержками при обработке запросов. Кеш-слои в теботах - это ключевой инструмент, который позволяет значительно ускорить обработку запросов, сохраняя часто запрашиваемые данные в памяти для быстрого доступа.

Кеширование становится особенно важным, когда бот имеет множество пользователей и обрабатывает запросы, требующие доступ к внешним ресурсам, таким как базы данных или внешние API.

Redis - это молниеносная, высокопроизводительная система управления данными в памяти, которая идеально подходит для кеширования в телеграм-ботах. Эта in-memory база данных спроектирована с учетом скорости и эффективности, позволяя разработчикам хранить и получать данные практически мгновенно. С Redis, вы можете сохранять разнообразные данные, такие как текстовые ответы, изображения, аудиофайлы, и даже более сложные структуры данных, все это с невероятной скоростью доступа.

Redis также предоставляет богатый набор функций, включая поддержку транзакций, публикации/подписки, управление исключениями и автоматическое удаление данных, что делает его превосходным выбором для создания надежного и масштабируемого кеш-слоя.

YarIkGU 18 окт 2023 в 05:53

NumPy: шпаргалка для начинающих

Простой

11 мин

119K

Python *

What's up guys!

В этой статье мы поговорим про NumPy. Это статья-шпаргалка для начинающих пользователей NumPy, надеюсь она будет вам полезна.

+14

pzrnqt1vrss 17 окт 2023 в 13:00

Простой ORM для sqlite3

Средний

12 мин

19K

Блог компании RUVDS.comPython * Базы данных * ООП *

Туториал

ORM, или объектно-реляционное отображение — это программная технология, которая позволяет взаимодействовать с базами данных с использованием объектно-ориентированной парадигмы. Вместо того чтобы писать SQL-запросы напрямую для работы с данными в базе данных, можно использовать ORM, чтобы взаимодействовать с данными, как если бы они были объектами в вашем коде.

Не бывало ли вам интересно, как работает изнутри такая идейно простая концепция? Благодаря чему достигается удобство работы? Сегодня мы напишем ORM самостоятельно и узнаем, какие инструменты python нам для этого понадобятся.

Читать дальше →

+48

PPR 17 окт 2023 в 07:47

Алгоритм поиска ключевых словосочетаний «на пальцах». Анализируем новости

Средний

5 мин

9.1K

Блог компании Программный ПродуктNatural Language Processing * Семантические сети * Python * Алгоритмы *

Туториал

В современном мире объем данных в интернете постоянно растет с огромной скоростью. Возникает логичный вопрос: как ориентироваться в этом информационном потоке?

Чтобы упростить себе задачу поиска и обобщения информации IT-энтузиасты применяют технологии генеративно обученных чат-ботов. Наиболее широкое распространение получил ChatGPT. Яндекс, в свою очередь, добавил в браузер YandexGPT, который позволяет тезисно ознакомиться с содержанием страницы. Всё чаще вакансия Prompt-инженера начинает встречаться на hh и Хабр Карьере. Специалисты и чат-боты помогают конечному пользователю экономить время для поиска необходимой информации.

Но что делать, если возможности обратиться за помощью к подобным технологиям нет? Указанные выше языковые модели нельзя интегрировать в собственные проекты, сценариев их использования много, но они всё равно ограничены.

В статье мы расскажем, как (не без нейронных сетей) можно создать простой алгоритм на Python, который поможет извлекать ключевые слова из любого текста, тем самым избавляться от ненужной информации и автоматизировать процесс анализа материалов. Мы будем работать с русским текстом, а именно — с новостными постами. Поэтому в частном случае используются пакеты для обработки, поддерживающие именно русский язык. В том числе используются модели, обученные на корпусах текстов с новостной семантикой.

michaelnv 16 окт 2023 в 17:38

Молниеносный инкрементальный линтинг Python-кода

Средний

11 мин

19K

Python *

Туториал

Линтинг кода бывает очень долгим, а в ситуациях наличия большого legacy‑проекта, который решили «причесать», линтинг может причинять боль и страдания разработчикам. В этой статье мы найдем решение, которое позволит без проблем линтить код с любого этапа разработки и делать это супер быстро и инкрементально!

vldmrmlkv 16 окт 2023 в 13:54

Примитивы синхронизации в Python Asyncio: Исчерпывающее руководство

Сложный

14 мин

31K

Python * Программирование *

Туториал

Перевод

При написании многопоточного приложения нужно помнить о возможности состояния гонки при использовании неатомарных операций. Даже простая задача по увеличению целого числа на единицу в конкурентной программе может вызвать ошибки, с трудом поддающиеся воспроизведению. Но при использовании asyncio мы всегда работаем в одном потоке, а значит можно не беспокоиться о гонках, правда? На самом деле не всё так просто...

Что было дальше?

+15

badcasedaily1 16 окт 2023 в 11:45

Архитектурный паттерн для обработки больших данных: Lambda

Сложный

13 мин

16K

Блог компании OTUSPython * Программирование * Анализ и проектирование систем * Проектирование и рефакторинг *

Обзор

Привет, Хабр!

Мы сталкиваемся с огромными объемами информации, высокой нагрузкой, и постоянно меняющимися требованиями. Все это требует от нас не только навыков программирования, но и грамотного проектирования архитектуры, которая способна справиться с этими вызовами.

Именно здесь на сцену выходит архитектурный паттерн, о котором мы сегодня поговорим - Lambda-архитектуре. Если вы уже имеете опыт в области обработки больших данных, то, возможно, слышали о ней. Lambda-архитектура - это эффективный способ структурирования и организации процессов сбора, обработки и анализа данных, обеспечивая надежность, масштабируемость и гарантированную консистентность.

badcasedaily1 16 окт 2023 в 09:38

Сквозное наблюдение (observability) в микросервисах

Простой

11 мин

8.8K

Блог компании OTUSPython * Программирование * Анализ и проектирование систем * Микросервисы *

Обзор

Привет, Хабр!

Сегодня мы поговорим о чем-то, что является неотъемлемой частью современной микросервисной архитектуры, что-то, без чего трудно представить себе успешное и надежное приложение в мире распределенных систем. Да, вы правильно догадались, мы говорим о сквозном наблюдении, или, как его еще называют, "observability."

Если вы читаете эту статью, то, вероятно, уже являетесь опытным разработчиком и хорошо знакомы с микросервисами. Вы, возможно, создали и поддерживаете множество микросервисов, и, скорее всего, столкнулись с ситуацией, когда отладка и мониторинг становятся настоящей головной болью.

Именно здесь на сцену выходит сквозное наблюдение. Это не просто новомодное словечко или набор инструментов, это фундаментальный компонент, который позволяет нам видеть и понимать, что происходит в наших микросервисах в реальном времени. С его помощью мы можем следить за запросами, анализировать производительность, идентифицировать проблемы и, конечно же, обеспечивать бесперебойную работу наших приложений.

Разберемся подробнее с первым из ключевых компонентов сквозного наблюдения - трассировкой.

+10

andrej_ilin7 16 окт 2023 в 09:12

Улучшаем модель RandomForestClassifier

Простой

5 мин

5.8K

Python *

Обзор

Из песочницы

Перевод

Статья взята из источника Daily Dose of Data Science.

Оговорюсь сразу: Я новичок в Data Scince и в оформлении статей. Пишу лишь сюда для своих заметок ну и может быть будет кому-то полезно. Прошу сильно не судить!)

Случайный лес - это довольно мощная и надежная модель, представляющая собой комбинацию множества различных деревьев принятия решений.

mr-pickles 16 окт 2023 в 09:10

От теории к практике: создаём веб-приложение для решения задачи коммивояжёра

Средний

14 мин

8.4K

Блог компании Wunder FundЗанимательные задачкиPython * Программирование *

Перевод

В таких сферах, как исследование операций (Operations Research) и наука о данных (Data Science) чрезвычайно актуально сближение теории и её практического применения в виде программных проектов. Теоретические выкладки формируют базу программ для оптимизации чего‑либо, так как теория даёт средства для решения разнообразных задач. Но очень важно помнить и о том, что подобные программы должны быть доступны конечному пользователю, что с ними должно быть удобно работать.

Задача коммивояжёра (Traveling Salesman Problem, TSP) — это, без сомнения, та самая задача комбинаторной оптимизации, которая изучена лучше всего (Rego, C., Gamboa, D., Glover, F., & Osterman, C., 2011. Traveling salesman problem heuristics: Leading methods, implementations and latest advances. European Journal of Operational Research, 211(3), 427–441). Её легко описать (по крайней мере — на словах), её можно использовать для того чтобы продемонстрировать некоторые из возможных компонентов API современной программы по построению маршрутов. В результате я просто не мог подобрать ничего лучше этой задачи в качестве основы для примера, который разобран в этой статье.

Здесь вы узнаете о том, как использовать Python‑библиотеку Streamlit для создания веб‑приложения, которое позволяет решать задачу коммивояжёра с использованием входных данных, предоставленных пользователем. Так как нас интересует создание приложения, пригодного для решения реальных задач, мы, анализируя пути перемещения между некими географическими точками, будем интересоваться не только евклидовым расстоянием между ними, но и другими характеристиками путей. В частности, наша программа, используя координаты точек, должна уметь получать данные о том, какое расстояние по автомобильным дорогам нужно преодолеть для перемещения между ними. Эти данные должны учитываться при выполнении оптимизации. Для этого мы воспользуемся API OpenStreetMap.

Если вы хотите лучше разобраться в теоретических аспектах числовой оптимизации — вам, возможно, интересно будет почитать мои статьи о линейном программировании и о задаче маршрутизации транспорта (это — обобщение задачи коммивояжёра).

Готовы поработать? Взгляните на то, что у нас должно в итоге получиться…

+17

vldmrmlkv 16 окт 2023 в 07:16

Паттерн производитель-потребитель и очередь с приоритетом asyncio.PriorityQueue в Python

Средний

8 мин

9.8K

Python * Программирование *

Туториал

Перевод

В предыдущей статье вы могли узнать что такое очередь в целом и как работает FIFO-очередь asyncio.Queue. Давайте продолжим и посмотрим на примере библиотеки aiohttp как работают очереди с приоритетом asyncio.PriorityQueue.

fish224 15 окт 2023 в 12:40

Делаем играющего онлайн шахматного бота при помощи Lichess API

2 мин

13K

Проектирование API * Python *

Туториал

Возможно, некоторые или даже многие из читателей писали шахматного бота, который мог играть с пользователем. Сегодня я расскажу вам, как сделать так, чтобы наш бот был доступен на известном шахматном веб-сайте lichess.org.

Читать дальше →

illusive_man_2000 14 окт 2023 в 13:14

Kornia — библиотека компьютерного зрения

Средний

15 мин

16K

Искусственный интеллектМашинное обучение * Визуализация данных * Обработка изображений * Python *

Обзор

Лучший Техноавтор 2023

Kornia это open source библиотека для решения задач компьютерного зрения. Она использует PyTorch в качестве основного бэкенда и состоит из набора дифференцируемых процедур и модулей. Создатели библиотеки вдохновлялись OpenCV, и поэтому Kornia является его аналогом, но при этом в некоторых моментах превосходит. Главным преимуществом Kornia по сравнению с тем же OpenCV, scikit-image или с Albumentations является возможность обрабатывать изображения батчами, а не по одному изображению и возможность обрабатывать данные на GPU.

+26

1 2 ...

151 152

153

154 155 ...

487 488

Python *

Классификация текстов в spaCy: пошаговая инструкция

Как создать черный список для токенов JWT в Django

API от А до Я (теория и практика)

Распознавание речи (транскрибация) по аудиозаписям диалогов. Whisper. Личный опыт

Решение школьных задач по химии в Python

Как Guidance выводит ИИ на новый уровень: инструмент для эффективного управления моделями

Упрощаем подключение линтеров в пайплайны Gitlab CI

Разработка высокопроизводительного кеш-слоя на основе Redis в телеграм-боте

NumPy: шпаргалка для начинающих

Простой ORM для sqlite3

Алгоритм поиска ключевых словосочетаний «на пальцах». Анализируем новости

Молниеносный инкрементальный линтинг Python-кода

Примитивы синхронизации в Python Asyncio: Исчерпывающее руководство

Ближайшие события

Архитектурный паттерн для обработки больших данных: Lambda

Сквозное наблюдение (observability) в микросервисах

Улучшаем модель RandomForestClassifier

От теории к практике: создаём веб-приложение для решения задачи коммивояжёра

Паттерн производитель-потребитель и очередь с приоритетом asyncio.PriorityQueue в Python

Делаем играющего онлайн шахматного бота при помощи Lichess API

Kornia — библиотека компьютерного зрения

Вклад авторов