Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

nalgeon 4 апр 2023 в 09:03

PokiToki: Удобный GPT-бот в телеграме

4 мин

27K

Open source * Python * Искусственный интеллектМессенджеры * Программирование *

PokiToki

За последние месяцы только ленивый не сделал телеграм-бота, который работает с API OpenAI. Были такие статьи и на Хабре.

Написать игрушечного ChatGPT-бота можно хоть за час. А вот сделать его удобным в повседневной работе заметно сложнее. Я занимался этим последние несколько недель и хочу показать, что получилось.

Читать дальше →

+24

UprightMan 4 апр 2023 в 08:08

Быстрее, больше, сильнее: фреймворки Python с параллельной обработкой данных

12 мин

17K

Блог компании FirstVDSВысоконагруженные системы * Open source * Python * Программирование *

Хотите распределить тяжелую рабочую нагрузку в проектах на Python между несколькими процессорами или вычислительным кластером? В этой статье расскажем про лучшие фреймворки, которые помогут реализовать подобно желание на практике.

+13

pcdesign 3 апр 2023 в 12:05

Обучаем с помощью LlamaIndex и OpenAI GPT-3 отвечать по вашей базе знаний

Простой

7 мин

25K

Python * Искусственный интеллектFlask *

Туториал

Перевод

От переводчика.

У меня накопилось куча всяких там данных, документов, pdf, doc, видосов на ютюбе, которые я бы хотел проиндексировать, и чтобы можно было по этой базе знаний у нейронки что-нибудь спрашивать.

Так же статья может пригодиться, если вы хотите собрать базу знаний по какой-то компании и затем заставить нейронку отвечать на вопросы пользователей. Например, чтобы ИИ прочитала кучу скучной документации, регламентов работы и прочего.

Пока выбираю, на чем это лучше сделать. Вот наткнулся на нижеследующий вариант, который решил попробовать.

pas-zhukov 2 апр 2023 в 19:32

Titanic Survivors Data Research

Средний

17 мин

17K

Python * Машинное обучение *

Из песочницы

15 апреля 1912 года произошло крушение парохода «Титаник», став одной из самых значимых катастроф в истории человечества. В данной статье исследованы данные пассажиров Титаника, сделаны и проверены предположения о влиянии определённых факторов на вероятность человека выжить в той катастрофе. Анализ данных сопровождается примерами кода на Python, с использованием пакета Pandas. Построена и обучена модель нейронной сети, предсказывающая вероятность человека выжить в катастрофе с точностью 0.78 на тестовых данных. Модель построена на базе фреймворка pyTorch.

+10

CHELODOR3000 2 апр 2023 в 14:48

Определение внимания водителей за рулем — реализация прототипов

Средний

6 мин

3.6K

Искусственный интеллектМашинное обучение * Обработка изображений * Python *

Из песочницы

Задача контроля водителя очень актуальна в наше время. Должный контроль за состоянием водителей поможет сохранить здоровье автолюбителей, избежать многих дорожно-транспортных происшествий, тем самым снизив количество человеческих жертв.

В конце 2022 года нашей команде поступил запрос на решение данной задачи. Было необходимо предложить подходы, используя которые можно понять, насколько устал водитель, занят ли он какими-либо посторонними делами за рулем, куда он смотрит при выполнении маневров, открыты ли у него глаза (не спит ли он) и т.д.

После продолжительного изучения существующих исследований в данной области, было принято решение начать работу с разработки следующих прототипов.

+13

Dannyk1 2 апр 2023 в 06:12

Telegram бот, который улучшит любую IT компанию

2 мин

16K

Python *

Всем привет, в этой статье я хотел бы рассказать о создании бота для мониторинга систем (сайтов) и внутренних сервисов – их доступность/недоступность.

Кому данный бот будет полезен 100%?
Абсолютно всем!

Вы можете мониторить как одну систему, так и хоть 100, получать уведомления в Telegram и оперативно принимать меры по устранению проблем.

Вкратце опишу принцип работы бота. Есть список URL, первый поток бегает по ним и проверяет на доступность, если находит недоступный ресурс – помещает его в список не работающих ресурсов и оповещает нас о недоступности ресурса, временно удаляя неработающий ресурс из списка рабочих. В свою очередь список неработающих систем также мониторится и в случае обнаружения рабочего ресурса – нас оповещают об этом и ресурс, который был в списке неработающих покидает этот список.

Первое что мы делаем – это создаем бота в @BotFather. Придумываем имя и получаем токен. Итак, перейдем непосредственно к коду.

Импортируем нужные библиотеки, telebot (pyTelegramBotAPI) хорошая и лёгкая библиотека для создания бота на Python. Библиотека threading импортируется для запуска в несколько потоков.

-12

AlexBryl27 31 мар 2023 в 18:51

Учим английский с chatGPT

Простой

4 мин

62K

Python * Изучение языковNatural Language Processing *

Пожалуй, новости о языковых моделях и их использовании уже немного надоели, но лично я нашел для себя полезное применение - изучать английский, в том числе и разговорный. Посмотрим, что могут нам предложить в этом деле товарищи из openai: совместим gpt-3.5-turbo, whisper и telegram.

+17

nstrek 31 мар 2023 в 16:18

Пора забывать GridSearch — встречайте ProgressiveGridSearch. Фракталы в ML, постепенно увеличиваем разрешение

Средний

8 мин

8.3K

Open source * Python * Математика * Машинное обучение * Искусственный интеллект

Cезон machine learning

Здравствуйте, меня зовут Николай Стрекопытов и я придумал как подбирать гиперпараметры бескомпромиссно лучше GridSearch’а. Нужно лишь изменить порядок вычислений. И да, это заявка на обновление индустриального стандарта - скоро вы сможете улучшить свои ML-пайплайны заменой нескольких строчек кода.

+32

vova_sam 31 мар 2023 в 13:24

Часть 2. Перевод нейронной сети на базе Keras LSTM на работу с матричными операциями

Средний

6 мин

7.6K

Python * Математика * Машинное обучение * TensorFlow *

Туториал

В первой части части я перевел обученную модель полносвязной сети на базе Keras на работу с матричными вычислениями. Модель разработана для новостного агрегатора с целью фильтрации нежелательных новостей.

Но если посмотреть статью-руководство от tensorflow, можно увидеть, что одной из рекомендаций по классификации теста является использование сетей долгой краткосрочной памяти (LSTM).

Забегая вперед скажу, что мне не совсем подошла данная сеть, но это, вероятно, особенность моего датасета. Полносвязная сеть с эмбеддином обладает хорошим качеством, предсказуемостью и стабильностью результатов (объяснимое переобучение, влияние архитектуры сети на качество и т.д.). Ну и немаловажно - быстро обучается, в отличие от LSTM.

Но ради "академического" интереса обучим сеть c LSTM для бинароной классификации текста и переведем её также на работу только с матрицами. Это также наглядно покажет, как устроены ячейки LSTM.

Sber 31 мар 2023 в 12:37

Замеряй и ускоряй: как мы сократили время вызова метода в Java-коде в 16 раз

Простой

5 мин

8.3K

Блог компании СберJava * Python * Тестирование IT-систем * Высоконагруженные системы *

Ретроспектива

Привет, Хабр! Замер производительности кода — не самое простое упражнение для разработчика. Приходится решать кучу сложностей: разбираться с методом, создавать правильные условия. И всё равно можно получить результат с погрешностью, потому что любой метод «не бесплатный» и требует ресурсов процессора.

Меня зовут Александр Певненко, я Java-разработчик в СберТехе. Вместе с командой мы развиваем Platform V DataSpace. Это облачный сервис, который упрощает и ускоряет разработку приложений, используя концепцию Backend-as-a-Service (BaaS) для хранения и управления данными. Я расскажу про наш способ замера производительности кода с помощью бенчмарков. Рассматривать метод будем на примере оптимизации кода в Platform V Dataspace, которая помогла сократить время вызова метода в 16 раз.

В статье я буду пользоваться языком Java, Python для построения графиков и набором библиотек JMH — они также адаптированы для Kotlin, Scala и т.д.

-1

xenon 31 мар 2023 в 12:22

NudeCrawler: Голый ползун по женщинам на телеграфе

Простой

10 мин

103K

Open source * Python * Социальные сети

Обзор

Nudecrawler - паук для поиска голых женщин.

+161

135

gogalaim 31 мар 2023 в 10:43

Текстовые строки в языках программирования

Средний

6 мин

10K

C++ * Программирование * Python * Ненормальное программирование *

Мнение

Из песочницы

Уже давно прошли те времена, когда текстовые строки в языках программирования были исключительно байтовыми без поддержки символов национальных алфавитов, а в некоторых случаях еще и ограничены размером не более 255 символов. В настоящее время наоборот, сложно найти такой язык программирования, который НЕ "поддерживает" юникод в текстовых строках.

Если вы обратили внимание, то слово "поддерживает" взято в кавычки и как говорил Винипух, это жжж не спроста, ведь с появлением Unicode понятие "символ" в текстовых строках стало не совсем однозначным.

Есть старая статья о проблемах поддержки Unicode в разных языках программирования: The importance of language-level abstract Unicode strings Matt Giuca

Основной смысл которой сводится к тому, чтобы призвать разработчиков языков программирования абстрагироваться от схем кодирования Unicode (доступом к отдельным байтам), и оставить для программистов только возможность работы с последовательностью символов, чтобы предотвратить большинство ошибок Unicode, так как с приходом эры Unicode изменилось само понятие символа и текстовой строки!

+15

honyaki 30 мар 2023 в 19:40

msgspec: быстрый и экономичный парсинг JSON на Python

Простой

4 мин

27K

Блог компании SkillfactoryPython * Высоконагруженные системы * Программирование *

Кейс

Перевод

В библиотеке msgspec много функций, например кодирование, поддержка MessagePack (альтернативный формат, который быстрее JSON) и другие. Если вы регулярно парсите файлы JSON, и у вас проблемы с производительностью или памятью, или просто нужны встроенные схемы, то попробуйте msgspec.

Ниже рассказываем о библиотеке подробнее. Итак, чтобы обработать большой файл JSON на Python без сбоев и аварийного завершения, нужно:

Убедиться, что используется не слишком много памяти.
Спарсить файл как можно быстрее.
В идеале также заранее убедиться, что данные валидны и имеют правильную структуру.

Конечно, можно объединить решения с несколькими библиотеками. А можно — всего с одной. Схемы, быстрый парсинг и хитрые приемы для уменьшения потребления памяти — все это новая библиотека msgspec.

Читать дальше →

mixon271 30 мар 2023 в 14:33

Консистентность в конкуретной среде: как не захлебнуться в потоках данных

Простой

21 мин

8.7K

Блог компании Точка БанкPython * Микросервисы *

Туториал

В прошлой статье я рассказал о конкурентной среде в Точке и типовых проблемах, с которыми сталкиваются разработчики. В этот раз речь пойдёт о том, как же можно эту консистентность реализовать и какие злые силы нам могут помешать это сделать. Решил больше не делить статьи на части, поэтому продолжение вот в этой большой статье, всё в одном месте.

Напомню, что текст рассчитан в первую очередь на разработчиков, которые имеют мало практического опыта работы в конкурентной и/или микросервисной среде, поэтому многие вещи я объясню на пальцах. Для тех, кто захочет ознакомиться с более строгими формулировками, сразу скажу, что здесь будут затронуты упрощённые идеи паттернов Transactional Outbox и Saga.

+18

badcasedaily1 30 мар 2023 в 14:23

Ультимативный Roadmap для Python-разработчика в 2023 году + источники знаний

Простой

4 мин

305K

Python * Учебный процесс в IT

Роадмэп

Python — один из самых популярных языков программирования в мире. Статистика современного рынка свидетельствует о том, что Python желаемый навык, и что его использование широко распространено в различных сферах, таких как наука, инженерия, бизнес, аналитика данных и многих других.

В этой статье я составил полную дорожную карту для изучения Python, прилагая полезные источники знаний.

ivankondrakov 30 мар 2023 в 14:22

ML-пайплайн классических банковских моделей классификации

10 мин

Блог компании ВТБPython * Машинное обучение * Искусственный интеллектФинансы в IT

Туториал

Всем привет! С вами на связи дата-сайентисты банка "Открытие" Иван Кондраков и Константин Грушин. В прошлой статье мы рассказывали про решение, которое позволило повысить эффективность в проверке гипотез для моделей. Если вы успели с ней ознакомиться, то уже знаете, что наша команда занимается разработкой и развитием пула моделей принятия решений о выдаче кредитных продуктов и банковских гарантий для малого и среднего бизнеса. Сегодня настало время поговорить с вами про пайплайн, который используется для разработки таких моделей. Мы построили достаточно много моделей, так что нам точно есть чем поделиться. К тому же существенный вклад в развитие такого универсального алгоритма внес каждый член команды.

peleccom 29 мар 2023 в 16:59

Как подружить Алису с ChatGPT

Средний

6 мин

83K

Python *

Из песочницы

О ChatGPT сейчас не говорит только ленивый. Давайте попробуем соединить голосовой помощник Алиса и ChatGPT. Таким образом мы сможем взаимодействовать с ChatGPT с помощью голоса. А он с помощью голоса может нам отвечать. Конечно тут будут ограничения о которых я подробно опишу далее. Данная статья не столько о ChatGPT а о том как писать навыки для Алисы.

+34

craxti 29 мар 2023 в 14:28

Как создать свою собственную нейронную сеть с нуля на Python

Средний

5 мин

142K

Ненормальное программирование * Python *

Туториал

Recovery Mode

Перевод

Как создать свою собственную нейронную сеть с нуля на Python

Мотивация: в рамках моего личного пути к лучшему пониманию глубокого обучения я решил создать нейронную сеть с нуля без библиотеки глубокого обучения, такой как TensorFlow. Я считаю, что понимание внутренней работы нейронной сети важно для любого начинающего специалиста по данным. Эта статья содержит то, что я узнал, и, надеюсь, она будет полезна и вам!

Что такое нейронная сеть?

В большинстве вводных текстов по нейронным сетям при их описании используются аналогии с мозгом. Не углубляясь в аналогии с мозгом, я считаю, что проще описать нейронные сети как математическую функцию, которая отображает заданный вход в желаемый результат.

Нейронные сети состоят из следующих компонентов:

+19

badcasedaily1 29 мар 2023 в 07:24

Пишем простого бота-администратора для Telegram на Python. Тестируем на жене

Простой

8 мин

93K

Python * Проектирование API *

FAQ

Создание своего собственного телеграм-бота является одним из увлекательных и полезных способов практического применения программирования. Я решил создать своего бота как вариант добавления нового увлекательного проекта в свой портфолио, а также для создания комфорта и удобства для пользователей, которые используют телеграм в своей повседневной жизни.

После анализа нескольких библиотек для создания телеграм-ботов, я выбрал библиотеку Telebot, которая предоставляет богатый набор инструментов для разработки функционально-насыщенных ботов.

Мой бот будет иметь функционал защиты от спама, возможность кикать пользователей с помощью команд, мутить, а также получение статистики. В этой статье подробно рассмотрим функционал моего бота и как я использовал библиотеку Telebot для его создания.

Тестировать бота мы будем с помощью моей жены.

+12

honyaki 28 мар 2023 в 20:19

Фракталы, рекурсия и Python

Простой

7 мин

14K

Блог компании SkillfactoryPython * Математика * Программирование *

Перевод

Фракталы — это бесконечные сложные узоры, которые самоподобны в разных масштабах. Например, ствол дерева расщепляется на ветки. Те распадаются на еще более мелкие ветви и так далее. Программная генерация фракталов превратит простые формы в сложные узоры. Я покажу, как построить впечатляющие фракталы при помощи Python простой геометрии и знания программирования.

Читать дальше →

1 2 ...

179 180

181

182 183 ...

486 487

Python *

PokiToki: Удобный GPT-бот в телеграме

Быстрее, больше, сильнее: фреймворки Python с параллельной обработкой данных

Обучаем с помощью LlamaIndex и OpenAI GPT-3 отвечать по вашей базе знаний

Titanic Survivors Data Research

Определение внимания водителей за рулем — реализация прототипов

Telegram бот, который улучшит любую IT компанию

Учим английский с chatGPT

Пора забывать GridSearch — встречайте ProgressiveGridSearch. Фракталы в ML, постепенно увеличиваем разрешение

Часть 2. Перевод нейронной сети на базе Keras LSTM на работу с матричными операциями

Замеряй и ускоряй: как мы сократили время вызова метода в Java-коде в 16 раз

NudeCrawler: Голый ползун по женщинам на телеграфе

Текстовые строки в языках программирования

msgspec: быстрый и экономичный парсинг JSON на Python

Ближайшие события

Консистентность в конкуретной среде: как не захлебнуться в потоках данных

Ультимативный Roadmap для Python-разработчика в 2023 году + источники знаний

ML-пайплайн классических банковских моделей классификации

Как подружить Алису с ChatGPT

Как создать свою собственную нейронную сеть с нуля на Python

Пишем простого бота-администратора для Telegram на Python. Тестируем на жене

Фракталы, рекурсия и Python

Вклад авторов