Обновить
915.17

Python *

Высокоуровневый язык программирования

Сначала показывать
Порог рейтинга
Уровень сложности

Fine-tune Qwen3 за написание позитивных отзывов о ресторанах

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели3.3K

Генератор отзывов о ресторане:

Собрано почти 16 000 положительных отзывов от ресторанов с оценкой выше 4,7 (из 5), расположенных в Москве с https://yandex.ru/maps. Использованная модель — Qwen3-4B Qwen3 как поддерживающий русский язык. Для обучения модели в течение двух эпох использовалась библиотека Unsloth с LoRA. В результате был выбран LoRA 32-го ранга и обучено 66 млн параметров. Теперь модель может дать хороший новый обзор:

Целью было понять, как можно начать проект с нуля.

Читать далее

Новости

Предвидеть, чтобы предотвратить: как анализ трендов помогает избегать аварий

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели4.4K

Как с помощью математической статистики мы ищем тренды в промышленных данных, предотвращая инциденты и аварии.

Читать далее

Почему Python — не лучший язык для data science. Часть 2 — Python против R

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели4.1K

Команда Python for Devs подготовила перевод статьи о том, почему Python — несмотря на свою популярность — не всегда идеален для Data Science. Автор показывает, как отсутствие нестандартной оценки выражений усложняет анализ данных, и сравнивает Python с R, где такие задачи решаются куда элегантнее.

Читать далее

Не читал, но одобряю: пишем софт для быстрого анализа пользовательских соглашений

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели4.7K

Недавно посмотрел видео про скандал вокруг известного сервиса по торговле ключами для игр Kupikod. Для тех кто не в курсе: ребята из данной конторы решили подзаработать деньжат довольно интересным способом - объявили у себя на сайте нулевые комиссии за пополнение кошелька, но почему-то после пополнения у клиентов дополнительно списывалось 300 рублей. Оказывается, пополняя кошелей, пользователь дополнительно оформлял помесячную подписку стоимостью 300 рублей, которая как раз и обеспечивала эти нулевые комиссии. И разумеется, если эту подписку не отменить, то с тебя так каждый месяц и будет списываться по 300 рублей. Информации об этом на сайте просто не было, она была указана в публичной оферте, том самом документе, который никто никогда не читает. Собственно вот этот пункт:

Читать далее

Неопределённость как часть модели

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5K

Привет, Хабр!

Сегодня рассмотрим тему неопределённости в моделях. Классические ML-модели детерминированы: на вход получили – на выход выдали одно число или метку. Но жизнь полна неопределённости, и игнорировать её плохая идея. Представьте, у вас мало данных, модель предсказывает конверсию 15%. Но насколько она уверена? Может, разброс от 5% до 30%. Обычная модель этого не скажет, а вот вероятностная модель скажет.

В этой статье в коротком формате разберём, как с помощью байесовского подхода и фреймворка Pyro моделировать такую неопределённость на примере A/B-теста конверсии и заставить модель честно признавать свою неуверенность.

Читать далее

Мой легковесный помощник: как я создал монитор системы, который не тормозит

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели9.6K

Привет, Хабр! Хочу поделиться историей создания Aether Monitor+ — простого и легкого монитора системы, который стал моим верным спутником в работе.

Читать далее

marimo — реактивный аналог Jupyter Notebook

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели9.4K

Рассматривается фреймворк marimo, названной в честь аквариумной водоросли, изображенной на заставке к статье. marimo позволяет работать с блокнотами — текстовыми файлами Python, ячейки блокнотов представляют собой декорированные функции Python. Переменные в ячейках реактивные, изменение значения переменной в ячейке приводит пересчету всех ячеек, где есть ссылки на данную переменную. Это позволяет представить вычисление ячеек блокнота в виде направленного ациклического графа, решает проблему скрытых состояний и воспроизводимости вычислений, имеющуюся в блокнотах Jupyter.

Наряду с ячейками Markdown и Python в marimo предусмотрены ячейки SQL, можно делать запросы не только к реляционным базам данных, но и фреймам данных pandas, polars, имеются удобные виджеты для работы с данными. По сравнению с Jupyter расширены возможности Markdown, в тексте могут отображаться значения переменных из других ячеек, виджеты пользовательского интерфейса, подсвеченный исходный текст, различные диаграммы.

В marimo встроен мощный редактор, позволяющий, редактировать и выполнять исходный текст Python, осуществлять интерактивную визуализацию с помощью библиотек altair, matplotlib и plotly, разрабатывать приложения с графическим пользовательским интерфейсом, легко переключаться между режимами редактирования, выполнения приложения, показа презентации.

Приложения marimo интегрируются в веб-приложения Flask, FastAPIи FastHTML.

Читать далее

Работаем с NLP на Python

Время на прочтение8 мин
Охват и читатели8.2K

На тему Natural Processing Language написано множество статей, однако во многих из них рассказывается о том, как уже используется NLP в различных отраслях. Однако, что делать тем, кто только хочет начать использовать естественный язык для своих задач? В этой статье мы изучим основы обработки естественного языка на Python, используя подход «сначала код», используя Natural Language Toolkit (NLTK).

Читать далее

Токенизация, как ключ к языковым моделям для низкоресурсных языков

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели6.2K

Привет Хабр, меня зовут Эдуард, и я хочу поделиться своими наблюдениями о том, как статистические алгоритмы извлекают грамматику из текстов.

Читать далее

Logos AI Assistant — полноценный ИИ-агент для вашего десктопа

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.5K

Logos AI Assistant — это не просто инструмент для автоматизации, это ваш творческий и исполнительный партнёр для решения широкого круга задач прямо на рабочем
столе. Он обладает всеми возможностями продвинутых ИИ-ассистентов, таких как Gemini CLI: может писать код, создавать и редактировать тексты, работать с файлами и
выполнять сложные команды в терминале.

Но Logos идёт гораздо дальше. Его ключевое преимущество — это выход за пределы командной строки. Благодаря движку компьютерного зрения OmniParser, ассистент
получает «глаза», а через управление мышью и клавиатурой — «руки». Это фундаментально расширяет перечень решаемых задач. Теперь LLM не ограничена файловой системой и терминалом; она может работать внутри любого графического приложения на вашем компьютере.

Читать далее

Контроль качества переводов на основе ИИ

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели6.5K

А вы задумываетесь иногда, что вот хочется что-то сделать такое, чтобы как-то выбиться из общей массы разработчиков? Сейчас придумаю идею, реализую, стану зарабатывать много денег? Все же так думают? Или только я один.

Да вот поэтому я и делаю постоянно какие-то проекты. И да, все они простые и не выдающиеся, но, наверное, главное — не унывать. Утешаю я себя так.

Читать далее

Книга «Python для инженерных задач»

Время на прочтение5 мин
Охват и читатели13K

Приветствуем, коллеги.

Расскажем вам о нашей долгожданной новинке – «Python для инженерных задач». Эту книгу написал уважаемый Евгений Ильин @jenyay, кандидат технических наук, преподаватель Московского Авиационного Института. В основу книги легли его университетские наработки, объём более чем внушительный – 672 страницы. Тем не менее, поскольку эта книга ориентирована на самую широкую аудиторию инженеров, мы решили выпустить её в серии «Самоучитель», из которой вам также может быть известен знаменитый «Компас-3D  V 23» Анатолия Герасимова.

Читать далее

Книга: «Весь Python. Самое актуальное и исчерпывающее руководство»

Время на прочтение3 мин
Охват и читатели11K

Привет, Хаброжители!

Всеобъемлющее современное руководство по программированию на Python, охватывающее фундаментальные идеи и практические приемы! Вы научитесь писать собственные программы и получите четкое представление о том, куда двигаться дальше и как использовать полученные знания. Изучение Python подкреплено практикой — огромным количеством примеров приложений.

К концу книги вы будете готовы применить полученные знания и создать несколько реальных проектов. Вы научитесь эффективно использовать Python в анализе данных, веб-разработке и автоматизации задач. Книга включает описание новейших возможностей, появившихся в версиях Python 3.9–3.12, в том числе главы об аннотациях типов и консольных приложениях, а также примеры, демонстрирующие современные практики веб-разработки на Python.

Читать далее

Ближайшие события

Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели4.6K

Всем привет! На связи Ваня Ващенко, и я лид по развитию нейросетевых моделей в команде персональных рекомендаций Wildberries. Раньше я развивал B2C-рекомендации и нейросети кредитного скоринга в крупнейшем банке, а теперь вы видите результаты моей работы каждый раз, когда заходите на главную страницу любимого маркетплейса. Сегодняшний рассказ — о том, как мы развиваем WildBERT.

Читать далее

Сердце не сыто. Python помогает раскрыть особенности мастерства поэта Вознесенского

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5.9K

Можно ли было читать советские стихи американцам? Пытаюсь выяснить это с помощью Python на примере Андрея Вознесенского.

Читать далее

Мониторинг SSSD через D-Bus: создаем собственный Ansible-модуль вместо sssctl

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели5.5K

Привет, Хабр! Сегодня хочу поделиться опытом того, как я отказался от стандартной утилиты мониторинга SSSD в пользу прямого общения с демоном через D-Bus и создал полнофункциональный Ansible-модуль.

Избавиться от зависимости!

Поиск свободных уникальных ников в Telegram

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.9K

Для одного проекта мне понадобился короткий ник в Telegram.

Мы имеем, порядка, 70 миллионов возможных, наиболее, коротких, пятисимвольных ников. Число большое, но чисто теоретически, могло быть занято (у Telegram, порядка, миллиарда активных пользователей в месяц).

У меня есть скрипт для проверки «зарегистрированности» ников крупными пачками.

Читать далее

LLM-клиент с MCP – дорогой и неэффективный подход в разработке

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели7.9K

В наше время тяжело представить разработку цифровых продуктов, в которые хоть в какой-то степени не включили так называемый ИИ на больших языковых моделях (LLM). И я вовсе не против, но у меня вызывают вопросы подходы разработчиков к способам внедрения интеллектуальных инструментов в свои продукты.

Думаю, абсолютное большинство оптимальным способом внедрения интеллекта в продукт выбрали использование проприетарных моделей через API, с добавлением кастомного функционала через вызовы MCP серверов. Кажется, это уже даже стало стандартом, и в этом я вижу проблему.

Давайте кратко разберем схему работы какого-то нашего приложения с официальным LLM-клиентом (например, OpenAI) + MCP:

Читать далее

Дифференциальная приватность в ML

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели7.8K

Привет, Хабр!

Сегодня поговорим в коротком формате о защите данных при обучении моделей, а именно в процессе обучения. Никому не понравится, если ваша нейросеть вдруг выдаст чужие паспортные данные или медицинские записи, правда? А ведь модели машинного обучения иногда склонны запоминать кусочки обучающего набора. Бывали случчаи, где из языковой модели вытаскивали строки с номерами телефонов и email тех людей, чьи данные были в тренировочном датасете.

Стоит ли нам вообще кормить модель конфиденциальной информацией, если она потом болтает лишнее? К счастью, есть крутая техника — дифференциальная приватность. Она позволяет обучать ML-модели на реальных данных, но с гарантией, что никакой отдельный пользователь не будет опознан моделью.

Разобраться в DP

context-async-sqlalchemy — лучший способ использовать sqlalchemy в async python приложении

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.7K

Привет! Хочу рассказать о своей новой библиотеке context-async-sqlalchemy, которая помогает очень просто работать с sqlalchemy в async python приложениях. Минимум кода для простых сценариев, но и максимум свободы для сложных.

Читать далее
1
23 ...

Вклад авторов