Все потоки

Python *

Высокоуровневый язык программирования

430,67

Рейтинг

СтатьиПостыНовостиАвторыКомпании

m4deme1ns4ne 19 июн в 20:37

LongConspectWriter: автоматическая генерация структурированных конспектов лекций на потребительском GPU

Сложный

20 мин

12K

Natural Language Processing * Open source * Python * Искусственный интеллектМашинное обучение *

Автоматическая генерация структурированных академических конспектов из аудиозаписей лекций по точным и естественным наукам затруднена для локальных малых языковых моделей (small language models, SLM). Транскрипт лекции продолжительностью ≈1,5 ч составляет около 15–20 тыс. токенов и формально умещается в контекстное окно современных локальных SLM, однако при обработке такого контекста single-call SLM систематически деградируют: теряют фрагменты из середины последовательности, не удерживают структуру и галлюцинируют термины и формулы. Это проявление эффекта Lost in the Middle: точность извлечения информации описывает U-образную кривую — высока на краях контекста и падает в середине; в наших условиях используются SLM, поведение которых так же описано в статье, и оно характеризуется выраженным забыванием не только из середины, но также и из начала контекста. Более того, на бюджете 8 ГБ VRAM single-call длинного транскрипта практически неприменим*, что делает декомпозицию не оптимизацией, а необходимым условием работоспособности.

Читать далее

+7

GoldenGekko 19 июн в 17:29

Мой личный джуниор. Часть 3. Учим агента ждать

Средний

8 мин

11K

Искусственный интеллектPython *

Привет, Хабр! Меня зовут Владимир и это продолжение статьи про разработку локального кодер-агента.

В первой части мы создали инфраструктуру: подняли контейнер с моделью, настроили Langfuse для трассировки и написали простейшего агента с доступом к MCP-инструментам.

Во второй части мы добавили агенту мозги: планировщик, оценщики, защиту от зацикливания и суммаризацию контекста.

Сегодня мы превратим этот набор в работающий граф. Добавим чекпоинтеры, прерывания и доработаем интерфейс под обновлённую архитектуру.

Читать далее

+10

GoldenGekko 19 июн в 17:17

Мой личный джуниор. Часть 2. Даём агенту немножечко мозгов

Средний

11 мин

11K

Искусственный интеллектPython *

Привет, Хабр! Меня зовут Владимир и это продолжение статьи про разработку локального кодер-агента на LangGraph с доступом к MCP-инструментам.

В первой части мы создали инфраструктуру, написали простейшего агента и дали ему доступ к MCP-серверам для работы с файлами, кодом Git и документацией. В этой половинке мы добавим агенту немного мозгов.

Читать далее

+8

haru_t 19 июн в 10:48

Невыразимое невалидное. Часть 1. Данные

Средний

8 мин

6.8K

Кейс

Из песочницы

Знакомый сценарий: фильтр или конструктор запросов начинается с одного опрятного класса, а через месяц в нём value: Any, валидатор на сотню строк и ветка, дописанная ночью перед релизом, — её забыли покрыть тестом, и она падает в проде.

Разбираем контринтуитивный выход: не «добавить ещё проверок», а сделать невалидное состояние таким, чтобы его нельзя было даже собрать. В первой части — сами данные: сумма-типы, дискриминированные union’ы и точные значения в pydantic; и где всё это ловит тайп-чекер, а где остаётся рантайму.

Читать далее

+5

StanislavShimovolos 19 июн в 08:01

CancelledError — не просто очередная ошибка. Разбираемся, как устроена отмена задач в asyncio

Средний

18 мин

9.3K

Блог компании Точка БанкPython * Управление разработкой * Программирование * Веб-разработка *

Это первая из двух статей о CancelledError — сигнале отмены задачи. В ней мы остановимся на стандартном asyncio. Узнаем, что на самом деле представляет собой CancelledError, с точки зрения event‑loop. Разберёмся, как работает счётчик отмены (cancel/uncancel), на котором построены TaskGroup и asyncio.timeout. Наконец, обсудим проблемы, которые возникают на практике, в первую очередь связанные с asyncio.shield.

Читать далее

+23

sunm8 18 июн в 16:32

Открыл бету AI-Мастера для D&D. Главная проблема оказалась не в кубиках, а в памяти

Средний

5 мин

14K

Игры и игровые консолиРазработка игр * Python * Программирование * Искусственный интеллект

Кейс

Я уже несколько месяцев в свободное время пилю одну штуку — Telegram-бота, который водит тебя по D&D 5e в одиночку. Нейросеть тут за Мастера: генерит историю, описывает сцены, ведёт бой по правилам, тянет кампанию. Играешь прямо в Telegram, лист персонажа и инвентарь — в мини-приложении.

Сразу честно, без «заходите, всё готово»: это активная стройка. Релиза не было. А 13 июня я впервые открыл её для людей — то самое открытое бета-тестирование. До этого бот варился в узком кругу, теперь зайти и поломать может любой.

Я готовился защищать механику. А первым посыпалось совсем другое. Но обо всём по порядку.

D20 на прочтение

+21

yanchino 18 июн в 09:05

Как я написал свой overlay-переводчик на python

Простой

4 мин

7.3K

Python * Windows * Open source * Интерфейсы *

Кейс

Из песочницы

Бывало у вас такое: находите крутую инди-игру или визуальную новеллу, а официальной русской локализации нет? Сидеть со смартфоном в руках и переводить экран через Google Переводчик - удовольствие сомнительное. Переключаться по Alt+Tab в браузер каждые две минуты - ломает всё погружение.

Посмотрев на существующие экранные переводчики, я понял, что они либо перегружены лишним функционалом, либо просят денег, либо просто неудобно сворачивают игру. В итоге я решил за пару вечеров собрать свой велосипед на Python: легковесную утилиту, которая по горячей клавише делает скриншот области, распознает текст, переводит его и выводит в красивом, прозрачном для кликов оверлее прямо поверх игры.

Читать далее

+5

nnazarov 18 июн в 09:00

Линеаризация. Увеличиваем мощность А/Б тестов с метрикой отношения

7 мин

7.7K

Блог компании X5 TechСтатистика в ITВеб-аналитика * Python * Математика *

Туториал

Статья о том, как линеаризация помогает оценивать А/Б тесты с метриками отношения и повышать чувствительность экспериментов.

Разберём применение линеаризации на примере эксперимента со средним чеком. Построим доверительный интервал для метрики отношения. Проверим корректность работы линеаризации и покажем, в каких случаях её эффективность может снизиться. Убедимся, что CUPED увеличивает мощность критерия, и обсудим как линеаризовать ковариату.

Читать далее

+13

c_eye 18 июн в 08:20

Компиляция yolov8n в формат HEF для Hailo-8L на Raspberry Pi 5

Простой

7 мин

7.8K

Python * Raspberry Pi * Linux * Искусственный интеллект

Кейс

Из песочницы

Подготовка модели Yolo для запуска на базе Hailo чипа для Raspberry Pi 5 AI HAT+.

Если есть интерес к легким аппаратным решениям в области ИИ, то добро пожаловать. В статье я затрагиваю вопрос подготовки модели детекции к работе на компактной малинке.

Читать далее

+7

inkedsymon 18 июн в 08:00

Сказ о том, как нейросеть занялась reward hacking прямо у меня на кухне

Средний

8 мин

18K

Блог компании SelectelPython * Машинное обучение * Алгоритмы * Искусственный интеллект

Я хотел просто пожарить кесадилью. В холодильнике лежали зеленые оливки (солено-кислые), сулугуни и фарш, а на полке консервированная кукуруза. И вот стою я над сковородкой и думаю: а оливки с кукурузой вообще сочетаются? А сулугуни не пересолит блюдо вместе с оливками? Сколько чего вообще класть?

В любой другой ситуации я бы загуглил рецепт. Но не тут-то было, я же великий ~~комбинатор~~ оптимизатор, и у меня в голове сразу всплыло: «это же задача оптимизации». Тем же вечером у меня был ноутбук с обученной нейросетью вместо ужина. Рассказываю, как дошел до жизни такой, и как из этого, внезапно, получился реально вкусный рецепт.

Читать далее

+81

2M12 18 июн в 06:10

Как заглянуть внутрь.exe, собранного через Nuitka? Новый инструмент с открытым кодом

Средний

4 мин

7.2K

Python * Реверс-инжиниринг * Open source * Сжатие данных * Анализ и проектирование систем *

Обзор

Из песочницы

Как узнать, что внутри .exe, собранного через Nuitka? DeNuitkanizator — инструмент с открытым кодом для анализа таких файлов. Извлекает строки, модули, хэши, информацию о защите и многое другое за один запуск.

Читать далее

+4

danyakr 18 июн в 03:20

Погружение в многозадачность Python: процессы, потоки, GIL и асинхронность

Средний

39 мин

12K

Python * Программирование * Параллельное программирование *

Туториал

Многозадачность кажется простой темой, пока дело не доходит до Python и GIL. В статье разбирается: чем процесс отличается от программы, зачем нужны потоки, что такое ядро процессора и в чём разница между конкурентностью и параллелизмом. Затем – специфика Python: как GIL влияет на потоки, когда стоит использовать процессы, асинхронность или корутины, и чем они отличаются от green threads. Материал сопровождается схемами, рабочими примерами кода и реальными замерами производительности для CPU-bound и I/O-bound задач, а в конце – практические выводы о том, что и когда выбирать.

Читать далее

+17

ashotagabekov 17 июн в 20:05

Квантовая монетка на IBM Quantum: как я переложил выбор свидания на 8 кубитов

6 мин

13K

Кейс

Когда не можешь выбрать, куда пойти на свидание, можно мучиться между кофейней, баром и прогулкой. А можно поступить взросло: отправить задачу на квантовый компьютер IBM и переложить ответственность на физику. Внутри — Qiskit, 8 кубитов, реальный job_id и самый пафосный способ заменить подбрасывание обычной монетки.

Github репо по ссылке

Читать далее

+8

Mixaer2 17 июн в 14:44

Как я случайно открыл функцию активации с багом, побеждающую Swish

Простой

2 мин

10K

Android * Python * Математика *

Кейс

Из песочницы

Началось всё с того, что мне было нечем заняться, и я баловался с языковой моделью, мучая её всякими разными вопросами по ML. В какой-то момент дело дошло до функций активации — сначала прошлись по уже известным, а затем и до ещё непроверенных. Так и появилась LLA — функция активации, являющаяся центральным элементом всей этой истории.

Формула у неё довольно простая:

+6

asomegoodboy 17 июн в 14:05

Почему мы до сих пор неправильно пишем физические движки и 3D-графику

Средний

8 мин

30K

Блог компании Timeweb Cloud3D-графика * C++ * Python * Алгоритмы *

Обзор

Стоит открыть исходники любого современного игрового движка – неважно, это C++-рендер, сделанный на коленке, или какая-нибудь гигантская экосистема вроде Unity или Unreal Engine – вы первым делом натыкаетесь на одни и те же знакомые сущности. Все вокруг живет в Vector3: координаты, направления движения, точки столкновений. Каждая частица указывает, куда она смотрит, с помощью Quaternion. А если требуется что-то покруче – переносить и одновременно крутить объект, то Matrix4x4. Это уже как стандарт де-факто: кто пробовал крутить объекты руками, тот точно переписывал код с этими структурами. Ещё конечно же отдельно существуют лучи, плоскости, сферы, bounding boxes, а между ними тянутся километры функций вроде dot(), cross(), normalize(), lookAt(), inverse(), project() и бесконечных преобразований типов.

Привыкаешь к этому быстро. Нам кажется совершенно естественным тасовать эти типы между собой – уж слишком давно так делается по всей индустрии. Но стоит лишь чуток задуматься, и начинает прорезаться легкий когнитивный диссонанс: выходит, вся наша графика построена на наборах несовместимых между собой математических запчастей. Для одного действия нам нужен один тип данных, для второго – другой, а пересчитать простое столкновение луча со сферой или плоскостью без пятого велосипеда никак не получается. Вроде бы всё работает и даже неплохо работает… Но ощущение конструктора из костылей не отпускает.

И самое интересное заключается в том, что так было не обязательно.

Читать далее

+181

infosave 17 июн в 13:05

Оптический компьютер из телефона и зеркала: считаем нейросеть светом

Средний

9 мин

11K

Python * ФототехникаФизикаКвантовые технологии

Обзор

Можно ли перенести LLM из кремния в чистую оптику? Чтобы проверить эту идею без дорогого лабораторного стенда, я собрал установку из обычного смартфона и зеркала на столе. Рассказываю о том, как пиксели камеры делают сложение за один оптический такт, и делюсь результатами 101 эксперимента — от волновой физики до оптического инференса трансформера.

Читать далее

+18

DepthSight 17 июн в 10:16

Парадокс Open-Source: Единственный способ победить корпорации — раздать свой код бесплатно

Средний

9 мин

9.3K

Open source * Python * Программирование * Проектирование и рефакторинг * Финансы в IT

Кейс

Вступление: Финал эксперимента и ответ скептикам. Как мы с ИИ написали Open-Source убийцу SaaS-ботов на 280 000 строк кода, и почему я отдаю его даром.

В своих прошлых статьях я рассказывал, как научился использовать ИИ вместо команды сеньоров («Почему для одних ИИ — гений, а для других — идиот») и почему классическая команда сегодня только тормозит разработку из-за бюрократии и потери контекста («Парадокс инвестиций: Почему $1,000,000 и команда сеньоров убили бы мой стартап»).

В комментариях на меня вылили ушат холодного и вполне обоснованного скепсиса. Мне писали: «Где метрики? Кому нужен твой пет-проект?».

И знаете что? Вы абсолютно правы. ©

Открыто бороться с гигантами индустрии, пытаясь перебить их рекламные бюджеты - это чистое самоубийство для соло-разработчика. У меня нет миллионов на закупку трафика и маркетинг. Именно поэтому я принял единственное доступное мне стратегическое решение: я не буду с ними конкурировать. Я просто убью их бизнес-модель.

Читать далее

+10

bugfixing 17 июн в 08:00

Код в эпоху AI: как перестать бороться за качество и начать контролировать деградацию

8 мин

12K

Go * Python * Swift * Kotlin * JavaScript *

Кейс

AI сделал нас быстрее, очень сильно быстрее, но у этого момента есть побочный эффект. Наверно многим, кто уже столкнулся в вайбкодингом в своих проектах, знакомо такое чувство когда радуешься от того, что фичи делаются быстро и потом в какой-то момент ты понимаешь, что система деградировала настолько, что новое впиливается все сложнее и сложнее, кол-во багов растет, тех долг накапливается и кажется, что проще все снести и переписать.

Читать далее

+24

LeonidKulygin 17 июн в 07:03

Базовые нейросетевые модели для кредитного скоринга физических лиц

Средний

8 мин

7K

Блог компании Альфа-БанкМашинное обучение * Python *

Туториал

Всем привет! Мы команда прикладных исследований и разработки моделей глубокого обучения Альфа-банка. В этой статье мы хотели бы рассказать о наших самых актуальных разработках в области нейросетевых подходов к решению задачи кредитного скоринга физических лиц. Ранее мы уже писали на эту тему, но последняя статья предыдущего цикла датирована 2023 годом. За это время мы смогли значительно продвинуться в исследовании способов решения данной задачи.

Читать далее

+12

dv1555 17 июн в 04:29

Обзор релиза 4.20 NodaLogic

Простой

14 мин

8.3K

1С * Разработка мобильных приложений * Python *

Обзор

В июньском релизе много всего: удобная пакетная синхронизация узлов от внешней системы до устройства - "контракты", онлайн-обработчики событий, интеграция мультимедиа-элементов с s3-хранилищем, чтобы не писать ничего при обмене документов с картинками, печатные формы, мощная система таймеров/воркеров и многое другое.

Читать далее

+4

1 2 ...

11

12 13 ...