Comments / Profile of tsvetkovpa / Habr

Technical Project Manager

Гениально или безумно: зачем инженеры изобрели электрический ластик

В бытность свою студентом строительного факультета обрел навык срезания туши лезвием для бриться с минимальным повреждением бумаги.

Эх... хорошее было время

Look

E-paper Arduino термометр на ESP-IDF

tsvetkovpa May 25 at 12:20

Спасибо. А я ищу плату на основе ESP32 с низким током утечки.

Пробовал собрать девайс на основе LILIGO T-Display, который большую часть времени проводит в режиме глубокого сна, который по спекам ESP32 должен потреблять микроамперы.

Но, к сожалению, переферия этой платы, даже в режиме глубокого сна потребляет ток, который высаживает 18650 за пару недель, даже если девайс не трогать.

Ищу теперь плату с минимальным током утчеки

Look

E-paper Arduino термометр на ESP-IDF

tsvetkovpa May 25 at 08:36

А от чего питаете?

Look

Как я создал полностью автоматизированное онлайн радио с AI ведущими и музыкой

tsvetkovpa Feb 23 at 19:04

В плане генерации голоса посмотрите на XTTS v2 или на этот проект на ее основе https://github.com/DrewThomasson/ebook2audiobook

Прелесть в том, что можно скормить 6 секунд образца голоса, и потом им зачитывать текст

Look

Сервисы для онлайн тренировок: Лучшие платформы для домашнего фитнеса

tsvetkovpa Feb 23 at 10:04

А как тут работает версионирование, командная работа? Авто-тесты?

Look

Интернет-провайдера обязали раскрыть 100 предполагаемых пиратов BitTorrent по иску RIAA

tsvetkovpa Feb 22 at 21:23

Можно собирать колекцию любимой музыки на сервисе годами, а потом правообладатели что-нибудь не поделят с сервисом и ваша коллекция накроется медным тазом.

За годы у меня пропали множество композиций из коллекций Youtube.Music и ему подобных

Look

Тебе сюда нельзя: Flutter блокирует разработчиков по национальности

tsvetkovpa Feb 6 at 06:49

Отсылка к болотам намекает, что ревьюэр был из Украины.

Look

Почему нам всем стоит отказаться от соцсетей в пользу RSS

tsvetkovpa Jan 24 at 18:39

Из того что хотелось бы поменять, наверное только подход к дообучению. Т.е. не учить на том, что модель разметила. А то получается что из всего набора новостей она отбирает процентов 10%, с явным смещением в сторону науки и техники, и они же потом с моими лайками-дислайками добавляются в датасет, из за чего там со временем растет пропорция таких новостей и распределение начинает отличатся от изначального, когда я руками размечал все подряд.

Видимо надо, чтобы она подкидывала случайные новости в телеграм и именно их добавлять в датасет. Обычная проблема Exploration vs Exploitation.

Look

Почему нам всем стоит отказаться от соцсетей в пользу RSS

tsvetkovpa Jan 24 at 10:35

Текст для классификации формировал из заголовка и той части текста статьи, который был доступен в RSS (в некоторых фидах только заголовок).

Код писал пользуясь этим примером. https://huggingface.co/docs/transformers/en/training

Первый пайплайн собрать довольно быстро. Больше времени писал сбор и хранение данных. Ну и потом игрался с подбором параметров обучения.

Из моих отличий. Датасет сильно несбалансированный по классам. Пришлось добавить Sample Weights.

У видяхи всего 8 GB Ram, влезал батч максимум на 6 сэмплов. Использовал Gradient Accumulation (слава богу transformers это умеет из коробки, просто параметр включить), подобрал оптимальный батч 384 сэмпла.

Обучение проводил в два этапа. На первом этапе учил только слои классификатора и замораживал все остальное.
На втором этапе размораживал слоит трансформера, но оставлял замороженными эмбеддинги токенов. И уменьшал шаг обучения.

Смотрел по тензорборду на метрики и выбирал модель, которая нравилась мне по метрикам.

Ввёл кастомную метрику качества, сколько процентов статей мне придется просмотреть по порядку, если их отсортировать по скору от нейросетки, прежде чем я найду 90% от всех интересных статей.

Look

Почему нам всем стоит отказаться от соцсетей в пользу RSS

tsvetkovpa Jan 23 at 17:04

Использовал предобученную модель от Сбера https://huggingface.co/ai-forever/ruBert-base в режиме классификатора.
Использовал библиотеки pytorch и transformers для файн-тюнинга.

Первичный датасет разметил при помощи Doccano, потом система вошла в закрытый цикл и стала учиться на лайках/дислайках, которые я ставил в Телеграме.

Обучение на GPU на ноутбуке. Инференс на CPU на файлопомойке от Synology в докере.

Схема работы получается примерно такая.
По таймеру система просыпается, скачивает новости с RSS каналов, прогоняет через нейросетевой классификатор, и если вероятность полученная от классификатора выше порогового значения, то присылает мне ссылку в Телегу.

Там я могу полайкать-дислайкать - эта инфа ложится обратно в базу новостей и используется для дальнейшей обучения.

Переобучение запускал руками время от времени. Перестал это делать когда датасет разросся до примерно 20 тыс. Работает больше года так.

Look

Почему нам всем стоит отказаться от соцсетей в пользу RSS

tsvetkovpa Jan 23 at 06:57

Пару нет назад тоже дошёл до осознания проблемы перегрузки информацией из новостей и запилил себе нейросетевой фильтр, который читает RSS фиды и постит мне в Телеграм, что потенциально мне понравится.

К сожалению мое решение не скейлится - пришлось руками разметить около 4000 новостей, прежде чем он начал приемлемо работать.

Для публичного продукта надо подходы типа коллаборативной фильтрации использовать.

Look

Провайдеры связи РФ: нет ограничений по трафику YouTube, сложности возникли на стороне сервиса или по внешним причинам

tsvetkovpa Dec 25 2024 at 16:17

Британский Роскомнадзор aka. Ofcom так же без суда оштрафовал Russia Today в 2019 году. А в 2022 отозвал лицензию на вещание, тоже без суда.

И все демократично.

Look

tsvetkovpa Dec 25 2024 at 16:10

А где можно посмотреть такую статистику по странам?

Look

tsvetkovpa Dec 25 2024 at 11:31

Те же ценности, которые проповедует демпартия США, спонсором которой является Alphabet Inc, который владеет Ютюбом.

Можете легко нагуглить официальную отчетность с последних выборов президента США. Там Alphabet Inc. указан как один из спонсоров предвыборной кампании Камалы Харрис.

Look

tsvetkovpa Dec 25 2024 at 11:08

Рассмотрим две ситуации. Американский регулятор или спецслужбы просят Youtube заблокировать пророссийиский канал на территории США за нарушение американского законодательства.

И, аналогично, российский регулятор просит Youtube заблокировать какой-то канал на территории России, за нарушение российского законодательства.

Какой из запросов должен выполнить Ютюб. И что произойдет,если он этогл не сделает?

Look

tsvetkovpa Dec 25 2024 at 10:57

Я больше скажу. Гугл мог бы выплатить штраф год назад и выполнить требования регулятора. Или оспорить решение суда в Верховном суде. И не надо было бы никакого VPN.

У нормального бизнеса принято выполнять требования местного законодательства. Dura lex - sed lex. В Пакистане, например, европейские банки работают по правилам халяльного банкинга и не чирикают.

Думаю, ютюб таки решил слиться таким образом. Типа это не мы ушли - это нас ушли. Они давно не показывают рекламу на российскую аудиторию - читай, не получают прибыль. А так, возможность уйти сохранив лицо и (*надевает шапочку из фольги*) уколоть российске руководство, ибо Alphabet Inc. спонсор демпартии США.

Look

Ктулху зовёт! Эволюция компьютерных игр по Лавкрафту. Часть 2: Анненербе у Хребтов безумия, X-COM 2 и немного Quake

tsvetkovpa Nov 25 2024 at 17:15

Из относительно свежего Phoenix Point имеет отсылки к Югготу и ссылается на Лавкрафта

Look

Офис Intel в Израиле отменил бесплатный кофе

tsvetkovpa Nov 2 2024 at 14:11

Может Интел решил закрыть офис в Израиле, из-за геополитических рисков.

Отбираем плюшки. Не платим бонусы. Не промоутим.

Глядишь - большая половина сбежит сама. Можно будет сэкономить на выходном пособии немногочисленным оставшимся.

Look

Как программисты становятся террористами. Взгляд изнутри на историю Bitzlato

tsvetkovpa Oct 28 2024 at 11:52

Чтобы сравнивать, нужно посмотреть по соотношению арестов и приговоров.

У нас много дел закрываемся до суда, если прокурор не уверен что выиграет.

Поэтому до суда доходят дела с очень большой вероятностью обвинительного приговора.

Получается смещённая выборка в сторону обвинительных приговоров.

Look

Сан-Франциско заплатит $212 млн, чтобы положить конец использованию 5,25-дюймовых дискет

tsvetkovpa Oct 24 2024 at 18:28

В ранних компьютерах (80286) действительно понижала. У меня друг читерил в тетрисе, когда скорость возрастала до некомфортной, он понижал скорость CPU этой кнопочкой и фигурки начинали падать медленее :-)

Look

2 3 4 5 6