Comments / Profile of KMiNT21 / Habr

old-school

«Если вы не можете ничего запомнить — записывайте, как я!» (с)

KMiNT21 May 1 2025 at 16:51

После нажатия боковой кнопки часы переходят в режим передачи аудиоданных по RTP протоколу (по UDP) внутри WiFi сети на python-сервер. Нажатие второй кнопки рядом отправляет маркированный RTP пакет, который означает конец передачи (ну либо оно по таймауту сработает). Ну а серверная часть из таких сессий сохраняет все в .wav файлы.

Халява приходит в программирование

KMiNT21 May 1 2025 at 11:25

Это первая статья про AI, которая настолько идеально совпадает со всеми моими мыслями на эту тему (и не на эту тоже). :)

Халява приходит в программирование

KMiNT21 May 1 2025 at 11:07

Ох, сколько раз я помню ощущение от чтения какой-нибудь статьи на Хабре, что вот-вот кровь из глаз пойдет. :) Несколько раз уже думал, что администрации пора бы уже прикрутить нейронку, которая будет проверять и аппрувить статьи (или указывать на проблемы). Как оказалось, кто-то даже не перечитывает то, что написал (помню, было признание).

«Если вы не можете ничего запомнить — записывайте, как я!» (с)

KMiNT21 May 1 2025 at 10:11

Все так. Схема рабочая. Я даже смог перехватить нажатие нижней боковой кнопки на Galaxy Watch 4 (хоть там это и "запрещено"). Хотелось сделать передачу сообщения по удерживанию, но там уже никак. Ну хоть так пока. По качеству звука замечаний вообще нет.

Как по мне, то часы -- единственный реальный вариант иметь "под рукой" AI ассистента круглосуточно.

«Если вы не можете ничего запомнить — записывайте, как я!» (с)

KMiNT21 Apr 24 2025 at 15:14

Мне захотелось перехват хардверной кнопки боковой. Удерживаешь -- говоришь. А каждый раз какие-то там приложения искать запускать -- вообще не интересно. Это во-первых. А во вторых -- это не для заметок, а для чего угодно. Т.е. это может быть и мгновенный ответ от своей LLM-ки на компьютере, но до этого руки так и не дошли.

«Если вы не можете ничего запомнить — записывайте, как я!» (с)

KMiNT21 Apr 24 2025 at 13:03

Я делал под Galaxy Watch 4

«Если вы не можете ничего запомнить — записывайте, как я!» (с)

KMiNT21 Apr 24 2025 at 08:43

Я вот для этого дела частично функционал запилил, но отложил, так как другие приоритеты. Как по мне, так реально рабочий вариант вот так выглядит: зажал на часах кнопку, проговорил мысль вслух (ну или то что надо запомнить, внести в базу/таблицу). Аудио-пакетики по RTP прилетели на сервер, там сложились в wav файлики, прогнались через Whisper, полетели дальше на LLM-ку (ну или напрямую, если используется мультимодальная модель). LLM-ка сохраняет все это в локальную векторную базу данных. В дальнейшем языковая модель всегда сама может вытягивать любую информацию из нее, когда контекст этого требует.

«Если вы не можете ничего запомнить — записывайте, как я!» (с)

KMiNT21 Apr 24 2025 at 08:35

Векторная база данных + RAG. Все можно локально.

Как ИИ не заменит программистов, а создаст дефицит кадров в IT больше, чем COVID-19

KMiNT21 Apr 15 2025 at 18:01

Даже не так. :) Вот так:

"Пробовал я ваш ***самолет. Даже в космос нельзя улететь!!111 Хайп и развод лохов на деньги!111"

Апгрейд компьютера в 2025

KMiNT21 Apr 15 2025 at 12:03

У меня тоже примерно такое соотношение. :) 4090 и Ryzen 7 1700X. Но под новый проц нужна еще новая материнка и новая память -- пока это выглядит неадекватным. Докинул лишь памяти до 64 Гига.

Как ИИ не заменит программистов, а создаст дефицит кадров в IT больше, чем COVID-19

KMiNT21 Apr 15 2025 at 08:52

может нараспознавать всякого. Вчера столкнулся - в одном месте фамилия попала под печать, и дипсек везде поменял на кривую, даже там где было пропечатано чётко.

Даже если оставить (зачем-то) бумаги, то подготовленный ИИ-агент справится на порядки лучше человека.

Допустим, где-то там клякса буквы закрыла какого-нибудь контрагента (какие-то буквы). Вот просто мелкий гипотетический пример.

Сразу будут задействованы несколько потоков.
1) Нейронка при сканировании внутри для себя запишет показатели "уверенности" распознавания для каждого слова/буквы. Если обнаружится проблемное место, можно будет сделать поиск по архиву, сопоставить данные по другим признакам и принять адекватное решение. Причем, оно может быть даже отложено. Например, если след. документ заполняет эти пробелы в информации.
2) Параллельно можно проверять данные еще по какому-то общедоступному каталогу юр. лиц, сопоставляя другую доступную информацию.
3) ....

Ну и дальше принимать решение на основе этого анализа. А при пограничных ситуациях будет громко кричать и размахивать руками.

Это может быть другая модель, которая на вход принимает сигналы из предыдущих. Ну или, скорей всего, универсальная мощная агентская система от мировых лидеров рынка.

Все к этому придет, как только будет экономически обосновано. Нет технических препятствий.

Как ИИ не заменит программистов, а создаст дефицит кадров в IT больше, чем COVID-19

KMiNT21 Apr 15 2025 at 08:36

но вот как раз тут вполне могут дожать ИИ
Я бы не сказал, что проблема в энергии, проблема в вычислительных мощностях,

Полностью поддерживаю. То же самое хотел написать про сканер и ИИ. Только я бы добавил, что проблема больше в отсутствии специализированных датасетов для обучения. Но все равно к этому все придет. Агентская бухгалтерская система и ошибки сканирования обнаружит (и, например, сопоставит данные из предыдущих документов, оценит вероятности и примет решение, стоит ли "докладывать", записав это в свой лог), и изменения в законодательстве всегда вовремя увидит в тот же день, и даже некоторые ошибки в документах сможет найти и "вытащить наружу" путем анализа других данных и сопоставления...

Все будет основываться на "должностной инструкции" этого агента. При условии, что он был этому обучен на специализированном датасете. И вот подготовка такого датасета -- это будет самая главная статья затрат.

Microsoft призвала пользователей отказаться от Windows 10 в пользу Windows 11, потому что она лучше по 7 причинам

KMiNT21 Apr 13 2025 at 19:46

то у меня перед глазами такие яркие черные инвертированные полосы-следы, что аж рябит.

А разве не у всех так? :)

Что будет, если не использовать TCP или UDP?

KMiNT21 Apr 6 2025 at 06:49

Наоборот, сети на IPX были куда как более в фаворе.

А я когда-то писал свой двухмодульный "проксер", чтобы осуществить побег через Novell-маршрутизатор, который маршрутизировал только IPX/SPX, в другую подсеть, где параллельно на машинах был и TCP/IP. Все для того, чтобы попасть в интернет, так как в моей подсети TCP/IP не было. :) Хоть и однопотоковый, но схема работала. :)

Телефонист. Фантастический рассказ

KMiNT21 Mar 30 2025 at 17:22

И: А меня зовут Иврэ. Какой предмет будем изучать?
...
И: Извини, видимо, у меня развилась профдеформация :)
....
В: Это вы меня извините, не понял, что шутите.

Что-то на этом споткнулось и запнулось мое чтение. :) Нейронка ж сказала, что профдеформация. Где же тут шутка-то?

Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом

KMiNT21 Mar 30 2025 at 05:32

и нужно еще как следует потрудиться, чтобы ее запустить, потому что с зависимостями в половине случаев царит полная неопределенность

Это да. Нужно и все версии питона иметь, и не пытаться отходить от рекомендованной, если автор только на одной какой-то тестировал. :) И все равно постоянно спотыкаешься на проблемы несовместимости пакетов, когда настраиваешь environment. Я уже размышлял на эту тему -- начинает казаться, что весь этот питоновский AI мир держится просто на соплях. Только толкнуть, и все просто рассыпется на молекулы. :)

В целом по поводу тайтла статьи... Есть вот такой вариант:

https://github.com/pinokiocomputer/pinokio (Install, Run & Control AI apps on Your Computer with 1 Click. Pinokio is a browser that lets you install, run, and manage ANY server application, locally.)

Он не про API, но очень сильно упрощает доступ к новым проектам. Оно ж реально лень становится каждый по отдельности устанавливать. А тут сразу подборка. Очень удобно. ComfyUI с кучей своих workflow, Pinokio с нужными проектами. И остальное, что не вошло в первые две системы.

P.S. /dɪˈsaɪ.dər/

Что делать, если разработчик работает хорошо, но очень медленно

KMiNT21 Mar 28 2025 at 22:45

Еще может сработать способ "мягкого" (и сопереживающего) смотрящего, который сядет рядом, чтобы тоже "поучаствовать", вникнуть. Если, вдруг, окажется, что производительность работника (например, программиста), резко повысится (в таком формате), то... Можно будет сделать определенные выводы. И присмотреться повнимательней.

Проанализировал более 260 тысяч футбольных матчей, чтобы поспорить с учёными-статистиками

KMiNT21 Mar 28 2025 at 19:54

При этом пик голеодорства придётся через 5–14 минут после первого мяча. Чисто психологически, это можно объяснить, что команды, пропустившая мяч, хочет быстрее отыграться, а значит побежит вперёд и усилит натиск. А вот соперник в этот момент может поймать на ошибке.

Кроме этого и другие сценарии тоже "сдвигаются" к вероятности забить. Например, атакующая команда нащупала слабину в обороне. И, соответственно, защищающаяся команда тоже резко теряет уверенность в своей игре, если не удалось удержать ворота на замке. Забитый гол (особенно первый) влияет очень сильно психологически на обе команды. Даже если обороняющаяся команда не начала бежать вперед, игроки могут начать делать больше ошибок. А нападающие ловят кураж.

В общем, любой первый мяч легко может вывести игру из "монотонного" состояния. А дальше сценарии уже разные бывают.

Проанализировал более 260 тысяч футбольных матчей, чтобы поспорить с учёными-статистиками

KMiNT21 Mar 28 2025 at 19:45

в т.ч. минимальных. Я не знаю, как это формализовать, но правило офсайда явно нуждается в пересмотре.

В каком? :) Минимальный оффсайд не считать? :) Не, ну серьезно. Ну какой тут пересмотр. Автоматизировать это надо максимально, чтобы минимизировать задержки по принятию решений. И все. Это чисто технический момент.

Поиск Gmail получит обновление на основе ИИ, которое позволит быстрее показывать «наиболее релевантные результаты»

KMiNT21 Mar 24 2025 at 00:46

Хороший способ "легализовать" привязку к аккаунту знаний о пользователе, полученных путем анализа содержимого почтового ящика. :) А то... всплывет, вдруг, в чат-боте что-то такое -- шуму лишнего будет...

3 4 ...

13 14