Комментарии / Профиль S

Андрей @S_A

modelize.ru

ПрофильСтатьи15ПостыНовостиКомментарии892

Нейросети без градиентов: спектральное моделирование и построение решений

Когда-то думал над игровой реализацией градиентного спуска. То есть нейроны играют в игру, и может быть (в зависимости от функции выигрыша) равновесие Нэша (по теореме о неподвижной точке). То есть улучшая любой нейрон, мы бы ухудшили лосс, увеличили его.

Вся проблема в выборе функции "положения" нейрона. Я не подобрал) возможно это можно сделать другой сеткой или RL, или например KAN. Вобщем, поле для экспериментов есть, времени нет.

Форсайт на основе ИИ: как аналитика больших данных трансформирует конструирование будущего

S_A 21 апр в 12:13

спасибо! на форсайт-сессиях, бывает, вначале проводят затравочный футуристический доклад - вот там "генИИ" точно может быть полезен.

а вообще вот буквально на днях генерил 50 возможных событий в ряде отраслей, специально без RAG - поискать лебедей и прочее. очень неплохо.

ну и наконец - с трендом на агенты - весь форсайт можно было бы отдать ИИ, а потом оценивать =)

а за идею про ИИ в форсайте большое спасибо.

Накорми языковую модель документами

S_A 21 апр в 08:08

предположу, речь идёт о zero-shot классификаторах

Накорми языковую модель документами

S_A 20 апр в 06:04

Некоторые модели хорошо понимают что в отданных чанках нет ответа на вопрос, особенно если их зампромптить на такой ответ: "если в указанной информации ответа нет, явно сообщи об этом числом 0".

Если есть похожие к запросу, но почему-то неревантные, значит надо улучшать retrieval.

Помощник читателя: визуализируем сюжет

S_A 15 апр в 09:05

Огонь! я делал чуть проще на малых текстах. промпт "изложи следующую историю в виде mermaid-диаграммы: текст", и это работает.

только работает это на не очень длинных саммари. но зато можно спросить про хронологию второй мировой например. не суть.

чтобы не зависеть от длины контекста, по идее можно RAG какой, предварительно обогатив поисковый запрос через LLM.

Статья понравилась, спасибо

Уже через год мы будем общаться с базами данных по-русски

S_A 30 мар в 01:15

С хорошими метаданными я такое ещё в 2018 делал на intent + NER, LLM ещё не было. Просто большой SQL-builder получился, и работал без проскальзываний, в синтаксисе уж точно. А join'ы делались кратчайшим путем в графе таблиц, без всяких пришлёпок.

Вопрос вполне естественный, ответ диаграммой.

LLM только очень большая будет неплохим SQL-билдером. Но в целом вся движуха мне по душе, очень давно жду.

Кто хочет попробовать RAG в этой задаче, посмотрите vanna.ai. Сам не пробовал, но выглядит рабочей штукой. Но и там все упирается в хорошую мету.

Цифровой вытрезвитель. Решение

S_A 27 фев в 06:41

В большинстве ваших инженерных трудностей поможет tabpfnv2, прямо очень рекомендую присмотреться.

Если бы Рамзи готовил диаграммы: рецепт идеального инструмента визуализации

S_A 12 фев в 12:11

Заряжаю в self hosted llm (saiga nemo) "Изложи следующий текст в виде mermaid диаграммы: Михаил пошёл на рыбалку и накопал себе тысячу червей", копирую-вставляю в ванильный obsidian - и все работает. Очень сложные подправляю все же руками.

Статья, если не привязываться к инструментам, хороша. А инструменты вкусовщина.

Экономика, вывернутая наизнанку

S_A 6 фев в 11:50

В Новокузнецке провел молодость, и я его понимаю. Кемерово, ощущение что застрял в нулевых. Проработал там год.

Что касается Академа Нского, там я прожил долго, лет 8. Хорошее, я бы даже сказал сказочное место. Но потом семейные обстоятельства вернули.

Экономика, вывернутая наизнанку

S_A 2 фев в 02:29

Извините за оффтоп, пишу из "депрессивного" Новокузнецка. Как у нас поступили с транспортом, никому не пожелаю. Поменяли все маршруты, уже три+ года полгорода не знает как из А доехать в Б. На линиях постоянно не хватает водителей, люди 30-40 минут ждут автобус по утрам.

Все остальное в Новокузнецке вполне себе не "депрессивное". Не все благоухает, но жить комфортно (лично мне, а я жил ещё в Москве и в Академе Новосибирска).

Lasso, Ridge и кастомные регуляризаторы: основы

S_A 15 ноя 2024 в 02:35

Смотрите, регуляризация - это наложение условий на веса модели через добавку в лосс. Почему в такой постановке работает - потому что это изменяет ландшафт лосс-функции, делая ее более оптимизируемой, и, следовательно с лучшим оптимумом. Об этом загляните в UDL book, https://udlbook.github.io/udlbook/

И еще чуть сложнее - регуляризация это внесение inductive bias в том числе, продвижение модели ближе к задаче (не очень точно выражено, но как-то так). Соответственно с ним перфоманс модели лучше, ее обобщающая способность.

Топология в нейросетях?

S_A 18 окт 2024 в 13:09

Очень интересно про tda для весов сети, так как сам экспериментировал недавно с этим, дошел до идеи сам.

А у вас ничего кроме идеи и не нашел.

ResNet-18: ищем динозавров или упражнения с векторами

S_A 24 июл 2024 в 09:10

Попробуйте вложения от dinov2, будете приятно удивлены. Без шуток

Как справиться с нехваткой открытых данных для обучения и тестирования ML-моделей

S_A 4 июл 2024 в 01:21

Это очень здорово! А есть в формате статьи? Интересны детали, как кластеризовали, как на сферу укладывали, как обратно разворачивали. И как графы в этом поучаствовали.

Вообще я для подобного использовал всегда VAE. Но тут похоже вы придумали что-то лучше

strtree — классификатор строк на основе регулярных выражений

S_A 26 июн 2024 в 06:56

Идея крутая. В кода примера есть две ошибки, strtree.StringTree, и recall_score наверное должно быть.

Открытое письмо BI компаниям — проект “Dashboard.AI”

S_A 30 окт 2023 в 12:41

Ну... Ничего нового. Посмотрите скажем на visiology. Более того... Дашборд можно составлять (и нужно) из сохраненных запросов.

text2sql простая задача без всяких data science при наличии метаданных к базе (просто появляется sql builder), просто на одних только ближайших или intent+ner.

Хотя направление мысли мне нравится. Если будет open source продукт chat with data, типа visGPT без OpenAI и self-hosted... прямо джва (четыре по факту) года жду

ML-искусство переживать проблемы: как избегать разочарований и находить аналоги товаров в периоды out-of-stock

S_A 13 авг 2023 в 06:25

Можно вам предложить присмотреться к

https://www.marqo.ai/

Нейронки в финтехе: пока небезопасно и только для простых задач. В общем, ИИ — не Senior, господа, расслабимся…

S_A 10 авг 2023 в 02:55

Я не то чтобы гарантирую... Но в целом разница вот в чем. В одном случае энергию добывают, а во втором расходуют. Первое всегда было сложнее.

Плюсом к электросеньору то, что его работа не умопомрачительно уникальна, ее можно алгоритмизировать и дополнить (техническим) кругозором. Это делают large language models все лучше и лучше.

Научное изобретение, прорыв для цивилизации, алгоритмизировать наверное нельзя

Нейронные сети, графы и эмерджентность

S_A 1 авг 2023 в 11:43

У архитектуры конечно же роль больше - потому что процедуры by design решают одну и ту же задачу, а архитектуры - разные. У Microsoft даже была архитектура neural architecture search. Перформила вполне до трансформеров.

В принципе трансформеры перформят потому attention - он человекоподобен (размечает кто?..). На физических задачах скажем, есть свои ноу-хау, как и в тех же экономических.

Ваша находка так или иначе впечатлила - кодирование архитектуры с некоторыми свойствами. Нет уверенности, однако, что только архитектура достаточна для перфоманса, я об этом.

В продолжение (топологической) мысли - процедуру было бы идеально переложить в теорию узлов и зацеплений, которая различает только количество путей из одной точки в другую. То есть оптимизатор мог бы разветвляться на разные траектории. Это не то чтобы из разряда фантазий, скорее некоторая намётка.

Вкратце: рельеф лосс-функции - результат архитектуры, но ввиду наших слабых вычислительных возможностей, имело бы смысл иметь топологические инварианты именно рельефа функции потерь, и идеально если бы они содержательно вязались бы с инвариантами архитектур

Нейронные сети, графы и эмерджентность

S_A 31 июл 2023 в 01:31

Сходимость зависит не только от архитектуры, но и от процедуры.
Кстати, уверен вам будет интересно ознакомиться с концепцией ограниченной машины Больцмана

3 4 ...

44 45