Комментарии / Профиль S

Андрей @S_A

modelize.ru

Профиль Публикации 15Комментарии 869Закладки 61

Топология в нейросетях?

S_A 18 окт в 16:09

Очень интересно про tda для весов сети, так как сам экспериментировал недавно с этим, дошел до идеи сам.

А у вас ничего кроме идеи и не нашел.

Посмотреть

ResNet-18: ищем динозавров или упражнения с векторами

S_A 24 июл в 12:10

Попробуйте вложения от dinov2, будете приятно удивлены. Без шуток

Посмотреть

Как справиться с нехваткой открытых данных для обучения и тестирования ML-моделей

S_A 4 июл в 04:21

Это очень здорово! А есть в формате статьи? Интересны детали, как кластеризовали, как на сферу укладывали, как обратно разворачивали. И как графы в этом поучаствовали.

Вообще я для подобного использовал всегда VAE. Но тут похоже вы придумали что-то лучше

Посмотреть

strtree — классификатор строк на основе регулярных выражений

S_A 26 июн в 09:56

Идея крутая. В кода примера есть две ошибки, strtree.StringTree, и recall_score наверное должно быть.

Посмотреть

Открытое письмо BI компаниям — проект “Dashboard.AI”

S_A 30 окт 2023 в 15:41

Ну... Ничего нового. Посмотрите скажем на visiology. Более того... Дашборд можно составлять (и нужно) из сохраненных запросов.

text2sql простая задача без всяких data science при наличии метаданных к базе (просто появляется sql builder), просто на одних только ближайших или intent+ner.

Хотя направление мысли мне нравится. Если будет open source продукт chat with data, типа visGPT без OpenAI и self-hosted... прямо джва (четыре по факту) года жду

Посмотреть

ML-искусство переживать проблемы: как избегать разочарований и находить аналоги товаров в периоды out-of-stock

S_A 13 авг 2023 в 09:25

Можно вам предложить присмотреться к

https://www.marqo.ai/

Посмотреть

Нейронки в финтехе: пока небезопасно и только для простых задач. В общем, ИИ — не Senior, господа, расслабимся…

S_A 10 авг 2023 в 05:55

Я не то чтобы гарантирую... Но в целом разница вот в чем. В одном случае энергию добывают, а во втором расходуют. Первое всегда было сложнее.

Плюсом к электросеньору то, что его работа не умопомрачительно уникальна, ее можно алгоритмизировать и дополнить (техническим) кругозором. Это делают large language models все лучше и лучше.

Научное изобретение, прорыв для цивилизации, алгоритмизировать наверное нельзя

Посмотреть

Нейронные сети, графы и эмерджентность

S_A 1 авг 2023 в 14:43

У архитектуры конечно же роль больше - потому что процедуры by design решают одну и ту же задачу, а архитектуры - разные. У Microsoft даже была архитектура neural architecture search. Перформила вполне до трансформеров.

В принципе трансформеры перформят потому attention - он человекоподобен (размечает кто?..). На физических задачах скажем, есть свои ноу-хау, как и в тех же экономических.

Ваша находка так или иначе впечатлила - кодирование архитектуры с некоторыми свойствами. Нет уверенности, однако, что только архитектура достаточна для перфоманса, я об этом.

В продолжение (топологической) мысли - процедуру было бы идеально переложить в теорию узлов и зацеплений, которая различает только количество путей из одной точки в другую. То есть оптимизатор мог бы разветвляться на разные траектории. Это не то чтобы из разряда фантазий, скорее некоторая намётка.

Вкратце: рельеф лосс-функции - результат архитектуры, но ввиду наших слабых вычислительных возможностей, имело бы смысл иметь топологические инварианты именно рельефа функции потерь, и идеально если бы они содержательно вязались бы с инвариантами архитектур

Посмотреть

Нейронные сети, графы и эмерджентность

S_A 31 июл 2023 в 04:31

Сходимость зависит не только от архитектуры, но и от процедуры.
Кстати, уверен вам будет интересно ознакомиться с концепцией ограниченной машины Больцмана

Посмотреть

Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами

S_A 10 июл 2023 в 17:48

Unet тут был правильным выбором, заводится с десятков примеров.

С точки зрении теории это потому что каждый пиксель считай пример. С object detection такой номер не пройдет...

Посмотреть

Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами

S_A 10 июл 2023 в 17:37

Картинка круть) в принципе для SAM есть FastSAM и MobileSAM вариации.

Задачу с котом конечно они не решат. Тут можно и yolov8-seg приплести бы... А можно и как выше рекомендовали, классификатор контуров какой.

Можно докидывать эвристик ("котлеты в центре", "движется в сцене только кошка" - background subtraction), но понятно, на другой сцене они развалятся.

Лично я бы заряжал конкретно в этой задаче yolov8n-seg, table или/и plate вроде есть в coco (могу ошибаться).

Более абстрактно если подходить... Технически контуры от SAM можно эмбеддить и иметь базу ближайших, считай knn, но в плане инференса это недешево.

Посмотреть

Применение метода взаимной информации в медицинских задачах классификации многомерных временных рядов

S_A 8 июл 2023 в 10:57

Прочитал с интересом. Как идею могу предложить - посмотреть на dynamic time warping (статистики из него в качестве фич).

Посмотреть

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

S_A 5 июл 2023 в 08:53

Чуть дополню себя. Теорема странноватая, а вывод и без нее понятный...

Понятно что один слой с relu даст линейное преобразование практически - из-за bias. То что нелинейность важна - так в этом и суть сеток. Все это про частный случай сеток - которые и появились для нелинейности.

Но сама идея x + sin(x)**2 отличная, есть где поиграться. Я как-нибудь попробую relu(x + alpha * sin(x / alpha)**2). Рассчитываю что докинет, причем в более мелкую сетку.

Посмотреть

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

S_A 5 июл 2023 в 07:50

Что-то не очень исправило. Примеры из статьи на тоненького.

Естественно сетки интерполируют, как и все остальные алгоритмы. И брать тощую сетку и делать глобальные выводы... Спорно. К тому же есть два момента

рекуррентные выучивают периодические паттерны, и трансформеры тоже. Кстати они Тьюринг-полные, хотя и на relu, и это важно по мне как. Они выучивают "программу дата генерации",
экстраполяция - это та же интерполяция, только в пространстве без дрейфа. Статья - попытка перейти в это пространство. Не специфицируя его явно. Этим она хороша.
От прочтения вашей статьи тем не менее удовольствие испытал, и обогатился идеями, спасибо

Посмотреть

Interpretability versus explainability: Интерпретируемость или объяснимость?

S_A 1 июл 2023 в 18:50

Да нормально написали, если кто варится в теме - не сказать что новое, но заострили внимание хорошо.

Интерпретируемость - это когда дизайн модели позволяет объяснить влияние изменений во входах на изменение выходов. На 1% больше одного из входов - выход меняется на X%. Есть и глобальная (на все данные) и локальная (для сэмпла) интерпретация. Проще говоря - как модель прогнозирует в принципе.

Объяснимость - это когда локально только. BERT выдаст на "я пошел в магазин и купил..." [хлеб] потому что "магазин" и "купил" важны (наиболее влияют на вероятность) в предикте. Локальная интерпретация, причем не полная. То есть объяснение - это что привело модель к прогнозу в конкретном случае.

Всем нужна интерпретируемость, но в случае Страшно Больших Сеток - это как геном расшифровать. Удовлетворяются объяснениями, как тестами из KDL ("на генетическом уровне у этого человека непереносимости глютена нет").

Посмотреть

Разбираемся в терминах искусственный интеллект и машинное обучение

S_A 14 июн 2023 в 15:53

У меня в нулевых был цифровой фотоаппарат Sony, который автоматом делал фото, если все лица в кадре улыбались. Магия!

Так вот ИИ - это термин гуманитариев. Для них эти все каскады Хаара, и прости Господи, нейросети, - магия.

Я не доживу до момента когда гуманитарии договорятся о понятии интеллекта-то, что уж об искусственном.

А вот насчет общества и технологий с машинным обучением (которое в принципе та же интерполяция, если повезет немного обобщающая вправо-влево), могу дать прогноз.

Благодаря гуманитариям общество научиться жить с неустранимыми ошибками моделей и примет некоторую неопределённость своих возможностей (в том числе в прогнозировании и управлении) как данность.

А благодаря data scientists, это начнет проникать "в природу" и "в технику": умные фабрики, умные бактерии, умные удобрения или топливо, умные города.

Модели будут создавать нужные реальные объекты, покуда мы - модели.

Посмотреть

Распознавание документов на Steam Deck. А нужен ли мне мой ноутбук?

S_A 14 июн 2023 в 15:44

Посмотрите deepdoctection

Посмотреть

Зачем нужен Руководитель проекта?

S_A 31 мая 2023 в 13:20

Если проекты не рассматривать в масштабе инвестиционных, то да, так часто бывает

Посмотреть

Зачем нужен Руководитель проекта?

S_A 30 мая 2023 в 17:14