Comments / Profile of S_A / Habr

How to become an author

Андрей @S_A

User

Profile Publications 15Comments 865Bookmarks 59

Открытое письмо BI компаниям — проект “Dashboard.AI”

S_A Oct 30 2023 at 15:41

Ну... Ничего нового. Посмотрите скажем на visiology. Более того... Дашборд можно составлять (и нужно) из сохраненных запросов.

text2sql простая задача без всяких data science при наличии метаданных к базе (просто появляется sql builder), просто на одних только ближайших или intent+ner.

Хотя направление мысли мне нравится. Если будет open source продукт chat with data, типа visGPT без OpenAI и self-hosted... прямо джва (четыре по факту) года жду

+2

ML-искусство переживать проблемы: как избегать разочарований и находить аналоги товаров в периоды out-of-stock

S_A Aug 13 2023 at 09:25

Можно вам предложить присмотреться к

https://www.marqo.ai/

?

0

Нейронки в финтехе: пока небезопасно и только для простых задач. В общем, ИИ — не Senior, господа, расслабимся…

S_A Aug 10 2023 at 05:55

Я не то чтобы гарантирую... Но в целом разница вот в чем. В одном случае энергию добывают, а во втором расходуют. Первое всегда было сложнее.

Плюсом к электросеньору то, что его работа не умопомрачительно уникальна, ее можно алгоритмизировать и дополнить (техническим) кругозором. Это делают large language models все лучше и лучше.

Научное изобретение, прорыв для цивилизации, алгоритмизировать наверное нельзя

0

Нейронные сети, графы и эмерджентность

S_A Aug 1 2023 at 14:43

У архитектуры конечно же роль больше - потому что процедуры by design решают одну и ту же задачу, а архитектуры - разные. У Microsoft даже была архитектура neural architecture search. Перформила вполне до трансформеров.

В принципе трансформеры перформят потому attention - он человекоподобен (размечает кто?..). На физических задачах скажем, есть свои ноу-хау, как и в тех же экономических.

Ваша находка так или иначе впечатлила - кодирование архитектуры с некоторыми свойствами. Нет уверенности, однако, что только архитектура достаточна для перфоманса, я об этом.

В продолжение (топологической) мысли - процедуру было бы идеально переложить в теорию узлов и зацеплений, которая различает только количество путей из одной точки в другую. То есть оптимизатор мог бы разветвляться на разные траектории. Это не то чтобы из разряда фантазий, скорее некоторая намётка.

Вкратце: рельеф лосс-функции - результат архитектуры, но ввиду наших слабых вычислительных возможностей, имело бы смысл иметь топологические инварианты именно рельефа функции потерь, и идеально если бы они содержательно вязались бы с инвариантами архитектур

+2

Нейронные сети, графы и эмерджентность

S_A Jul 31 2023 at 04:31

Сходимость зависит не только от архитектуры, но и от процедуры.
Кстати, уверен вам будет интересно ознакомиться с концепцией ограниченной машины Больцмана

0

Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами

S_A Jul 10 2023 at 17:48

Unet тут был правильным выбором, заводится с десятков примеров.

С точки зрении теории это потому что каждый пиксель считай пример. С object detection такой номер не пройдет...

+1

Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами

S_A Jul 10 2023 at 17:37

Картинка круть) в принципе для SAM есть FastSAM и MobileSAM вариации.

Задачу с котом конечно они не решат. Тут можно и yolov8-seg приплести бы... А можно и как выше рекомендовали, классификатор контуров какой.

Можно докидывать эвристик ("котлеты в центре", "движется в сцене только кошка" - background subtraction), но понятно, на другой сцене они развалятся.

Лично я бы заряжал конкретно в этой задаче yolov8n-seg, table или/и plate вроде есть в coco (могу ошибаться).

Более абстрактно если подходить... Технически контуры от SAM можно эмбеддить и иметь базу ближайших, считай knn, но в плане инференса это недешево.

0

Применение метода взаимной информации в медицинских задачах классификации многомерных временных рядов

S_A Jul 8 2023 at 10:57

Прочитал с интересом. Как идею могу предложить - посмотреть на dynamic time warping (статистики из него в качестве фич).

+1

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

S_A Jul 5 2023 at 08:53

Чуть дополню себя. Теорема странноватая, а вывод и без нее понятный...

Понятно что один слой с relu даст линейное преобразование практически - из-за bias. То что нелинейность важна - так в этом и суть сеток. Все это про частный случай сеток - которые и появились для нелинейности.

Но сама идея x + sin(x)**2 отличная, есть где поиграться. Я как-нибудь попробую relu(x + alpha * sin(x / alpha)**2). Рассчитываю что докинет, причем в более мелкую сетку.

+1

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

S_A Jul 5 2023 at 07:50

Что-то не очень исправило. Примеры из статьи на тоненького.

Естественно сетки интерполируют, как и все остальные алгоритмы. И брать тощую сетку и делать глобальные выводы... Спорно. К тому же есть два момента

рекуррентные выучивают периодические паттерны, и трансформеры тоже. Кстати они Тьюринг-полные, хотя и на relu, и это важно по мне как. Они выучивают "программу дата генерации",
экстраполяция - это та же интерполяция, только в пространстве без дрейфа. Статья - попытка перейти в это пространство. Не специфицируя его явно. Этим она хороша.
От прочтения вашей статьи тем не менее удовольствие испытал, и обогатился идеями, спасибо

+1

Interpretability versus explainability: Интерпретируемость или объяснимость?

S_A Jul 1 2023 at 18:50

Да нормально написали, если кто варится в теме - не сказать что новое, но заострили внимание хорошо.

Интерпретируемость - это когда дизайн модели позволяет объяснить влияние изменений во входах на изменение выходов. На 1% больше одного из входов - выход меняется на X%. Есть и глобальная (на все данные) и локальная (для сэмпла) интерпретация. Проще говоря - как модель прогнозирует в принципе.

Объяснимость - это когда локально только. BERT выдаст на "я пошел в магазин и купил..." [хлеб] потому что "магазин" и "купил" важны (наиболее влияют на вероятность) в предикте. Локальная интерпретация, причем не полная. То есть объяснение - это что привело модель к прогнозу в конкретном случае.

Всем нужна интерпретируемость, но в случае Страшно Больших Сеток - это как геном расшифровать. Удовлетворяются объяснениями, как тестами из KDL ("на генетическом уровне у этого человека непереносимости глютена нет").

+1

Разбираемся в терминах искусственный интеллект и машинное обучение

S_A Jun 14 2023 at 15:53

У меня в нулевых был цифровой фотоаппарат Sony, который автоматом делал фото, если все лица в кадре улыбались. Магия!

Так вот ИИ - это термин гуманитариев. Для них эти все каскады Хаара, и прости Господи, нейросети, - магия.

Я не доживу до момента когда гуманитарии договорятся о понятии интеллекта-то, что уж об искусственном.

А вот насчет общества и технологий с машинным обучением (которое в принципе та же интерполяция, если повезет немного обобщающая вправо-влево), могу дать прогноз.

Благодаря гуманитариям общество научиться жить с неустранимыми ошибками моделей и примет некоторую неопределённость своих возможностей (в том числе в прогнозировании и управлении) как данность.

А благодаря data scientists, это начнет проникать "в природу" и "в технику": умные фабрики, умные бактерии, умные удобрения или топливо, умные города.

Модели будут создавать нужные реальные объекты, покуда мы - модели.

+2

Распознавание документов на Steam Deck. А нужен ли мне мой ноутбук?

S_A Jun 14 2023 at 15:44

Посмотрите deepdoctection

0

Зачем нужен Руководитель проекта?

S_A May 31 2023 at 13:20

Если проекты не рассматривать в масштабе инвестиционных, то да, так часто бывает

0

Зачем нужен Руководитель проекта?

S_A May 30 2023 at 17:14

Отвечая на поставленный в заголовке вопрос. У компании столько проектов, сколько у неё руководителей проектов. ну там на константу может помножить.

+1

Математическое моделирование в ORtools: задача планирования расписаний

S_A May 17 2023 at 16:21

Feasible - это допустимое решение. Хорошо поставленная задача должна давать решению статус optimal.

Ну и с нэймингом стоит поработать... А в целом хорошо что вытащили на свет ortools - так-то годный очень пакет.

+2

Производная с вещественным показателем

S_A May 10 2023 at 07:10

Дробное дифференцирование (необязательно по базису синусов-косинусов, но это отдельный вопрос) бывает полезно в анализе временных рядов: у нулевой производной много памяти по истории, а у первой - (бывает) предсказуемое поведение.

Что-то посередине может организовать пакет (python) fracdiff. Даже степень подбирать умеет.

+6

Давно у меня вызревает план написания своего личного AI...

S_A Apr 28 2023 at 16:26

Для быстрой расширяемости берите zero shot classification модели с huggingface. joeddav/xlm-roberta-large-xnli например.

В принципе, chat gpt тут не вижу что нужен. И для русского языка (речь в текст) весьма недурно работает vosk.

+1

Учим нейросеть принимать решения на основе уже известного опыта (на примере Шахмат и загруженного датасета)

S_A Mar 14 2023 at 03:39

Кстати, еще такая мысль. Если сетка была бы рекуррентной, или трансформер с positional encoding, они Тьюринг полные, то при хорошем качестве прогнозов, на уровне человека или лучше, можно было бы свидетельствовать в пользу Тезиса Черча (о том что интуитивно вычислимые функции частично рекурсивны, то есть решаются машиной Тьюринга). В классе стратегических задач

+1

Учим нейросеть принимать решения на основе уже известного опыта (на примере Шахмат и загруженного датасета)

S_A Mar 13 2023 at 17:16

Идея отличная сама по себе. Сетку помощнее бы, и датасет.

Идея нравится тем, что сеть имплицитно в своих весах находит и вес фигур, и вес конкретных ситуаций. Первый слой мог бы быть embeddings layer технически.

Мы же конечно знаем, что шахматы имеют конечное дерево игры, но тут важно что его можно приблизительно экстраполировать до финала.

Без всяких reinforcement learning.

+1

1

2 3 ...