Как стать автором
Обновить

Уроки проектирования. Предметная область и ее математические модели

Время на прочтение 26 мин
Количество просмотров 11K
“Многого можно добиться добрым словом. Но гораздо большего можно добиться добрым словом и пистолетом”( Аль Капоне). “Но иногда помогает только пистолет”( не Аль Капоне).

Чтобы не быть обвиненным в пропаганде вооруженного бандитизма, сразу поясню, что под пистолетом здесь понимается математическая модель предметной области. Поэтому афоризм трансформируется в “Многого можно добиться словами. Но гораздо большего можно добиться словами и математикой. А иногда помогает только математика”. Теряется острота, но правда ведь остается.

История одного проекта


«Это было недавно, это было давно»

Начинающим программистом я устроился в ВЦ банка и столкнулся со знаменитой, по тем временам, задачей “Операционный день банка”. Фактически это бухучет, который обязательно должен завершиться выдачей правильных бухгалтерских регистров к концу дня. Говоря более высоким стилем, это система реального времени с квантом реальности в одни сутки.Начинаю знакомиться с предметной областью. Иду в отдел постановок, в котором сидят женщины выпускницы института народного хозяйства – нархоза. Пытаюсь выяснить, что такое дебет и кредит. У каждой дамы свое мнение. Одно из них такое: мне показывают какой-то первичный документ, со структурой “самолетик” – так мне это назвали. Голова самолетика – входящее сальдо счета, левое крыло – это дебет, правое — кредит, хвост — исходящее сальдо. Я впал в ступор от таких объяснений. Пошел в библиотеку и после нескольких сумбурных книг типа “Учет и операционная техника в банках ” наткнулся на книгу “Теория бухгалтерского учета”. Автор – Палий. Он дал полуфилософское изложение учета, начиная от Луки Паччоли. Мне изложение весьма понравилось и я кое-что узнал о бухучете. Меня поразило, что о таких приземленных вещах как бухучет, можно говорить чуть ли не философски.

Потом, долго работая в ВЦ банка, участвуя во многих предпроектных обследованиях я пришел к выводу, что от конечных пользователей проку мало и что нужно крутиться самому, рыться в библиотеках(интернета еще не было) и самому определять, что пользователю надо и потом его убеждать в этом. Хотя до последнего я не дотягивал. Работаю я с таким представлением о пользователях и вдруг такой случай. Банкир, довольно высокого ранга, выходит в наш ВЦ со своей постановкой по обработке показателей всех строек БССР — постановка ТЭПС(Технико-Экономические Показатели Строек). Постановка сверхсложная с лесом математических формул в которых так и мелькают трехэтажные индексы. Мой шеф с ней не разобрался и положил её под сукно. И тут меняется руководство ВЦ. Моего шефа, подсуконника, увольняют. Новый начальник ВЦ сразу обратился к упомянутой постановке. Несколько месяцев изучаем постановку и, оказывается, что все можно представить в понятном виде и без леса трехэтажных формул. Но для внедрения нужен, как теперь говорят, реинжиниринг бизнеса. У нас он свелся к тому, что появились новые входные документы, новая бизнес-операция по заполнению этих документов, операция-запрос к БД, анализ полученных результатов. Для двух последних выделялись из штата бизнес-аналитики. Существующие формы документов(план финансирования, смета, титульный список и т.д.) были не только не машиночитаемы, но и человеку вводить с них данные в компьютер было сверхнеудобно, поэтому мы предложили ввести новые, промежуточные формы документов, с которых было удобно вводить данные. Но эти новые документы нужно было заполнять со старых. Со всеми требуемыми нововведениями выходим на руководство.

Руководство банком ознакомилось с ними, согласилось с ними, придало им законность приказом по банку и работа закипела. Внизу в филиалах и отделениях нас все проклинали за огромную дополнительную работу по заполнению входных документов. Дело в том, что низ делал черновую работу по заполнению входных документов, а результатами обработки этих данных не пользовались: компьютер стоял в столице в ВЦ головного аппарата. Вот этот аппарат и занимался аналитикой, сам не занимаясь подготовкой данных.

Проект естественным образом распался на три части:

  1. Ведение базы данных паспортов строек
  2. Ведение базы знаний
  3. Прием запросов и генерация ответа на запрос

Я отвечал за базу знаний. Так как она реализовывалась на последовательных файлах и непрерывно обновлялась, то главной программой обновления была программа корректировки последовательного файла. Я не стал заморачиваться и взял алгоритм из книги “Дисциплина программирования” Дейкстры.

Работали напряженно, но без авралов, без ночных смен, без работы в выходные. Не распивали ни чая ни кофе. Это еще не входило в традицию. К тому же кофе был дефицитом. Да и более-менее приличный чай тоже. Мы были молодые и крепкие. Но босс один раз сломался и с сердечным приступом попал в больницу. А мы немного отдохнули и подтянули “хвосты”. Но босс вызывал нас и в больницу по поводу “Как дела?”.

Программировали на ассемблере. И я не уверен, что на языке высокого уровня было бы быстрее. Создали свой отладчик и начали кодировать и отлаживать. Никаких фреймворков, никаких библиотек. Библиотеки создавали сами. Они были не универсальны, а заточены под проект. Менее чем через год проект заработал. База – файловая БД. Она состоит из базы данных(файлы прямого доступа) и базы знаний(файлы последовательного доступа). База знаний – это формулы расчета показателей, описания всевозможных выборок-фильтров и описание всевозможных группировок выходных данных. Выборки реализовывались как логические функции. Группировки реализовывались как деревья, каждый узел которого связывался с определенной выборкой и определенной функцией агрегации. Все это непрерывно изменялось, пополнялось самими пользователями или с нашей помощью. Автоматизируемая бизнес-функция – генерация динамических аналитических отчетов по задаваемым показателям, фильтрам и группировкам. И вот проект сдали в эксплуатацию. И понеслось. Машина только и штампует отчеты(АЦПУ печатало не посимвольно, а построчно). Были и 100-страничные и больше. Аналитик что-то выискивал в них, вместо того, чтобы поиск доверить машине. А все потому, что онлайн-доступ проект не предоставлял. Не было еще такой возможности. Хотя и теперь, при возможности в любое время задать онлайновый запрос к БД, остались многостраничные отчеты. И используются генераторы отчетов, как инструмент такой штамповки. Я не понимаю зачем они нужны.

А кончилось дело тем, что и постановщика и нашего босса — начальника нашего ВЦ(он руководил проектом) забрали в Москву. Босс и постановщик поучаствовали в разделе госпремии. Мы, разработчики не получили деньгами ничего, но многому научились на проекте. Босс стал еще большим боссом – он возглавил ГВЦ союзного банка. Он стал проталкивать аналогичный проект для всего Союза, но уже с учетом наших проколов. Однако грянули перемены, Промстройбанк уже не занимался стройками, а стал обычным коммерческим банком и проект ТЭПС стал Промстройбанку не нужен.

А постановщик возглавил в перестройку некий Московский банк и в наши командировки в Москву рассказывал перестроечные детективы: как на него наезжала мафия, если он не давал кредиты: угрозы, поджоги, автоаварии. Но это, как говорится, уже совсем другая история.

Проект мы реализовывали по старинке: обследование предметной области --> ТЗ --> постановка --> проект БД --> архитектура ПО --> кодирование --> отладка --> внедрение. Интересно, что мы ни разу не возвращались ни к постановке, ни к проекту БД, ни к архитектуре ПО. Всё как спроектировали так оно и работало.

Слабое место обнаружилось не в кодах, не в БД, а в алгоритме. Недостаточность знаний не позволило нам построить универсальный интерпретатор выражений. И это привело к тому, что проект вышел на вторую реализацию — московскую.

И еще один промах, на мой взгляд. Но с этим не согласился босс. У нас показатель кодировался по такому шаблону: ддссгг, где дд – код документа, сс – строка документа, гг – графа документа. А сам документ представлял собой прямоугольную сетку, в каждой ячейке которого был проставлен код показателя в правом верхнем углу ячейки. Вот пример формулы вычисления производного показателя:

$(100102)=[(101120)-(050203)/(022212)]$



Понятно, что это не способствует ни запоминанию, ни осмыслению, и не представляет основы для расширения знаний. Короче, явно не виден экономический смысл.

Мне казалось разумным ввести мнемонические коды. И тогда вышеприведенная формула приняла бы примерно такой вид:

$margin\%=[\%In-\%Out]/Asset$


Но над этим нужно было много поработать и убеждать и руководителя и пользователей-банкиров. Они в то время боялись математики как огня. Не знаю как сейчас.

Итак, главные недочеты имели алгоритмический и психологический, точнее эргономический характер. Архитектура ПО, структура БД, кодирование остались неизменными.

Уроки разработки


Я не знаю, будет ли толк из этих уроков для современных айтишников. Больно далеко уж разошлись дороги айтишников тогда и теперь. Это просто выводы на то время.

Первородный хаос

Пользователи редко отчетливо представляют, что им нужно. А если представляют, то в сильно завуалированном виде, который нужно еще перелопачивать, трансформировать, фильтровать. Изначально хаос и в голове айтишника. А нужно выделить порядок, отбросить фантазии, структурировать возможное и представить результат понятным и убедительным образом. Иначе говоря, из хаоса нужно выделить реалистичную систему.

Первое лицо

Успех проекта зависит от первого лица заказчика. Это один из постулатов Глушкова – классика советской кибернетики. Без непосредственного участия первого лица заказчика проект не был бы реализован.

Воля руководителя

Успех разработки обеспечивает не столько интеллект, сколько воля руководителя проекта. Иногда он должен сказать, как Королев: “Луна твердая”, и прекратить бесконечные дебаты.

Компетентность

Компетентность идет следом за волей. Здесь проколы также имеют тяжелые последствия. Например, наш дилетантизм не позволил единым образом запрограммировать любую арифметико-строко-логическую функцию над показателями строек. И только когда мы узнали об обратной польской записи, мы поняли свой прокол.

Технология разработки

Составные технологического успеха: компетентность, дисциплина, жесткий контроль руководителя, здравый смысл в руководстве и проектировании, фиксация проектных решений и строгое следование им. Никаких жестких формальных рамок каких-либо технологий управления. Мы поневоле придерживались будущего принципа Agile принимать все требования банка – нашего заказчика. Иначе и не могло быть, так как ВЦ был на содержании банка и попробуй откажись. Однако радикальных перемен, инициируемых заказчиком, не было.

По поводу контрольных совещаний я вспоминаю максиму “Cобирая информацию, не проводи совещаний, проводя совещание, не собирай информации”. Один мой босс этим и руководствовался, а второй ровно наоборот.

На совещаниях нужен индивидуальный подход к участникам. Есть олимпиадники, которые быстро схватывают и быстро предлагают решение. Есть антиолимпиадники, которым нужно время на раскачку и время на принятие решения. И это решение может быть и лучше решения олимпиадника. Я, к примеру, никогда не преуспевал на очных олимпиадах, но вполне прилично выступал на заочных. Среди крупных математиков были и олимпиадники и нет, и кого из них больше я не знаю.

Мировоззрение

Я понял, что на успех проекта влияет не только (а может и не столько) инструментарий, но и широта общего мировоззрения айтишника. Не имея представления о нейроне, не выдумаешь нейронную сеть. Не имея представления о генетике и естественном отборе, не выдумаешь генетический алгоритм. Можно не знать деталей, но поле мышления должно охватывать крупными мазками такие понятия: рекурсия, подпрограмма, сопрограмма, граф, дерево, список, стек, сортировка, паттерн, БД, функция, композиция и декомпозиция функций… Главное — такое мировоззрение должно охватывать предметную область.

Язык программирования

От языка программирования далеко не все зависит. Я, кстати, программировал и на Коболе, и на ассемблере (IBM), и на PL/1, и на С, и на Delphi, и на Prologe, и на C# и к своему стыду никогда детально не знал языка, а всегда держал под рукой какой-нибудь учебник(поэтому я не прошел бы сегодня собеседование ни в одну солидную фирму). Это, видимо, замедляло разработку, но зато не обременяло мой ум деталями, оставляя свободное пространство для более широких понятий. Достаточно было того, что я когда-то нагрузил его знанием IBM DOS, а потом нагрянула IBM OS и все мои знания пошли коту под хвост. А как знать PL/1, где целый том был посвящен ошибкам при преобразовании данных? Нужно иметь широкое представление о стратегических вещах. Надо уметь анализировать предметную область, уметь построить удобную реалистичную модель, знать какие есть алгоритмы, построить удобную архитектуру ПО. А язык? — Есть коряво пишущие знатоки русского языка и есть не совсем грамотные хорошие писатели. Самое замечательное знание языка программирования не обеспечивает хорошего программирования.

Шедевры есть на хинди, на греческом, на арамейском, на французском…Можно, конечно, вести бесконечные дебаты о скобках, комментариях, константах, паттернах, зацепленности и расцепленности, подмечать локальные огрехи, а глобальный продукт написать никуда не годный.

Есть еще неформализуемый здравый смысл, который еще нужен в ИТ. Мне встречался разработчик, который детально знал SQL и очень умно рассуждал о нем, но запросы к БД писал ужас, что такое. Локальные отличные знания инструмента и глобальная гармония проекта находятся, по-видимому, на разных полюсах интеллекта. И ещё, я не верю, что полуграмотный в родном языке, способен написать грамотный “роман” на языке программирования. Рассказик – может быть, роман – нет. Я помню в каким нетерпением ждал появления Алгол-68: он позиционировался как язык поэтов программирования. Но не дождался.

А вот что написал Дейкстра о языке программирования в своей книге “Дисциплина программирования”: “Когда начинаешь писать подобную книгу, сразу возникает проблема: каким языком программирования пользоваться? И это не только вопрос представления! Наиболее важным, но в то же время и наиболее незаметным свойством любого инструмента является его влияние на формирование привычек людей, которые имеют обыкновение им пользоваться. Когда этот инструмент — язык программирования, его влияние, независимо от нашего желания, сказывается на нашем способе мышления. Проанализировав в свете этого влияния все известные мне языки программирования, я пришел к выводу, что ни они сами, ни их подмножества не подходят для моих целей. С другой стороны, я считал себя настолько не подготовленным к созданию нового языка программирования, что дал зарок не заниматься этим в ближайшее пятилетие, и я твердо знаю, что этот срок еще не вышел. (Прежде, помимо всего прочего, мне нужно было написать эту монографию.) Я попытался выбраться из этого тупика, создав лишь подходящий для моих целей мини-язык и включив в него только те элементы, которые представляются совершенно необходимыми и достаточно обоснованными»

Системный подход

Он требует не забывать о соседних системах и надсистеме. И, значит, нужно прогнозировать расширение и реализовывать заготовки впрок, так чтобы не пришлось радикально менять проект при его расширении. Заготовки впрок противоречит принципу “не делай ничего впрок”. Именно и делай впрок, если работаешь не на дядю, а на себя.

Мотивация

У рядового разработчика была ничтожная денежная мотивация. Пусть ты в 10 раз производительнее коллеги, а получать будешь на 10% больше его. Поэтому мало кто читал что-то кроме системной документации, а многие и этого не читали, а все приставали с вопросами к знающим. Правда, документации хватало – письменный стол можно было завалить ряда в три книжками документации по матобеспечению ЕС ЭВМ. Но были люди и увлеченные. В том числе и я. Помню до сих пор какое впечатление на меня, дилетанта в программировании, произвели в техническом плане книги “Вычислительные структуры” Холла, первый том Кнута, “Систематическое программирование” Вирта и еще некоторые. А в идейном плане — “Дисциплина программирования” Дейкстры и “Наука программирования” Гриса.

Границы

Границы моего языка означают границы моего мира“(Витгенштейн). Под языком человека я понимаю всю его понятийно-вербальную линейку (поле мышления)от мировоззрения до формального языка. Вот эта линейка: мировоззрение -->родной язык -->сфера широкой компетентности(науки) -->сфера узкой компетентности(специализация) --> математика --> модели --> информатика --> язык программирования. Спускаясь по этой шкале мы увеличиваем точность и ясность, но теряем в широте семантики и метафоричности представлений. Это дополнительные вещи.


Примеры применения сфер поля мышления айтишника:

Язык программирования. Здесь доминирует формальный подход. Это строгий синтаксис, это фиксированные программные конструкты: выбор, присваивание, циклы, селекторы, итераторы, интерфейсы, объекты, методы. Этот готовые решения в виде библиотек, это заготовки типа “делай как я” – паттерны. Здесь процветает сленг. Но, в поисках вдохновения, программирование требует “заскоков” в вышестоящие слои поля мышления, откуда черпаются идеи. А язык программирования диктует только форму, в которой предстанут эти идеи.
Желательно иметь представление об ассемблере, императивном языке, логическом языке, функциональном языке, SQL, NoSQL. Из процедурных языков я программировал на ассемблере, PL/1, Delphi, C#. Из логических — Prolog. SQL само-собой разумеется. Из функциональных ни одного, хотя я и пришел в ИТ из точных наук и, казалось бы, они должны были заинтересовать меня. И я хоть и стар, мне стало стыдно и я загорелся желанием попробовать или Haskell или F#. А может Idris, о котором я в первый раз услышал в Как развернуть односвязный список на собеседовании. Меня очень впечатлили леммы и теоремы в этой статье.

Информатика. Это теоретические основы для языков программирования. Это узкое мировоззрение айтишника. Понятийные островки: cинтаксис, прагматика, формальные языки, алгоритмы, машина Тьюринга, вычислительные структуры.

Модели. К ним относятся схемы БД, модели UML, модели SADT, HTML, CSS, TCP/IP, семиуровневая модель OSI, формализм Бэкуса-Наура, регулярные выражения.

Математика. Она предоставляет аппарат для точного знания и снабжает универсальными средствами: отношения, множества, функции, формулы, уравнения. Это язык точного рассуждения. Но она представляет не только аппарат для решения задач, но и может прямо влиять на язык программирования. Пример — Haskell и теория категорий в математике. Это весьма привлекательная идея слить статичный язык математики с языком программирования.

Специальное образование. Для меня, например, это – физика. Для кого-то математика. Для профессионала – информатика. А иногда и экономика, менеджмент.

Общее образование. Знакомство с генами и теория естественного отбора естественно приводит к понятию генетического алгоритма. Знакомство с нейрофизиологией мозга приводит к понятию нейронной сети.

Родной язык. Синтаксис обычного языка наводит на мысль о синтаксисе языка программирования. Привычки родного языка влияют на алгоритмическое мышление. Пример приводит Дейкстра в своей книге ”Дисциплина программирования ”, где он отметил различие семитов и несемитов в подходе начинать слева-направо или наоборот. Меня удивляет как мало внимания писатели уделяют внимания синтаксису и обсуждению на каком языке лучше писать. Писатели не жалуются, что синтаксис мешает им творить шедевры, а пишут на английском, немецком, русском… Я встретил только у Набокова (“Дальние берега”) сравнительные рассуждения о писательстве на английском и русском. А немецкий не оставил у него никакого впечатления. Но это Набоков.

А вот программистов, в отличие от писателей, часто заносит в синтаксис и начинаются дебаты об отступах, скобках, дилемма “имена с подчёркиванием или имена стиля CamelCase” и т.п.
Засилие американизмов в жаргоне программистов – это может быть неявное желание расширить поле мышления? Читая на Хабре статьи некоторых современных программистов, я начинаю комплексовать: поминутно лезу в Википедию, чтобы понять сленг. Ну это уже мои проблемы.
Я с грустью замечаю, что русский язык становится от американизмов такой же “трасянкой”, как мой родной белорусский язык стал “трасянкой” от русизмов.

Меня очень поразила фраза Толстого "Если допустить, что жизнь человеческая может управляться разумом, — то уничтожится возможность жизни "(«Война и мир», т.4, Эпилог). Похоже, что это надо очень и очень иметь ввиду политикам. А как это перекликается с квантовой механикой, где подсматривание за процессом, радикально нарушает его течение! А может это аукнется и в программировании, при попытках построить разумных роботов, контролируемых человеком или программой.

Мировоззрение. Это сфера невербального мышления и вербально-философского мышления. Исходя из философии бихевиоризма мы можем сказать: если что-то ведет себя как человек, то это человек. Главное отличие человека от животных — осмысленная речь. Из такого бихевиористического подхода родился тест Тьюринга. Проблема искусственного интеллекта также порождается мировоззрением из размышлений о разуме, интеллекте. Лингвистическая философия с её акцентацией на языки и роль слов ведет к формальным языкам. Герменевтика ставит проблему истолкования текстов программ. И, кто знает, может быть знание идей Кассирера в его труде «Философия символических форм» откликнется и в программировании, или может быть феноменология Гуссерля повлияет на феноменологию программирования. Мне кажется миры программ сильно повлияют на философию, и она станет более конструктивной, обретя в мире программ инструменты проверки своих концепций. И тогда будет явным и обратное влияние.
В формальных языках синтаксис сливается с семантикой слов. А в мировоззрении вообще нет никакого синтаксиса. Неспособность мыслить метафорично (уровень родного языка) лишает наши тексты литературности. Где в программировании эссе, рассказы, повести, романы, стихи и поэмы? Где герменевтика текстов программ? Для меня образец метафоричности в программировании – Дейкстра с его книгой “Дисциплина программирования”. Итак, возможно новыми конструктивными понятиями должны выступить метафоричность, литературность, герменевтика… И тут, я понял, что “Остапа понесло”. Да, я увлекся и, похоже, нарушил другую максиму Витгенштейна: “То, что вообще может быть сказано, должно быть сказано ясно; о том же, что сказать невозможно, следует молчать“.

Математизация


Сначала приведу цитату из Арнольда: “Слово «математика» означает «точное знание». Варварские народы, не склонные к таковому, не имели и соответствующего слова в языке, поэтому сейчас почти во всех языках используется непонятный греческий термин. Исключение составляет лишь голландский язык, где Стевин уже в XVII в. боролся с засорением терминологии иноязычными «сайтами» и «файлами», «баксами» и «киллерами», и настаивал на переводе всех терминов словами родного языка, так что их термин—«вискунде», «знание», приближает уже для детей математику к реальному миру”.

Не потому ли так высок уровень физики, математики, информатики в маленькой Голландии, которая по нобелевским лауреатам обходит Россию, не говоря уже о моей Беларуси, которая по населению сравнима с Голландией, а по территории больше. А может по той же причине и футбол там отличный?

Под математикой я понимаю не только формульное представление. Главное — точные начальные понятия и строгие выводы. Так таблицы БД я понимаю как функции, заданные таблично. Ключ в таблицах – гарантия однозначности функции, нормализация – выделение самых базисных функций из композиции которых можно составлять более сложные (например, view БД).

В связи с математизацией я попробовал в проектах вести понятие внешней и внутренней постановки. Внешняя – для пользователя в терминах предметной области. Внутренняя — для ИТ-шников в терминах информатики и математики. Внутренняя представляет точную трансляцию внешней. Это трансляция представлений пользователя в представления проектировщика и он легко мог переходить к техническому проектированию. Тем самым проектировщик освобождался от детального знания предметной области, а мыслил уже в родных терминах. Но это нововведение было многими встречено в штыки и не прижилось.

Когда я понял важность постановки и её моделирования, я во избежание двусмысленностей всегда старался сделать и математическую модель задачи. А вот в проекте ТЭПС мы узнали на вербальном уровне, что такое конструктивная математическая формула, но не представили ее в формализме Бэкуса-Наура и тем-самым лишились возможности написать универсальный интерпретатор формул.

Исходя из важности математического представления, я приведу далее несколько математических моделей.

Математическая модель бухучета


Модель эта была составлена постфактум для собственного удовольствия, а не для проекта.

Структурные элементы бухучета


В бухучете учитываются деньги. Деньги всегда появляются из неких источников и размещаются в некие стоки. Они не должны теряться (потеря — это некий неизвестный сток). Даже если украдены, то нужно ввести сток Кража, или, что менее криминально, сток Потери. Источники и стоки это одни и те же средства, только видимые с разных сторон. Именно поэтому всегда общий размер всех источников денежных средств = общему размеру всех стоков средств (=размещений средств):

$I(t)=R(t)$


Это баланс источников и стоков. Это справедливо для любого момента времени. Значит для любого ∆t:

$I(t+∆t)=R(t+∆t)$


Из двух последних соотношений следует

$∆I(t,∆t)=∆R(t,∆t)$


Это баланс изменений.
Каждый объект учета может увеличиваться (Uv) или уменьшаться (Um).
Для источников:

$I(t+∆t)=I(t)+∆I(t,t+∆t)$


$∆I(t,t+∆t)=UvI(t,t+∆t)-UmI(t,t+∆t)$


Аналогично для стоков:

$∆R(t,t+∆t)=UvR(t,t+∆t)-UmR(t,t+∆t)$


Баланс изменений примет вид

$UvI(t,t+∆t)-UmI(t,t+∆t)= UvR(t,t+∆t)-UmR(t,t+∆t)$


или

$UvI(t,t+∆t)+ UmR(t,t+∆t)= UvR(t,t+∆t)+UmI(t,t+∆t)$


Договорились говорить об уменьшении источников как о дебете(Dt), а об увеличении как о кредите(Kt).

Для стоков, наоборот: уменьшение – кредит(Kt), увеличение – дебет(Dt). И это логично в силу антиподности источников и стоков.
Тогда

$DtI(t,t+∆t)+DtR(t,t+∆t)= KtI(t,t+∆t)+KtR(t,t+∆t)$


Или просто

$Dt(t,t+∆t)=Kt(t,t+∆t)$


Это баланс дебета и кредита.

Счет


Счета, учитывающие источники называются пассивными, а их общий размер называется пассивом. Обозначим его как $П(t)$.

Счета учитывающие стоки называются активными, а их общий размер называется активом. Обозначим его как $A(t)$.

Дебет, кредит, сальдо


Размер учитываемого на счете объекта – сальдо S.

$S(t+dt)=S(t)+Uv(t,t+dt)-Um(t,t+dt)$


Для счета пассивов:

$S(t+dt)=S(t)-Dt(t,t+dt)+Kt(t,t+dt)$


Для счета активов:

$S(t+dt)=S(t)+Dt(t,t+dt)-Kt(t,t+dt)$



Капитал и основные уравнения бизнеса


Среди счетов актива можно выделить счета на которых учитываются требования фирмы – средства которые мы вправе когда-либо затребовать вернуть. Это выданная ссуда, например. Это деньги в кассе. А вот счет Расходы к требованиям не относится. Дальше, среди счетов пассива можно выделить счета на которых учитываются обязательства фирмы – средства которые мы должны когда-нибудь вернуть. Это полученная ссуда, например. А вот счет Доходы к обязательствам не относится. Обязательства – заемные средства. Но у фирмы есть и собственные средства – капитал фирмы. Размещая заемные средства и собственные средства мы трансформируем их в требования. Это и есть текущая функция бизнеса в абстрактном выражении.

Среди счетов актива можно выделить счета на которых учитываются размещения средств фирмы – средства которые мы куда-то направили с целью получения прибыли. Требования входят в размещения.

Среди счетов пассива можно выделить счета на которых учитываются привлечения бизнесом средств от стороннего бизнеса. Это полученные ссуды – средства которые мы куда-то направили с целью получения прибыли. Обязательства входят в привлечения.

$Размещения(t) =Капитал(t) + Привлечения(t). $


Или более привычно:

$ Ac(t)=At(t)+C(t)$


Это уравнение состояний

Весь бизнес работает ради прибыли. В учете это отображается так:

  • Есть счет Расходы. Он дифференцируется по типам расходов.
  • Есть счет Доходы. Он дифференцируется по типам доходов.

Тогда:

$Прибыль(t_1,t_2) = Доходы(t_1,t_2) – Расходы(t_1,t_2)$


Или более привычно

$Pr(t_1,t_2 )=I(t_1,t_2 )-E(t_1,t_2)$


Это уравнение потоков.

Часть прибыли можно капитализировать и тем самым расширить финансовую базу бизнеса.

План счетов


Все множество допустимых счетов, называется планом счетов. Он диктуется государством. План счетов состоит из дерева Пассив и дерева Актив, содержащим соответственно все пассивные и активные счета. Формально можно объединить два дерева в одно, введя вершину “План счетов” и подчинив ей деревья Пассив и Актив.

Разработчик волен расширять дерево плана счетов вниз в своих интересах. Так счет привлеченных депозитов дифференцируется до индивидуальных депозитных счетов. Счет выданных кредитов дифференцируется до индивидуальных ссудных счетов. Расчетный счет дифференцируется до индивидуальных счетов субъектов, ведущих расчеты через банк.
Иногда пользователь заинтересован в двух планах счетов.

Хозяйственные операции


Хозяйственная операция – операция, изменяющая бизнес-состояние. Большинство хозяйственных операция затрагивают финансы и поэтому они затрагивают источники и стоки. Хозяйственная операция, вызывающая движение денег, обычно сопровождается платежным документом, в котором отображено это движение средств. Оно оформляется проводками. Проводка состоит из дебетуемого счета, кредитуемого счета и размера проводки:

$Tr=\{s_{dt},s_{kt},size\}$


На размер проводки дебет-счет должен дебетоваться, а кредит-счет кредитоваться.

Хозяйственная операция реализуется одной или несколькими проводками. Если дебет-счет и кредит-счет оба пассивны или оба активны, то баланс не меняется. Если дебет-счет активен, а кредит счет пассивен, то баланс увеличивается. Если дебет-счет пассивен, а кредит-счет активен, то баланс уменьшается. Если проводка реализуется только по дебету или только по кредиту, то баланс будет нарушен. Отсюда ясно, что при машинной реализации проводка должна реализовываться как транзакция, иначе баланс будет нарушен. Кстати в англоязычной литературе проводка так и называется “транзакция”.

Отображение хозяйственной операции на проводки – главная задача бухгалтера. Он, в зависимости от хозяйственной операции и экономических характеристик субъектов проводки (плательщик и получатель), должен определить проводки. Иногда здесь возможны варианты и тогда искусство бухгалтера состоит в том, чтобы выбрать проводки выгодные для фирмы бухгалтера.

Баланс Актив=Пассив


В терминах “пассив” и “актив” баланс стоков и источников запишется так:

$П(t)= A(t)$


И все это должно быть сгруппировано по плану счетов S, так что:

$∑_{s∈S}П_s (t=∑_{s∈S}A_s (t)$


Это баланс активов и пассивов. Он представляет баланс состояний.

Информационная структура в которой приведены все активы и пассивы в разрезе плана счетов называется бухгалтерским балансом. Обычно его приводят в виде двух иерархий: слева на листе баланса иерархия пассива, справа на листе баланса иерархия актива. И завершается эти иерархии общим размером актива и пассива. Эти размеры должны совпадать. Иначе – ошибка.

Баланс Дебет=Кредит


$∑_{s∈S}Dt_s (t,t+∆t) =∑_{s∈S}Kt_s (t,t+∆t)$



И все это должно быть сгруппировано по платежным документам, или интегрировано до уровня плана счетов(оборотно-сальдовая ведомость).
Это баланс оборотов — баланс потоков.

Расширения учета как применение системного подхода


Системный подход требует не забывать, что проект всегда погружен в надсистему и возможно будет расширен, так что в расширение захватятся некоторые части надсистемы. Так что если такое расширение весьма вероятно, то заранее нужно побеспокоиться об атрибутах, избыточных для данного проекта, но нужных для расширенного проекта. Бухгалтерский учет естественным образом может быть расширен до операционного и управленческого учета, а ещё дальше до бизнес-аналитики в широком смысле.

Операционный учет

В той реализации операционного дня в которой я участвовал, с платежного документа вводились только проводки. Для операционного учета нужно вводить и код хозяйственной операции. Кроме того, нужно знать инициатора хозяйственной операции и бухгалтера, определившего проводки.

Управленческий учет

Для управленческого учета нужно привязать субъектов хозяйственной операции к подразделению фирмы. А также желательно больше знать об экономическом содержании операции. Для этого нужно идентифицировать экономический объект операции: транспорт, здание, компьютер, НДС, …

Экономические показатели


С точки зрения экономики сальдо и обороты счета – это экономические показатели. Тогда естественно спросить, а почему мы должны ими ограничиться, ведь это не вся экономика. Нужна численность работников, уровень инфляции, рыночные ставки и т.д. Кроме того, состояние счета в бухучете – это текущее состояние, а бизнесу нужно и прогнозное значение и детальный анализ прошлого, текущего и прогнозного состояний. Так мы приходим к абстракции экономического показателя. Для примера рассмотрим показатель Гэп в коммерческих банках. Если мы будем иметь на счетах дату прогнозного платежа и ее размер, то мы можем вычислять так называемый гэп.

Пусть

TrС(t1,t2) – требования срочности (t1,t2) и чувствительные к изменениям процентной ставки. Pr% — процентная прибыль. Тогда
$G(t1,t2) =TrС(t1,t2)- ObС(t1,t2) $ — это, по определению, гэп срочности (t1,t2)

Гэп – одна из основных характеристик процентного риска и риска ликвидности. Так если изменится рыночная ставка на ∆r, то, как учит экономика, имеем возможный скачок в процентной прибыли:

$∆Pr\% = ∆r*G.$


Это и говорит о важности гэпа как меры процентного риска.

Математическая модель эмпирического риска


Если приведенная выше модель бухгалтерского учета была факультативной в проекте Операционный день, то приводимая ниже была практически необходима.

Эмпирическая вероятность – вероятность, основывающаяся на опытных данных, а не исчисленная по всем правилам теории вероятностей. Обычно для строгого применения теории вероятностей недостаточно данных, а иногда и неясно как ее применить. Так, для коммерческих рисков неясно как применить понятие вероятностного пространства. Поэтому можно попробовать применить некие модельные интуитивные подходы.

Обычно разработчики ПО не выдумывают своей математики, а пользуются готовой. Но иногда необходимо придумывать математическую модель. Для меня это произошло при разработке математической модели оптимального портфеля. Там все размеры депозитов, кредитов должны учитывать риски досрочного снятия депозита и риски невозврата кредита.

Всякая оценка рыночного решения носит вероятностный характер. Всякое решение сопряжено с риском. Само понятие риска – вероятностное понятие. Риск есть вероятность потери определенного ресурса в определенной ситуации. Существуют разные типы рисков для разных операций: риск страны при вложении капитала в эту страну, риск отрасли при вложении капитала в эту отрасль, риск актива при покупке актива, риск клиента при выдаче ссуды клиенту. Здесь мы рассмотрим модель эмпирического риска, т.е. модель, учитывающая реальные размеры проигрыша по рисковому фактору в течение всего времени отслеживания этого фактора.

Композиция рисков


Обычно задаются коэффициентом риска для ссуды определенного вида залога. Так залог под ценные бумаги государства обычно менее рискован чем залог под ценные бумаги частного предприятия. Кроме того, каждый клиент характеризуется своим коэффициентом риска независимо от вида залога.

Стоит задача определить $r_{sk}$ — интегральный коэффициент риска по клиенту и ссуде совместно, зная $r_s$ — риск по ссуде и $r_k$ — риск по клиенту, которому выдается ссуда.

Обобщим. Вместо конкретных типов риска введем абстрактный фактор риска. Пусть есть два фактора риска: фактор 1 и фактор 2.Зная риски $r_1$,$r_2$ по каждому фактору нужно найти композитный риск r. Риск по первому фактору — это вероятность события “неуспех по фактору 1”. Риск по второму фактору — это вероятность события “неуспех по фактору 2”. Композитный риск — это вероятность события (неуспех по фактору 1 ИЛИ неуспех по фактору 2). Тогда привлекая теорию вероятностей имеем

$r= r_1+r_2-r_1 r_2 $


риски не складываются!

И только при общей сумме рисков много меньше единицы риски можно складывать.

Тогда для конкретных рисков по типам ссуд и клиентам имеем

$r_{sk}= r_s+r_k-r_s*r_k $



Модели определения ссудного риска по клиенту


В банке не было никаких методик определения риска. Разработчикам нужно было создать собственную методику. Эмпирическая база – кредитная и депозитная история клиента. И нужно найти эмпирическую формулу для риска.

Для эмпирической формулы вероятности представляются естественными следующие содержательные требования:

  1. Если клиент вовремя расплачивался по ссудам, то риск по нему равен 0(или другое стартовое значение <1)
  2. Если клиент имеет невыплаты на момент t, то на этот момент риск по клиенту равен 1
  3. Чем больше невыплаты, тем больший риск
  4. Чем больше срок невыплаты, тем больше риск
  5. Чем меньше доля времени невыплат от общего времени существования кредитных отношение с клиентом, тем меньше риск
  6. И одно математическое требование временно’й композиции рисков, которое вытекает из необходимости вероятностной трактовки:

$r(t_1,t_3 )=r(t_1,t_2 )+r(t_2,t_3 )-r(t_1,t_2 )r(t_2,t_3 ) $



Введем следующие величины, характеризующие просроченную задолженность:
$T=∑_i∆t_i $ — время существования кредитных отношений с клиентом
$∆t$ – интервал в днях существования неплатежа
$Z_p (t)$ — просроченная задолженность на момент t
$Π_p (t)$ — процентное число просроченной ссуды на момент t(импульс просроченности)

$Π_p (t)≡Π_p (t-∆t)+Z_p (t-∆t)∙∆t$


В интегральном представлении:

$Π_p (t)=∑_{i=1}^tZ_p (i)∙∆t_i$


Где в течение периода $∆t_i$ неплатеж составлял $Z_p (i)$
$\barΠ_p (T)$ – средний неплатеж
$\barΠ_p (T)=(∑_{i=1}^TΠ_p (i))/T $

Введем следующие величины, характеризующие срочную задолженность:
$Z_s (t)$ — cрочная задолженность на момент t
$Π_s (t)$ — процентное число срочной ссуды на момент t

$Π_s (t)≡Π_s (t-∆t)+Z_s (t-∆t)∙∆t$


В интегральном представлении:

$Π_s (t)=∑_{i=1}^tZ_s (i)∙∆t_i$


Где в течение периода $∆t_i$ срочная задолженность составляла $Z_s (i)$

Можно, поиграв с формулами и воображением, предложить несколько моделей, удовлетворяющих вышеперечисленным условиям, кроме требования композиции вероятностей:

$r(t)=1-1/\{1+Π_p (t)/[\barΠ_p (T)∙T]\}$


$r(t)=Π_p (t)/\{Π_p (t)+Π_s (t)\}$


$r(t)=1-exp⁡\{-Π_p (t)/[Π_s (T)]\}$


И для всех формул полагаем по определению r(0)=0, r(t)=1 если в момент t есть неплатеж.

Так какую формулу из приведенных выбрать? И тут поможет правила временно’й композиции рисков. Непосредственной проверкой убеждаемся, что правило соблюдает только последняя эмпирическая формула.

Итак

$r(t)= 1-exp⁡\{-Π_p (t)/∑_{i=1}^TΠ_s (i) \}$



Модели определения депозитного риска по клиенту


Все рассуждения предыдущего пункта модифицируются для депозитного риска. Полученная формула сохраняется, только нужно только заменить термин “просроченная ссуда” на “преждевременное снятие депозита” и где индекс p трактуется как преждевременное снятие.

Обобщения


Абстрагируемся от кредита и депозита и вводим абстрактный фактор-риск – потенциальная безвозвратная потеря, которая влечет за собой и некие реальные потери. Вышеприведенные формулы с некоторыми вариациям применимы и к этому общему случаю.

Далее я приведу только словесное описание других моделей, для которых были разработаны и математические модели.

Математическая модель оптимизации выдачи кредита


В коммерческом банке есть портфель кредитных заявок — портфель потенциальных кредитов. Все их удовлетворить невозможно по следующим:

  • Банк ограничен ресурсами, обеспечивающими кредиты.
  • Центробанк диктует нормативы, которым должен удовлетворять состояние коммерческого банка
  • Некоторые потенциальные заемщики могут характеризоваться недопустимым риском

Задача: соблюдая допустимые риски и соблюдая ограничения центробанка выбрать такое подмножество заявок(оптимальный портфель) которое максимизирует процентную прибыль, по сравнению со всеми другими подмножествами. Показатель оптимальности можно варьировать. Например, вместо процентной прибыли можно взять NPV — чистую приведенную стоимость портфеля-претендента.

Оказалось, что задача решается в рамках задачи линейного программирования.

Математика отношений между субъектами


Более-менее развитая бизнес-экономика потребует анализа отношений между субъектами. В роли субъектов выступают предприятия, люди, банки, государство… Отношения могут быть разными:

  • Платежи
  • Кредитование
  • Депозитование
  • Договорные
  • Вражда
  • Криминал
  • Сотрудничество
  • Банковское обслуживание

И т.д.
Отношения могут быть простыми (A связан с B), и сложными (A связан с B, B связан с C и т.д).

Задача: создать продукт позволяющий обрабатывать множество отношений:

  • Находить цепочки(в том числе и циклы) отношений произвольной длины для однородных отношений
  • Находить цепочки(в том числе и циклы) отношений произвольной длины для неоднородных отношений
  • Находить вышеозначенные цепочки для отношений, удовлетворяющих задаваемым условиям
  • Находить вышеозначенные цепочки для субъектов, удовлетворяющих задаваемым условиям и т.д.
  • Находить цепочки минимальной длины
  • Находить цепочки максимальной стоимости(для платежей)

Механизмом реализации было естественно взять ориентированный граф с нагруженными ребрами и нагруженными узлами. А потом применить к этим графам алгоритмы, которые излагаются в многочисленных пособиях.

Ориентированность графа возникает из-за несимметричности отношений.

Проект был реализован на Delphi и Visual Prologe.

Выдача векселей


Пусть у банка есть портфель векселей, каждый на некоторую свою фиксированную сумму. Клиент просит продать ему векселя на заданную сумму. Требуется подобрать такое подмножество векселей, которое максимально удовлетворит заявку клиента.

Это, конечно, математическая задача. Я помню удовлетворился довольно примитивным эвристическим алгоритмом. А мой сотрудник подошел к делу серьезно и точно решил задачу. Хотя и расхождения между двумя решениями и были невелики, но все-же были.

Определение оптимального лага клиринга


В банке могут быть две дисциплины оплаты клиентских платежных документов:

  1. Платить в реальном времени. Обычно в таком режиме реализуются крупные платежи и соответствующий режим носит название RTGS(Real-Time Gross Settlement)
  2. Платить через некоторые дискретные моменты времени. Между этими моментами собирается портфель неоплаченных документов. А когда промежуток простоя(лаг клиринга) истекает, начинается оплата с учетом встречных требований, что в общем случае приводит к тому, что может реализоваться больше платежей, чем в оплате реальном времени. Так, если A должен заплатить B 100, а B должен заплатить A 90, то A платит B 10 и все Ok. Можно строить цепочки не только из двух клиентов, а из произвольного числа клиентов. Этот режим называется клирингом, а точнее неттинг-клирингом.

При клиринге есть два противоположно действующих фактора:

  1. Слишком большой лаг клиринга приводит к простою ресурсов и становится невыгодным. Это очевидно, если взять бесконечный лаг
  2. Слишком маленький лаг клиринга не приносит выгоды и становится бесполезным. Это очевидно, если взять лаг равный нулю.

Задача: определить оптимальный лаг клиринга.

Я не уверен, что решил задачу точно. Но введя некоторые естественные требования и правдоподобные допущения я получил формулу для оптимального лага клиринга. Это, конечно, эвристическая формула.

Заключение


Широта мыслительной сферы имеет не менее важное значение, чем язык программирования. Языки программирования приходят и уходят, а мировоззрение остается. Одним из действенных инструментов, влияющих на успех проекта, является построение математических моделей предметной области или ее частей.

Из того, что было изложено выше делаем вывод, что математическая модель может быть:

  • Функциональной, динамической, воплощаемых в терминах математических функций. В терминах ООП это математизация методов объектов. Методы – имманентность объектов. Примеры функциональных моделей: риски, оптимизация выдачи кредитов.
  • Статической, воплощаемой в связях между данными объектов. Алгоритм обработки этих связей зависит от выбранных структур. Примеры статических моделей: план счетов, отношения между субъектами.

В ортогональной к первой классификации математическая модель может быть:

  • Эвристической. Это модель, дающая приблизительное решение, воплощающее некую строгую, но неточную модель, удовлетворяющее здравому смыслу. Не имея точного решения, нужно удовлетвориться эвристикой. Примеры эвристических моделей: эмпирический риск, оптимальный лаг клиринга.
  • Точной. Это модель, дающая, в принципе, точное решение. Примеры точных моделей: оптимизация выдачи кредита, физические модели: управление ядерным реактором, управление полетом ракеты, вычисление координат по GPS.

В ортогональной к первым двум классификациям математическая модель может быть:

  • Нормативной. Без такой модели нет проекта. Она диктует проект. Она суть проекта. Выражаясь философски она имманентна проекту. Примеры модели: модель оптимизации выдачи кредита. Вряд ли кто-то предложит ее решение, не опираясь на математику. К такого рода задачам относятся задачи управления полетом ракет, управление работой реактора, обработка данных на адронном коллайдере, задачи машинного обучения и т.д.
  • Объяснительной. Без неё проект строить можно. Но имея объяснительную модель, можно привести свои представления о предметной области в строгую систему и подготовиться к возможным расширениям. Пример объяснительной модели: модель учета. Расширяя рамки объяснительной модели, можно прийти к нормативной.
Теги:
Хабы:
+7
Комментарии 13
Комментарии Комментарии 13

Публикации

Истории

Работа

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн