Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики

ПА

Парфёнов

автор материала

livejournal → vk →

YouTube1:00:14

Видеоверсия доклада

Этот доклад посвящен вопросам управления производством — какие принципы должны заменить идею планирования в условиях непрерывных изменений, и как их можно реализовать в обществе, окончательно снявшем потребность в наемном труде. Для этого пришлось:

обозначить объективные изменения производительных сил, ставшие итогом капиталистического развития товарного производства;
показать разницу решений задач планирования индустриальной эпохи и кибернетического дизайна регуляторов жизнеспособной системы на базе отличий задач ОГАС и Cybersyn;
разобрать ее устройство и кибернетические принципы, а также то, как они воплощаются в работе современных мультиагентных команд нейронных сетей;
установить целевую функцию самообучающейся мультиагентной системы, способной эффективно справляться с неопределенностью, на базе универсального принципа минимизации свободной энергии, регулирующего развитие всех таких систем;
ввести показатель такой целевой функции, пригодный для регулирования экономических процессов в безнаемной экономике;
пофантазировать о возможных экономическо-информационных механизмах, которые могли бы технически воплотить реализацию расчета этой целевой функции и принятие на ее основе субоптимальных экономических решений в мультиагентной системе;
приземлить созданный образ на формы общественных отношений собственности на средства производства;
поставить задачу для дальнейшего исследования.

Я останавливаюсь подробно на основах кибернетической нотации Стаффорда Бира или сущности когнитарной революции. Я уже освещал их в прошлых докладах. Всех интересующихся этими вопросами я приглашаю посмотреть их в записи.

Экономические основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #1

Каждая эпоха решает свои задачи.

Капитализм — это развитая социальная форма товарного производства. Систему всегда можно определить через то, что она производит. Сущностью капитализма является самовозрастание капитала, то есть накопление отчужденного труда в производительной форме, в виде средств производства.

Отношения, в которых выражается суть капитализма, следуют из разделения труда — это специализация и конкуренция. Они находят свое воплощение в институтах частной собственности и стихии рынка, порождающей саморегулируемые кибернетические контуры в экономике.

Проблемы капиталистического развития являются обратной стороной их преимуществ. Товарное производство на базе частной собственности и стихийности рынков порождает дисбалансы, ведущие к кризисам перепроизводства товаров и капитала. Капиталистическое распределение усиливает неравенство, подрывающее его основу — покупательную способность масс. Оно хищнически поглощает нетоварные блага, вроде природных ресурсов и человеческих отношений.

В попытке добиться успешного развития товарного производства, человечество столкнулось с необходимостью вмешаться в работу рынков для решения следующих задач:

Достижение сбалансированности, пропорциональности производства, чтобы избежать кризисов;
Поддержание постоянного роста, чтобы удовлетворить потребность капитала в расширении;
Оптимизация использования ресурсов, чтобы компенсировать потери от несогласованности целей отдельных агентов;
Справедливость при распределении результатов экономического роста, чтобы снизить социальное напряжение и сдержать рост неравенства.

Этот идеал воплотился в образе плановой экономики, согласованно распоряжающейся всем хозяйством как единой фабрикой.

Но развитие капитализма создало мир,
в котором такая фабрика не смогла бы просуществовать и дня.

Современный мир — это комплексный, быстро меняющийся, пронизанный нелинейными зависимостями многослойный клубок отношений, который сегодня характеризуется такими аббревиатурами, как VUCA, BANI, RUPT, TUNA.

VUCA: Volatility, Uncertainty, Complexity, and Ambiguity
BANI: Brittle, Anxious, Non-linear, Incomprehensible
RUPT: Rapid, Unpredictable, Paradoxical, Tangled
TUNA: Turbulent, Uncertain, Novel, Ambiguous

Все они говорят, что экономика живет в условиях неопределенности, неоднозначности, непредсказуемости, нелинейности, сложности за пределами охвата нашим мышлением, противоречивости и турбулентности.

Это состояние не является простым дефектом рыночной системы. Оно представляет собой продукт нового уровня развития производительных сил. Согласно модели клиодинамиков, возрастание числа образованных людей на планете, а также доступных им свободных ресурсов и средств усиления интеллекта, приводит к увеличению числа изобретений на единицу времени, а значит и изменений производственных технологий.

Каждое изменение технологии — это перемена величины общественно-необходимых затрат труда, а значит — необходимость поиска нового экономического равновесия. Если скорость нахождения этого равновесия ниже, чем скорость появления новых возмущений, то система никогда не сможет его достичь. В таких условиях планирование становится невозможным.

При управлении организациями фиксированное планирование давно уступило место бюджетированию и стратегическому управлению. Вместо последовательного выполнения заранее утвержденных задач и рассчитанных расходов бюджетирование задает рамки использования ресурсов, а стратегическое управление подразумевает регулярный пересмотр способа достижения поставленных целей, и даже самих этих целей. Впрочем, сегодня уже и классическое бюджетирование, и стратегическое управление теснят скользящие бюджеты и гибкие методологии управления, подразумевающие координацию автономных продуктовых команд, непрерывную приоритезацию задач и развитие через выдвижение и рыночную проверку гипотез.

Изменение условий объективной реальности отражается в изменении концепций, принимаемых за основу при разработке систем управления промышленностью. Согласно предложенной в 2017 году классификации, сегодня мы живем в эпоху перехода от промышленности 4.0 к версии 5.0.

Она характеризуется совершенно другими требованиями к системе управления:

Человекоцентричность, то есть подчинение производственного процесса управлению человеком, а устранение и не встраивание его внутрь процесса;
Устойчивое развитие, то есть поддержание баланса между скоростью потребления и воспроизводства ресурсов;
Неопределенность, то есть действовать в условиях неполной информации, справляться с непредсказуемостью и находить для новых проблем решения, которые не были заложены при обучении;
Мультиагетность, то есть децентрализация принятия решений по разным уровням, и многофакторность — несводимость целевой функции всех агентов к одному критерию.

Это означает необходимость отказа не только от единого всестороннего плана в том виде, как его понимали в прошлом веке, но и от самих принципов его составления. Вместо производительности, экономичности и управляемости производственной системы на первый план выходят требования по ее фитнесу, избыточной мощности и ультрастабильности.

Избыточная мощность означает постоянное наращивание и поддержание производственных способностей, перекрывающих непосредственные потребности.
Фитнес означает готовность быстро маневрировать этими способностями в ответ на изменение условий или целей.
А ультрастабильность — это умение распознавать и реагировать на незапланированные и непредсказуемые нарушения в работе, возвращая системе работоспособность.

Иными словами, сегодня необходимо уйти от мечты о плановой работе, и сосредоточиться на состоянии повышенной готовности к обработке любых возмущений, появлению новых возможностей или угроз. Как это сказывается на парадигме управления экономикой?

Организационные основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #2

С точки зрения кибернетики любое управление — это процесс осуществления выбора, то есть производство информации. Напомню об этом вкратце.

Цель управления — это приведение системы к желаемому (целевому) состоянию. При этом система может принимать множество других состояний, полное число переходов между которыми (разнообразие) мы можем считать мерой ее сложности. Сама система существует в окружении, которое также имеет свой уровень сложности. Управление является внутренней функцией системы, и аппарат управления также обладает определенной сложностью, то есть способен различить и обработать ограниченное количество вариантов поведения системы.

Закон Эшби гласит, что для успешного регулирования разнообразие регулятора должно быть не ниже разнообразия регулируемой системы. Чтобы добиться управляемости, избыточное разнообразие должно где-то поглощаться, глушиться; а собственное разнообразие системы управления должно усиливаться.

Стаффорд Бир определял содержание управления жизнеспособностью системы как инженерию эффективных глушителей и усилителей разнообразия таким образом, чтобы система могла достигать целей несмотря на непредсказуемые возмущения в ее окружении или в ее работе.

Одним из возможных усилителей разнообразия выступают информационные системы управления. Например, СССР в рамках планового управления промышленным производством нуждался в инструменте, который бы позволил ему из всего многообразия возможных состояний производственного плана выбрать то, которое окажется сбалансированным, пропорциональным, выполнимым. Для этого Глушков предложил создать федеральную систему обмена данными и автоматизировать расчет межотраслевого баланса. Это позволило бы более эффективно решать экономические задачи по распределению ресурсов между отраслями и предприятиями.

Как видим, назначением ОГАС было поддержание пропорциональности производства, оптимальное распределение ресурсов и уверенный экономический рост, плоды которого справедливо распределялись среди трудящихся. Успешный результат этой деятельности — это точно выполненный план!

В то же время в Чили Стаффорд Бир тоже помогал решать задачи государственного управления при помощи информационных систем. Он помогал создавать систему Киберсин, которая могла быть внешне похожей на ОГАС: она также предполагала использование компьютеров и каналов электронной связи. Однако назначение этой системы было совсем другим! Вместо расчета производственного задания, то есть экономической задачи, она должна была выполнять задачи управления, то есть помогать принимать решения.

Киберсин был предназначен для обеспечения информацией агентов на разных уровнях управления, от фабрики до министерства, а главное — для подчинения экономики самим людям. В его функции включались своевременное выявление требующих вмешательства проблем, сценарное моделирование и ускорение реакции системы, то есть увеличение ее способности справляться с неопределенностью.

В терминах этой цели,
точно выполненный план — это полный провал.

Ведь план составляется до начала деятельности исходя из текущего состояния дел, которое всегда отличается от состояния дел на конец планового периода. Если план выполнен в точности, то это значит, что все объективные изменения за прошедший период были просто проигнорированы!

Как можно продемонстрировать работу такой системы, призванной усилить внутреннее разнообразие системы управления, повысить ее способность реагировать на неизвестные угрозы и возможности? Самым ярким практическим примером ее использования стал транспортный кризис, вызванный забастовкой водителей грузовиков. От работы автомобильного транспорта зависела вся экономика этой вытянутой с юга на север страны. При наступлении кризиса оперативный штаб, используя созданные линии связи, владел экономической ситуацией с точностью до текущего дня и мог оперативно маневрировать ограниченными ресурсами. В результате страна успешно преодолела этот кризис, а правительство Альенде сохранило власть.

Был ли Киберсин специально спроектирован для решения задачи по координации логистических потоков? Или, может, он мог предсказать и запланировать преодоление такого кризиса? Нет. Но сама сущность созданной системы заключалась в повышении "фитнеса" управляющих процессов страны, то есть их способности справляться с непредвиденными возмущениями благодаря эффективной обработке информации.

Как же была устроена эта система?

Технические основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #3

Первая подситсема, Кибернет — это каналы электронной связи между предприятиями, отраслевыми и центральными органами. Ввиду отсутствия в Чили лучшего оборудования был использован телекс и телефонные линии. Кибернет предоставлял каналы и для сбора исходных данных, и для передачи результатов их обработки на места. Все показатели были приведены к нормативной триаде значений «факт - возможность - потенциал» и передавались в виде индексов, принимающих значение в диапазоне от 0 до 1, что существенно облегчало их обработку. Даже столь несовершенные средства позволяли получать оперативную информацию о состоянии экономики с точностью до дня.

Собранные данные проходили через Киберстрайд — это математический фильтр, позволяющий отделить сигнал от шума, определить природу возмущений (разовый всплеск, смена тренда, изменение динамки…) и выявить те из них, которые необходимо принять во внимание. Это мощный глушитель, подавляющий избыточное разнообразие, и тем самым освобождающий дефицитные вычислительные ресурсы центра от паразитной нагрузки. Результат его работы направлялся прежде всего самим предприятиям, чтобы они могли заметить возмущения и принять меры на своем уровне.

Далее, CHEKO — это динамическая модель экономики Чили, устанавливающая закономерности взаимного влияния показателей разных предприятий и отраслей. Она позволяла выполнять сценарное моделирование последствий предпринимаемых мер, то есть существенно усиливала внутреннее разнообразие системы управления.

И операционная комната, визитная карточка проекта — сердце предприятия, где располагался штаб, владеющий информацией о работе экономики в режиме реального времени. Он должен был отслеживать только такие отклонения в работе экономики, с которыми агенты не смогли справиться самостоятельно, и потому требовалось вмешательство.

Сегодня мы бы сказали, что операционный центр "осуществляет дежурный мониторинг на базе дашбордов, дрилл-даун отчетов и алертов для купирования инцидентов".

Связать деятельность правительства непосредственно с метасистемой, которой правительство подчинено, то есть с народом, должна была специальная подсистема — Киберфолк. Предполагалось транслировать обсуждение важных государственных решений через национальное телевидение и собирать реакцию граждан в виде уровня согласия на непрерывной шкале через передачу электрического сигнала с домашних аппаратов. При этом общий уровень согласия должен был поступать правительству и выводиться на экран для самих граждан.

Наконец, сама система должна была осуществлять сбор, фильтрацию и обеспечение информацией не только для центра, а для каждого предприятия и каждого отраслевого министерства. Система управления на каждом уровне должна была иметь одну и ту же структуру, то есть ее устройство носило рекурсивный характер: одни и те же средства позволяли решать разные задачи. Вместо командно-административного управления работа экономики строилась на базе автономии субъектов и децентрализованном принятии решений каждым уровнем, то есть на базе многоуровневой мультиагентности.

Удивительно, но в самом процессе составления и согласования планов, который детально рассмотрен Биром в отдельной главе в книге "Сердце предприятия", Киберсину не отводилось никакой роли!

Кибернетические основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #4

В основе Киберсина лежала кибернетическая теория — модель жизнеспособной системы. Стаффорд Бир выводит ее индуктивно и дедуктивно, от биологической аналогии и от кибернетических основ, в двух книгах: "Мозг фирмы" и "Сердце предприятия". Я же воспользуюсь результатами этого вывода, чтобы определить роль созданных подсистем.

Первым пунктом на пути потока разнообразия от окружения к системе управления выступают каналы связи. Их пропускная способность определяет, какой объем информации вообще может дойти до управления и насколько она будет актуальна. Эти же каналы передают принятые решения обратно к системе, которая осуществляет воздействие на окружение. Так как канал связывает разные уровни, то сигнал проходит перекодирование из одной символьной системы в другую, например из натуральных показателей в индексы.

Вторым пунктом выступают глушители и усилители разнообразия. Так как пропускная способность любого канала ограничена, то фильтр необходим, и он неизбежно появляется. Глушители могут быть плохими, игнорирующими существенное в потоке данных. Или они могут быть хорошими, очищающими сигнал от шума. Когда мы выбираем, какие показатели передавать, в какой форме, с какой частотой — это фильтр. Когда определяем, какие изменения показателей имеют значение, а какие нет — это тоже фильтр.

Далее наша система управления производит некоторое преобразование входящих сигналов в исходящие. У нее есть свои ограничения: это вычислительная мощность, в чем бы мы ее ни измеряли — в людях или процессорах. Это объем данных, которыми она оперирует. И главное — это ее внутренняя модель, то есть набор правил преобразования, отражающий закономерность поведения самой управляемой системы.

Каждый из ее элементов может быть усилен. Например, усилителем для обработки набора данных может выступать система управления фокусом внимания, позволяющая перерабатывать входные данные по частям и различать их важность. Усилителем для набора правил преобразования выступает процедура сценарного моделирования, позволяющая на базе памяти — накопленного прошлого опыта — продумать не один, а несколько разных вариантов поведения, и оценить последствия каждого. Наконец, дополнительным источником разнообразия, может выступать... собственный генератор случайного поведения, создающий непредсказуемые и невыводимые решения, догадки. Он дает возможность выйти за рамки стереотипов, то есть преодолеть ограниченность знаний, полученных из прошлого опыта и текущих данных.

Так как объем разнообразия каждой системы управления ограничен, то она никогда не сможет составить исчерпывающую модель той системы, которой управляет. Эта система будет всегда выступать для нее черным ящиком — или, точнее, "мутным", с ограниченной прозрачностью. Это значит, что любая жизнеспособная система сама должна состоять из других жизнеспособных систем, имеющих свою собственную подсистему управления, построенную ровно по тем же правилам.

Системы, находящиеся на разных уровнях этой холархии, будут иметь разные внутренние языки и словари, адаптированные под свои внутренние нужды. Чтобы описать универсальный принцип общения систем и метасистем, Стаффорд Бир ввел отдельный термин "алгедонод", от латинского "боль" и "удовольствие". Выделенный канал передает сигнал о нормальной работе системы в метасистему, который просто игнорируется. Но в случае нарушения работы системы за рамками допустимого этот сигнал меняется на другое универсальное значение: он передает боль, сигнализирующую о наличии проблемы, которая требует вмешательства, независимо от ее природы.

Бир вводит еще одно понятие, помогающее разобраться, как ограниченные по мощности системы все-таки достигают успеха при неограниченном разнообразии возмущений в своем окружении. Это — эвристический поиск в ландшафте пространства возможностей. Дело в том, что система действует не в абстракции, и на самом деле пространство возможных состояний ограничено объективными условиями окружающей среды. Какие-то состояния более вероятные, а какие-то менее. Для навигации по этому ландшафту не обязательно иметь его полную карту. Его можно изучать эвристически, выбирая направление движения, которое приводит к улучшению состояния относительно текущего положения, и иногда совершая случайные маневры, чтобы не зависать в областях локального максимума. Так двигается улитка по склону горы: хотя у нее нет карты, она движется в том направлении, где склон повышается, и стремится к вершине, расположенной неизвестно где. В процессе такого движения сама система меняется, она адаптируется, учится.

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #5

Тот, кто читал Бира, наверняка обратил внимание на тот образ, который он выбирает для системы управления: anastomotic reticulum, или... нейросеть. Ничего удивительного в этом, конечно, нет. Нейросеть действительно представляет собой систему усиления когнитивной деятельности для принятия решений, и потому должна соответствовать тому же кибернетическому инварианту.

Прикладные основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #6

Любая нейросеть имеет сенсорный слой рецепторов на входе и слой эффекторов, выдающих результат после обработки на выходе. Для повышения пропускной способности данные для сети кодируются. Так же в Киберсине Бир поступал с показателями предприятий.

Сами нейросети выступают как глушителями, так и усилителями разнообразия. Типовым глушителем разнообразия являются сети, осуществляющие распознавание объектов — то есть выделение из всего объема данных полезного сигнала. Теперь к ним добавились и суммаризирующие способности генеративных нейросетей, выделяющие из текста самое существенное.

Внутренняя сложность нейросети чаще всего характеризуется числом ее внутренних параметров и размером контекста. Но качество ее работы не определяется только этой мощностью. Куда важнее результативность ее обучения, то есть качество модели, отраженной в наборе весов — ведь по сути нейросеть представляет сложное математическое правило преобразования входных состояний в выходные.

Дополнительным усилителем в ее работе выступают, во-первых, механизмы управления ее внутренним фокусом внимания, а во-вторых, стохастический генератор случайных так называемых "затравок", позволяющий увеличить разнообразие стартовых позиций. А сейчас на базе нейросетей собирают композиты в виде Mixture Of Agents, позволяющие генерировать разный набор ответов и потом выбирать из них самый лучший — это аналог сценарного моделирования.

Сами нейросети все чаще используются не поодиночке, а в составе "команды агентов" или даже "агентного роя". Мы видим принципы рекурсии, где внутри универсальных нейросетей работают специализированные нейросети, а сами нейросети входят в состав команд, которые координируются и работают как единый большой агент, то есть рекурсивную холархию условно-автономных субъектов.

Обучение модели требует либо внешнего подкрепления (от учителя), либо внутреннего (через соревнование в игровом пространстве), но по сути представляет собой задачу эвристического поиска. А система "выравнивания целей" — alignment — контролирует, чтобы нейросеть исключала недопустимые с точки зрения человека результаты, то есть обеспечивает ее “воспитание” от имени метасистемы, хотя та и говорит на неизвестном ей языке

Но где лежат источники такого сходства между кибернетической моделью и современными нейросетями? Это притянутая за уши аналогия или что-то большее?

Математические основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #7

В одном недавно вышедшем материале по обучению новой, пока закрытой модели искусственного интеллекта от OpenAi, который обозначен именем Q*, приводится следующая концепция. Представим объективную реальность как некоторый ландшафт, например, кровать, на которой лежит множество вещей. В этом случае обучение нейросети напоминает набрасывание на эту кровать простыни или одеяла. В процессе обучения эта простынь опускается, как под действием силы тяжести, пока не повторит форму всех объектов, лежащих на этой кровати. Простынь с ее получившейся топологией — это и есть математическая абстрактная репрезентация реальности, которую формирует нейросеть в процессе обучения. Ее "карта высот" представляет собой модель, которую можно использовать для навигации в идеальном представлении, в симуляции, для поиска корректных решений.

Эта концепция восходит к принципу свободной энергии, введенному нейробиологом Карлом Фристоном. Он гласит, что любая жизнеспособная система, действующая в рамках окружения, стремится минимизировать расхождение между ожидаемой и фактически поступающей от органов чувств информацией, то есть стремится к снижению неопределенности. Чем выше неопределенность, тем больше решений требуется принимать и тем больше энергии находится в свободной форме. Минимизация этой энергии — это снижение отклонения прогнозных состояний от наблюдаемых.

Обучение нейросети представляет собой приближение прогноза к реальности, как падение простыни на кровать под действием силы тяжести, в позицию минимальной потенциальной энергии.

Виталий Ванчурин заметил единство этого процесса, его инвариантность, не только в живых системах или в процессе обучения нейросетей, но и на других уровнях абстракции нашей реальности. Например, ровно тому же закону соответствуют и квантовые явления, и термодинамические процессы, и даже эволюция вирусов.

Иными словами, весь мир ведет себя так же,
как одна большая нейросеть,
постепенно выпадая в "осадок" в растворе энтропии
в согласии с законом минимизации свободной энергии,
то есть накапливая информацию.

Еще Клод Шеннон заметил, что создание информации — это процесс, обратный термодинамической энтропии. Окончательно принцип эквивалентности энергии, массы и информации был введен Мелвином Вопсоном в 2019 году. В нем он расширил принцип Ландауэра, сформулированный в 1961 году, о минимально возможной величине выделении тепловой энергии при единичном вычислении.

Но нас интересуют не отдельные вычисления, а групповые. Макмиллен и Левин применили концепцию интеллекта к системам, состоящим из множества агентов. Они показали, как множество отдельных так называемых разнообразных интеллектов, словно птицы в стае, реализует коллективное поведение на базе предсказания взаимного действия и выработки регулирующих его политик. Это порождает кооперативную и конкурентную вычислительную среду, решающую проблемы в новых, недоступных отдельным агентам пространствах и на более высоких масштабах, а также способную лучше справляться с шумом, сложностью и изменениями в окружении. Марксисты бы назвали это социальностью.

А как группа агентов может достичь успеха в совместной вычислительной деятельности? Карл Фристон с группой ученых изучали коллективный разум мультиагентных систем и вывели понятие "разделяемых протенций”. Отдельная "протенция" агента — это проекция ранее приобретенного знания на будущее. “Разделяемые протенции” — это взаимно согласованные ожидания относительно будущих состояний и действий, которые позволяют относительно независимым агентам координировать свое поведение для достижения общих целей без централизованных органов.

Теперь нам необходимо перенести эти подходы в экономическое поле, на управление производительными силами общества.

Деонтические основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #8

Но зачем такой сложный подход? Почему нельзя просто использовать планирование для оптимального, сбалансированного развития производственных мощностей в целях максимизации общественного богатства в рамках капиталистической экономики?

Тут необходимо вернуться к представлению о том, что движет развитием товарной экономики. Центральной целевой функцией капиталистического производства выступает прибыль. Прибыль сигнализирует об относительных дефицитах, связывая спрос и предложения. Она направляет ресурсы в сферу, где их применение принесет наибольшую отдачу, регулируя переток инвестиций между отраслями. Она обеспечивает расширенное воспроизводство капитала, а значит и рост производительных сил. Прибыль представляет такую “разделяемую протенцию” — взаимно согласованные ожидания относительно будущих состояний и действий рыночных агентов.

В условиях товарного производства человек выступает в роли поставщика рабочей силы, то есть для масс труд становится главным средством доступа к любым товарам и, следовательно, их универсальным эквивалентом. В этих условиях прибыль — это лишь денежная форма, которую принимает прибавочная стоимость. Максимизируя прибыль, мы тем самым одновременно максимизируем неоплаченную часть труда работников. А значит, максимизация прибыли тождественна максимизации эксплуатации в ее марксистском понимании.

Капиталистическая экономика не подчиняется интересам всего общества. Рост капитала связан с интересами только некоторой его части, обладающей частной собственностью на средства производства. Этой частью не может быть все общество, так как товарное производство строится на экономическом принуждении (в отличие от феодального или античного). Это порождает необходимость разделения агентов на проводников интересов капитала и труда, и подчинения одного класса другому.

В обществе, которое сняло потребность в наемном труде, такое подчинение невозможно, потому что бессмысленно. Потеряв свое инструментальное качество, человек выходит из роли и поставщика рабочей силы, и ее распорядителя. Он остается только распорядителем средств производства, только вещей.

Эта система уничтожает саму эксплуатацию, делает невозможным присвоение неоплаченного труда, а значит не может более управляться ее превращенной формой — прибылью.

На каких же принципах может быть выстроено управление такой экономикой? Что будет выступать для нее "целевой функцией", которая будет положена в основу принятия решений, если не прибыль?

Капитал, взятый в абстракции от своей социальной функции (эксплуатации), представляет собой средства производства. Если мы переведем идею "протенции" из виртуального мира в материальный, за рамки простого предвидения или прогнозирования, то они превратятся... в производственные возможности. Ведь каждая система не только подстраивается под изменение окружения, совершенствуя свою модель, но и активно меняет это окружение, стабилизирует его, руководствуясь той же целью снижения неопределенности. Коллективный материально воплощенный интеллект действует, максимизируя собственные возможности, повышая свою степень готовности к неизвестным событиям в будущем — только так можно действительно достичь минимума свободной энергии.

Это значит, что целевой функцией общества является обобщенная производственная мощность ее производительных сил. Но как можно измерить обобщенную мощность, когда производительные силы состоят из множества качественно разнородных частей, которые нельзя между собой никак напрямую сопоставить?

И здесь нам помогает марксистский аппарат диалектики.

Диалектические основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #9

Производительные силы состоят из множества агентов, конкретные производительные функции которых качественно различны.

Производительная мощность каждого агента имеет количественную определенность, измеряемую как объем выпуска его продукции в единицу времени. Гипотетически можно было бы просто просуммировать эти мощности между собой, но невозможно приравнять напрямую киловатт-часы электростанции и годовой прирост стада овец. Для этого должно быть найдено тождество в чем-то третьем, через что можно выразить каждую отдельную мощность, и в чем будет стерт конкретный характер любой отдельной производственной функции. То есть от конкретной мощности нам надо абстрагироваться.

Если мы говорим об обобщенной производительной мощности, то мы должны говорить о способностях всей производственной системы общества. Измерить такую мощность в единицах одной конкретной продукции невозможно. Однако мы можем измерить способность экономики произвести заданный набор продукции через количество времени, которое необходимо для ее производства.

Действительно, любой производительный агент (будь то станок, фабрика или целая отрасль) потребляет продукцию других производительных агентов. Но помимо нее он потребляет еще один ресурс, который не производится никаким агентом — это время.

Значит, любой продукт может быть выражен в совокупной величине времени, которое требуется для его производства, включая время производства и всех потребленных в этом процессе продуктов.

Мы приходим к тому, что в производительной системе, исключившей рабочую силу человека из производительного процесса, где человек остается только распорядителем производственных мощностей в собственных целях, субстанцией стоимости производимых продуктов становится совокупное общественно-необходимое время на их производство.

Однако для целей управления производительной системой нас интересует не частное время производства отдельного продукта, а совокупное время производства всего набора продуктов. Как же мы можем его оценить, если этот набор продуктов нам неизвестен, да и к тому же он постоянно меняется?

Мы говорим о производственной мощности в понимании возможностей, способностей производительной системы. Это означает, что нас интересует не фактическая величина или скорость выпуска, а общий потенциал системы, готовность справляться с разными производственными заданиями в условиях постоянных возмущений — например, появления новых технологий или изменения общественных предпочтений.

Для обобщенной мощности мы могли бы задать эту метрику как математическое ожидание времени, которое понадобится системе для исполнения всего возможного набора производственных заданий во всех возможных условиях, взятых (например) в пропорции к квадрату вероятности их наступления с заданным уровнем значимости.

Оценка такого времени не является принципиально невыполнимой задачей, так как бесконечное пространство возможных условий и заданий не является однородным и равновероятным, а обладает понижающейся вероятностью по мере их удаления от текущего состояния.

Это и есть целевая функция, которая будет оценивать уровень "фитнеса" нашей системы. Одновременно она воплощает оценку свободной энергии нашей производственной системы, которая подлежит минимизации. Чем она ниже, тем быстрее система сможет отреагировать на изменение. В ней воплощаются все три стороны производительных возможностей: избыточная мощность, способность реагировать на угрозы и возможности и даже ультрастабильность как умение восстанавливать работоспособность в условиях возмущений неизвестной природы.

Давайте спроектируем производственную систему, построенную на указанных принципах.

Монетарные основания

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #10

В основе этой системы будет положена рекурсивная холархическая мультиагентность.

Разделим все производительные силы на единичных агентов, включая природные ресурсы и даже само пространство.

Каждый агент будет характеризоваться производственной функцией скорости преобразования ресурсов в выходную продукцию. Мощность источников природных ресурсов описывается скоростью их естественного воспроизводства. У пространства скорость воспроизводства является константой, но надо помнить, что само пространство географически неоднородно. Частным случаем производственной функции является инвестиционная функция: скорость преобразования ресурсов в дополнительные производственные мощности.

Помимо агентов, нам нужны логистические функции, описывающие скорость обмена продукцией и ресурсами между географически распределенными агентами, а также актуальные запасы, которые можно описать как агентов с нулевой скоростью воспроизводства.

Поведение каждого агента моделируется и управляется собственной нейросетью — цифровым двойником. Эти агенты не требуется программировать: они должны быть обучены на виртуальном пространстве, играя сами с собой, как alfaZero. Целью игры должна быть выработка такого поведения, которое минимизирует нашу целевую функцию.

Агенты объединяются в производственные агрегаты: станки — в цех, цеха — в фабрики, фабрики — в отрасли и т.п. Каждый агрегат приобретает собственную функцию, производную от функций его компонентов, и описывающую время преобразования агрегированного вектора входных ресурсов в вектор выходных продуктов. Его сводное поведение моделируется и управляется его собственной нейросетью, но по тем же правилам.

Время работы каждого агента получает выражение через особый эквивалент: токены, привязанные к календарному времени задействования этих мощностей. Эмиссия этих токенов неуправляемая, так как они распределяют реальное время работы реального производства.

Эта псевдовалюта торгуется и обменивается агентами через электронные биржи, где в процессе торгов устанавливается кросс-курс частных производительных токенов, а также кросс-курс токенов одного агента, но разного времени действия. Через продажу собственных токенов и покупку токенов на мощности, производящие необходимые агенту сырье, агенты осуществляют динамическое планирование производственной деятельности. Ввиду того, что токены привязаны ко времени, агенты напрямую заинтересованы в оптимальной утилизации всех мощностей, чтобы те не "сгорели" впустую.

Мы получаем коллективную мультиагентную нейросетевую модель, занятую поиском такого поведения в пространстве возможностей, которое позволяет выполнить производственный заказ общества. При этом найденный способ выполнения этого заказа приводит систему в состояние, которое минимизирует время выполнения любого измененного заказа при любых новых возмущениях.

Формирование реального производственного заказа выполняет общество. Для этого производится эмиссия обезличенных токенов доступа к обобщенным производственным мощностям, которые равномерно распределяются среди всех граждан — ввиду отсутствия экономического принуждения.

Размещая производственный заказ, потребитель автоматически получает на бирже текущий курс обмена потребительских токенов на производственные токены мощностей производительных агентов, необходимых для изготовления заказа. При этом в обменном курсе будут отражены существующие ограничения всех производственных мощностей и запасов, а также резервы на то, что требуется системе производства для собственного воспроизводства.

Таким образом формируется общественная стоимость продукта, выраженная в обобщенном, абстрактном общественно-необходимом времени на его производство.

Данной системе для оптимизации своей работы не требуются ни фиксированные циклы планирования, ни единый подробный план, ни централизованный планирующий орган, ни детальный прогноз изменения предпочтений каждого потребителя. А самое главное, такая система будет обладать избыточностью, устойчивостью к нарушениям, произвольной масштабируемостью и способностью к самообучению — то есть к самостоятельному выяснению всех своих производственных функций. При этом она останется подчинена потребностям человека.

Исследовательские задачи

Cybersyn как прообраз системы нейросетевого регулирования мультиагентной экономики, image #11

Можем ли мы представить структуру собственности, соответствующую предложенной схеме?

На нижнем уровне, в инфра-диапазоне, лежит использование средств производства в личной собственности — то есть для удовлетворения собственных потребностей. Это как домашняя рисоварка или семейный автомобиль: их подключение к мультиагентной системе в качестве поставщиков в общем случае бессмысленно. Однако ресурсы для собственных средств производства (энергия, сырье, может даже пространство в случае постройки дома) получаются извне, от производительной системы другого уровня

На втором уровне находятся средства в коллективном управлении и коммунальном использовании. Это и территория местных сообществ, и локальные источники ресурсов, и какие-то автоматические цеха, например, в просьюмерских центрах. Они подключены к локальному сегменту мультиагентной сети. Их обмен с глобальными системами происходит преимущественно теми ресурсам, которые они не способны произвести внутри сегмента. Второй уровень может быть не единичным, а множественным, например, иметь промежуточное воплощение на уровне города, региона, страны, а то и планеты.

На третьем уровне мы говорим про производственные ресурсы всего общества. Природные ископаемые, большие промышленные автоматизированные фабрики, логистическая инфраструктура. Потребление мощностей этих ресурсов как отдельными людьми, так и сообществами осуществляется только через систему мультиагентного распределения.

Производственные заказы могут быть разделены на две группы. Во-первых, это индивидуальные заказы для личного пользования или потребления — производится то, чем пользуется сам заказчик. Затрачиваемые на них мощности регулируются собственным лимитом потребителя.

Во-вторых, это групповые заказы для коллективного пользования. На такой заказ может формироваться дотация через мультипликатор затраченных группой токенов.

При изготовлении новых средств производства, предназначенных для коллективного управления, обеспечение их ресурсами производится на общих основаниях через подключение к мультиагенту. Иными словами, вы оплачиваете их работу из собственного лимита, но можете ограничивать доступ к их мощностям, регулируя долю поступающих на биржу токенов. Однако вам выгодно расширять этот доступ, так как чем больше людей ими пользуются, тем ниже расходы на их обеспечение ресурсами за счет эффекта масштаба.

Когда полный объем токенов мощностей средства в групповом пользовании передается на биржу и спрос на них превышает затраты на воспроизводство, тогда это средство может быть передано на локальный баланс сообщества или на баланс всего общества для общественного использования с возвращением затраченных на его производство токенов начальным инвесторам.

Предлагаемая структура экономики обладает всеми свойствами, которые нужны жизнеспособной системе. Она воплощает принципы мультиагентности, децентрализации, масштабируемости. Она позволяет реализовать экономическое регулирование работы производственной системы, не использующей ни наемного труда, ни эксплуатации. И она воплощает кибернетические принципы, сформулированные Стаффордом Биром более 50 лет назад.

Описанная мной модель, безусловно, нуждается в теоретической проработке, математической формализации и имитационной проверке. Эта задача еще ждет своих героев. Необходимо создать формальное описание агента, обучить способную его моделировать нейросеть, собрать мультиагентную среду, обучить нейросеть, которая способна моделировать поведение агрегата, и поставить эксперимент для исследования способностей данной системы справляться с задачами оптимального распределения ресурсов.

Я думаю, тут найдется достаточно работы для хорошей диссертации — или небольшой свободной социалистической лаборатории по социально-экономическому моделированию.

ПА