Методы агрегирования, эквивалентирования, декомпозиции и ранжирования факторов

Большая сложность реальных систем энергетики предопределяет значительные трудности при разработке их математических моделей. Опыт построения математических моделей показывает, что учет всего многообразия элементов и связей системы в рамках одной математической модели нецелесообразен по следующим обстоятельствам [9, 20]: во-первых, математическая формализация реально существующих связей и элементов системы привела бы к задаче математического программирования слишком высокой размерности; во-вторых, практически нереально было бы интерпретировать и анализировать полученные (решения.

Кроме того, разработчику математических моделей сложных объектов следует учитывать результаты теоретических исследований в области анализа эффективности алгоритмов [22]. Напомним основные понятия этой теории. Для любого вычислительного процесса, реализованного на ЭВМ, существенны два фактора: длительность работы алгоритма и объем использованной памяти. При фиксированной схеме кодирования исходных данных любой задачи объем использованной памяти может быть оценен в битах; например, запись последовательности из т чисел х( потребует п битов:


Длительность работы программы является функцией от этой величины л. Если в процессе вычислений, решающих поставленную задачу, происходит не более чем к обращений к исходным данным (независимо от величины л), то верхняя оценка длительности работы программы пропорциональна л. С другой стороны, возможна ситуация, когда для всех известных алгоритмов, решающих поставленную задачу, число обращений к исходным данным экспоненциально зависит от числа л, например 2П. Такие алгоритмы следует теоретически признать малоэффективными, так как при достаточно больших л длительность их работы будет астрономически велика.

Основным практическим выводом является необходимость учитывать при постановке математической задачи тот факт, что для широкого класса интересных с точки зрения практики задач длительность работы программы может экспоненциально зависеть от объема использованной информации.

В этой ситуации весьма плодотворны методы, основанные на сокращении объемов входной информации математических моделей реальных систем и процессов. Уменьшение входной информации о моделируемом объекте или системе объектов достигается методами, известными под названиями агрегирование, эквивалентирование, декомпозиция и ранжирование факторов. В настоящее время эти методы не формализованы до такой степени, чтобы можно было указать конкретные рецепты, приводящие к решению задачи, и требуют активного участия человека, моделирующего наблюдаемую систему. Несмотря на эвристичность этих методов, необходимость их применения не вызывает сомнений.

На примере системного исследования СЦТ рассмотрим особенности этих методов и возможности их применения.

Под агрегированием задачи понимается процесс перехода от большей совокупности параметров и переменных, описывающих наблюдаемую систему, к меньшей. Например, для выражения функции цели в технико-экономических расчетах и моделях используется запись:



Переход от совокупности отдельных компонентов капиталовложений (или ежегодных затрат) к системному параметру — их сумме является простейшим примером агрегирования. Если число слагаемых в суммах (3.3) и (3.4) достаточно велико, то выделение групп отдельных слагаемых также является агрегированием. При определении капитальных затрат в ИТ принято группировать слагаемые, пропорциональные мощности ИТ, а при определении эксплуатационных расходов по ИТ — затраты, пропорциональные выработке теплоты и пропорциональные мощности установки (постоянная составляющая эксплуатационных расходов). Часто также приходится пренебрегать частью слагаемых в суммах (3.3) и (3.4), если известно, что их величина значительно меньше возможной точности модели.

С математической точки зрения агрегирование информации аналогично выбору некоторой весовой функции р на пространстве состояний системы в зависимости от численных значений внешних параметров и усреднению величин х,- с выбранным весом


В простейших ситуациях (например, (3.3) и (3.4)) весовая функция постоянна на всех состояниях и равна единице.

Агрегирование является весьма сильным средством сокращения объема исходной информации, так как позволяет исследователю не только соизмерять значимость отдельных факторов, но и пренебрегать частью наблюдаемых факторов. В связи с этим весьма важно, как отмечается в работе [9], сохранить присущие объекту или системе объектов качественные особенности, не утратив их в процессе агрегирования.

Для традиционных разделов физики соответствие между моделью и действительностью весьма точно. При системных исследованиях сложных и больших технических систем, таких, как ИТ и СЦТ, соответствие между моделью и реально существующей системой менее точно. Анализируя с помощью математики количественные соотношения в наблюдаемой системе, исследователь создает рабочую модель реального объекта. При этом модель, или математический аналог реальности, с одной стороны, должна иметь много общего с реальным объектом, а с другой стороны, позволять сделать практически полезные вычисления и предсказания.

С этой точки зрения возможности агрегирования информации, как указано в работе [20], тесно связаны с ожидаемой точностью модели и возможностью различать с помощью модели интересные для исследователя состояния системы. С математической точки зрения вопрос о точности имеет смысл только при условии существования двух моделей: исходной модели А, по определению принимаемой за адекватную изучаемой системе, и модели В, отличающейся совокупностью переменных и совокупностью функций, описывающих связи и ограничения в системе. Обычно считается, что более подробная, полная модель лучше соответствует реальному объекту. Однако с помощью такой модели затруднено проведение практических расчетов для содержательных, реальных задач. Процессы агрегирования исходной информации и постановка задачи тесно связаны между собой, а первоначальная точная модель часто просто отсутствует, поэтому вопросы адекватности модели реальной системе решаются специалистами в данной области — группой экспертов.

Другим тесно связанным с агрегированием методом сокращения исходной информации является эквивалентирование. Термин эквивалентирование, появившийся в связи с возможностью упрощения расчета последовательных и параллельных электрических схем, широко используется в литературе по энергетике.

Математически строго он обоснован только для линейных моделей, например для электрических сетей постоянного тока (модель процесса составляет совокупность уравнений I и II законов Кирхгофа). Формальное обоснование этого метода на нелинейные задачи представляет собой весьма трудную математическую задачу, не решенную до сих пор.

Часто считают, что эквивалентирование является процессом сокращения исходной информации более широким, чем агрегирование, понимая под эквивалентированием [20]: 1) уменьшение числа учитываемых факторов и оптимизируемых переменных, а также упрощение системы ограничений и выражения функции цели — при решении задач оптимизации; 2) уменьшение числа степеней свободы (размерности) в системе уравнений, описывающих исследуемые процессы.

Однако между понятиями агрегирование и эквивалентирование есть незначительное отличие, которое имеет смысл сохранить из методических соображений. Основой любой математической модели являются: пространство состояний процесса или системы, характеризуемое числом степеней свободы системы (размерностью), и совокупность функций, описывающих исследуемые процессы (система уравнений или ограничения, описания связей и функция цели в оптимизационной задаче). Можно связать термин ’’агрегирование, как было сделано в (3.2), с изменением числа степеней свободы (пространства состояний), а термин ’’эквивалентирование с изменением (упрощением, аппроксимацией) функций, входящих в математическую модель. Однако следует иметь в виду, что оба процесса, агрегирование и эквивалентирование, обычно идут параллельно [20].

Применительно к системным исследованиям СЦТ эквивалентирование применяется, например,, при оптимизации тепловых сетей- Тепловая сеть крупного города или промышленного центра может содержать тысячи, десятки тысяч отдельных участков, имеющих разные условия прокладки, гидравлические сопротивления и другие характеристики. При гидравлическом расчете такой сети (или оптимизации диаметров ее участков) зачастую не удается рассчитать систему в целом; в таких случаях отдельные совокупности участков сети заменяются меньшим (часто одним) количеством участков, т.е. модель тепловой сети агрегируется н эквивалентируется. Особенно важно эквивалентирование при использовании метода избыточной схемы [11], так как до начала расчета требуется задать всю возможную совокупность трасс тепловых сетей.

Более сложным примером эквивалентирования, понимаемого в широком смысле, является упрощение математического описания тепловой сети. Например, при оптимизации СЦТ можно использовать как метод избыточной схемы, так и сетевую модель (в рамках специальных методов линейного программирования) [17, 23]. Так как допустимая размерность линейных сетевых задач значительно превышает возможности решения нелинейных сетевых моделей, многие процессы стараются исследовать вначале с помощью линейной аппроксимации.

При использовании агрегирования и эквивалентирования в математическом моделировании энергетического объекта или системы следует иметь в виду, что относительная погрешность исходных данных существенно зависит от уровня эквивалентирования (или агрегирования). Обычно относительная погрешность исходных данных уменьшается с увеличением уровня эквивалентирования. При уменьшении уровня эквивалентирования, т.е. большей детализации модели, относительная погрешность исходных данных увеличивается. Таким образом, стремлению более детально описать изучаемую систему противостоит увеличение погрешности используемой при этом исходной информации. Например, капитальные вложения в пиковые котельные (ПК) малой мощности могут быть существенно различными в зависимости от вида топлива и местных условий. Если заменить всю совокупность ПК данной СЦТ одной эквивалентной установкой, то относительная погрешность определения капитальных затрат в нее уменьшится. Поэтому в моделях СЦТ [17, 24] мелкие ИТ рассматриваются в совокупности, а крупные по отдельности с детализацией по элементам основного оборудования ИТ.

Третьим методом сокращения исходной информации является декомпозиция. Под декомпозицией понимается процесс расчленения задачи (исходной информации) на ряд подзадач (информационных комплексов) с последующим независимым решением подзадач (преобразованием информации) и взаимная увязка полученных решений с помощью координирующей задачи.

Известно, что при декомпозиции существенна степень связности моделируемой системы [20] и относительная сила проявления связей системы. Формально декомпозиционные методы можно математически обосновать только для слабо взаимодействующих подсистем. Поэтому эти методы часто применяются в тех ситуациях, когда интуитивно ясна слабость отдельных связей. Например, при оптимизации СЦТ естественной Декомпозицией является расчленение задачи на две подзадачи: оптимизация собственно ИТ и оптимизация тепловых сетей (рис. 3.2). Основанием подобного расчленения задачи является тот факт, что для расчета потокораспределения в сети неважно, какими техническими средствами (типами ИТ) создается поток теплоносителя. Важны только виды теплоносителя и массовые расходы теплоносителя в выделенных узлах сети. Таким образом, при заданной конфигурации сети возможна декомпозиция исходной задачи [17].


Второй случай возможности применения метода декомпозиции - ситуация, в которой связи между отдельными подсистемами сильны, но декомпозиция по сильным связям приводит к уменьшению числа параметров, характеризующих систему в целом.

Приемы и способы декомпозиции энергетических задач весьма разнообразны. Обзор наиболее часто используемых методов декомпозиции в нелинейных задачах приводится в работе [20]. Отметим только, что для успешного применения этих методов (закрепления параметров связей между подсистемами — замораживание связей, групповой релаксации и множителей Лагранжа) необходимо учитывать наблюдаемую силу связей и число параметров, характеризующих эти связи в моделируемой системе; в случае высокой степени связности объем перерабатываемой информации по задаче в целом не будет уменьшаться.

Наряду с агрегированием, эквивалентированием и декомпозицией весьма важно применять методы обработки исходной информации, позволяющие выделить основные влияющие на систему факторы. Такая предварительная обработка информации позволяет сокращать число учитываемых факторов.


В качестве величины 3 может рассматриваться любой выходной показатель системы или объекта; обычно в качестве 3 рассматривают величину приведенных затрат в систему или объект. Простота вычисления коэффициентов чувствительности приводит к широкому распространению этого метода ранжирования факторов в инженерной практике. Однако его применение требует априорного допущения о достаточной гладкости функции 3, так как в практических расчетах принимается


Третьей, менее известной в энергетической литературе возможностью ранжирования факторов, не требующей гладкости функции цели, является метод, применяемый в теории распознавания образов [26]. Рассмотрим основные предпосылки и этапы этого метода. В простейшей постановке предполагается, что имеются опытные данные о фактических значениях переменных проектируемой системы или объекта. Эта совокупность числовых данных является множеством точек в пространстве признаков (факторов) X = {X,, х2,..., Xf} и называется в теории распознавания образов материалом обучения. При этом неважно, являются ли переменные х, непрерывными, дискретными или булевыми (0; 1). Важно только, что эта совокупность факторов может влиять на рассматриваемый объект. Функция цели на материале обучения считается заданной и в простейшем случае принимает значения 0 и 1. Таким образом, исследователь, используя опыт эксплуатации или экспериментов, наблюдает на материале обучения относительную силу проявления действующих факторов. Требуется определить, как и в основной задаче ранжирования факторов, какие из факторов или их совокупностей оказывают существенное влияние на функцию цели, и указать эти факторы. Для этой цели совокупность точек пространства факторов X (материал обучения) проектируется на некоторое подпространство L пространства X. Если в этом подпространстве L можно отделить с помощью гиперплоскости П множество точек со значением функции цели 1 от множества точек со значением функции цели 0, то совокупность факторов (i,... , xL), определяющая подпространство L, является существенно влияющей.

Кроме того, построенная гиперплоскость П (линейная комбинация существенно влияющих признаков) является новым фактором, который можно использовать для построения математической модели. Построение подпространств и гиперплоскостей П осуществляется алгоритмически. При этом переход к большему числу факторов осуществляется только в том случае, если во всех подпространствах меньшей раз- мерности материал обучения не позволяет разделить признаки на существенно влияющие и несущественные.

Отметим очевидные достоинства этого метода по сравнению с другими методами ранжирования факторов. Основными объектами алгоритмизации этого метода являются гиперплоскости и подпространства пространства признаков, т.е. системы линейных уравнений и неравенств, что обусловливает простоту реализации на ЭВМ. Не требуется составления модели процесса или системы на этапе анализа значимости факторов. Результатом анализа значимости факторов может явиться не только выделение заранее определенных факторов xt (но в меньшем количестве), но и построение ’’новых агрегированных факторов.

Естественно, что эффективность применения этого метода будет зависеть от качества материала обучения, а сложность расчетов — от количества исходных элементарных признаков (факторов). Однако эти трудности являются общими и для других методов ранжирования факторов.

Исследование систем теплоснабжения/Л.C. Попырин, К.С. Светлов, Г.М. Беляева и др. М.: Наука, 1989.

на главную