Развитие энергетики России Тепловые станции Экологический аспект Электрофильтры Регенеративные методы Математическое моделирование экологических систем Аварийные ситуации на АЭС

Введение в экологию энергетики

Наиболее часто используются иерархические классификации [Айвазян с соавт., 1974; Жамбю, 1988], которые могут быть представлены в двух основных формах – дерева (фиг. А рис. 2.3) и вложенного множества (фиг. В). Дерево представляет собой специальный вид направленного графа – структуры, состоящей из узлов, связанных дугами. Дерево иерархической классификации обладает следующими свойствами:

имеется один и только один корень (иногда в полном противоречии с ботаникой его называют вершиной);

всегда имеется путь от корня до любого другого узла в дереве;

каждый узел, кроме корня, имеет одного и только одного родителя (т.е. граф не должен иметь циклов и петлей) и произвольное число потомков;

узлы дерева, которые не имеют потомков, называются листьями и они соответствуют исходному множеству классифицируемых объектов. Развитие нетрадиционной энергетики Энергосберегающие технологии

Рис. 2.3. Методы представления результатов классификации

(А – дерево, В – вложенное множество)

Визуализация дерева разбиений осуществляется в виде двух специальных графиков:

дендрограммы, где пары объектов соединяются в соответствии с уровнем связи, отложенным по оси ординат,

дендрита – графа максимального корреляционного пути, где изображение объектов на плоскости произвольно, а ребра соответствуют максимальному значению из всех связей каждого объекта с другими.

В справочнике И.П. Гайдышева [2001] показано, что дендрограмма, и дендрит – визуальное отображение одной и той же сущности: по графу легко может быть построена дендрограмма и наоборот.

Многомерный подход основан на предположении, что существует возможность лаконичного объяснения природы анализируемой многокомпонентной структуры [Браверман, Мучник, 1983; Александров, Горский, 1983; Верхаген с соавт., 1985]. Это означает, что есть небольшое число определяющих факторов, с помощью которых могут быть достаточно точно описаны как наблюдаемые характеристики анализируемых состояний, так и характер связей между ними [Ким с соавт., 1989]. Иногда эти факторы могут оказаться в явном виде среди исследуемых признаков, но чаще всего оказываются латентными или скрытыми. Сжатое (редуцированное) представление исходных данных в виде матрицы F с меньшим числом переменных p (m > p) без существенной потери информации, содержащейся в исходной матрице X, является сущностью таких важнейших методов снижения размерности, как факторный анализ, многомерное шкалирование, метод главных компонент, целенаправленное проецирование [Ватанабе, 1969; Харман, 1972; Дубров, 1978; Терехина, 1986; Краскел, 1986; Дэйвисон, 1988; Ципилева, 1989]. Эти методы применяются при решении следующих задач:

редукция данных или понижение размерности признакового пространства типа "объект-признак" за счет сведения многочисленных взаимозависимых наблюдаемых переменных к некоторым обобщенным ненаблюдаемым факторам;

преобразование исходных переменных к более удобному для визуализации виду и классификация объектов на основе сжатого признакового пространства;

создание структурной теории исследования объектов и интерпретация косвенных факторов, не поддающихся непосредственному измерению.

С общетеоретических позиций кластерный анализ также является своеобразным методом снижения размерности, выполняемый в пространстве объектов. Определены [Попечителев, Романов, 1985] основные требования, которые являются определяющими для выбора метода снижения размерности: взаимная некоррелированность, наименьшие искажения структуры моделируемых данных, наибольшая надежность правильного разбиения исходной выборки на естественные группы и т.д.


На главную