title-icon Статьи о ремонте
title-icon
» » Принципы классификации гидрогеологических объектов

Принципы классификации гидрогеологических объектов

Классификация — это один из наиболее сильных и наиболее разработанных методов познания реального мира. По-видимому, он возник вместе с человеком, поскольку восприятие нами действительности основано на расчленении ее на составляющие: предметы живые и неживые, растения и животные, млекопитающие и рыбы, насекомые и птицы, твердое и мягкое и т. д. Знакомство с геологическими объектами также началось с классификаций: минералов, горных пород, палеофауны и флоры, геологических процессов и т. п. Однако теорией классификационного анализа, теорией классификации как метода стали заниматься относительно недавно и стимулировало эти разработки появление ЭВМ и их использование в естественных науках. На первых этапах развития гидрогеологии наблюдалось всеобщее увлечение классификациями. Гидрогеологи находили все новые и новые поводы и возможности разделения подземных вод на разного рода типы, классы, группы, царства. К концу 50-х годов нашего века наступило пресыщение, и казалось, что разумные пределы расчленения подземных вод на составляющие достигнуты. Однако, как это было всегда в науке, развитие теории дало новый толчок практике и в настоящее время интерес к классификационному анализу возник снова, но уже на другом, более высоком и сложном уровне.
В классификационном анализе обычно различают две основные задачи: 1) построение классов; 2) распознавание объекта по классификационным признакам, т. е. отнесение нового объекта к тому или иному из построенных классов.
Использование ЭВМ позволило создавать очень сложные многопараметрические классификационные структуры, часто формализованные и абстрактные. Поэтому в последние годы все чаще и чаще стала возникать еще одна задача — задача интерпретации классов. Кратко остановимся на этих задачах.
Построение классов. Смысл этой задачи заключается в том, чтобы множество в общем случае многопараметрических объектов разделить на более мелкие и однородные группы (или классы). Очевидно, что число таких групп имеет ограничения. Во-первых, все исходное множество может быть принято за один класс, во-вторых, классом может считаться каждый объект отдельно. Таким образом, если множество содержит n объектов, то число классов m определяется

Чтобы разделить множество А, состоящее из п объектов, A = (n), на m классов, необходимо выполнить три условия.
1. Выбор меры сходства между объектами множества. Иными словами, вначале надо решить, по каким признакам мы будем расчленять множество А. Например, множество анализов подземных вод можно разделить на классы по минерализации — по одному признаку, либо по основным шести компонентам, либо по температуре, либо по газовому составу и т. д.
2. Нахождение правила расчленения, или, как говорят, выбор функции, отражающей внутреннюю однородность групп. Например, выделяя классы вод по минерализации, мы делим воды на пресные и соленые по значению минерализации 1 г/л, исходя из вкусовых ощущений человека. Среди соленых вод выделяем солоноватые (до 10 г/л) и сильносоленые (более 10 г/л), ориентируясь на вкусовые ощущения животных. Критерий разделения вод на классы по минерализации может быть и более строгим, скажем, по растворимости преобладающих в растворе солей или по преобладанию различных ионов (табл. 8.1).

Можно предложить и другие варианты. Таким образом, правил членения, так же как и мер сходства для их реализации, может быть очень много, теоретически бесконечно много. И выбор их контролируется лишь теми целями, которые ставит перед собой исследователь.
Однако в ряде случаев одно и то же правило позволяет создавать различные классификации. Чаще всего такая ситуация возникает при формальном расчленении множества. Например, если совокупность n нужно разделить на m групп, то число вариантов такого членения определяется числом Стирлинга второго рода S (n, m)

которое даже для небольших значений n весьма велико. Ниже приведены числа вариантов разделения n объектов на четыре группы.

Поэтому встает вопрос о том, на каком же варианте остановиться? Желателен всегда оптимальный вариант, а к нему предъявляется одно специальное требование: этот вариант должен обеспечивать максимальное сходство объектов внутри каждого класса по выбранному признаку. В связи с этим возникает еще одно, третье, условие.
3. Следует определить критерий максимальной однородности в классах. Такие критерии могут быть самыми разными, скажем, коэффициент корреляции, дисперсия признака и т. п.
Распознавание объекта. Общая теория этого вопроса разработана еще чрезвычайно слабо, однако существует ряд методов, которые успешно применяются для решения задачи. В качестве примера можно назвать дискриминантный анализ. Этот метод достаточно подробно описан в литературе и входит в число стандартных программ большинства современных ЭВМ. Смысл его состоит в следующем.
1. Рассматриваются два класса, представленные многопараметрическими совокупностями U и V (если классов много, то производят анализ для каждой пары классов).
2. Имеется объект, охарактеризованный в тех же параметрах.
3. Спрашивается, к какой из совокупностей он может быть отнесен.
Для этого строят дискриминантную функцию D (х1, x2, ..., хn), где x1, x2, ..., xn — результаты измерения K-характеристик объекта. Выбирается число Do, такое, что если D (х1, х2, ..., xn) > D0, объект относится к совокупности U, если D (х1, х2, ..., xn) < D0 — объект относится к совокупности V.
Общие же трудности задачи распознавания связаны с динамичностью классов. Представьте себе, скажем, фотографию человеческого лица. Нужно определить, кому она принадлежит (чье лицо изображает). Человеческое лицо меняется. Причем здесь можно говорить о тенденциях возрастных изменений и о случайных изменениях (разного рода гримасах, ужимках и т. д.), т. е. о том, что называют деформациями. В криминалистике эта задача сегодня решена, однако для геологии и гидрогеологии таких решений еще нет, хотя здесь много общего. Например, нам известны карты гидроизогипс или гидроизопьез, построенные для различных территорий на характерные периоды года. Спрашивается, можно ли по особенностям поведения уровней и напоров эти территории отнести к одному классу режима или они разные. Заметьте, что в общем случае речь может идти не о среднегодовом цикле режима, а о конкретных и для разных территорий различных годах. Нетрудно понять, что эта задача большой сложности и простыми методами ее не решить.
Задача интерпретации классов еще не имеет теоретических разработок, но во многих работах, посвященных классификациям, можно найти конкретные ее решения по отдельным частным направлениям.
В заключение скажем лишь одно: в настоящее время методов и приемов классификаций существует уже довольно много, большинство из них имеют разработанные программы для ЭВМ. Например, факторный анализ, метод главных компонент, кластерный анализ, метод коммивояжера и т. д. В то же время постоянно ведется работа по их совершенствованию, модификации, созданию новых методов, накапливается опыт классификационного исследования.

title-icon Подобные новости