ПРОГРАММЫ КЕМГЕП, РАНКОР (пакет документов)
Содержание
стр.
Общая справка о программе КЕМГЕП2
....................................
Основные изменения и дополнения в программе ..........................
Системные требования и установка программы ...........................
Требования к исходным данным .........................................
Последовательность работы с программой ...............................
Файлы (Раздел главного меню) .........................................
Расчет показателей (Раздел главного меню) ............................
Классификация (Раздел главного меню) .................................
Расчет сходства (Раздел главного меню) ...............................
Результаты классификации (Раздел главного меню) ......................
Графический вывод (Раздел главного меню) .............................
Справка (Раздел главного меню) .......................................
Выход (Раздел главного меню) .........................................
Алгоритмы (Раздел главного меню) .....................................
АЛГОРИТМЫ ПРОГРАММНОГО КОМПЛЕКСА "KEMGEP" ДЛЯ АВТОМАТИЗИРОВАННОЙ
ОБРАБОТКИ ГЕОХИМИЧЕСКИХ ДАННЫХ НА
ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРАХ .........
Программы
Общая справка о программе КЕМГЕП2
В
последние годы резко возросла роль геохимических методов при картировании,
поисках месторождений полезных ископаемых, а также в природоохранных
мероприятиях (геоэкомониторинг). Высокая их эффективность определяется, в
первую очередь, тем, что они основаны на обнаружении прямых признаков
оруденения, загрязнения окружающей среды и т.п. Однако из-за того, что
геохимические данные, как правило, многокомпонентные, возникает необходимость
их свертывания и структуризации. В то же время многокомпонентность данных
позволяет существенно повысить эффективность и надежность решения задач
геохимической классификации, расчленения, распознавания, прогнозирования
изучаемых объектов и факторов.
Описываемый
ниже системный комплекс "KEMGEP" разработан в ЦМГХП ГФУП УГОМЭ
совместно с ООО фирмой "ГЭТИ" в период 1995-1999 (2001) гг. Автором
алгоритмов комплекса является Вострокнутов Г.А., автором программ и
алгоритмов обработки данных на ПК – Брусницын В.Д.
Актуальность
разработанного комплекса программ определяется повышением требований к
геохимическим работам при государственном геологическом картографировании.
Проведение крупномасштабных геохимических работ в настоящее время ограничено в
силу низкого финансирования. Однако в фондах геологических организаций накоплен
огромный материал геохимических съемок за прошедшие годы. Предлагаемая система
ориентирована на эффективное использование подобного материала. Комплекс
программ "KEMGEP" позволяет:
-
рассчитывать различные комплексные геохимические показатели, основанные на
кларках концентраций, геофонах, включая суммарный показатель геохимического
загрязнения Zc, коэффициенты аномальности, минерализованности, зональности,
основанные на балльных оценках рудоносности (по Г.А. Вострокнутову),
аналогичные показатели, основанные на нормированных оценках содержаний,
нормированных оценках, суммарные показатели идентичности заданным объектам и
т.п.;
-
выполнять классификацию (разделение) заданных множеств многомерных
геохимических проб, других многомерных данных (минералогических и пр.), имеющих
атрибуты, представленные в цифровом или ранговом виде;
-
определять многомерное геохимическое или иное ранговое сходство исследуемых
массивов проб или объектов с заданными наборами эталонных объектов;
-
выводить на экран монитора результаты классификации (разграничения) или
сходства пространственных данных в виде карт, разрезов для предварительного
просмотра и необходимых корректив (в настоящее время в связи с интенсивным
улучшением программ вывода и анализа пространственных данных ГИСПАРК, ArcView,
MapInfo, Surfer необходимость в этом разделе отпадает);
-
подготавливать материалы расчетов для вывода карт на наиболее распространенных
ГИС-системах, используемых в геологической службе (ГИСПАРК, ArcView, MapInfo,
Surfer);
-
рассчитывать и выводить результаты расчетов в текстовой и табличной формах
(таблицы принятых показателей и геохимических спектров по выделенным классам,
таблицы корреляции между классами, ряды информативности элементов и т.п.)
-
создавать, просматривать и поддерживать файлы баз данных (dbf).
Основные изменения и дополнения в программе
Программа
КЕМГЕП2 является второй версией программы КЕМГЕП. При
практическом применении программы возникли некоторые трудности с открытием
файлов в связи с некоторыми недоработками в FoxPro, неудобство вывода текстовых
файлов по спектрам, каталогов и др. При этом внесены следующие основные
изменения и дополнения:
1.
Разработана подпрограмма вывода СПЕКТРОВ непосредственно в любой рабочий файл
(основной, эталонный файл - со средней характеристикой по выделенным классам)
как по коэффициентам, так и по рангам, для химических элементов и отдельно для
сложных компонентов (HCO3- и др.). Это дает большое
преимущество дальнейшего использования спектров для разнообразных целей - как
создания каталогов, так и отражения на картах.
2.
Предусмотрен экспорт файлов в программу Excel; основная цель - вывод спектров и
других характеристик по файлам в любом виде и формате независимо от
программного кода.
3.
Дополнительно доработан код открытия файлов во всех основных подпрограммах.
Раньше файлы предлагалось открывать только после запуска какого-либо раздела
программы (наблюдались некоторые системные сбои по неопределенным причинам -
неполное открытие окон и т.д.). В настоящей версии в меню Файлы предлагается открыть основной и эталонный файлы до выполнения
расчетов и их просмотра, а затем запускать расчет. При этом надо учитывать, что
меню "ОТКРЫТЬ ФАЙЛ ЭТАЛОНОВ"
предназначено для открытия эталонов и их использования как вспомогательных файлов
при расчете Zc, баллов, сходства. В других случаях, когда надо пересчитывать
эталонный файл, его следует считать основным.
4.
Переделана программа статистики с выводом результатов в Excel, а также в виде
файла dbf.
5.
Доработана программа РАНКОР - при расчете сходства наряду с основным полем
сходства по преобладающему какому-либо классу (Rsp) добавляются поля со
сходством по каждому классу с названием в форме Cl+номер класса.
6.
Разработан файл справки-инструкции по работе с программой и т.д.
Системные требования и установка программы
Система
"KEMGEP" работает на IBM-совместимых компьютерах, под управлением
Windows98. Для работы программы требуется не менее 5 МБ на рабочем диске (без
учета объема, требуемого под исходные, временные и результирующие файлы). По
умолчанию сама система располагается в директории C:\KEMGEP, рабочие материалы
располагаются по усмотрению авторов. Система отличается простотой в
использовании в случае понимания основных положений обработки данных.
УСТАНОВКА
ПРОГРАММЫ
Для
установки программы создайте на вашем рабочем диске директорию TEMP или другую,
в которую скопируйте содержимое 3-х установочных дискет. После чего запустите
команду setup.exe - ПК перейдет к установке системы на ваш диск в директорию.
В
случае наличия установленной программы Visual FoxPro 5 нет необходимости
устанавливать программу - можно просто запускать программу Kemgep2.exe.
Требования к исходным данным
ИСХОДНЫЕ
ДАННЫЕ
Файлы
исходных данных должны быть в формате dbf. Их можно создавать как
непосредственно в программе через меню Файлы
- "Создать файл", так и в других системах (FoxPro, dBase,
ArcView, MapInfo, ГИСПАРК, Excel и др. с последующим экспортом в dbf формат).
Главные ограничения для полей в файлах заключаются в следующем: запрещаются
имена полей Zc, Klasse, Kl1- Kln (n - целое число), R_Sp, Intensiv, Ka_plu,
Ka_min, Ka_sum, Sum, а также окончания полей _K, _R (независимо от регистра).
Это связано с тем, что при выполнении программы происходит генерация полей с
такими именами, а появление полей с одинаковыми именами вызовет сбой в
программе. Для расчетов параметров (кларков концентраций, Zc, баллов и т.п.)
должны быть заранее подготовлены эталонные файлы с кларковыми, рудными
содержаниями. При нормировке показатели вычисляются автоматически, но их можно
изменить. Главное условие заключается в том, что эталон при любых вычислениях
должен иметь все элементы, используемые в основном файле, а цифровые поля
основного файла должны иметь не менее 2-х десятичных знаков после запятой. При
расчете нормированных оценок и баллов в файлах должны отсутствовать нулевые
содержания (в связи с тем, что вычисления проводятся в логарифмах), они должны
быть заменены какими-либо цифрами. Файл эталонов для вычисления связи (RANCOR)
- обычный dbf - должен содержать поле с названием "KLASSE", в котором
вводится номер эталона для цели классифицирования.
Последовательность работы с программой
Все
основные понятия и методы расчетов приведены в отчете по программе КЕМГЕП,
поэтому здесь не дублируются.
Здесь
приведена вся последовательность основных операций по расчетам.
Следует
особо подчеркнуть, что прежде чем проводить расчеты, надо четко понимать, зачем
нужны данные расчеты и как они выполняются - перед работой рекомендуется
прочитать отчет или книги по классификациям (кластерному анализу и т.д.)
Программа
составлена бывшим ведущим геологом ЦМГХП УГОМЭ, поэтому устроена крайне просто
и рационально и рассчитана прежде всего на геологов.
Каждый
файл, полученный на какой-либо стадии расчетов, может где-либо применяться.
Так, например, рассчитанные по подпрограмме Zc и КК могут использоваться сразу
без классификаций для построения карт различных видов, и в случае вывода в
дополнительное поле спектров для вывода каталогов проб с ранжированными
спектрами - наилучшим образом при предварительном экспорте в формат Excel. Файл
с рассчитанными рангами можно использовать для классификации или расчета
сходства и т.д. Поэтому все операции в программе разделены. И стоит только
строго соблюдать порядок расчетов. Порядок расчетов очевиден из отчета и
нижеследующего текста. Полностью дублировать отчет здесь не имеет смысла.
Последовательность
работы с программой заключается в следующем:
-
создать рабочую копию файла необходимой структуры и, если нужно, заменить нули;
-
расчет коэффициентов;
-
расчет рангов;
-
расчет классов с итерациями или сходства с эталонами (причем в последнем случае
файл эталонов должен быть той же структуры, что и основной, пересчитан и
ранжирован по тем же параметрам, что и основной);
-
вывод результатов "ЭКСПОРТ В
Excel" и в текстовый формат;
-
вывод карт производится на любой системе подготовки основных карт (ГИСПАРК,
ArcView, MapInfo, Surfer), где имеется топооснова, геологические карты и др.
Перед
расчетами рекомендуется открывать и просматривать файлы и затем запускать
нужный вид расчетов.
При
расчете кларков концентраций открыть в меню Файлы основной файл (иначе программа запрашивает сначала основной
файл); например, файл Poroda.dbf имеет такие содержания элементов:
sreda |
istochnik |
edizm |
cu |
pb |
zn |
Порода 1 |
Справочник |
г/т |
10 |
1 |
50 |
Порода 2 |
Справочник |
г/т |
87 |
6 |
105 |
Порода 3 |
Справочник |
г/т |
30 |
15 |
60 |
Порода 4 |
Справочник |
г/т |
10 |
19 |
39 |
Порода 5 |
Справочник |
г/т |
5 |
12 |
130 |
Порода 6 |
Справочник |
г/т |
45 |
20 |
95 |
Порода 7 |
Справочник |
г/т |
5 |
7 |
16 |
Порода 8 |
Справочник |
г/т |
4 |
9 |
20 |
Порода 9 |
Справочник |
г/т |
100 |
8 |
130 |
Порода 10 |
Справочник |
г/т |
20 |
20 |
60 |
Затем
в меню Файлы открыть файл эталона с
фоновыми или кларковыми концентрациями; например, файл KlarkZk.dbf имеет такие
содержания элементов:
sreda |
klasse |
istochnik |
edizm |
cu |
pb |
zn |
Кларк З.К. |
1 |
Головин_1998 |
г/т |
53 |
8 |
68 |
После
выбора эталона идет пересчет; в результате получаем, к примеру, файл
PoroZc.dbf, который имеет следующие пересчитанные коэффициенты и суммарный
коэффициент, который можно использовать в каких-либо целях:
sreda |
cu_k |
pb_k |
zn_k |
zc |
Порода 1 |
0.18868 |
0.125 |
0.73529 |
1 |
Порода 2 |
1.64151 |
0.75 |
1.54412 |
2.19 |
Порода 3 |
0.56604 |
1.875 |
0.88235 |
1.88 |
Порода 4 |
0.18868 |
2.375 |
0.57353 |
2.38 |
Порода 5 |
0.09434 |
1.5 |
1.91176 |
2.41 |
Порода 6 |
0.84906 |
2.5 |
1.39706 |
2.9 |
Порода 7 |
0.09434 |
0.875 |
0.23529 |
1 |
Порода 8 |
0.07547 |
1.125 |
0.29412 |
1.13 |
Порода 9 |
1.88679 |
1 |
1.91176 |
2.8 |
Порода 1 |
0.37736 |
2.5 |
0.88235 |
2.5 |
Расчет
нормированных оценок и баллов проводится ПОЛНОСТЬЮ аналогично.
При
расчете нормированных оценок открыть в меню Файлы основной файл (иначе программа запрашивает основной файл), а
затем идет пересчет, и в окне появляются параметры вычислений (среднее и стандарт),
которые по желанию можно изменить, после чего (при нажатии клавиши ESC) идет
окончательный пересчет.
При
расчете баллов открыть в меню Файлы
основной файл (иначе программа запрашивает сначала основной файл), а затем в
меню Файлы открыть файл эталонов,
содержащий фоновые и рудные содержания компонентов (иначе программа запрашивает
файл эталона) с фоновыми или кларковыми концентрациями и рудными содержаниями,
после выбора двух эталонов идет пересчет.
При
расчете рангов открыть в меню Файлы основной
файл (иначе программа запрашивает файл) с заранее рассчитанными коэффициентами,
например, файл PoroZc.dbf, и после ранжирования получаем файл, например, файл
PoroRn.dbf с ранжированными коэффициентами:
sreda |
cu_k |
pb_k |
zn_k |
zc |
cu_r |
pb_r |
zn_r |
t_t |
Порода 1 |
0.18868 |
0.125 |
0.73529 |
1 |
2 |
3 |
1 |
0 |
Порода 2 |
1.64151 |
0.75 |
1.54412 |
2.19 |
1 |
3 |
2 |
0 |
Порода 3 |
0.56604 |
1.875 |
0.88235 |
1.88 |
3 |
1 |
2 |
0 |
Порода 4 |
0.18868 |
2.375 |
0.57353 |
2.38 |
3 |
1 |
2 |
0 |
Порода 5 |
0.09434 |
1.5 |
1.91176 |
2.41 |
3 |
2 |
1 |
0 |
Порода 6 |
0.84906 |
2.5 |
1.39706 |
2.9 |
3 |
1 |
2 |
0 |
Порода 7 |
0.09434 |
0.875 |
0.23529 |
1 |
3 |
1 |
2 |
0 |
Порода 8 |
0.07547 |
1.125 |
0.29412 |
1.13 |
3 |
1 |
2 |
0 |
Порода 9 |
1.88679 |
1 |
1.91176 |
2.8 |
2 |
3 |
1 |
0 |
Порода 1 |
0.37736 |
2.5 |
0.88235 |
2.5 |
3 |
1 |
2 |
0 |
При
расчете классификации открыть в меню Файлы
основной файл (или программа запрашивает файл) с заранее рассчитанными рангами,
например, файл PoroRn.dbf, и после классификации получаем, например, файл
Porok3.dbf с пробами, разделенными на классы (в нашем случае на три). После
выполнения итераций по этому файлу получаем:
sreda |
cu_k |
pb_k |
zn_k |
zc |
cu_r |
pb_r |
zn_r |
t_t |
klasse |
r_sp |
Порода 1 |
0.18868 |
0.125 |
0.73529 |
1 |
2 |
3 |
1 |
0 |
1 |
1 |
Порода 2 |
1.64151 |
0.75 |
1.54412 |
2.19 |
1 |
3 |
2 |
0 |
3 |
1 |
Порода 3 |
0.56604 |
1.875 |
0.88235 |
1.88 |
3 |
1 |
2 |
0 |
2 |
1 |
Порода 4 |
0.18868 |
2.375 |
0.57353 |
2.38 |
3 |
1 |
2 |
0 |
2 |
1 |
Порода 5 |
0.09434 |
1.5 |
1.91176 |
2.41 |
3 |
2 |
1 |
0 |
1 |
0.5 |
Порода 6 |
0.84906 |
2.5 |
1.39706 |
2.9 |
3 |
1 |
2 |
0 |
2 |
1 |
Порода 7 |
0.09434 |
0.875 |
0.23529 |
1 |
3 |
1 |
2 |
0 |
2 |
1 |
Порода 8 |
0.07547 |
1.125 |
0.29412 |
1.13 |
3 |
1 |
2 |
0 |
2 |
1 |
Порода9 |
1.88679 |
1 |
1.91176 |
2.8 |
2 |
3 |
1 |
0 |
1 |
1 |
Порода1 |
0.37736 |
2.5 |
0.88235 |
2.5 |
3 |
1 |
2 |
0 |
2 |
1 |
В результате
итераций формируется таблица средних характеристик по выделенным классам,
например, файл Poroi5.dbf (в нашем случае пять итераций):
N_prob |
cu_k |
pb_k |
zn_k |
zc |
cu_r |
pb_r |
zn_r |
t_t |
klasse |
r_sp |
Средний спектр |
3 |
0.723 |
0.875 |
1.5196 |
2.07 |
2 |
3 |
1 |
0 |
1 |
0.833 |
Zn 1.5 Pb 0.9 Cu 0.7 |
6 |
0.36 |
1.875 |
0.710 |
1.97 |
3 |
1 |
2 |
0 |
2 |
1 |
Pb 1.9 Zn 0.7 Cu 0.4 |
1 |
1.64 |
0.75 |
1.544 |
2.19 |
1 |
3 |
2 |
0 |
3 |
1 |
Cu 1.6 Zn 1.5 Pb 0.8 |
Примечание:
спектры выводятся в файлы по желанию, но после всех необходимых расчетов, в
связи с тем, что наличие символьного поля будет препятствовать расчетам. В этом
случае спектр или переместить, или удалить через Меню - Файлы - Изменить структуру, а затем снова рассчитать.
При
расчете сходства открыть в меню Файлы
основной файл (или программа запрашивает вначале основной файл), например,
вышеуказанный файл PoroRn.dbf (с ранжированными коэффициентами) с заранее
рассчитанными рангами. В меню Файлы открыть файл эталонов (или программа запрашивает файл
эталонов) с заранее рассчитанными рангами в том же порядке и с теми же
кларками, что и основной (в ряде случаев опытные специалисты могут выбирать
другие кларки и фоны или простые ряды): в нашем случае мы выбрали эталон -
колчеданные руды, например, RUDA.dbf:
sreda |
klasse |
istochnik |
edizm |
cu |
pb |
zn |
Руда Cu |
2 |
Овчинников, 1998 c доп. |
г/т |
19000 |
550 |
19700 |
После
расчета кларков концентраций получаем файл, например, RUZc.dbf:
sreda |
klasse |
cu_k |
pb_k |
zn_k |
zc |
Руда Cu |
2 |
358.49 |
68.75 |
289.706 |
714.95 |
После
расчета рангов получаем файл, например, RURn.dbf:
sreda |
klasse |
cu_k |
pb_k |
zn_k |
zc |
cu_r |
pb_r |
zn_r |
t_t |
Руда Cu |
2 |
358.49 |
68.75 |
289.70 |
714.95 |
1 |
3 |
2 |
0 |
И
после запуска расчета из соответствующего пункта меню пересчитывает сходство в
третий файл, например, RUSH.dbf:
sreda |
cu_k |
pb_k |
zn_k |
zc |
cu_r |
pb_r |
zn_r |
t_t |
r_sp |
klasse |
intens |
kl2 |
spectr по Кк |
Порода 1 |
0.18868 |
0.125 |
0.73529 |
1 |
2 |
3 |
1 |
0 |
0.5 |
2 |
1.05 |
0.5 |
Zn 0.7 Cu 0.2 Pb 0.1 |
Порода 2 |
1.64151 |
0.75 |
1.54412 |
2.19 |
1 |
3 |
2 |
0 |
1 |
2 |
3.94 |
1 |
Cu 1.6 Zn 1.5 Pb 0.8 |
Порода 3 |
0.56604 |
1.875 |
0.88235 |
1.88 |
3 |
1 |
2 |
0 |
-1 |
2 |
3.32 |
-1 |
Pb 1.9 Zn 0.9 Cu 0.6 |
Порода 4 |
0.18868 |
2.375 |
0.57353 |
2.38 |
3 |
1 |
2 |
0 |
-1 |
2 |
3.14 |
-1 |
Pb 2.4 Zn 0.6 Cu 0.2 |
Порода 5 |
0.09434 |
1.5 |
1.91176 |
2.41 |
3 |
2 |
1 |
0 |
-0.5 |
2 |
3.51 |
-0.5 |
Zn 1.9 Pb 1.5 Cu 0.1 |
Порода 6 |
0.84906 |
2.5 |
1.39706 |
2.9 |
3 |
1 |
2 |
0 |
-1 |
2 |
4.75 |
-1 |
Pb 2.5 Zn 1.4 Cu 0.8 |
Порода 7 |
0.09434 |
0.875 |
0.23529 |
1 |
3 |
1 |
2 |
0 |
-1 |
2 |
1.2 |
-1 |
Pb 0.9 Zn 0.2 Cu 0.1 |
Порода 8 |
0.07547 |
1.125 |
0.29412 |
1.13 |
3 |
1 |
2 |
0 |
-1 |
2 |
1.49 |
-1 |
Pb 1.1 Zn 0.3 Cu 0.1 |
Порода 9 |
1.88679 |
1 |
1.91176 |
2.8 |
2 |
3 |
1 |
0 |
0.5 |
2 |
4.8 |
0.5 |
Zn 1.9 Cu 1.9 Pb 1.0 |
Порода 10 |
0.37736 |
2.5 |
0.88235 |
2.5 |
3 |
1 |
2 |
0 |
-1 |
2 |
3.76 |
-1 |
Pb 2.5 Zn 0.9 Cu 0.4 |
В
итоге можем сделать вывод, что на колчеданные руды в геохимическом смысле
похожи породы 1 и 9 и больше остальных пятая, что и следовало ожидать, так как
они выделились в первый класс при разделении выборки на три класса.
Здесь
на примере показаны все основные функции программы. Все прочие аналогичны и
приводятся в тексте отчета и в характеристике действий меню в других разделах
данной справки.
Файлы (Раздел главного меню)
"Создать файл" |
Создает файл на основе
стандартных средств FoxPro |
"Изменить структуру
файла" |
Открыть файл, изменить
структуру |
"Просмотр файла" |
Открыть, просмотреть,
закрыть |
"ОТКРЫТЬ ОСНОВНОЙ
ФАЙЛ" |
Открывает основной файл,
по которому предполагается выполнять какой либо пересчет Открыть, просмотреть,
закрыть |
"ОТКРЫТЬ ФАЙЛ
ЭТАЛОНОВ" |
Открывает файл эталонов, с
применением которого предполагается выполнять какой либо пересчет Открыть, просмотреть,
закрыть |
"Закрыть файлы" |
Закрывает открытые ранее
файлы |
"Экспорт в
FoxPro2x" |
Раздел введен для
совместимости с более старыми программами и программами, не распознающими
формат Visual FoxPro (например MapInfo 5) |
"Экспорт в Excel" |
Экспорт
в Excel предназначен для преобразования файлов в формат Excel; служит для
различных целей, но, в основном, для вывода характеристик (спектров и др.)
классов в любой форме для переноса в другие программы (Word и др.) |
Расчет показателей (Раздел главного меню)
"Расчет Kk и Zc" |
Рассчитывает кларки концентраций
и суммарный показатель геохимического загрязнения Zc с использованием файла с
заранее введенными значениями кларков или местных фонов, при этом расчеты
выводятся в новый файл с изменением двух последних букв исходного файла на
"Zc" |
"Пересчет в
обобщенный закон" |
Пересчитывает содержания
элементов с учетом обобщенного логнормального закона. Две последние буквы в
новом файле заменяются на ob |
"Нормировка
данных" |
1. "Нормировка данных" Рассчитывает нормированные
оценки автоматически с учетом логнормального распределения (в исходном файле
не должно быть нолей - 0), выводит параметры нормировки в новый файл, при
этом изменяет две последние буквы исходного файла на "np"; этот
файл появляется в окошке, и предлагается заменить параметры по усмотрению
авторов, затем происходит нормировка исходных данных и запись в файл с
измененными двумя последними буквами на "nr" 2. "Нормировка эталонов" Рассчитывает нормированные
оценки по имеющемуся файлу с окончанием "np" или любым, введенным
заранее |
"Расчет баллов" |
Рассчитывает баллы и
коэффициенты с использованием файла с заранее введенными значениями кларков
или местных фонов и рудных содержаний. Две последние буквы в новом файле
заменяются на bl |
"Статистика" |
Вычисление статистики по
файлам с выводом результата в формате Excel. Две последние буквы в новом
файле заменяются на st, выходной файл - в формате Excel |
"Норпок" |
Выполняется программа
Норпок для DOS |
Классификация (Раздел главного меню)
"Расчет
рангов" |
Подраздел
меню 1. "Расчет рангов по
КК" Рассчитываются
ранги по кларкам концентраций с различной степенью разности логарифмов КК
соседних элементов в ранжированном ряду. В случае различия меньшего заданному этим элементам присваиваются одинаковые ранги 2. "Расчет рангов по
баллам и нормированным оценкам" Рассчитываются
ранги по баллам и нормированным содержаниям с различной степенью их разности.
В случае различия меньшего заданному этим элементам
присваиваются одинаковые ранги |
"Расчет
классов" |
Подраздел
меню 1. "Расчет классов со
снижением величины комплексного показателя" Задается
уровень минимального значения rcq, выбирается показатель и затем
его максимум; все пробы, имеющие связь > rcq (0,1-0,9)
относятся к первому классу и т.д. 2. "Расчет классов с
поиском наиболее удаленных по степени связи объектов" Задается уровень значимости rcq (0.01-0,3), выбирается
показатель и затем его максимум; все пробы относятся к первому классу c rc>rcq,
находится наиболее удаленная проба от максимальной и т.д. до превышения rc
вычисленного значения при выбранном уровне (rc>rcq). Примечание
rc- коэффициент ранговой корреляции по Спирмену 3. "Расчет заданного
числа классов" Число
классов (1-15) задается жестко, выбирается показатель и затем его максимум,
далее так же. Результат выводится в файлы с заменой двух последних букв на
"kn", где n - число классов |
"Итерации" |
Подраздел
меню Жестко
задается число итераций (обычно пяти достаточно). Результат выводится в файлы
с заменой двух последних букв на "in", где n - число итераций |
Расчет сходства (Раздел главного меню)
Рассчитывает
сходство по основному файлу с использованием файла с набором эталонов. Данные
как, в основном, так и в файле эталонов должны быть предварительно
преобразованными в кларки концентраций, баллы или нормированные оценки и
ранжированы.
Результаты классификации (Раздел главного меню)
"Спектры
по коэффициентам для элементов" |
Вывод
в файл спектров упорядоченных по коэффициентам (КК, баллам, нормированным
оценкам) для элементов таблицы Менделеева |
"Спектры
по рангам для элементов" |
Вывод
в файл спектров упорядоченных по рангам для элементов таблицы Менделеева |
"Спектры
по коэффициентам для компонентов" |
Вывод
в файл спектров упорядоченных по коэффициентам (КК, баллам, нормированным оценкам)
для сложных компонентов (HCO3- и т.д.) |
"Спектры
по рангам для компонентов" |
Вывод
в файл спектров упорядоченных по рангам для сложных компонентов (HCO3-
и т.д.). В результате в основном файле добавляется поле со спектрами, которые
можно использовать в зависимости от потребности - или использовать в тексте,
или выводить на карту |
"Вывод
связей между классами" |
Выводится
таблица с коэффициентами ранговой корреляции (rc) между средними
характеристиками выделенных классов. Результат выводится в файл с исходным
названием, но с расширением TX2 |
"Вывод
информативности элементов" |
Выводится
информативность элементов - степень смены местоположения в классах. Результат
выводится в файл с исходным названием, но с расширением TX1 |
Графический вывод (Раздел главного меню)
Предназначен для расчета равномерной сети границы между классами. Граница
вычисляется в виде координат X и Y и может выводиться в любой системе. Наличие
более совершенных систем вывода: ArcView, MapInfo и др. определило данный
раздел программы как вспомогательный с ограниченными возможностями, и
необходимость его использования может возникать только в крайнем случае.
Рекомендуется вывод границ между классами и пр. выполнять на основной системе.
Это связано так же с тем, что все основные материалы - геология, геофизика и
др., как правило, уже имеются у пользователя в одной из вышеуказанных систем.
"Расчет
равномерной сети" |
Выбирается
файл, масштаб и границы расчета равномерной сети; запись в файл с измененными
тремя последними буквами на "gri" |
"Расчет
границ" |
Выбирается
файл, масштаб расчета границ; запись в файл с измененными тремя последними
буквами на "grа" |
"Вывод
карты на экран монитора" |
Выбирается
файл, масштаб |
Справка (Раздел главного меню)
Выводит
разделы справки по программе.
Выход (Раздел главного меню)
Закрытие
файлов и выход из программы.
Алгоритмы (Раздел главного меню)
Приводятся
алгоритмы из текста отчета в формате WinWord, при нажатии на пункт меню
запускается WinWord и открывает главу из отчета. Раздел предназначен для любознательных.
АЛГОРИТМЫ ПРОГРАММНОГО КОМПЛЕКСА "KEMGEP" ДЛЯ
АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ГЕОХИМИЧЕСКИХ ДАННЫХ НА ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРАХ
На основе использования непараметрического критерия
ранговой корреляции Спирмэна (сокращенно – rc-критерий) составлены
алгоритмы основного программного комплекса "KEMGEP" для
автоматизированной обработки геохимических данных на персональных компьютерах.
Программный комплекс "KEMGEP" предназначен
для автоматической классификации, выделения и картирования исследуемых объектов
на основе многомерных геохимических данных, в том числе для Картирования
Единого Многомерного ГЕохимического Поля (КЕМГЕП).
Кроме того, он позволяет в
режиме "RANCOR" проводить сравнительный анализ многомерных
геохимических данных с заданными геохимическими эталонами изучаемых объектов
(руд, околорудных ореолов, пород, источников техногенного загрязнения и т.п.)
для выявления и ранжирования "похожих" на объекты проб, картирования
полей геохимического сходства проб с заданными эталонными объектами.
Программный комплекс "KEMGEP" отвечает
следующим основным требованиям:
1. Адаптирован к современным широко используемым
геоинформационным системам (ГИС) и использует известные программные продукты,
такие как ArcView, FoxPro, Surfer и др.
2. Учитывает специфику реальных геохимических
данных, в частности, их неполноту вследствие недостаточной чувствительности
анализа ряда химических элементов (компонентов), дискретный характер
полуколичественных определений, изменчивость содержаний в пределе от 0 до 100 %
вес. или в иных установленных
пределах.
3. Результаты обработки выдаются в виде
соответствующих карт, а также (дополнительно) в виде графиков, таблиц исходных,
преобразованных и ранжированных данных, различных комплексных показателей,
ранжированных геохимических спектров и т.п.
Программный комплекс обеспечивает возможность
обработки любых численных данных, естественно, включая геохимические.
Он состоит из следующих основных блоков:
1. Блок формирования баз первичных (исходных)
геохимических (или иных численных) данных.
2. Блок преобразования, дополнения, нормирования
исходных данных.
3. Блок "KEMGEP" для ранжирования и
автоматической классификации данных из блока 2.
4. Блок "RANCOR" для ранжирования и сравнения
данных из блока 2.
5. Блок вывода результатов классификации в текстовом
формате.
6. Блок подготовки данных для построения карт
единого многомерного геохимического поля и карт полей сходства геохимических
спектров проб с заданными эталонами по данным блока 4 с соответствующими
таблицами.
1. Первый блок формируется в общепринятых форматах
(растровых и векторных) с использованием программы FoxPro и других
общеизвестных программ. Требования к формированию баз геохимических данных
изложены в инструктивно-методических руководствах ИМГРЭ [Требования..., 1999] и
далее не рассматриваются. Заметим только, что при
формировании баз первичных данных очень важно координировать пробы (пикеты) с
точностью соответствующего масштаба карт (ошибка в определении координат не
должна превышать искажения в нанесении местоположения проб, равного одному
миллиметру в масштабе карты), а также 100 % контролировать правильность
занесения в базу данных всех цифровых значений (содержаний химических
элементов). Форматы баз данных должны позволять вносить в них
необходимые дополнения как по новым пробам, так и по
новым признакам, а также формировать и выдавать на экран монитора и печать в
виде необходимых пользователю таблиц для контроля и дальнейшего применения,
записывать для долгосрочного хранения на оптические (лазерные) диски и т.п.
2. Второй блок весьма важен ввиду уже упоминавшейся
неполноты части геохимических данных. Замена качественных данных ("не
обнаружено", "менее некоторого числа", "следы",
"много", "очень много" и т.п.) может производиться самим
исследователем, исходя из некоторых обоснованных представлений об уровнях
содержаний. Например, "следы" заменяются на
следующую градацию от минимальных численных значений содержаний в принятой
шкале градаций (или от чувствительности анализа); "не обнаружено" –
на две градации, "много" – на одну градацию от максимальных значений,
"очень много" – на две градации и т.п. Возможна и автоматизированная
замена не обнаруженных содержаний при условии задания (вычисления) нормированной
точки усечения (фактической чувствительности анализа) нормализованных
распределений обнаруженной части содержаний [Вострокнутов, 1971]. Алгоритм этой
процедуры целесообразно рассмотреть после получения преобразованных и
нормализованных оценок содержаний. Выше уже упоминалось, что
использование исходных содержаний химических элементов для построения и
исследования многомерных геохимических полей, как правило, невозможно ввиду
ряда обстоятельств: величины содержаний разных элементов существенно отличаются
между собой, отражая, прежде всего, глобальные геохимические особенности
элементов, связанные со строением и свойствами атомных ядер, выражающиеся в
существенно различных кларковых количествах разных элементов в геосферах,
частях литосферы и т.п. Например, кремния обычно много больше, чем
титана, титана – чем меди, меди – чем золота. Чтобы уравнять относительные
количества элементов и сделать их сопоставимыми, В.И. Вернадский и ряд других
известных геохимиков предложили делить содержания элементов на их кларки (Скj), получая кларки концентраций – рассеяния или
вернады по В.В. Иванову [1994]. Вычисления кларков концентраций являются
простейшим и широко распространенным преобразованием содержаний элементов. Они
предусмотрены во втором блоке программных комплексов. Вместо кларков могут быть
применены так называемые фоновые содержания элементов, характерные для
относительно локальных территорий и объектов, отображающие средние количества
элементов, регулируемые процессами безрудного рассеяния вне участков развития
рудно-ореольных процессов и техногенных загрязнений. При оценке фоновых
значений лучше использовать непараметрический критерий – медианные значения
содержаний элементов (Мефj) в достаточно
представительных (по площади и числу проб) фоновых выборках.
Принимая во внимание
сделанные выше оговорки насчет того, что распределения элементов всегда
являются величинами положительными и конечными, то есть изменяются в некоторых
пределах, для достижения которых в соответствии с представлениями Н.И.
Сафронова [1971] требуется бесконечно большая энергия, необходимы
предварительные преобразования содержаний в новые величины, изменяющиеся в
пределах от -¥ до +¥ и нормализующие (в широком
смысле симметрии дисперсий левой и правой ветвей унимодальных кривых) распределения
исходных содержаний элементов. С нашей точки зрения, этим условиям отвечает
модель обобщенного логнормального распределения, рассмотренного выше (формула
1).
Для принятых кларковых (фоновых) содержаний
элементов значения Хj = 0 для любого j элемента,
что отвечает единице для исходных кларков концентраций или геофонов.
Таким образом, алгоритмы второго блока программных
комплексов должны обеспечить различные варианты преобразований исходных
содержаний химических элементов (компонентов).
Блок II, вариант 1, алгоритм:
2.1.1. Полная матрица ||Сji||
исходных значений содержаний j элементов в i пробах (j = 1,2...m; i = 1,2...n)
размером N = m х n центрируется по заданным величинам кларковых (Скj)
или фоновых (Сфj) содержаний j элементов по формуле:
lgKKcji = lgCji – lgСкj
(12) или
lgKФсji
= lgCji – lgСфj
(13),
где KKcji – кларк концентрации j элемента
в i пробе, KФсji – концентрация
относительно фона j элемента в i пробе.
Как следует из формул (12) и (13), для кларковых
(фоновых) значений lgKKcji или lgKФсji равны нулю; для
значений Cji > Скj или Cji > Сфj
получаем lgККс или lgКФс > 0, характеризующие привнос и
накопление j элемента; для значений Cji < Скj или Cji
< Сфj имеем lgККс или lgКФс < 0, характеризующие вынос и
рассеяние j элемента.
Матрицы значений KKcji или KФсji в дальнейшем используются для ранжирования в
порядке убывания значений и последующей классификации (KEMGEP) или сравнения
(RANCOR).
Блок II, вариант 2, алгоритм:
2.1.2. Полная матрица ||Сji|| исходных содержаний размером N = m х n
преобразуется в матрицу ||Хji|| по формуле (1) для заданных
содержаний элементов при условии (a<Сji<b). В пределе для весовых количеств элементов a = 0, b = 100 % вес. или 106 г/т.
Соответственно, формула (1) преобразуется в:
106 · Сjj
Хji = lg —————————— (14).
106 - Сjj
Аналогично преобразуются заданные кларковые или
фоновые содержания элементов.
В дальнейшем вычисляются логарифмы кларков
концентраций (КК) или геофонов (КФ) элементов по формулам:
lgKKхji
= Хji – Хкj
(15),
lgKФхji = Хji – Хфj (16).
Матрицы ||lgKKхji||
или ||lgKФхji|| ранжируются по убыванию lgККj или lgКФj
и в дальнейшем так же используются для классификации или сравнения.
Блок II, вариант 3, алгоритм:
2.1.3. Та же исходная матрица содержаний, преобразованная
в матрицу ||Хji||.
Задаются стандартные рудные значения содержаний для
каждого элемента рассматриваемой ассоциации (Срj)
наряду с Хкj или Хфj.
Рудные содержания преобразуются по формулам (1) или
(11) в Хрj. Далее вычисляются балльные
оценки содержаний (Бji) по формуле (6).
Хji - Хкj
Бкji
= 10 ——————————— (17),
Хрj - Хкj
Хji - Хфj
Бфji
= 10 ——————————— (18).
Хрj - Хфj
Получаемые матрицы ||Бкji||
или ||Бфji|| ранжируются по убыванию значений Бкj или Бфj
и в дальнейшем используются для классификации или сравнения.
Блок II, вариант 4, алгоритм:
2.1.4. Определяются параметры кларковых или фоновых
распределений Хji, исходя из модели
нормального распределения.
nj
`Хj = S Хji nj (19),
i=1
1 nj
Sj = ——— S (Xji - `Хj)2 (20).
n–1 i=1
Вместо `Хj
можно принять медиану ряда Хj (Меj), а при расчетах Sj
заменять в формуле (20) `Хj на Меj.
Далее производится нормировка Хji
по формуле:
Хji - `Хj
Zji =
————————— (21) или
Sj
Хji - Меj
Zjim =
————————— (22).
Sjm
Полученные матрицы значений ||Zji|| или
||Zjim|| будут иметь в пределах принятого фона (кларкового объекта)
распределения, близкие к N(0,1), то есть симметричные, близкие к нормальным распределения с нулевым средним и единичной
дисперсией. Для проверки соответствия распределений нормальному закону можно
использовать нормированные оценки асимметрии (ZA) и эксцесса (ZE), значения
которых не должны превышать по модулю 3-х сигм, либо критерий c2 для оценки значимости
отклонений эмпирических частностей Zji от теоретических частностей Zтji.
Для больших массивов данных распределения Бji и Zji должны быть достаточно
близкими по параметрам. Действительно, по определению в пределах кларковых
(фоновых) содержаний средние оценки `Бji, как и `Zji равны нулю или стремятся к
нулю. Различия могут касаться только стандартов распределения Бji(SБ) и Zji(SZ).
Для оценки значимости различий может быть использован критерий Фишера [Дэвис,
1990 и др.]:
S2max
F = —————— (23).
S2
При существенных отклонениях S2Б
от единицы преобразование Бji в Zji
может быть осуществлено по формуле:
Бji
Zji = ———— (24).
SБj
Блок II, вариант 5, алгоритм:
2.1.5. Для перехода от ||Бji|| или ||Zji||
к ||Zрji||, где Zрji –
нормированные оценки рудоносности j элементов в i пробе [Вострокнутов, 1982],
необходимо применить следующие формулы:
10 - Zji
Zрji
= ———————— (25),
SZji
10 - Бji
Zрji
= ———————— (26),
SБji
где SБji
- стандарт распределения Бji. В тех случаях, когда SZji » SБji » 1, формулы превращаются в 10 - Zji
или 10 - Бji, так как оценка Zрji
для руды заданного стандартного качества равна 10. Дальше матрица ||Zрji|| ранжируется по убыванию Zрj в
каждой i пробе и так же может использоваться для классификации и сопоставления.
Блок III. Программный блок "KEMGEP".
"KEMGEP" предназначен
для автоматической классификации стандартизированных и ранжированных
геохимических данных, поступивших после соответствующих вариантов
преобразований из блока II. "KEMGEP" классифицирует эти данные по
следующим вариантам.
Вариант 1 (3.1).
П.1. Рассчитывается в каждой пробе из базы данных
объемом N проб комплексный аддитивный показатель аномальности (Zc) по формуле:
m
Zc = S КК – (m - 1) (27),
j=1
где КК – кларки концентраций (геофоны) ³ 1; j – число слагаемых
показателей (элементов); j = 1,2...m.
П.2. В матрице значений ||Zc|| находится Zcmax.
П.3. Для Zcmax определяется ранжированный
по убывающим значениям КК геохимический спектр исследуемой ассоциации
элементов.
П.4. С этим спектром попарно сравниваются
ранжированные геохимические спектры той же ассоциации элементов в остальных
пробах матрицы (объем сравнений равен N-1).
П.5. Рассчитываются коэффициенты ранговой корреляции
Спирмэна (rc) для каждой сравниваемой пары проб по формуле [Смирнов,
1981]:
m
(m
3- m)/6 - S (R(maxZc)-Ri)2
– Tk - Tl
j=1
rc
=
—————————————————————————————————————————
(28),
[(m3-m)/6 - 2Tк]1/2
· [(m3-m)/6 - 2Tl]1/2
где R(maxZc) – ранги элементов в пробе с
Zcmax, Ri – ранги элементов в i сравниваемой пробе; Tк и Tl – поправки на совпадающие ранги; m – число
ранжированных элементов;
mс t3j -
tj
Тк = S ———————— (29) для пробы с Zcmax;
j=1 12
mс – число групп элементов с
совпадающими (усредненными) рангами; tj – объем j группы элементов с
совпадающими рангами; Tl рассчитывается по формуле, аналогичной (29), для
попарно сравниваемой i пробой.
П.6. В связи с тем, что ранжирование элементов по
величине КК (или lgКК) может носить случайный характер
из-за несущественных случайных флуктуаций в значениях КК, программой
предусмотрено введение критической величины DlgКК. Если
разница в соседних значениях lgКК меньше заданной DlgКК, то элементам
присваиваются одинаковые средние ранги.
П.7. При малом числе элементов (от 5 до 10) для
определения критических значений rcq используют специальные таблицы
[Смирнов, 1981 и др.]. Если m > 10, то
3
Р(rc³rcq) » 1 - Ф
m-1·rcq[1-0.19(rcq2 - ————)] » 1-Ф( m-1·rcq) (30),
m-1
где Ф – функция нормального распределения с
параметрами (0,1);
х
1 2
Ф = ————— е-t /2
dt. Соответственно,
2p
-¥
y(1-q)
0,19 y(1-q)
rcq(m) » ———————
1 - ———— [y2(1-q)-3] » ——————— (31),
m-1
m-1 m-1
где y - функция, обратная Ф.
Все пробы с rc ³ rcq будут
обладать статистически значимым сходством с пробой, для которой определен Zcmax,
и выделяться в 1-й класс проб. При расчетах rcq предполагается, что
содержания химических элементов (Х.Э.) ведут себя как случайные величины. В
действительности это не так. Наблюдаемые содержания Х.Э. (Сн) в изучаемых
объектах можно представить в виде: Сн = Сп ± DСсл, где Сп – "истинное"
неслучайное содержание Х.Э., обусловленное спецификой геолого-геохимического
процесса (объекта), обусловившего величину содержания Х.Э.; DСсл – случайная компонента изменчивости Сп,
обусловленная множеством случайных факторов различного происхождения, в том
числе связанных с погрешностями работ. Как показали наши наблюдения, если DСсл < 0,3Сп, то существенных погрешностей DСсл в геохимические поля не вносят и вместо
уровня rcq может быть задан иной уровень уже не статистической, а
практической значимости.
Как показали наши исследования, за практически
значимые могут быть приняты значения rc, меньшие rcq.
Удобно в качестве уровня практической значимости выбрать |rcq| =
0,5, но он может быть и ниже (до 0,3-0,2). Дальнейшее решение вопросов о
случайном или неслучайном характере геохимического сходства удобно проводить на
основе пространственного расположения проб соответствующего класса или полей сходства с заданным эталоном.
П.8. Все пробы, для которых величина rc ³ rcq,
объединяются в один класс с пробой, имеющей Zcmax,
и исключаются из общей матрицы проб. Образуется первый класс объемом n1
проб.
П.9. Процедура 2-5 повторяется для оставшейся части
проб, равной N-n1, и формируется второй класс объемом n2
проб.
П.10. В конечном итоге формируется
К классов проб при условии N = n1 + n2 + ... + nК.
П.11. Для каждого выделенного класса проб
определяются средние ранги элементов, образующих геохимические спектры:
n
S Rji
j=1
`Rji = —————— (32),
n
где `Rj – средний ранг
j элемента в i классе проб (i = 1,2...n).
П.12.Элементы в каждом классе ранжируются в порядке
убывания средних рангов. Образуется матрица обобщенных ранжированных
геохимических спектров объемом К классов.
П.13. Ранжированный геохимический спектр каждой
пробы соответствующего класса сравнивается с обобщенными ранжированными
спектрами К классов, и проба перемещается в тот класс,
для которого определено максимальное значение rc/к max из всех К
значений rc. Соответственно, объемы первоначально выделенных классов
могут измениться, равно как и их средние ранжированные геохимические спектры,
установленные с применением формулы (32).
П.14. Данная процедура, условно названная нами итеративной,
повторяется до тех пор, пока не образуется устойчивое по числу и номерам проб
множество из К геохимических классов.
П.15. При помощи rc-критерия исследуется
матрица средних ранжированных геохимических спектров окончательно выделенных
классов проб; все классы, для которых rc ³ rcq,
объединяются и остаются только классы, для которых все rc < rcq,
то есть подмножество взаимонезависимых классов.
П.16. Процедуры 12-15 повторяются до тех пор, пока
не будут выдерживаться условия п. 14.
П.17. Если число ожидаемых классов априори известно
или заранее задано и требуется оптимальным образом распределить пробы только по
этим классам, то процедура классификации упрощается. Условие rc ³ rcq ³ 0,5 отменяется, условия
п.п. 12-14 остаются.
П.18. В конечном итоге каждой i
пробе классифицируемой выборки ставится в соответствие ее принадлежность к j
классу (j = 1,2...К).
П.19. На карту наносятся цифровые обозначения
классов и величин rc, отображающих соответствие геохимических
спектров проб данным классам.
П.20. Пробы, отнесенные к одному классу, отделяются
условными границами от проб, принадлежащих к другим классам. Полученные условно
мозаичные, пространственно дифференцированные классы проб изображаются на
соответствующей основе карт (топографической, геологической, ландшафтной и
т.п.). Они могут сопровождаться картами изолиний степени сходства проб с
соответствующими классами (построенным с использованием программы
"Surfer").
П.21. К карте, построенной по программе
"KEMGEP", прилагается таблица, строки которой соответствуют
выделенным классам проб, а в столбцах-графах для каждого класса последовательно
показываются: N класса, число проб в классе, среднее значение rc для
проб данного класса с его усредненным геохимическим спектром, величина Zc
критерия, ранжированный (по рангам) геохимический спектр классов с указанием
медианных количеств элементов в виде КК или г/т.
Вариант 2 (3.2). Аналогичен варианту 3.1, только
используется исходная матрица не ||Сji||, а ||Хji||.
Вместо Zc рассчитываются КА+ по формуле (10), КА-
по формуле (11), КА по формуле (12).
Вариант 3 (3.3).Используются исходные матрицы ||Бкji||
или ||Бфji||, в остальном аналогичен
варианту 2.
П.1. Рассчитывается в каждой пробе коэффициент
аномальности в баллах (КА)
m
m
КАБк = max S Бкji m
или КАБф = max S Бфji m
(30).
j=1
j=1
П.2. Выбирается проба с наибольшим значением КА (max
КА). Для нее определяется ранжированный по убыванию Бкji (или Бфji)
геохимический спектр, который попарно сравнивается с ранжированными
геохимическими спектрами остальных проб и рассчитываются коэффициенты ранговой
корреляции спектров (rр). Все пробы, для
которых rc ³ rcq,
объединяются с пробой, где max КА в 1-й класс. Дальнейшие процедуры
классификации, как в варианте 1. В таблице и карте вместо Zc приводятся
значения КА, а в геохимических спектрах вместо величин КК указываются значения
Бкji или Бфji.
Вариант 4 (3.4). Рассматривается исходная матрица
нормированных оценок содержаний ||Zji||. В каждой пробе вычисляются
значения коэффициента аномальности в нормированных оценках (КАZ) по формуле, аналогичной (30):
m
КАZ
= max S Zji m.
j=1
Дальнейшие операции, как в вариантах 3 и 1.
Вариант 5 (3.5). Могут быть использованы любые
исходные матрицы и показатели аномальности.
П.1. Определяются пробы основного класса по обычному
алгоритму (rc ³ rcq).
П.2. Определяются пробы альтернативного класса со
значениями rc min £ -rcq.
П.3. Определяются пробы промежуточного класса со
значениями –rcq < rc < rcq.
П.4. Определяются средние ранжированные
геохимические спектры проб каждого из 3-х классов, с которыми сравниваются все
пробы. Пробы перегруппируются по классам с учетом значений rc. При
этом возможно выделение 4-го класса проб, для которого rc по каждому
классу будут меньше заданных rcq. Данная процедура повторяется до
тех пор, пока все пробы не будут распределены по К
классам при условии
их принадлежности к соответствующему классу, когда rc/к max ³ rcq.
Остальные процедуры те же, что в варианте 1.
4. Программный блок "KEMGEP" с последующим
"распознаванием" проб.
4.1. Задается матрица ранжированных геохимических
спектров "Р" эталонных классов.
4.2. После стандартной процедуры классификации (см. вариант 3.1 или 3.5) каждая проба "К" класса
сравнивается с геохимическим спектром заданной эталонной матрицы. Если хотя бы
с одним эталонным классом значения rc ³ rcq и будут
максимальными среди остальных значений rc для других эталонных
классов, то проба отождествляется с этим эталонным классом. В конечном итоге из
N проб получаются Nэ проб, отнесенных к
соответствующим эталонным классам, и N-Nэ проб, точно не распознанных и не
попадающих ни в один из заданных эталонных классов (для них по всем эталонным
классам соблюдается неравенство rc < rcq). По ним
требуется дополнительная диагностика.
Блок III, программный блок "RANCOR".
"RANCOR" основан
на установлении степени геохимического подобия (сходства) исследуемого
множества проб с заданным эталонным классом. Исследуемые содержания химических
элементов (Х.Э.) в пробах преобразуются по одному из вышерассмотренных 5
вариантов в матрицу стандартизированных и ранжированных оценок. Обозначим их
через Z, а матрицу через ||Z||. Аналогичным путем преобразуются и
распределяются содержания Х.Э. в заданном эталоне. Далее для каждой пробы
вычисляется rc между ранжированными спектрами эталона и сравниваемой
с ним пробы. Получается матрица значений rc объемом N проб: ||rc||N.
Если пробы координированы,
то для построения карты поля сходства ранжированных спектров с заданным
эталоном используется программа "Surfer", позволяющая использовать
разные варианты сглаживания (фильтрации) сигналов, в данном случае – значений rc
и их плоскостного изображения в виде карты (плана) изолиний (полей) сходства
ранжированных геохимических спектров проб с заданным эталоном. Густота фиктивных центров
усредненных данных, радиус осреднения (сглаживания), математическая модель
сглаживания, максимальное число проб определяются опытным путем для достижения
максимально адекватного и наглядного эффекта геохимического сходства. Обычно в
практике работ фиктивно-равномерная сеть пикетов задается равной 2 мм в
масштабе карты, максимальное число проб, равным 15-20, радиус осреднения –
20-25 мм в масштабе карты.
Сглаженные данные могут быть с успехом использованы
и в программном комплексе "KEMGEP" для более наглядного выявления
общих классификационных закономерностей и "снятия" высокочастотных
классификационных "помех".