Методика системного исследования окружающего мира

Общие замечания
Ход или последовательность практических действий
Критические заметки о  факторном анализе

Текущая литература

Общие замечания

 Ход или последовательность практических действий

Критические заметки о применении факторного анализа

Весь практический опыт, а также редкие упоминания в литературе подсказывают, что при малом числе параметров можно визуально анализировать корреляционные матрицы. Это обусловлено тем, что фактанализ вычисляется на основе корреляционной матрицы, и часто просто запутывает суть. Если параметров более 10-12 то восприятие матрицы усложняется. Для сверхбысторго анализа и обхода сложностей исходных данных NULLей, 0 и др. я разработал программку корреляция .  Для облегчения восприятия матрицы и облегчения анализа, я запрограммировал удаление избыточной части и получилась «ГОРОЧКА», см. многочисленные корреляции на САЙТЕ. Можно подкрашивать «нужные» цифирки для совместного анализа нескольких таблиц по связанным объектам (элементам).

Собственно фактанализ состоит из двух этапов: аппроксимация корреляционной матрицы и интерпретацией материалов. Выбор числа факторов – трудный вопрос, по-моему мнению не более половины числа компонентов иначе зачем фактанализ нужен – снижение числа переменных. СТРОГО математический подход тут вряд – ли уместен

Наиболее подходящий – метод главных компонент. Существует прямое факторное решение – простая аппроксимация и преобразование – вращение при котором получают косвенное факторное решение, например варимаксное вращение. Происходит как-бы более точная подгонка и усиление факторов. Но здесь есть проблемы. Вращений и подходов несколько видов. Для спецсложного случая и множества переменных (атрибутов) можно покрутить факторами, поанализировать, если есть время. Я применяю сразу варимаксное вращение. Но, например, при анализе петрохимии при прямом решении ничего, но после вращения всё встает на голову – хотелось, чтобы главным положительным фактором был наиболее значимый по содержанию компонент – SiO2, а получается наоборот элементы «основности» берут верх числом. Проблем как бы нет, смотри наоборот, или вычисли плюс на минус. Но если я хочу классифицировть по своей программке числовое пространство с выделением в точке ведущего фактора, то SiO2 будет спрятан, если он в минусе – где он сильный!

В результате фактанализа главный результат – матрица факторных нагрузок (Loadings), это, по сути, коэффициенты корреляции компонентов с факторами. Внизу приводится дисперсия или относительный вклад каждого фактора в изменчивость данных и её процент. Важный момент – метки (Scores) придаются каждому объекту (пробе и т.д.) по каждому фактору – именно по ним строятся карты факторов и прочие радости.

Существует ещё косоугольный подход, когда всё неясно, но, по-моему, станет ли ясно неизвестно. Есть интерес – разбирайтесь! Хотел здесь поместить стандартную справку по фактанализу Statistica и передумал – лучшие специалисты готовят эту программу – глаза разбегаются от кнопочек, голова пухнет от терминов. Но пример приводят по 5 – 7 компонентам, что нарушает НАШИ с Вами идеи. Нам любят мозги, чтобы продать (хорошую) программу. Вверх

Текущая литература (общие списки будут позднее):

Математическая статистика. Учебник/Иванова В.М., Калинина В.Н., Нешумова Л.А, Решетникова И.О. – 2-е изд. Перераб. и доп. – М.: Высш. Школа, 1981 – 371 с. Добротная книга (для ТЕХНИКУМОВ - вся в формулах). Редкий пример решение перехода состояний матрицы по цепям Маркова - см. пример программки прототипа на Excel.

Пузаченко Ю. Г. Математические методы в экологических и географических исследованиях: Учеб. Пособие для студ. Вузов/Юрий Георгиевич Пузаченко. – М.: Издательский центр «Академия», 2004. – 416 с. Умная творческая книга, очень много примеров по Statistica, о пользе чтения статлитературы и очень важное утверждение - раньше не было компьютеров - была цель написать как можно больше формул (от себя добавлю ЗАГОГУЛИН), а сейчас время действовать - считать (COMPITь) (хотя и думать тоже)   Вверх


Сайт управляется системой uCoz