Akademik

ФАКТОРНЫЙ АНАЛИЗ

- раздел многомерного статистич. анализа, объединяющий математико-статистич. методы снижения размерности исследуемого многомерного признака x= (x₁, х ₂, . . ., x_р)', т. е.-построения,- на основе исследования структуры связей между компонентами x_ix_j, i, j=1,2, . . ., р,- таких моделей, к-рые позволяли бы восстанавливать (с нек-рой случайной ошибкой прогноза значения ранализируемых компонент признака хпо существенно меньшему числу так наз. общих (непосредственно не наблюдаемых) факторов f=(f₁, f₂, . . ., f_т)'.
Простейшим вариантом формализации подобной постановки задачи служит линейная нормальная модель Ф. а, с взаимно ортогональными общими факторами и с некоррелированными остатками:

или в матричной записи

где -матрица qкоэффициентов линейного преобразования наз. матрицей нагрузок общих факторов на исследуемые переменные.
Предполагается, что вектор специфич. остатков (ошибок прогнозов) подчиняется р-мерному нормальному распределению с нулевым вектором средних значений и с неизвестной диагональной ковариационной матрицей вектор общих факторов f, в зависимости от специфики решаемой задачи, может интерпретироваться либо как m-мерная случайная величина с ковариационной матрицей V_f специального вида, а именно - с единичной (т. е. V_f=I_m), либо как вектор неизвестных неслучайных параметров (взаимно ортогональных и нормированных), значения к-рых меняются от наблюдения к наблюдению.
Если предположить, что наши переменные заранее процентрированы (т. е. то из (1') с учетом принятых допущений немедленно получается следующее соотношение, связывающее ковариационные матрицы векторов xи и матрицу нагрузок:

При проведении реального статистич. анализа исследователь располагает лишь оценками элементов ковариационной матрицы V_x (полученными по наблюдениям x₁, х ₂, ..., x_n), в то время как структурные параметры модели - элементы q_ki матрицы нагрузок . и дисперсии специфич. остатков являются неизвестными и подлежат определению.
Таким образом, при проведении Ф. а. исследователю приходится последовательно решать следующие основные задачи:
существования или правомерности использования модели типа (1); ведь далеко невсякая ковариационная матрица V_x представима в виде (2); задача сводится к проверке гипотезы о специальной структуре связей между компонентами исследуемого вектора х;единственности (идентификации) модели типа (1); принципиальные трудности при вычислениях и интерпретации модели состоят в том, что при т> 1 ни структурные параметры, ни сами факторы не определяются однозначно; если пара является решением в соотношении (2), то и любая другая пара вида где с- ортогональная матрица размера тоже будет удовлетворять соотношению (2); обычно выясняют, при каких дополнительных априорных ограничениях на матрицу нагрузок qи на ковариационную матрицу остатков определение параметров q, f и анализируемой модели будет единственным; возможность ортогонального вращения решения факторной модели используется также для получения наиболее естественно интерпретируемого решения;
статистич. оценивания (по наблюдениям x₁, x₂,... ,x_п) неизвестных структурных параметров модели qи
статистич. проверки ряда гипотез, связанных с природой модели (линейность, нелинейность и т. п.) и со значениями ее структурных параметров таких, как гипотеза об истинном числе общих факторов, гипотеза адекватности принятой модели по отношению к имеющимся результатам наблюдения, гипотеза о статистически значимом отличии от нуля коэффициентов q_ij и т. п.;
построения статистич. оценок для ненаблюдаемых значений общих факторов f; алгоритмически - вычислительной реализации процедур статистич. оценивания и статистич. проверки гипотез.
Разработка теоретически обоснованных решений перечисленных задач в достаточно полной мере осуществлена лишь в рамках описанной выше линейной нормальной модели Ф. а.
Однако в практич. применениях широко используются более общие версии моделей Ф. а.: нелинейные, построенные на неколичестненных переменных, оперирующие с трехмерными матрицами исходных данных (к двум традиционным измерениям исходных данных - размерности ри числу наблюдений п,- присоединяется еще одна, пространственная или временная, координата). Подобные модели не сопровождаются, как правило, сколько-нибудь убедительным матема-тико-статистич. анализом их свойств, но основаны на вычислительных рекомендациях эвристич. или полуэвристич. характера.

Лит.:[1] Xатман Г., Современный факторный анализ, пер. с англ., М., 1972; [2] Айвазян С. А., Бежаева 3. И., Староверов О. В., Классификации многомерных наблюдений, М., 1974; [3] Sреаrman С., лAmer. J. Psychol.

Математическая энциклопедия. — М.: Советская энциклопедия. И. М. Виноградов. 1977—1985.