На главную страницу Форма обратной связи
Рекомендуем:
Разделы сайта
Факторный анализ. Массив данных --- 
Факторный анализ. Массив данных

Исследователь изучает набор данных с большим числом переменных. Чтобы сократить число переменных без существенной потери информации, он заменяет часть исходных переменных на меньшее число новых искусственных переменных. Эти новые переменные называются факторами, далее аналитик работает с ними, а не с исходными показателями.
Заметим, что лишь формулировка проблемы является новой. Такой подход известен довольно давно. Например, при массовом пошиве одежды портные используют всего три характеристики — размер, полноту и рост. Эти характеристики вычисляются по исходным измерениям. Например, по одной из формул полнота определяется как разность между длиной 0}Фужности груди п длиной окружности талии, деленной на Два. Конечно, к использованию этих характеристик пришлось привыкать, они искусственные, до сих пор ведутся споры о наилучшем виде формул для каждой из них. Главное же то, что эти показатели удобны и очень полезны. Без них работа портного была бы намного сложнее, ему надо добиться того, чтобы «костюмчик сидел» па покупателе, чье тело — сложный геометрический объект. С помощью факторов существенно упрощается очень сложная задача, изначально требовавшая огромного числа измерений и примерок.
Итак, размер, полнота и рост — факторы, искусственные переменные. Они были найдены эмпирически, методом проб и ошибок. Применить методы портных для решения задачи о вероятности банкротства фирмы сложно, проще придумать метод заново. Применение факторного анализа формализует, организовывает и упрощает решение задач такого рода. Факторный анализ — универсальное средство, его можно применять для решения разнообразных задач.
При проведении факторного анализа делается акцент на исключении из данных дублирующей информации. Проиллюстрируем это положение. Предположим, что вы проводите исследование влияния различных пищевых добавок на рост. Для этого были получены значения двух переменных: измерен рост 100 человек в дюймах и сантиметрах. Ясно, что использовать обе переменные бессмысленно, рост является одной и той же характеристикой человека независимо

Факторный анализ. Массив данных

от того, в каких единицах он измерен. Присутствует дублирование информации. Вы отбрасываете одну переменную и оставляете другую. Это и есть простейший пример сокращения данных. Конечно, на практике такая ситуация не возникнет, дублирование слишком очевидно, но нашей целью было обсудить ясный выразительный пример.
В чем заключалось дублирование с математической точки зрения? В том, что значения одной переменной могут быть вычислены по значениям другой с помощью линейного преобразования. Для будущих рассуждений будет полезно заметить, что из наличия линейной зависимости между переменными следует, что коэффициент корреляции между ними равен единице.
Как поступать, если наличие линейной связи не самоочевидно, как в рассмотренном примере? Можно рассуждать в обатном направлении. Если коэффициент корреляции равен 1 или '1. т0 междУ переменными имеется линейная зависимость,
яна из них выражается через другую и любую переменную в паре можно отбросить.
разовьем предыдущие рассуждения. Допустим, у нескольких переменных зафиксированы большие парные значения коэффициентов корреляции. Факторный анализ основывается на предположении) что переменные измеряют «практически» одно и то же. При наивном подходе из такого набора можно удалить все переменные, кроме одного «представителя». Но такая операция слишком радикальна, при этом можем потерять важную информацию. Вместо этого процедура факторного анавдза строит новую переменную, которая служит «представителем», будет измерять то общее, что содержится в исходных переменных.
Факторный анализ разработан для вычисления таких новых переменных, они называются факторами или главными компонентами. Фактор, представляющий группу коррелирующих переменных, будет иметь с этими переменными высокие корреляции.
Факторный анализ завершается интерпретацией полученных результатов, т.е. заключением, что именно измеряет каждый фактор. При этом, с одной стороны, основываются на статистических соображениях, в первую очередь на интерпретации корреляций факторов с исходными переменными. С другой стороны, опираются на здравый смысл и опыт в предметной области, в той отрасли науки, технологии или бизнеса, в которой проводилось исследование. Например, ответы на шесть или семь вопросов, сильно коррелирующие с интерпретируемым фактором и объединенные в одну группу, мот выражать степень удовлетворенности респондента данным продуктом.
  Также рекомендуем другие статьи:

  • Факторный анализ. Массив данных
  • Дискриминант. Дискриминантный анализ
  • Проведение факторного анализа. Анализ
  • Факторный анализ. структурная зависимость. Практическое применение факторного анализа
  • Зависимые и независимые переменные. Разработчики SPSS



  • Книги по экономике

    Copyright © 2009-2019
    EcoUniver.com - Все по экономике и рынках