На главную страницу Форма обратной связи
Рекомендуем:
Разделы сайта
Дискриминант. Дискриминантный анализ --- 
Дискриминант. Дискриминантный анализ

Во избежание путаницы отметим, что термин "дискриминант" (от. англ. discriminate - различать, распознавать и т.п.) практически не имеет отношения к дискриминанту, используемому в школе.
Дискриминантный анализ остался в наследство с докомпьютерных времен, когда можно было применять только методы, требующие простых вычислений. В настоящее время он вытесняется другими, более современными компьютерно ориентированными методами вроде нейронных сетей, метода к-го ближайшего соседа и т.д. Спад интереса был усилен публикацией примеров, в

Дискриминант. Дискриминантный анализ

которых дискриминантный анализ ошибается при классификации практически половины всех наблюдений, хотя в этих примерах существует линейное разделение на подгруппы. Естественно, распределения переменных в этих примерах сильно отличаются от смеси нормальных распределений, для которых, в первую очередь, создавался дискриминантный анализ.
Дискриминантный анализ используется для классификации наблюдений в тех случаях, когда:
заранее известно (или задано аналитиком) чиста групп, на которые нужно разбить набор объектов;
имеется набор объектов, для которых известно, к каким группам они принадлежат (эти объекты уже расклассифицированы).
Часто такие группы заранее известны просто из постановки задачи. Иногда распределение по группам может быть результатом других видов анализа, например кластерного анализа. Заметим, что количество групп не должно быть больше, чем количество переменных-признаков.
Другими словами, исходные данные состоят только из та-Ких наблюдений, для которых разбиение на группы уже известно. Этот набор наблюдений называется обучающей выборкой.
Она используется для того, чтобы настроить, обучить процедуру, т.e. подобрать параметры днекрнмпнаитного анализа так. чгобы он сам «научился» классифицировать  наблюдения.
Л-тя реализации днаернмннантного анализа необходимо, чтобы среди переменных была одна, особенная неременная. указывающая, к какой группе относится данное наблюдение. Именно эта переменная классифицирует все наблюдения. Среди остальных неременных выбираются те. но которым в будущем будет проводиться классификация новых наблюдений. Эти переменные называются независимыми. (Здесь имеется вызывающая сожаление путаница а терминологии. С точки зрения определения из теории вероятностей эти переменные почти всегда являются зависимыми.) Если какая-то переменная не является классифицирующей и не выбрана для будущей классификации, то она игнорируется на всех этапах использования дискриминантного анализа.
Классифицирующая переменная измеряется в номинальной или ранговой шкале. На практике она чаще всего принимает лишь два различных значения, что соответствует разбиению на две группы.
Математическая теория дпекриминантного анализа строилась для случая, когда каждая подгруппа имеет нормальное распределение. На практике днекриминантный анализ используется и для данных, распределения которых значительно отклоняются от нормального. Тем не менее для независимых переменных недопустимо использовать ранговую или номинальную шкалу.
  Также рекомендуем другие статьи:

  • Факторный анализ. Массив данных
  • Иерархический кластерный анализ. Кластерный анализ
  • Проведение факторного анализа. Анализ
  • Факторный анализ. структурная зависимость. Практическое применение факторного анализа
  • Как проводить SWOT-анализ для малых и средних предприятий? SWOT-анализ.



  • Книги по экономике

    Copyright © 2009-2019
    EcoUniver.com - Все по экономике и рынках