Главная > Нечеткие вычисления > Нечеткие методы автоматической классификации
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Резюме

Методы выделения однородных групп объектов, иначе именуемые классификацией, условно объединяются в вероятностный, вариативный и структурный, иначе именуемый геометрическим, подходы. Исходные данные в задачах классификации могут быть представлены в виде матрицы именуемой матрицей «объект-признак», где представляет собой значение признака на объекте исследуемой совокупности объектов а также в виде матриц попарных расстояний или мер близости имеющих общее обозначение где величина характеризует отдаленность или близость объектов исходного множества и именуемых матрицами «объект-объект». Таким образом, при интерпретации объектов как точек в соответствующем пространстве признаков задача классификации заключается в разделении совокупности точек в пространстве на однородные классы таким образом, чтобы точки, принадлежащие одному классу, находились бы относительно близко друг от друга, а сами классы различались бы между собой. Полученные в результате разбиения группы именуются кластерами, классами, образами или таксонами, а методы их обнаружения соответственно называются кластерным анализом,

автоматической классификацией, распознаванием образов с самообучением или численной таксономией. Методы автоматической классификации условно объединяются в эвристическое, иерархическое, оптимизационное и аппроксимационное направления, причем иерархические методы, в свою очередь, условно делятся на агломеративные и дивизимные методы. Любой задаче классификации зачастую оказывается свойственна нечеткость, значительно затрудняющая или вообще делающая невозможным получение решения. Понятие нечеткости является общенаучным и может быть определено как внешнее выражение качества внутренней основы явлений, специфика которого заключается в непрерывности перехода от отсутствия проявления к полному выявлению качества предметов, свойств и отношений реального мира, что находит свое отражение в познавательной и мыслительной деятельности индивида. При анализе форм нечеткости, свойственной процессу анализа данных, более уместным представляется использование понятия неопределенности, под которой следует понимать нечеткость соответствия математической постановки задачи анализа данных предметно-содержательной установке на цели исследования и исходным данным. Основными видами неопределенности в задачах автоматической классификации являются неопределенность целей исследования, включающая такие формы, как неясность и неточность, неопределенность характера результатов исследования, формами проявления которой являются неопределенность формы и взаимного расположения кластеров, неоднозначность числа кластеров и размытость природы искомой классификации, а также неопределенность как характеристика исходных данных, имеющая такие формы, как, опять же, неоднозначность числа кластеров, неоднозначность числа объектов исследуемой совокупности и неоднозначность, неточность либо неполнота значений в матрице исходных данных. Каждому из рассмотренных видов и форм неопределенности в задачах автоматической классификации соответствует определенная методология ее формализации или устранения. Краткое логико-гносеологическое рассмотрение вопроса о возможности применения теории нечетких множеств к решению задач кластер-анализа показывает, что эта теория оказывается гибким инструментом для представления данных, когда исходная структура оказывается нечеткой, и более адекватным аппаратом для представления непрерывных кластеров, чем теория вероятностей; кроме того, теория нечетких множеств позволяет воспроизводить человеческий подход к проблеме классификации и открывает богатые

возможности для естественной интерпретации результатов процесса классификации. На содержательном уровне нечеткая модификация задачи автоматической классификации может быть сформулирована следующим образом: представить исходное множество объектов, структура которого характеризуется размытостью и информация о котором задана в виде матрицы «объект-свойство» или матрицы «объект-объект», заранее известным либо нет числом однородных, в некотором смысле, нечетких классов, адекватным образом. Адекватность представления исследуемой совокупности объектов нечеткими классами определяется целями исследования, видом искомой структуры классификации и содержательными рассмотрениями проблемы классификации в каждом конкретном случае.

<< Предыдущий параграф Следующий параграф >>
Оглавление