rangmet

Непараметрические ранговые методы.

 

Непараметрические ранговые методы – это бурно развивающаяся область математической статистики.  История современных непараметрических методов, основанных на рангах, довольно коротка – всего лишь около 40 лет. Ранговые методы выделились в особое направление непараметрической статистики не только вследствие природы исходного материала, но и по идеям его дальнейшего использования.  Сегодня этими методами решаются многие задачи анализа экономических, статистических, инженерных, естественнонаучных, социологических, медицинских данных.

Ранжирование – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.       Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Как показали статистические исследования, проведенные за последние 10-15 лет, ранговые методы в значительной мере лишены ряда недостатков для работы с малыми выборками, распределение которых неизвестно.  Как известно, переход от самих наблюдений к их рангам сопровождается определенной потерей информации.  Однако,  эти потери не слишком велики.  К сожалению, в настоящее время все еще сказывается нехватка специальной литературы по данному вопросу.

В последнее время в  прогнозировании и при решении ряда других задач стали широко применяться  экспертные оценки.  Методы ранговой корреляции в этой области является едва ли не единственным путем обобщения экспертных оценок.

Теория рангов впервые возникла как ответвление теории случайных процессов. На начальной стадии в  рангах чаще всего видели просто удобный аппарат, благодаря которому удается обойтись без изменения абсолютной величины переменных и тем самым сэкономить время или усилия.  Благодаря использованию рангов можно было избежать трудностей, связанных с построением объективной шкалы абсолютных значений. Позднее статистика рангов смогла завоевать признание благодаря своим собственным достоинствам.

Ниже будут рассмотрены наиболее распространенные способы упорядочения изучаемых объектов:

– задача может сводиться просто к упорядочению объектов по месту, которое они занимают в пространстве или во времени.  Например, карты были расположены в колоде в некотором порядке, а затем перетасованы. Новое расположение карт также характеризуется определенным порядком, ранжированием. Сравнив его со старым,  можно увидеть, насколько  тщательно были перетасованы карты.  В этой задаче интересно только общее  расположение  карт в колоде,  и нет необходимости упорядочить объекты в соответствии с “возрастанием” или “убыванием” того или иного присущего всем им признака;

 – упорядочить объекты можно и по некоторому качеству, для которого не существует объективной  абсолютной шкалы изменения. Можно, например, ранжировать образцы горных пород по твердости, исходя из следующего простого критерия: А тверже Б, если А оставляет царапину на Б, когда они соприкасаются. Если А оставляет царапину на Б, а Б – на В, то А будет оставлять царапину на В. Таким образом, прибегнув к ряду сопоставлений, можно с достаточной точностью упорядочить рассматриваемые объекты (если только набор не включает такие два объекта, которые обладают одинаковой твердостью).  Однако подобный способ не позволяет измерить абсолютную величину твердости горных пород.  Всегда можно установить, что А тверже Б.  Однако до тех пор, пока не построена та или иная шкала измерения абсолютных величин,  нельзя утверждать,  что А, скажем, вдвое тверже Б;

– упорядочение может проводиться в соответствии с измеряемой (или теоретически  исчисляемой) величиной некоторого признака. Например, можно располагать людей в том или ином порядке в зависимости от их роста, а города по численности населения. При этом не всегда требуется прибегать к самому процессу измерения: можно «на глаз» построить группу студентов по росту; однако в таких случаях критерий, по которому происходит ранжирование, должен допускать возможность непосредственных сопоставлений.

Можно упорядочить объекты по некоторому признаку, величину которого, в принципе, можно измерить,    но на практике (или даже теоретически) не удается прибегнуть к такому измерению в силу тех или иных причин. Например, можно упорядочить ряд лиц по их интеллектуальным способностям, полагая, что такое качество действительно существует и что можно разместить людей в том или ином порядке в соответствии с интенсивностью этого признака.

В практических  приложениях    методов, основанных на  ранжировании,  иногда сталкиваются со случаями,  когда два или несколько объектов настолько подобны, что не удается отдать предпочтение одному из них.  Когда эксперт ранжирует объект на основе субъективных суждений, то это свойство (отсутствие предпочтений) связано с истиной их неразличимостью или неспособностью исследователя найти существенные различия.  В этом случае говорят, что такой объект называется связанным.

Например, студентов расположили в соответствии с их достоинствами или экзаменационными баллами.  Метод, который принимается для предписания числовых значений рангов связанных объектов, заключается в усреднении рангов, которые они имели бы, если были различимы.  Например, если связывают третий и четвертый объекты, то каждому приписывают ранг, равный 3,5, если же связывают объекты от второго до седьмого, то получаемый ранг  равен 4,5.

Иногда такой подход называется  “методом средних рангов”.  Когда нет основания для выбора между объектами, то ясно, что в этом случае нужно приписать всем одинаковые ранги.  Преимуществом данного метода является то, что сумма рангов для всех объектов остается точно такой же как и при ранжировании без связей.

В анализе социально – экономических явлений часто  приходится прибегать к различным, условным оценкам с помощью рангов, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи.

 

КОММЕНТАРИИ