Коэффициент качественной вариации. Коэффициенты вариации

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой.

Показатели описательной статистики

Существует несколько показателей, которые использует описательная статистика.

Итак, представим, что перед нами стоит задача описать рост всех студентов в группе из десяти человек. Вооружившись линейкой и проведя измерения, мы получаем маленький ряд из десяти чисел (рост в сантиметрах):

168, 171, 175, 177, 179, 187, 174, 176, 179, 169.

Если внимательно посмотреть на этот линейный ряд, то можно обнаружить несколько закономерностей:

  • Ширина интервала, куда попадает рост всех студентов, – 18 см.
  • В распределении рост наиболее близок к середине этого интервала.
  • Встречаются и исключения, которые наиболее близко расположены к верхней или нижней границе интервала.

Совершенно очевидно, что для выполнения задачи по описанию роста студентов в группе нет необходимости приводить все значения, которые будут измеряться. Для этой цели достаточно привести всего два, которые в статистике называются параметрами распределения. Это среднеарифметическое и стандартное отклонение от среднего арифметического. Если обратиться к росту студентов, то формула будет выглядеть следующим образом:

Среднеарифметическое значение роста студентов = (Сумма всех значений роста студентов) / (Число студентов, участвовавших в измерении)

Если свести все к строгим математическим терминам, то определение среднего арифметического (обозначается греческой буквой – μ («мю»)) будет звучать так:

Среднее арифметическое – это отношение суммы всех значений одного признака для всех членов совокупности (X) к числу всех членов совокупности (N).

Если применить эту формулу к нашим измерениям, то получаем, что μ для роста студентов в группе 175,5 см.

Если присмотреться к росту студентов, который мы измерили в предыдущем примере, то понятно, что рост каждого на сколько-то отличается от вычисленного среднего (175,5 см). Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением.

На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ 2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N). В виде формулы это рассчитывается понятнее:

Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример:

Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии. С единицами измерения тоже теперь все в порядке, можем посчитать стандартное отклонение для группы:

Получается, что наша группа студентов исчисляется по росту таким образом: 175,50±5,25 см.

Среднее квадратичное отклонение хорошо работает с рядами, в которых разброс значений не очень велик (это хорошо прослеживалось на примере роста, где интервал был всего 18 см). Если бы ряд наших измерений был значительнее, а варьирование роста было сильнее, то стандартное отклонение стало непоказательным и нам потребовался бы критерий, который может отразить разброс в относительных единицах (т. е. в процентах, относительно средней величины).

Для этих целей предусмотрены абсолютные и относительные показатели вариации в статистике, характеризующие вариационные масштабы:

  • Размах вариации.

Квадратический коэффициент вариации (обозначается как Vσ) – это отношение среднеквадратичного отклонения к среднеарифметическому значению, выраженное в процентах.

Для нашего примера со студентами, определить Vσ несложно - он будет равен 3,18%. Основная закономерность – чем больше будет изменяться значение коэффициента, тем больше разброс вокруг среднего значения и тем менее однородна выборка.

Преимущество коэффициента вариации в том, что он показывает однородность значений (асимметрия) в ряду наших измерений, кроме того, на него не оказывают влияния масштаб и единицы измерения. Эти факторы делают коэффициент вариации особенно популярным в биомедицинских исследованиях. Будет считаться , что эксцесс значения Vσ =33% отделяет однородные выборки от неоднородных.

Если найти в ряду значений роста (первый пример) максимальное и минимальное значения, то получим размах вариации (обозначается как R, иногда ещё называется колеблемостью). В нашем примере – это значение будет равно 18 см. Эта характеристика используется для расчёта коэффициента осцилляции:

Коэффициент осцилляции – показывает как размах вариации будет относиться к среднему арифметическому ряда в процентном отношении.

Расчёты в Microsoft Ecxel 2016

* — в таблице указан диапазон A1:A10 для примера, при расчётах нужно указать требуемый диапазон.

Итак, обобщим информацию :

  1. Среднее арифметическое – это значение, позволяющее найти среднее значение показателя в ряду данных.
  2. Дисперсия – это среднее значение отклонений возведенное в квадрат.
  3. Стандартное отклонение (среднеквадратичное отклонение) – это корень квадратный из дисперсии, для приведения единиц измерения к одинаковым со среднеарифметическим.
  4. Коэффициент вариации – значение отклонений от среднего, выраженное в относительных величинах (%).

Отдельно следует отметить, что все приведённые в статье показатели, как правило, не имеют собственного смысла и используются для того, чтобы составлять более сложную схему анализа данных. Исключение из этого правила — коэффициент вариации, который является мерой однородности данных.

Коэффициент вариации – это один из наиболее применимых в финансовой сфере статистических коэффициентов. Расскажем, как рассчитать коэффициент вариации и чем он может пригодиться финансовому директору.

Что такое коэффициента вариации и зачем он нужен

Коэффициент вариации (Coefficient of variation, или CV) – это мера относительного разброса случайной величины. Он показывает, какую долю составляет средний разброс случайной величины от среднего значения этой величины.

В общем случае коэффициент вариации используют для определения дисперсии значений без привязки к масштабу измеряемой величины и единицам измерения. Коэффициент вариации входит в группу относительных методов статистики, измеряется в процентах и поэтому его можно использовать для сравнения вариации нескольких не связанных между собой процессов и явлений.

Использование коэффициента вариации в финансовом моделировании

Коэффициент вариации является лидером среди вариационных статистических методов, которые используют финансовые и инвестиционные аналитики.

Аналитики используют коэффициент:

  1. Для определения устойчивости прогнозной модели.
  2. Для сравнения нескольких прогнозных моделей (в основном инвестиционных) с разными абсолютными уровнями дохода и риска.
  3. Для проведения XYZ анализа.

Формула расчета коэффициента вариации

Коэффициент вариации рассчитывается по формуле:

где CV – коэфф вариации,

σ – среднеквадратическое отклонение случайной величины,

tср – среднее значение случайной величины.

Формула коэффициента вариации для инвестиционных финансовых моделей:

где NPV – чистый приведенный доход.

Формула коэффициента вариации для инвестиций в ценные бумаги:

где:%год – доходность по ценной бумаге в % годовых.

Коэффициент вариации в Excel

=СТАНДОТКЛОНПА(диапазон значений)/СРЗНАЧ (диапазон значений)

Или с использованием встроенного пакета «Анализ данных».

Анализ коэффициента вариации

Коэффициент вариации более универсален, в отличие от дисперсии и среднеквадратического отклонения, потому что позволяет сопоставлять риск и доходность двух и более активов, которые могут существенно отличаться. Правда, у метода оценки пары доходность/риск с помощью коэффициента вариации есть ограничения. Если ожидаемая доходность стремится к нулю, то значение коэффициента вариации стремится к бесконечности. И даже незначительное изменение ожидаемой доходности проекта (или ценной бумаги) приводит к значительному изменению коэффициента, что необходимо учитывать при обосновании инвестиционных решений.

  • меньше 10%, то степень риска проекта является незначительной,
  • от 10% до 20% – средней,
  • больше 20% – значительной,
  • если значение коэффициента вариации больше 33%, то финансовая модель считается неоднородной, неустойчивой. По ней нельзя принимать объективных инвестиционных решений

Примеры расчета коэффициента вариации в Excel

Пример 1

Первый – открытие сети розничных точек для торговли ювелирными изделиями в Москве и Санкт-Петербурге.

Второй – открытие сети розничных точек по всей России в городах-миллионниках.

Финансовый аналитик предприятия составил финансовые модели обоих проектов в Excel и по модели Монте-Карло сделал по 5000 прогонов для NPV в каждом проекте (см. также, как создать наглядную финансовую модель в Excel ). Далее с помощью пакета анализа «Анализ данных» получил следующие статистические показатели (см. таблицы 1 и 2).

Таблица 1 . Показатели по проекту 1

Средний предполагаемый NPV от Проекта 1 составит 14,05 тысяч долларов, дисперсия (она же среднее квадратическое отклонение) будет равна 1,72 тысяч долларов.

Коэффициент вариации для первого проекта равен:

CV = 1.72/14.05 = 12%

Проект признается среднерисковым.

Средний предполагаемый NPV от Проекта 2 составит 25,23 тысяч долларов, дисперсия будет равна 6,30 тысяч долларов.

Коэффициент вариации для второго проекта составит:

CV = 6,30/25,23 = 24,97%

Проект признается высокорисковым.

Если сравнивать проекты 1 и 2 по коэффициенту вариации, то следует выбрать Проект 1, так как соотношение доход/риск у него лучше.

Пример 2

Компания «Сигма» проводит XYZ анализ товарного ассортимента по показателю изменчивости продаж. Продуктовая линейка компании представлена пятью товарами: А, В, С, D и E.

Имеется помесячная статистика продаж за последний год по каждому товару (см. рисунок). На практике лучше иметь статистику за период более трех лет/

Рисунок . Статистика продаж за последний год по каждому товару

Финансовый аналитик компании рассчитал коэффициент вариации для каждого товара

CVа = СТАНДОТКЛОНПА(B2:В13)/СРЗНАЧ (В2:В13) = 30%

В компании установлены следующие интервалы для групп XYZ:

Z – 31–100%.

Значит, товары B и D относятся к категории X. Спрос на них постоянный, запасы на складах по ним должны быть под пристальным контролем и постоянно пополняться.

Товары A и C относятся к категории Y. Спрос на них отклоняется в пределах 30% от месяца к месяцу. Возможно, имеет место сезонность спроса. Нужно глубже анализировать статистику продаж и выработать оптимальную политику по остаткам на складах для данной группы.

Товар E имеет наиболее волатильный спрос, продажи по нему осуществляются нерегулярно, поэтому возможно имеет смысл перейти на работу с ним по предзаказу.

Выводы

Следует помнить, что коэффициент вариации – это не единственный способ оценки эффективности инвестирования, так как он не учитывает несколько важных факторов:

  1. Объемы первоначального инвестирования.
  2. Возможную асимметричность распределения. При расчете коэффициента вариации предполагается, что разброс значений случайной величины расположен симметрично к среднему (часто по нормальному распределению). Но это не всегда соответствует действительности. Например, для опционов, доходность которых не может быть ниже нуля, имеет место асимметрия распределения, и анализировать коэффициент вариации по ним нужно с оглядкой на другие методы статистического анализа.
  3. Инвестиционную политику субъекта инвестирования.
  4. Другие нечисловые факторы.

Однако метод оценки статистических, в том числе финансовых, данных посредством расчета коэффициента вариации заслуженно признан одним из наиболее эффективных сравнительных методов статистики.

Квадратный корень из дисперсии носит название среднего квадратического отклонения от средней, которое рассчитывается следующим образом:

Элементарное алгебраическое преобразование формулы среднего квадратического отклонения приводит ее к следующему виду:

Эта формула часто оказывается более удобной в практике расчетов.

Среднее квадратическое отклонение так же, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные значения признака от среднего их значения. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Между ними имеется такое соотношение:

Зная это соотношение, можно по известному показатели определить неизвестный, например, но (I рассчитать а и наоборот. Среднее квадратическое отклонение измеряет абсолютный размер колеблемости признака и выражается в тех же единицах измерения, что и значения признака (рублях, тоннах, годах и т.д.). Оно является абсолютной мерой вариации.

Для альтернативных признаков, например наличия или отсутствия высшего образования, страховки, формулы дисперсии и среднего квадратического отклонения такие:

Покажем расчет среднего квадратического отклонения по данным дискретного ряда, характеризующего распределение студентов одного из факультетов вуза по возрасту (табл. 6.2).

Таблица 6.2.

Результаты вспомогательных расчетов даны в графах 2-5 табл. 6.2.

Средний возраст студента, лет, определен по формуле средней арифметической взвешенной (графа 2):

Квадраты отклонения индивидуального возраста студента от среднего содержатся в графах 3-4, а произведения квадратов отклонений на соответствующие частоты - в графе 5.

Дисперсию возраста студентов, лет, найдем по формуле (6.2):

Тогда о = л/3,43 1,85 *ода, т.е. каждое конкретное значение возраста студента отклоняется от среднего значения на 1,85 года.

Коэффициент вариации

По своему абсолютному значению среднее квадратическое отклонение зависит не только от степени вариации признака, но и от абсолютных уровней вариантов и средней. Поэтому сравнивать средние квадратические отклонения вариационных рядов с различными средними уровнями непосредственно нельзя. Чтобы иметь возможность для такого сравнения, нужно найти удельный вес среднего отклонения (линейного или квадратического) в среднем арифметическом показателе, выраженном в процентах, т.е. рассчитать относительные показатели вариации.

Линейный коэффициент вариации вычисляют по формуле

Коэффициент вариации определяют по следующей формуле:

В коэффициентах вариации устраняется не только несопоставимость, связанная с различными единицами измерения изучаемого признака, но и несопоставимость, возникающая вследствие различий в величине средних арифметических. Кроме того, показатели вариации дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

По данным табл. 6.2 и полученным выше результатам расчетов определим коэффициент вариации, %, по формуле (6.3):

Если коэффициент вариации превышает 33%, то это свидетельствует о неоднородности изучаемой совокупности. Полученное в пашем случае значение говорит о том, что совокупность студентов по возрасту однородна по своему составу. Таким образом, важная функция обобщающих показателей вариации - оценка надежности средних. Чем меньше с1, а2 и V, тем однороднее полученная совокупность явлений и надежнее полученная средняя. Согласно рассматриваемому математической статистикой "правилу трех сигм" в нормально распределенных или близких к ним рядах отклонения от средней арифметической, не превосходящие ±3ст, встречаются в 997 случаях из 1000. Таким образом, зная х и а, можно получить общее первоначальное представление о вариационном ряде. Если, например, средняя заработная плата работника по фирме составила 25 000 руб., а а равна 100 руб., то с вероятностью, близкой к достоверности, можно утверждать, что заработная плата работников фирмы колеблется в пределах (25 000 ± ± 3 х 100) т.е. от 24 700 до 25 300 руб.

Вариация - это принятие единицами совокупности или группами различных, отичающихся друг от друга, значений знака. Вариация является результатом воздействия на единицу совокупности множества факторов. Синонимами терминация являются понятия изменение (изменчивость, вариативность’).

Вариация - одна из важнейших категорий статистической науки. Явления, подверженньие вариации, лежат в области исследования статистической науки, в то время как явления неизменные, статистические, постоянные в статистике не рассматриваются.

Практически все явления, имеющие естественный характер происхождения, подвержены изменчивости (например, химические процессы, изменчивость наследственных признаков у каждого человека и др.). Явления, а также ряд естественных законов могут иметь неизменный характер (например, минимальный размер заработной платы)

Необходимо подчеркнуть значение исследования вариации в статистической науке:

1 . Выявление измеычввости размеров явления дает возможность оценить степень зависимости изучаемого явления от других факторов, в свою очередь подверженньих изменчивости, или, другими словами, - оценить степень устойчивоти явленияк внешним воздействиям.

2. Вариация предполагает оценку однородности изучаемого явления, т. е. меру типичности, рассчитанной для этого явления средней величины.

Вариационным рядом называется последовательность различных вариант, записанных в возрастающем порядке вместе с соответствующими частотами.

В зависимости от типа признака различают дискретньие и интервальные вариационньие ряды. В зависимости от объема исходных данных и области допустимых значений одномерного количествснного признака, частотные распределения также подразделяются на дискретньие и интервальные. Если различных очень много (более 10-15), то эти варианты группируют вьибирая определенное число интервалов группировки и таким образом интервальное частотное распределение.

Первым шагом при построении интервального вариационого ряда является выбор определенного принципа, который дается в основу построения интервального ряда. Выбор этого принципа зависит от степени однородности рассматриваемой совокуности. Если совокупность однородна, то при построении ряда используют принцип равных интервалов. При этом вопрос однородности решается содержательным анализом изучаемых явлений.

Изменчивость явления в статистическом анализе отображается с помощью целого ряда характеристик, называемых системой показателей вариации . В нее входят:

абсолютные показатели вариации :

1) размах вариации;

2) средние величины (групповые и общие):

- степенные средние величины;

- структурные средние величины;


3) среднее линейное отклонение;

4) дисперсии (групповая, межгрулповая и общая) и среднее квадратическое отклонение;

относительные показатели вариации:

1) коэффициент осцилляции;

2) коэффициенты вариации (в том числе линейный);

3) коэффициенты детерминации (эмпирические и теоретические).

Размах вариации отражает пределы изменчивости признака или, другими словами, амплитуду вариации. Размах вариации рассчитывается как разность между максимальной величиной при знака (х) и минимальной величиной признака (х), т.е. по фор муле:

х - наибольшее значение признака;

х. - наименьшее значение признака.

Дисперсия - средний квадрат отклонений индивидуальньх значений признака от их средней величины:

Для вариационного ряда дисаерсия вычисляется по следующей формуле: (см. таблицу 2.)

Часто для исследования удобно представлять меру рассеяния в тех же единицах измерения, что и варианты. Тогда вместо дисперсии используют среднее квадратическое отклонение , которое является квадратным корнем из дисперсии, т.е. среднее квадратичное отклонение вычисляется по формуле: (см. таблицу 2)

Рассмотренные выше меры рассеявия (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными величинами, судить по ним о степени колеблимости признака не всегда возможно, в некоторых задачах необходимо использовать относительные показатели рассеяния. Таким показателем является коэффициент вариации (V), который представляет собой отношение среднего квадратичного отклонения к средней арифметической, выраженное в процентах:

Коэффициент вариации позволяет:

Сравнивать вариацию одного и того же признака у разных групп объектов;

Выявить степень различия одного и того же признака одной и той же группы объектов в разное время;

Сопоставить вариацию разных признаков у одних и тех групп объектов.

Если значение коэффициента вариации не превышает 33 то изучаемая совокупность считается однородной .

Рассмотрим на примере методику расчёта среднего квадратического отклонения и дисперсии признака.

ПРИМЕР 5 . В результате выборочной проверки расфасовки чая получены следующие данные:

Масса пачки чая, г. Число пачек чая, шт.

52 и выше 3

Исчислить среднюю массу пачки чая,среднее квадратическое отклонение,дисперсию признака.

Для расчёта используем формулы из таблицы 2.

Все расчёты желательно оформить в виде таблицы. Для определения середины интервала

В каждой группе,т.е. среднего значения,необходимо от интервального перейти к дискретному ряду. Величина интервала равна 1 (например,50 – 49 =1).Значит среднее значение для первой группы составит ((48 +49) /2 = 48,5 ;для второй и третьей групп соответственно 49,5 и 50,5 и т. д.

Масса Число Середина Х*f Х – Х (Х – Х) (Х – Х) * f

представляет собой отношение среднего квадратического отклонения к среднему ожидаемому значению и показывает степень отклонения получаемых результатов.
V = -* 100%, Х
гдеV - коэффициент вариации, %;
G- среднее квадратическое отклонение;
X - среднее ожидаемое значение.
Так как коэффициент вариации - величина относительная, то на его размер не оказывают влияние абсолютные значения изучаемого показателя. С помощью коэффициента вариации можно сравнивать даже колебле-
мость признаков, выраженных в разных единицах измерения. Коэффициент вариации изменяется в пределах от 0 до 100%, при этом, значение коэффициента прямо пропорционально силе колеблемости. Установлена следующая качественная оценка различных коэффициентов вариации:
до 10% - слабая колеблемость;
10-25% - умеренная колеблемость;
свыше 25% - высокая колеблемость.
В качестве варианта может быть использован несколько упрощенный метод определения степени риска. Так как количественно риск характеризуется оценкой вероятной величины максимального и минимального результатов, то «чем больше диапазон между этими величинами при равной их вероятности, тем выше степень риска»1 . Тогда для расчета дисперсии можно использовать следующую формулу:
&2 = PMAX * (max - XУ + Pmin * (X - Xmin У,
2
гдеа2 - дисперсия;
Pmax - вероятность получения максимального результата;
Xmax - максимальная величина результата;
X - средняя ожидаемая величина результата;
Pmjn - вероятность получения минимального результата;
Xmjn - минимальная величина результата.
Полученные показатели следует учитывать в комплексе, так как использование отдельного критерия оценки риска не может служить основой принятия решения в пользу какой-либо стратегии.
В практике встречаются ситуации, когда отсутствует информация о вероятностях состояний среды, т.е. необходима оценка риска в условиях полной неопределенности - (2). В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из перечисленных критериев рассмотрим на примере матрицы выигрышей А (1) и матрицы рисков R (2).

Еще по теме Коэффициент вариации:

  1. ВАРИАЦИИ В СТРУКТУРЕ И СТРУКТУРНО-ОБУСЛОВЛЕННЫЕ ВАРИАЦИИ
  2. 1.2.10. Определение. Если существует производная функциив точке, то она называется первой вариацией функционала в точке при данной вариации аргумента, и обозначается: