Вторичная перегруппировка. Open Library - открытая библиотека учебной информации

Аналитическая группировка

Аналитические – такие группировки, которые применяются для исследования взаимосвязей между явлениями. Для проведения аналитической группировки нужно определить факторный и результативный признак.

Факторные – это те признаки, которые оказывают влияние на другие связанные с ними признаки.

Результативные – это признаки, которые изменяются под влиянием факторных.

Аналитические группировки позволяют изучить многообразие связей и зависимостей между варьирующими признаками. Чтобы исследовать взаимосвязь между признаками, производится группировка единиц совокупности по факторному признаку. В каждой группе вычисляется среднее значение результативного признака. Изменение признака от группы к группе под влиянием факторного будет говорить о наличии или отсутствии связи между факторами.


Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода, могут оказаться несопоставимыми из-за различного числа групп или неодинаковости границ интервалов. Для того, чтобы привести такие группировки к сопоставимому виду (это позволяет провести их сравнительный анализ), используется метод вторичной группировки.

Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам и когда границы новых и старых интервалов совпадают. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Этот способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые.

Рассмотрим первый способ проведения вторичной группировки.

Пример1 Пусть даны две группировки кредитов по сроку выдачи за ноябрь и декабрь (таблица 3.1, таблица 3.2).

Таблица 3.1руппировка кредитов коммерческих банков по сроку выдачи, ноябрь 2011 г. (данные условные)



Таблица 3.2 – Группировка кредитов коммерческих банков по сроку выдачи, декабрь 2011г. (данные условные)

Для удобства сравнения группировки ноябрьских и декабрьских кредитов произведем вторичную группировку ноябрьских кредитов, приняв за основу группировку декабрьских кредитов. Составим таблицу 3.3.

Таблица 3.3 – Группировка кредитов коммерческих банков по сроку выдачи, ноябрь-декабрь 2011 г. (данные условные)

Теперь можно сравнить группировки ноябрьских и декабрьских кредитов. Доля заключенных договоров по краткосрочным кредитам снизилась почти на 11 процентных пунктов, доля среднесрочных кредитов осталась без изменения, а количество долгосрочных кредитов в анализируемом периоде значительно выросло. Несмотря на эти изменения, в декабре так же, как и в ноябре, в структуре суммы выданных кредитов преобладающую долю занимали краткосрочные кредиты, затем следовали среднесрочные, а на последнем месте – долгосрочные кредиты. Для решения данного примера использовали метод объединения первоначальных интервалов.

Пример2 Имеются данные о структуре колхозов по числу дворов. Исходные данные не позволяют произвести сравнительный анализ структуры, так как в разных районах имеется разное число групп.

Структура колхозов по числу дворов

1 район 2 район
№ группы Уд. вес колхозов, % № группы Группы колхозов по числу дворов Уд. вес колхозов, %
До 100 4,3 До 50 1,0
100-200 18,3 50-70 1,0
200-300 19,5 70-100 2,0
300-500 28,2 100-150 10,0
свыше 500 29,7 150-250 18,0
250-400 21,0
400-500 23,0
свыше 500 24,0
ИТОГО 100,0 100,0

Проведем вторичную группировку колхозов второго района, приняв за основу группировку первого района, используя метод долевой перегруппировки (таблица 3.5).Таблица 3.5 – Вторичная группировка

Поясним расчеты. В первую, вновь образованную группу колхозов второго района с числом дворов до 100 войдут первые три группы колхозов, удельный вес которых равен 4% (1+1+2).Теперь надо образовать вторую группу колхозов с числом дворов от 100 до 200. В нее входит четвертая группа колхозов с числом дворов от 100 до 150, составляющая 10% общего числа колхозов, а также часть пятой группы, из которой должны перейти 50 дворов. Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно принимается, что оно должно быть пропорционально удельному весу отобранных дворов. Удельный вес 50 дворов в пятой группе равен: , или 50%.

Следовательно, в новую группу надо взять половину колхозов из пятой группы: .

Таким образом, удельный вес колхозов новой группы с числом дворов 100–200 составит 19% (10+9).

При формировании группы колхозов с числом дворов 200 – 300 видно, что в нее войдет часть пятой группы с удельным весом колхозов 9% и часть шестой группы, из которой надо добавить в третью группу 50 дворов, пропорционально которым должно быть отобрано из этой группы 7% колхозов: .Тогда группа колхозов с числом дворов 200–300 составит 16% (9+7).

Аналогично производится расчет при образовании других групп. Если наряду с удельными весами имеются абсолютные значения показателей по группам, то все расчеты показателей по вновь образованным группам ведутся в тех же соотношениях, что и численность распределения единиц. Таким образом, сравнивая оба района по числу дворов в колхозах, видно, что во втором районе оно было более дифференцировано, чем в первом районе.

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.

Пример 1.

Произвести укрупнение интервалов на основе данных таблицы 2.7.:

Таблица 2.7.

Число магазинов

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2.8.).

Таблица 2.8.

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот за IV квартал, тыс.руб.

Товарооборот в среднем на 1 магазин, тыс.руб.

Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.

Пример 2.

Имеются следующие данные о распределении колхозов по числу дворов (табл. 2.9.).

Таблица 2.9.

Удельный вес колхозов группы в процентах к итогу

Группы колхозов по числу дворов

Эти данные не позволяют провести сравнение распределения колхозов в 2-х районах по числу дворов, так как в этих районах имеется различное число групп колхозов. Необходимо ряды распределения привести к сопоставимому виду.

За основу сравнения необходимо взять распределение колхозов 1 района. Следовательно, по второму району надо произвести вторичную группировку, чтобы образовать такое же число групп и с теми же интервалами, как и в первом районе. Получим следующие данные (табл.2.10.).

Таблица 2.10.

Группы колхозов по числу дворов

Удельный вес колхозов группы в % к итогу

21-7=14, 14+23=37

Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно примем, что это число колхозов должно быть пропорционально удельному весу отобранных дворов в группе.

Определяем удельный вес 50 дворов в пятой группе.

(50 * 18) / (250 - 150) = 9

Определяем удельный вес 50 дворов в шестой группе.

(50 * 21) / (400 - 250) = 7 и т.д.

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

  • § Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
  • § Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Ряды распределения

Группировка может быть построена на основе ряда распределения. В то же время построение рядов может осуществляться на основе группировки. Всестороннее изучение статистического явления наиболее плодотворно, если в его основе лежит система группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны явления.

Рядом распределения называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку.

Виды рядов распределения:

  • - атрибутивный;
  • - вариационный - дискретный и интервальный.

Иными словами, ряд распределения - результат группировки.

Под атрибутивным рядом понимается ряд распределения по атрибутивному признаку, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и т.д.

Любой ряд, представленный в табличном виде, состоит из двух колонок. В первой колонке указываются значения изучаемого признака (атрибутивные или количественные). Во второй колонке фиксируется число единиц наблюдения, обладающих данным значением. Таким образом, построение вариационного ряда сводится к определению значения признака в каждой классификационной группе и определению количества элементов, попавших в эту группу.

Каждое индивидуальное значение признака в ряду распределения называется вариантой.

Количество элементов в каждой классификационной группе или количество элементов в совокупности с данной вариантой называется частотой, или, иначе, число единиц наблюдения, содержащееся в каждой отдельной группе, принято называть частотой ряда распределения.

Удельный вес данной группы в совокупности называется частостью. Частость или структура, показывает долю совокупности данной классификационной группы.

Частость - отношение частоты к общему количеству исследуемых элементов, то есть объему совокупности.

Частоту обозначим n или f , частость - p или j.

Пример дискретного ряда.

Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.

Вторичная группировка

Вторичная группировка - это образование новых групп на ос­нове ранее произведенной группировки. Применяют два способа об­разования новых групп на основе ранее произведенной группировки.

Первый способ состоит в укрупнении первоначальных интерва­лов. Это наиболее простой и распространенный способ.

Второй способ принято называть методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определœенная до­ля единиц совокупности. Рассмотрим два способа на примере.

Имеется группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы (цифры условные).

Таблица 3.6

Кредитное управление Валютное управление
№ груп­пы Число работ­ников, чел. № группы Размер зарплаты, руб. в мес. Число работ­ников, чел.
2000 - 2500 2000 - 3000
2500 - 3000 3000 - 5000
3000 - 4000 5000 - 7000
4000 - 5000 7000 и более
5000 и более - -
Итого Итого

Приведенные данные не позволяют сравнить распределœение работников по размеру месячной заработной платы, так как величины интервалов различны, в связи с этим крайне важно привести эти ряды распределœения к сопоставимому виду.

Произведем вторичную группировку, образовав группы с новыми укрупненными интервалами.

Таблица 3.7

При вторичной группировке методом долевой перегруппировки устанавливаем новые интервалы распределœения работников по размеру месячной заработной платы, при этом за каждым интервалов закрепляем определœенную долю единиц совокупности. В нашем примере одну из группировок (по кредитному управлению) оставляем без изменений. А по валютному управлению производим перегруппировку следующим образом. В первой группе с интервалом от 2000 до 3000 руб. частота равна 2. Применительно к группировке по кредитному управлению данный интервал крайне важно разбить на два равных интервала: от 2000 до 2500 руб. и от 2500 до 3000 руб., при этом исходная частота делится поровну. Следующий интервал от 3000 до 5000 руб. соответственно нужно разделить на два равных интервала: от 3000 до 4000 руб. и от 4000 до 5000 руб., при этом исходная частота делит­ся поровну (6:2 = 3). Последние две группы крайне важно объединить в одну с интервалом 5000 руб. и выше.

Таблица 3.8

№ группы Размер зарплаты, руб. в мес. Кредитное число управления работников Валютное число управления работников
чел. в % к ито­гу чел. в % к итогу
2000 - 2500 8,33 3,33
2500 - 3000 16,67 3,33
3000 - 4000 25,00 10,00
4000 - 5000 33,33 10,00
5000 и выше 16,67 73,34
Итого 100,00 100,00

Контрольные вопросы

(выберите правильный ответ)

1. Статистическая сводка включает в себя:

а) только подсчет итогов в данных;

б) группировку данных и подсчет итогов;

в) группировку данных, подсчет итогов и расчет обобщаю­щих показателœей.

2. Группировка, в которой изучается структура совокупности, принято называть:

а) типологической; б) структурной; в) аналитической.

3. Группировочный признак может быть:

а) количественный;

б) качественный;

в) и количественный, и качественный.

4. Величина интервала определяется:

а) верхней границей интервала;

б) нижней границей интервала;

в) разностью верхней и нижней границ.

5. Вариационный ряд распределœения строится:

а) по качественному признаку;

б) по количественному признаку.

6. Частоты - это:

а) абсолютные числа;

б) относительные числа.

7. Частости - это:

а) абсолютные числа;

б) относительные числа.

8. В дискретном вариационном ряду значения признака выражены:

а) в виде чисел;

б) в виде интервалов.

9. Интервальный вариационный ряд графически изображается в виде:

а) полигона распределœения;

б) гистограммы;

в) кумуляты.

10. Вторичная группировка осуществляется методом:

а) уменьшения интервалов;

б) укрупнения интервалов;

в) и уменьшения, и укрупнения интервалов;

г) долевой перегруппировки.

Сложные группировки. Группировки по одному признаку называются простыми . Для того же, чтобы полнее и глубже изучить сложное общественное явление, необходимо сгруппировать данные по двум или более признакам. Такие группировки называют сложными .

Наиболее распространенным видом сложных группировок являются комбинированные группировки , когда группы, образованные по одному признаку, делятся затем на подгруппы по второму и т.д. признакам. Обычно в основание группировки кладется от 2 до 4 признаков.

Одновременное использование нескольких группировочных признаков позволяет выявить и сравнить такие различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков.

При изучении влияния большого числа признаков применение комбинированных группировок становится невозможным, поскольку чрезмерное дробление информации затушевывает проявление закономерностей и тем самым не позволяет выявить одновременное влияние всего комплекса факторных признаков на исследуемый показатель.

Вторичная группировка. Особым видом группировок в статистике является вторичная группировка , под которой понимается образование новых групп на основе ранее выделенной (первичной) группировки .

Обычно новые группы получают путем укрупнения первоначальных интервалов. Вторым способом образования новых групп является долевая перегруппировка единиц совокупностей.

К вторичной группировке прибегают в целях решения ряда задач, в частности для: 1) создания более укрупненных групп, в которых яснее проступает характер распределения; 2) образования качественно однородных групп (типов); 3) приведения двух (или более) группировок с различными интервалами к единому виду в целях сравнимости.

Предприятие 1 Предприятие 2
группы рабочих по размеру зарплаты, тенге удельный вес рабочих по группам, % к итогу
12000–14000
14000–16000 13000–16000
16000–18000 16000–19000
18000–20000 19000–22000
20000–22000 22000–25000
22000–24000 25000–28000
24000–26000 28000–31000
26000–28000
Итого Итого

Поскольку распределение рабочих на этих двух предприятиях имеет различные интервалы, то сравнить их непосредственно невозможно. Однако с помощью вторичной группировки можно привести их к сравнимому виду. Возьмем, к примеру, интервал в 4000 тенге:

Распределение рабочих по размеру месячной заработной платы

(группировка единая)

Группы рабочих по размеру зарплаты, тенге Удельный вес рабочих по группам, % к итогу
предприятие 1 предприятие 2
12000–16000 17 (5+12)
16000–20000 44 (18+26) 37 (30+1/3×21)
20000–24000 32 (25+7) 24 (2/3×21+2/3×15)
24000–28000 7 (4+3) 21 (1/3×15+16)
28000–32000
Всего

Ряды распределения.

Определение ряда распределения. В результате сводки статистических материалов образуются ряды статистических данных, раскрывающих либо изменение объемов совокупностей в динамике (будут рассмотрены в отдельной главе), либо распределение совокупностей по тем или иным признакам в статике.

Распределение может быть по признакам, не имеющим количественной меры (атрибутивным), и по признакам, в которых изменяется их количественная мера (вариационные ряды).

Атрибутивные ряды распределения. Примерами подобных распределений служат распределение населения на городское и сельское, мужское и женское, товарооборота на продовольственные и непродовольственные товары, занятого населения по отраслям и профессиям, взрослого населения по уровню образования.

Вариационные ряды. Например, к таким рядам относятся распределения рабочих по размеру среднемесячной заработной платы и предприятий по объемам производства или численности работающих.

В вариационном ряду различают два элемента: варианты и частоты. Варианты это отдельные значения группировочного признака, которые он принимает в вариационном ряду. Частотами называют числа, показывающие, как часто встречаются те или иные варианты.

Сумма всех частот образует объем ряда распределения, или его численность . Частоты, выраженные в виде относительных величин (долях единицах, процентах), называют частостями .

Вариационные ряды по способу построения бывают интервальными и дискретными. Интервальные вариационные ряды – ряды, в которых значения вариант даны в виде интервалов (например, численность населения по группам возрастов). Дискретные вариационные ряды – ряды, в которых значения вариант имеют значения целых или фиксированных чисел (например, общее число семей по числу человек).

Характер вариационного ряда (интервальный или дискретный) определяется характером вариации. Вариация может быть непрерывной (интервальный ряд) и прерывной (дискретный ряд).

Примерами непрерывной вариации служат урожайность сельскохозяйственных культур, заработная плата, объемы производства.

К дискретной вариации могут относиться число членов семьи, тарифный разряд рабочего, число комнат в квартире, число рабочих на предприятии.

Если дискретная вариация проявляется в широких пределах (например, численность рабочих на предприятии), то строятся интервальные вариационные ряды.

Примеры построения и графического изображения рядов распределения (Тарифный разряд и стаж работы рабочих-слесарей). Построим первоначальный дискретный ряд распределения рабочих по тарифным разрядам. Характер вариации признака здесь определен шестью группами – по числу разрядов. Подсчет числа рабочих в каждом разряде легко провести непосредственно по первичным данным. В результате получим таблицу.