Курсовая работа: Статистика отрасли
2 этап. Сводная обработка данных на основе группировки и построения таблиц
1. а) Ранжированный ряд по объемам реализованной продукции, тыс. руб. (25 признак):
369; 385; 393; 400; 411; 433; 466; 467; 486; 488;489; 490; 494; 506; 517; 543; 545; 555; 588; 600; 612; 621;624;639; 714; 716; 726; 746; 761.
xmin= 369; xmax= 761; iопт= 392/5,7= 68,7719 ~ 69.
б) Ранжированный ряд по среднему заработку, руб. на чел. в год (28 признак):
2858; 2913; 2956; 3049; 3050; 3070; 3074; 3075; 3119; 3144;3151;3173; 3191; 3237;3245; 3262; 3280; 3297;3367; 3372; 3442; 3449; 3464; 3469; 3520; 3577; 3610; 3740.
xmin= 2858; xmax= 4126; iопт= 1268/5,7= 222,456 ~ 223.
Особенности группировок по объемным и качественным признакам
По объемным признакам (с 1 по 18) применяется группировка с неравными интервалами в группах, т.е. прогрессивно возрастающие интервалы (чтобы выделить мелкие, средние и крупные предприятия).
По качественным признакам (с 19 по 37) применяется группировка с равными интервалами в группах. Для определения количества выделяемых групп применяется формула оптимального интервала:
iопт= (xmax – xmin ) / (1+3,21lqN) ,
где iопт - величина оптимального интервала, при котором вариационный ряд не будет громоздким и в нем не исчезнут особенности изучаемого явления;
xmin и xmax - соответственно наименьшее и наибольшее значение признака в ранжированном ряду;
N - число леспромхозов (число значений варьирующего признака).
Полученное iопт округляем до 0,5; 1,0; 2,0; 5,0; 10; 50; 100; 500. После этого строятся групповые таблицы на основе группировки.
2. Групповые таблицы:
Признак № 28 | |
Средняя зарплата, руб. на работающего в год |
Количество леспромхозов |
до 3000 | 3 |
3000 – 3200 | 10 |
3200 – 3400 | 7 |
3400 – 3600 | 6 |
свыше 3600 | 2 |
Итого | 30 |
Признак № 25 | |
Комплексная выработка в м3 на рабочего лесозаготовок |
Количество леспромхозов |
до 400 | 3 |
400-480 | 5 |
480-580 | 11 |
580-700 | 6 |
свыше 700 | 5 |
Итого | 30 |
3. Аналитическая комбинационная таблица:
Комплексная выработка в м3 на рабочего лесозаготовок | Средняя зарплата, руб. на работающего в год |
Количество леспромхозов |
||||
до 3000 |
3000 – 3200 |
3200 – 3400 |
3400 – 3600 |
свыше 3600 |
||
до 400 | 1 | 2 | 3 | |||
400-480 | 1 | 2 | 1 | 1 | 5 | |
480-580 | 1 | 6 | 2 | 1 | 1 | 11 |
580-700 | 1 | 2 | 3 | 6 | ||
свыше 700 | 1 | 3 | 1 | 5 | ||
ИТОГО: | 3 | 10 | 8 | 7 | 2 | 30 |
4. Характер связи:
Прямая связь.
3 этап. Расчет обобщающих показателей – средних и относительных величин
Перестройка комбинационной таблицы с использованием средних и относительных величин:
1) Рассчитать средние величины, групповые и общие; по двум взаимосвязанным признакам.
2) Рассчитать относительные величины, приняв за базу сравнения среднее значение признака в первой группе (по данным карточек).
Перестроенная комбинационная таблица:
Интервалы факторного признака |
Среднее значение факторного признака (25) по перв. Данным |
Среднее значение результативного признака (28) |
Количество леспромхозов |
Относительные величины | |
факторный | результативный | ||||
до 400 |
380 | 3424 | 3 | 100 | 100 |
400 – 480 | 434 | 3145 | 5 | 114,2 | 91,8 |
480 – 580 | 509 | 3181 | 11 | 133,9 | 92,9 |
580– 700 | 607 | 3394 | 6 | 159,7 | 99,1 |
Свыше 700 | 691 | 3318 | 5 | 181,8 | 96,9 |
ИТОГО: | 0,525 | 3269 | 30 | - | - |
Расчет средних величин по объемным признакам (1-18) производится по первичным и по групповым данным.
Среднее значение факторного признака (25) по первичным данным находится как сумма пр.4/на сумму пр.8 по всем ЛПХ.
х =Sx/n
x1= (467+190+479)/(1265+483+1241)*1000=380
x2= …=434
x3= …=509
x4= …=607
x5= …=691
xср= сумма х / количество ЛПХ=0,525
Среднее значение результативного признака (28):
(сумма пр.11 в группе)/(сумма пр.7 в группе)*1000 (с точностью до 1 руб.)
x1= ((5999+2118+6072)/(1677+1725+741))*1000=3424,81=3424
x2=…=3145
x3=…=3181
x4= ...=3394
x5=…=3318
xср=(сумма пр.11 / сумма пр.7)*1000=(92920/28421)*1000=3269
Расчет относительных величин:
Выбираем за 100% одно из средних значений. Остальные средние значения делим на эту величину и умножаем на 100.
Относительные по факторному признаку:
114,2= 434/380*100
133,9= 509/380*100
159,7= 607/380*100
181,8= 691/380*100
Относительные по результативному признаку:
91,8= 3145/3424*100
92,9= 3181/3424*100
99,1= 3394/3424*100
96,9= 3318/3424*100
4 этап. Применение графического способа для выявления формы связи между показателями и расчет корреляционного уровня зависимости (y=f(x))
1. В системе координат нанести на график:
- корреляционную решетку, используя интервал – группировку по обоим признакам;
- фактические точки, характеризующие поле рассеивания по данным карточек;
- фактическую линию регрессии – по данным перестроенной комбинационной таблицы и средним значениям обоих признаков, исчисленных по первичным данным. На основе ломанной линии выбрать форму связи.
2. По данным перестроенной комбинационной таблицы рассчитать
уравнение корреляционной зависимости (используя уравнение прямой линии, гиперболы или параболы). Для этого нужно методом наименьших квадратов решить систему нормальных уравнений, чтобы найти параметры уравнения. Теоретические значения нанести на график и провести теоретическую линию регрессии.
Уравнение прямой:
у = а + в*х
Применяется при более или менее равномерном возрастании или убывании
результативного признака по мере изменения факторного.
Система нормальных уравнений для прямой:
nа + bSx =Sy
aSx+bSx2=Syx
Q - число ср. значений (вариантов) исчисленных по интервалам факторного признака.
n – число групп факторного признака .
Уравнение гиперболы:
у = а + b/х
Применяется при ускоренном снижении результативного признака по мере возрастания факторного. Система нормальных уравнений для гиперболы:
nа + b*S1/х= Sy
aS1/x + b*S1/x2= Sy/x
Уравнение параболы:
у = а + bх + сх2
Применяется при ускоренном возрастании или убывании результативного признака по мере возрастания факторного:
nа + bSx + cSx2 = Sy
aSx + bSx 2+ cSx3 = Syx
aSx2 + bSx 3+ cSx4 = Syx2
На основе ломанной линии выберем уравнение прямой.
Найдем коэффициенты А и В. Выразим А из первого уравнения системы:
nа + bSx = Sy
aSx + bSx2= Syx
a= (Sy - bSx) / n
Подставим a во второе уравнение системы: b=(nSyx-SxSy) /(nSx2-SxSx).
Получим:
X | Y |
X2 |
XY |
380 | 3424 | 144400 | 1301120 |
434 | 3145 | 188356 | 1364930 |
509 | 3181 | 259081 | 1619129 |
607 | 3394 | 368449 | 2060158 |
691 | 3318 | 477481 | 2292738 |
2621 | 16462 | 1437767 | 8638075 |
B = (5*8638075 – 2621 *16462) / (5 * 1437767 2621 *2621) = 0,00632 A = (16462 - 0,00632*2621) / 5 = 3289
Получили уравнение прямой: 3289 + 0,00632*Х.
5 этап. Оценка тесноты связи между двумя признаками на основе применения правила сложения дисперсий
I. Рассчитать три вида дисперсий по результативному признаку:
1. Общую Jобщ. 2. Внутригрупповую Jвн. 3. Межгрупповую dмг.
Произвести проверку правила их сложения.
П. Определить коэффициент тесноты связи (корреляционное отношение) h между показателями.
Особенности расчета дисперсии по объемным признакам.
1. Общая дисперсия
J2общ. == S(x – хср)2 / n
Общая дисперсия – это средний квадрат отклонений результативного признака относительно их общего уровня. Исчисляется по первичным данным. Характеризует собой вариацию результативного признака под влиянием на это изменения всех факторов, которые могут быть в жизни, включая и наш факторный признак.
2. Внутригрупповая дисперсия
J2вн. = SJ2i * yi / у
Внутригрупповая дисперсия как средневзвешенная из групповых дисперсий характеризует собой колеблемость отдельных значений результативного признака внутри групп, образованных по факторным признакам. Эта дисперсия учитывает влияние на результативный признак всех неучтенных нами факторов, исключая наш факторный признак.
3. Межгрупповая дисперсия
d2мг=S( xсрi- xср)*yi/Sy
Межгрупповая дисперсия – это квадрат отклонений групповых средних относительного общего среднего уровня результативного признака, поскольку эти колебания между группами образованные по факторному признаку, то эта дисперсия характеризует влияние только лишь факторного признака. Существует правило сложения трех дисперсий: Jобщ. = Jвн. + dмг.
Особенности расчета дисперсии по качественным признакам.
Расчет дисперсии по качественным признакам производится с учетом размеров предприятий определяемого его долей в общем объеме производства. В зависимости от сущности качественного показателя выступающего в роли результативного признака, эта доля определяется и в общем объеме производства или в общем размере того объемного признака, который является базовым (служит знаменателем) в расчете данного качественного показателя. Так, например, по совокупности ЛПХ для качественных показателей 20,21, 22, 23, 26, 35 определяется доля в общем объеме вывозки древесины; для показателей 19, 31, 34 доля в общем объеме товарной продукции; для показателей 24, 25, 27, 28, 32 доля в общей численности работников.
1. Общая дисперсия
J2общ. = (S(x – хср)2 * f) / Sf = S(x – хср )2 * f ,
где f =Qi / SQ –доля отдельных ЛПХ в суммарном базисном признаке.
2. Внутригрупповая дисперсия
J2вн. = (S(x - xсрi ) * f )/ S f = S(x - xсрi) * f,
где f =SQi / SQ - доля отдельных групп предприятий
3. Межгрупповая дисперсия
d2мг. = (S(xсрi – xср )2 * fi) / S f = S(xсрi – xср )2 * fi
Правило сложения трех дисперсий: Jобщ. = Jвн. + dмг.
Определение корреляционного отношения.
На основе соотношения внутригрупповой и межгрупповой в общей дисперсии определяется теснота связи между двумя признаками. Чем выше доля межгрупповой дисперсии в общей дисперсии, тем теснее связь между двумя признаками и наоборот большая доля между межгрупповой дисперсии характеризует определяющее влияние неучтенных нами факторов. Исходя из этого, определяется коэффициент тесноты связи:
h=Ö(dмг/Jобщ)
0 ≤ h ≤ 1,0
при h < 0,5 - связь слабая