|
|
Метод группировок, ряды динамики, задачи по совхозамI. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ Тема 2. Вопрос 2: В чём сущность метода группировок и его значение? Изучаемые статистикой массовые явления и процессы протекают в качественно однородных совокупностях. Однако качественная однородность единиц, составляющих совокупность, не является чем-то абсолютным, навсегда и на все случаи заданным. Единицы, качественно однородные в одном отношении, оказываются разнородными в другом. Это позволяет делить статистическую совокупность на частные подсовокупности - использовать методы группировки. Таким образом, группировка - это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка - это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Устойчивое разграничение объектов выражается классификацией. Классификация - это как бы стандарт, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Классификация основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов и т. д.). Таким образом, классификация - это узаконенная, общепринятая, нормативная группировка. Метод группировки основывается на двух категориях - группировочном признаке и интервале. Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Классификация и группировка должны производиться на основании вполне объективных и легко распознаваемых признаков. При этом последние могут носить как атрибутивный, так и количественный характер. Следует иметь в виду, что в ряде случаев классификация, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида. Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бывают: равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова; неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе; открытые, когда имеется только либо верхняя, либо нижняя граница; закрытые, когда имеются и нижняя, и верхняя границы. Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования существующих зависимостей. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная, аналитическая (факторная). Типологическая группировка решает задачу выявления и характеристики социально-экономических типов (частных подсовокупностей). Структурная дает возможность описать составные части совокупности или строение типов, а также проанализировать структурные сдвиги. Аналитическая (факторная) группировка позволяет оценивать связи между взаимодействующими признаками. В зависимости от числа положенных в их основание признаков различают простые и многомерные группировки. Группировка, выполненная по одному признаку, называется простой. Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации. По отношениям между признаками выделяют иерархические и неиерархические группировки. Иерархические группировки выполняются по двум и более признакам, при этом значения второго признака определяются областью значений первого (например, классификация отраслей промышленности по подотраслям). Неиерархические группировки строятся, когда строгой зависимости значений второго признака от первого не существует. Среди простых группировок особо выделяют ряды распределения. Ряд распределения - это группировка, в которой для характеристики групп (упорядочение расположенных по значению признака) применяется один показатель - численность группы. Другими словами, это ряд чисел, показывающий, как распределяются единицы некоторой совокупности по изучаемому признаку. Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения. Ряды распределения, построенные по количественному признаку, называются вариационными рядами, По очередности обработки информации группировки бывают первичные (составленные на основе первичных данных) и вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала. Относительно временного критерия группировки бывают статические, дающие характеристику совокупности на определенный момент времени или за определенный период, и динамические. Последние - это группировки, показывающие переходы единиц из одних групп в другие (а также вход и выход из совокупности). Количества таких переходов, рисующие внутреннюю динамику совокупности, удобно располагать в "шахматную" таблицу, которую называют матрицей перехода. Такую матрицу также часто называют миграционной или матрицей мобильности. При проведении группировки приходится решать ряд задач: 1) выделение группировочного признака; 2) определение числа групп и величины интервалов; 3) при наличии нескольких группировочных признаков описание того, как они комбинируются между собой; 4) установление показателей, которыми должны характеризоваться группы, т. е. сказуемого группировки. Рассмотрим методологические вопросы построения различных видов группировок. Типологическая группировка может строиться для разных целей и по различным критериям. Задача выделения типов из общей совокупности решается сравнительно просто только в тех случаях, когда различия очевидны и устойчивы и могут быть описаны одним или несколькими признаками. Однако на практике это бывает редко. Принадлежность группируемых объектов к общей совокупности приводит обычно к появлению у них некоторых общих особенностей, маскирующих различия между типами. Кроме того, недостаточно четкое обособление отдельных типов друг от друга в действительности, множественность признаков описания объекта и ряд других обстоятельств еще более усложняют группировку. Поэтому задача проведения качественной типологической группировки совокупности весьма сложна. По способу формирования типологических групп различают: 1) способ последовательных разбиений, заключающийся в формировании таких групп, все объекты которых имеют одинаковые значения классификационных признаков; 2) способ многомерной классификации. В этом случае объекты, образующие группы, могут иметь различные значения классификационных признаков. Первый способ является исторически более ранним. Он включает в себя два метода. Во-первых, это типичный для него метод комбинационной группировки, при которой формирование групп производится путем последовательного разбиения сначала всей совокупности по одному признаку, затем полученных частей - по другому и т. д., причем строго соблюдается принцип иерархии групп. Во-вторых, это многошаговый метод последовательных разбиений совокупности. Способ многомерной классификации, когда группы формируются на основе близости объектов одновременно по большому числу признаков, получил широкое применение с разработкой методов распознавания образов и появлением ЭВМ. При использовании методов комбинационной группировки классификация осуществляется путем последовательного логического деления совокупности по отдельным признакам. Очередность этапов здесь такова: 1) наметка типов; 2) выбор группировочного признака (признаков); 3) определение числа групп и величины интервалов; 4) сведение выделенных групп в типы; 5) характеристика типов с помощью системы показателей. Наметка типов производится с помощью теоретического качественного анализа. Предварительно намечают столько типов, сколько их может быть в данной совокупности теоретически (хотя фактически возможно меньшее их число). При выборе группировочного признака необходимо учитывать два условия. Во-первых, типологическая группировка должна выполняться только по существенным признакам. Теоретически следует охватить все существенные признаки, однако при таком подходе получается излишнее дробление совокупности. Группы оказываются малы по объему и не пригодны дня статистического анализа. Поэтому рекомендуется проводить группировку по двум-трем главным признакам, взятым в комбинации. Во-вторых, при необходимости для характеристики разных типов выбираются различные признаки, т. е. осуществляется специализация признака. Например, для выделения типов сельскохозяйственных предприятий по размеру в качестве Группировочного будет выступать признак отраслевой принадлежности (растениеводство или животноводство). Далее же количественные признаки: для растениеводства - посевная площадь и число комбайнов, а для животноводства - поголовье крупного рогатого скота и производство молока. На различных этапах формирования типологической группировки число групп неодинаково. По ее завершении оно соответствует фактическому числу выделенных типов. На предварительном этапе количество комбинированных групп определяется произведением К1 • К2 • ... • Кm, где Кi - число градаций i-го группировочного признака. В случае количественного группировочного признака необходимо определять величину интервалов. Интервалы задают критические точки перехода одного качества в другое. При построении типологической группировки интервалы должны быть неравными и специализированными. Специализация интервалов означает, что разным значениям одного признака соответствуют разные значения другого. Полученные комбинированные группы в итоге чисто технически объединяются в типы. Критерием оптимальности выполненной типологической группировки может служить максимум межгрупповой дисперсии интересующего исследователя признака: Если результат не устраивает исследователя, то группировку следует повторить, задавая для каждого признака меньшее число групп. Если группировка оказывается приемлемой, то для характеристики типов разрабатывается система показателей, среди которых обязательно должны быть характеристика численности типов - веса либо частоты - и интегральные показатели, рассчитанные в виде средних, удельных весов, соотношений, показателей динамики и т. д. В процессе анализа иногда возникает задача рационального построения типов на основе комбинационной группировки в условиях ограниченности совокупности и наличия более четырех качественных признаков, предположительно вызывающих неоднородность. В таких случаях можно использовать модификацию метода комбинационной группировки - многошаговый метод последовательных разбиений совокупности. Он базируется на анализе коэффициентов вариации качественных признаков. Коэффициент вариации характеризует способность признака различать отдельные элементы совокупности. Расчет значений коэффициента вариации качественных признаков 0(Х) основан на сопоставлении числа различных пар событий: где I - число градаций признака X; ni - число объектов, принимающих i-ю градацию признака (i= 1,2, ..., I); N - число объектов совокупности: Коэффициент вариации качественных признаков Q(Х) реагирует только на характер распределения объектов по градациям признака. Он принимает максимальное значение 1 при равенстве частот градаций признака и считается, что равен 0 при одной градации, т. е. когда вся совокупность образует по данному признаку одну группу. Малое значение коэффициента вариации свидетельствует о том, что распределение объектов на группы по данному признаку крайне неравномерно, т. е. большинство объектов имеет одинаковую градацию изучаемого признака и лишь небольшое число -отличную. В этом случае, если нет запрета на исключение рассматриваемого признака и связь его с моделируемым показателем слаба, признаки с малым значением коэффициента вариации могут вообще не рассматриваться. Используя коэффициент вариации признака, группы формируют следующим образом. По каждому признаку вычисляется Qi(Х), и разбиение совокупности производится по тому признаку, который имеет максимальное значение. Если таких признаков оказывается несколько, то выбор среди них осуществляется по содержательному смыслу. Результатом будут группы первого шага разбиения. Далее полученные группы рассматриваются как самостоятельные совокупности и описанная выше процедура повторяется на следующем шаге. Такое деление производится до тех пор, пока однородность объектов не достигнет желаемой степени либо число элементов в группах не станет меньше заданного. В ходе научных исследований обнаружилось, что принципы чистой логики, лежащие в основе метода комбинационной группировки, часто бывает нелегко применять к эмпирическому материалу. Это обусловило необходимость разработки новых принципов группировки, отличных от традиционных. Сущность этих новых принципов, лежащих в основе многомерной классификации, состоит в следующем. Классификация объектов производится не последовательно по отдельным признакам, а одновременно по большому числу признаков. Этот фиксированный набор признаков образует так называемое пространство признаков, а каждому признаку придается смысл координаты. Если задано т существенных признаков совокупности, то любой объект рассматривается как точка в m-мерном пространстве признаков и задача классификации сводится к выделений сгущений объектов в этом пространстве. Для этого используются разные алгоритмы, но всегда группы (типы, классы) формируются на основании близости объектов по комплексу признаков. Подходы к формированию групп, применяемые в многомерной группировке, лучше, чем комбинационные, согласуются со сложившимся представлением о существовании естественных типов объектов, близких по совокупности признаков. В самом деле, при комбинационной группировке объект, отклоняющийся по одному-единственному признаку от нормы, характерной для группы, будет автоматически из нее исключен. Более того, если этот признак используется на первом шаге группировки, то объект может легко попасть в группу, очень далекую от той, с которой он в действительности имеет наибольшее сходство. Если вспомнить понятие пространства признаков, то группы, получаемые при комбинационной группировке, представляют собой секторы такого пространства. При этом границы между ними обычно параллельны осям данного пространства и жестко заданные интервалы признаков часто разрушают реально существующие классы. Этот основной недостаток делает комбинационные группировки не всегда эффективными для выделения типов объектов по комплексу признаков, так как с добавлением каждого нового признака опасность разрушения объективно существующих однородных групп возрастает. Следовательно, главное преимущество методов многомерной группировки заключается в том, что они позволяют с той или иной степенью приближения выделить реально существующие в признаковом пространстве скопления точек - объектов. Это связано с одновременной группировкой по большому числу признаков и использованием сложных поверхностей в качестве границ. Реализация методов последовательного разбиения возможна и без применения вычислительной техники, в то время как методы многомерной группировки в связи с трудоемкостью расчетов требуют использования ЭВМ, почему их часто называют методами автоматической классификации. Цели этих двух способов совпадают, основное же различие состоит в том, что при автоматической классификации исследователь лишь указывает направление поиска (заданием набора признаков, имеющих отношение к цели классификации), но отказывается на данном этапе от самостоятельного формирования классов. Выбор одного из указанных способов классификации во многом определяется характером признаков, составляющих описание объекта. Если преобладают качественные признаки, их не очень много и априори известно, что они неравнозначны с точки зрения цели классификации, то целесообразнее использовать способ последовательного разбиения. При наличии большого числа примерно равнозначных признаков, особенно если это признаки количественные, а вопрос иерархии признаков и групп не столь важен, следует ориентироваться на многомерную классификацию. Структурная группировка применяется для характеристики структуры и структурных сдвигов. При проведении структурной группировки решаются следующие вопросы. 1. Выбор группировочного признака. В данном случае в качестве такового может выступать как существенный, так и несущественный признак. 2. Определение числа групп и величины интервала. Здесь необходимо учитывать несколько условий: а) число групп детерминируется уровнем колеблемости группировочного признака. Чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп; б) число групп должно отражать реальную структуру изучаемой совокупности; в) не допускается выделение пустых групп. Если проблема пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы. Для нахождения числа групп служит формула n = 1 + 3,322 • Ig N. где N - количество элементов совокупности. В случае равных интервалов величина интервала может быть определена как 3. Определение системы показателей для характеристики групп. Обязателен показатель численности групп. Он может быть представлен либо частотой (количеством единиц в каждой группе), либо частотностью (удельным весом каждой группы). Аналитическая (факторная) группировка предназначена для установления тесноты связи между взаимодействующими признаками - факторным и результативным. Она позволяет выявить наличие и направление связи, а также измерить ее тесноту и силу. Методологическими вопросами построения факторной группировки являются выбор группировочного признака, определение числа групп и величины интервала, выбор системы показателей для характеристики групп. Чаще всего в качестве группировочного принимают факторный признак, выделенный на основе априорного анализа. Интервалы в аналитической группировке берутся преимущественно равные либо равнонаполненные (группы с приблизительно одинаковой частотой). Величина интервала рассчитывается так же, как при построении структурной группировки. Среди показателей групп обязательным является среднее значение результативного показателя по каждой группе. Тема 6. Вопрос 1: Понятие и виды рядов динамики. Ряд динамики, хронологический ряд, динамический ряд, временной ряд - это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Всякий ряд динамики включает, следовательно, два обязательных элемента: во-первых, время и, во-вторых, конкретное значение показателя, или уровень ряда. Ряды динамики различаются по следующим признакам. 1. По времени - моментные и интервальные ряды. Интервальный ряд динамики - последовательность, в которой уровень явления относится к результату, накопленному или вновь произведенному за определенный интервал времени. Таковы, например, ряды показателей объема продукции по месяцам года, количества отработанных человеко-дней по отдельным периодам и т. д. Если же уровень ряда показывает фактическое наличие изучаемого явления в конкретный момент времени, то совокупность уровней образует моментный ряд динамики. Примерами моментных рядов могут быть последовательности показателей численности, населения на начало года, величины запаса какого-либо материала на начало периода и т. д. Важное аналитическое отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель - общий выпуск продукции за год, общие затраты рабочего времени, общий объем продаж акций и т. д., сумма же уровней моментного ряда, хотя иногда и подсчитывается, но реального содержания, как правило, не имеет. 2. По форме представления уровней- ряды абсолютных, относительных и средних величин (табл. 5.1 - 5.3). 3. По расстоянию между датами или интервалам времени выделяют полные и неполные хронологические ряды. Полные ряды динамики имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Это равноотстоящие ряды динамики (см. табл.5.1 и 5.2). Неполные - когда принцип равных интервалов не соблюдается (см. табл. 5.3). 4. По числу показателей можно выделить изолированные и комплексные (многомерные) ряды динамики. Если ведется анализ во времени одного показателя, имеем изолированный ряд динамики (см. табл. 1 и 2). Комплексный ряд динамики получаем в том случае, когда в хронологической последовательности дается система показателей, связанных между собой единством процесса или явления (см. табл. 3). Таблица 1 Объем продаж долларов США на ММВБ, млн. долл. Дата 10.01.94 11.01.94 12.01.94 13.01.94 Объем продаж 126,750 124,300 148,800 141,400 Таблица 2 Индекс инфляции в 1993 г. (на конец периода, в % к декабрю 1992 г.) Период Январь Февраль Март Апрель Май Июнь Индекс инфляции 126 162 190 221 264 310 Таблица 3 Потребление основных продуктов питания на одного члена семьи, кг/год Продукты 1980 1985 1990 1991 1992 1993 Мясо и мясопродукты Молоко и молочные 80,0 78,4 74,1 68,3 58,7 63,2 продукты Хлебные продукты 411,2 101,2 389,6 91,6 378,9 85,7 345,4 91,8 280,4 98,0 285,6 105,8 II. ПРАКТИЧЕСКАЯ ЧАСТЬ Задача №5 Сгруппируйте совхозы по качеству почв. Выявите влияние этого фактора на урожайность озимой пшеницы. Таблица 4 № п/п Качество почв, баллы Посевная площадь, га Урожайность озимой пшеницы, ц/га 1 68 310 21 2 80 400 29 3 55 250 20 4 45 480 15 5 87 400 36 6 88 350 35 7 90 450 38 8 78 370 25 9 65 290 21 10 70 300 21 11 64 400 18 12 60 500 29 13 50 260 15 14 63 300 19 15 66 300 20 16 88 310 42 17 48 340 25 18 80 410 38 19 94 340 46 20 76 420 32 21 50 160 18 22 64 400 18 23 80 300 28 24 86 300 35 25 70 200 22 26 77 300 26 27 80 310 42 28 90 300 38 29 75 220 33 30 66 250 20 Решение: Установим на основе метода статистических группировок взаимосвязь между результативным (урожайность озимой пшеницы) и факторным (качество почв) признаками. На основе таблицы исходных данных (таблица 4) разделяем совокупность совхозов на 4 группы, предварительно определив величину интервала по формуле: , где xmax - наибольшее значение оценки качества почв (x19=94); xmin - наименьшее значение (x4=45). Строим вспомогательную таблицу 5 и разносим по группам 30 заданных совхозов. Затем подсчитываем групповые и общие итоги. Таблица 5 Группировка совхозов района по качеству почв и исходные данные по группам Группы совхозов № совхоза Качество почв, баллы Посевная площадь, га Урожайность озимой пшеницы, ц/га Валовой сбор, ц I 3 55 250 20 5000 4 45 45 15 675 45 - 57,25 13 50 260 15 3900 17 48 340 25 8500 21 50 160 18 2880 Итого: 5 49,6 1055 18,6 20955 II 1 68 310 21 6510 9 65 290 21 6090 57,26 - 69,5 11 64 400 18 7200 12 60 500 29 14500 14 63 300 19 5700 15 66 300 20 6000 22 64 400 18 7200 15 66 300 20 6000 Итого: 8 64,5 2800 20,75 59200 III 2 80 400 29 11600 8 78 370 25 9250 69,51 - 81,75 10 70 300 21 6300 18 80 410 38 15580 20 76 420 32 13440 23 80 300 28 8400 25 70 200 22 4400 26 77 300 26 7800 27 80 310 42 13020 29 75 220 33 7260 Итого: 10 76,6 3230 29,6 97050 IV 5 87 400 36 14400 6 88 350 35 12250 81,76 - 94 7 90 450 38 17100 16 88 310 42 13020 19 94 340 46 15640 24 86 300 35 10500 28 90 300 38 11400 Итого: 7 89 2450 38,57 94310 Всего по совокупности 30 69,92 2383,75 26,88 67878,75 Строим итоговую таблицу, характеризующую взаимосвязь между урожайностью озимой пшеницы и качеством почв. Для этого сумму валового сбора делим на сумму посевных площадей и находим среднюю урожайность по каждой группе. Таблица 6 Итоговая группировочная таблица, характеризующая взаимосвязь урожайности озимой пшеницы с качеством почв Группы по качеству почв Кол-во совхозов в группе Средний уровень урожайность озимой пшеницы, ц/га качество почв I 45 - 57,25 5 19,86 49,6 II 57,26 - 69,5 8 21,14 64,5 III 69,51 - 81,75 10 30,05 76,6 IV 81,76 - 94 7 38,49 89 Итого: 30 27,39 Анализируя итоговую таблицу можно отметить прямую зависимость урожайности от качества почв, чем выше качество почв, тем больше урожайность. Задача №45 По первым пяти совхозам определите: средний размер посевной площади картофеля; 2) среднюю урожайность картофеля. Объясните какие виды средних величин вы использовали и почему. Таблица 7 № п/п Посевная площадь картофеля, га Урожайность картофеля, ц/га 1 150 260 2 80 220 3 106 120 4 94 130 5 120 230 Решение: Средний размер посевной площади вычисляем как среднюю арифметическую, поскольку посевная площадь является независимой от других факторов величиной. . Среднюю урожайность вычисляем по формуле средней арифметической взвешенной, так как имеется ряд данных по двум взаимосвязанным показателям (площадь и урожайность), для одного из которых нужно вычислить среднюю величину (урожайность). При этом известны численные значения знаменателя (F) в формуле вычисления урожайности (У = ВС/F, где У - урожайность, ц/га, ВС - валовой сбор, ц, F - посевная площадь, га) и не известны значения числителя (ВС), которые могут быть найдены как произведение двух взаимосвязанных показателей (У и F)1. Откуда: ц/га . В качестве веса здесь выступает посевная площадь. Задача №85 Определите снижение себестоимости в 1988г. по сравнению с 1987г. по всем видам продукции и сумму экономии от снижения себестоимости. Таблица 8 Продукция Общие затраты на производство в 1988г., тыс. р. Изменение себестоимости 1ц в 1988г. по сравнению с 1987г., % Зерно 10,2 -2 Картофель 14,0 -4 Молоко 12,6 -3 Решение: Выясним смысл исходных данных и переведём процентные величины в индексную форму. Таблица 9 Продукция Общие затраты на производство в 1988г., тыс. р. Изменение себестоимости 1ц в 1988г. по сравнению с 1987г., % Изменение себестоимости 1ц в 1988г. по сравнению с 1987г., в долях Индивидуальный индекс себестоимости, iz = z1 / z0 Зерно 10,2 -2 - 0,02 0,98 Картофель 14,0 -4 - 0,04 0,96 Молоко 12,6 -3 - 0,03 0,97 q1z1 iz Для вычисления снижения себестоимости продукции используем средний гармонический себестоимости продукции. При этом q - количество выпускаемой продукции, z - затраты на единицу выпускаемой продукции. Следовательно снижение себестоимости составило 3,1%. Сумма экономии от снижения себестоимости составила: Задача №6 Сгруппируйте совхозы по урожайности озимой пшеницы. Выявите влияние этого фактора на себестоимость 1ц озимой пшеницы. Таблица 10 № п/п Посевная площадь, га Урожайность озимой пшеницы, ц/га Себестоимость 1ц, руб. 1 310 21 5,9 2 400 29 4,8 3 250 20 6,5 4 480 15 6,9 5 400 36 4,1 6 350 35 5,2 7 450 38 5,1 8 370 25 5,6 9 290 21 7,7 10 300 21 6,6 11 400 18 7,8 12 500 29 5,4 13 260 15 7,9 14 300 19 5,6 15 300 20 5,9 16 310 42 3,9 17 340 25 5,1 18 410 38 4,2 19 340 46 4,0 20 420 32 4,6 21 160 18 7,0 22 400 18 7,8 23 300 28 4,9 24 300 35 4,2 25 200 22 6,5 26 300 26 5,5 27 310 42 3,8 28 300 38 5,0 29 220 33 4,7 30 250 20 6,2 Решение: Установим на основе метода статистических группировок взаимосвязь между результативным (себестоимость 1ц озимой пшеницы) и факторным (урожайность озимой пшеницы) признаками. На основе таблицы исходных данных (таблица 10) разделяем совокупность совхозов на 4 группы, предварительно определив величину интервала по формуле: , где xmax - наибольшее значение оценки качества почв (x19=46); xmin - наименьшее значение (x4=15). Строим вспомогательную таблицу 11 и разносим по группам 30 заданных совхозов. Затем подсчитываем групповые и общие итоги. Таблица 11 Группировка совхозов района по качеству почв и исходные данные по группам Группы совхозов № совхоза Урожайность озимой пшеницы, ц/га Посевная площадь, га Валовой сбор, ц Себестоимость 1ц, руб. I 1 21 310 6510 5,9 3 20 250 5000 6,5 15 - 22,75 4 15 480 7200 6,9 9 21 290 6090 7,7 10 21 300 6300 6,6 11 18 400 7200 7,8 13 15 260 3900 7,9 14 19 300 5700 5,6 15 20 300 6000 5,9 21 18 160 2880 7 22 18 400 7200 7,8 25 22 200 4400 6,5 30 20 250 5000 6,2 Итого: 13 3900 73380 6,79 II 2 29 400 11600 4,8 8 25 370 9250 5,6 22,76 - 30,5 12 29 500 14500 5,4 17 25 340 8500 5,1 23 28 300 8400 4,9 26 26 300 7800 5,5 Итого: 6 2210 60050 5,21 III 5 36 400 14400 4,1 6 35 350 12250 5,2 30,51 - 38,25 7 38 450 17100 5,1 18 38 410 15580 4,2 20 32 420 13440 4,6 24 35 300 10500 4,2 28 38 300 11400 5 Итого: 7 2630 94670 4,62 IV 16 42 310 3,9 13020 19 46 340 4 15640 38,26 - 46 27 42 310 3,8 13020 29 33 220 4,7 7260 Итого: 4 1180 4,1 48940 Всего по совокупности 30 Строим итоговую таблицу, характеризующую взаимосвязь между себестоимостью озимой пшеницы и урожайностью. Для этого сумму валового сбора делим на сумму посевных площадей и находим среднюю урожайность по каждой группе. Таблица 12 Итоговая группировочная таблица, характеризующая взаимосвязь себестоимости озимой пшеницы с урожайностью Группы по качеству почв Кол-во совхозов в группе Средний уровень себестоимость, руб. урожайность озимой пшеницы, ц/га № п/п Интервал I 15 - 22,75 13 6,79 18,82 II 22,76 - 30,5 7 5,22 27,17 III 30,51 - 38,75 6 4,63 36,00 IV 38,26 - 46 4 4,10 41,47 Итого: 30 5,19 30,86 Анализируя итоговую таблицу можно отметить обратную зависимость себестоимости от урожайности, чем выше урожайность, тем ниже себестоимость. Задача №99 Зависимость между баллом почв и урожайностью картофеля. Таблица 13 № п/п Посевная площадь, га Урожайность картофеля, ц/га Качество почв, баллы 1 150 260 68 2 80 220 80 3 106 120 55 4 94 130 45 5 120 230 87 6 110 290 88 7 90 300 90 8 120 290 78 9 80 110 65 10 100 130 70 11 100 210 64 12 90 110 60 13 56 140 50 14 110 120 63 15 110 250 66 16 170 270 88 17 140 100 48 18 70 240 80 19 116 310 94 20 98 160 76 21 150 200 50 22 100 210 64 23 100 210 80 24 120 220 86 25 110 130 70 26 100 290 77 27 160 280 80 28 100 290 90 29 50 165 75 30 80 240 66 Решение: Предварительно для решения задачи строим график зависимости урожайности картофеля от качества почв. По графику делаем предположение о линейной связи урожайности и качества почв, имеющей вид y = a + bx. Составляем вспомогательную таблицу 14. Таблица 14 № п/п Результат Фактор Расчётные данные Урожай Качество почв y2 x2 xy 1 260 68 67600 4624 17680 2 220 80 48400 6400 17600 3 120 55 14400 3025 6600 4 130 45 16900 2025 5850 5 230 87 52900 7569 20010 6 290 88 84100 7744 25520 7 300 90 90000 8100 27000 8 290 78 84100 6084 22620 9 110 65 12100 4225 7150 10 130 70 16900 4900 9100 11 210 64 44100 4096 13440 12 110 60 12100 3600 6600 13 140 50 19600 2500 7000 14 120 63 14400 3969 7560 15 250 66 62500 4356 16500 16 270 88 72900 7744 23760 17 100 48 10000 2304 4800 18 240 80 57600 6400 19200 19 310 94 96100 8836 29140 20 160 76 25600 5776 12160 21 200 50 40000 2500 10000 22 210 64 44100 4096 13440 23 210 80 44100 6400 16800 24 220 86 48400 7396 18920 25 130 70 16900 4900 9100 26 290 77 84100 5929 22330 27 280 80 78400 6400 22400 28 290 90 84100 8100 26100 29 165 75 27225 5625 12375 30 240 66 57600 4356 15840 ?y= 6225 ?x= 2153 ? y2=1427225 ? x2=159979 ?yx= 466595 Для нахождения параметров уравнения взаимосвязи решаем систему уравнений: Подставляя данные из таблицы 14, получим: a = (6225-2153b) / 30 = 207,5 - 71,767b ; 2153(207,5 - 71,767b) + 159979b = 466595 ; 446747,5 - 154514,351b + 159979b = 466595 ; 5464,61b = 19847,5 ; b =3,632 ; a = 207,5 - 71,767 *3,632 = - 53,158 . Уравнение взаимосвязи имеет вид: y = 3,632x - 53,158 . При линейной связи тесноту определяем по формуле парного коэффициента регрессии: . Предварительно составляем таблицу . Таблица 15 № п/п y x yx y-y x-x (y-y)2 (x-x)2 1 260 68 17680 52,50 -3,77 2756,25 14,18778 2 220 80 17600 12,50 8,23 156,25 67,78778 3 120 55 6600 -87,50 -16,77 7656,25 281,1211 4 130 45 5850 -77,50 -26,77 6006,25 716,4544 5 230 87 20010 22,50 15,23 506,25 232,0544 6 290 88 25520 82,50 16,23 6806,25 263,5211 7 300 90 27000 92,50 18,23 8556,25 332,4544 8 290 78 22620 82,50 6,23 6806,25 38,85444 9 110 65 7150 -97,50 -6,77 9506,25 45,78778 10 130 70 9100 -77,50 -1,77 6006,25 3,121111 11 210 64 13440 2,50 -7,77 6,25 60,32111 12 110 60 6600 -97,50 -11,77 9506,25 138,4544 13 140 50 7000 -67,50 -21,77 4556,25 473,7878 14 120 63 7560 -87,50 -8,77 7656,25 76,85444 15 250 66 16500 42,50 -5,77 1806,25 33,25444 16 270 88 23760 62,50 16,23 3906,25 263,5211 17 100 48 4800 -107,50 -23,77 11556,25 564,8544 18 240 80 19200 32,50 8,23 1056,25 67,78778 19 310 94 29140 102,50 22,23 10506,25 494,3211 20 160 76 12160 -47,50 4,23 2256,25 17,92111 21 200 50 10000 -7,50 -21,77 56,25 473,7878 22 210 64 13440 2,50 -7,77 6,25 60,32111 23 210 80 16800 2,50 8,23 6,25 67,78778 24 220 86 18920 12,50 14,23 156,25 202,5878 25 130 70 9100 -77,50 -1,77 6006,25 3,121111 26 290 77 22330 82,50 5,23 6806,25 27,38778 27 280 80 22400 72,50 8,23 5256,25 67,78778 28 290 90 26100 82,50 18,23 6806,25 332,4544 29 165 75 12375 -42,50 3,23 1806,25 10,45444 30 240 66 15840 32,50 -5,77 1056,25 33,25444 ?6225 ?2153 ?135537,5 ?5465,367 Средние 207,50 71,77 15553,17 Средние квадратические отклонения: ; . Откуда коэффициет корреляции равен: . Коэффициент корелляции больше 0,7 , что свидетельствует о наличии взаимосвязи между факторным и результативным признаком. Задача №104 Зависимость между расходом кормов на одну корову и продуктивностью коров. Таблица 15 № п/п Поголовье коров, гол. Среднегодовой удой молока от одной коровы, ц Расход кормов ц к. ед. на одну корову 1 519 43,3 54,2 2 985 26,6 46,4 3 1000 34,8 53,9 4 800 26,1 40,2 5 1250 32,8 48,2 6 1400 32,3 53,4 7 1700 29,9 45,5 8 649 51,4 60,7 9 1600 31,0 47,8 10 207 46,3 60,1 11 283 29,6 47,1 12 600 29,6 41,4 13 1277 29,1 43,1 14 2000 23,7 39,4 15 1315 27,2 46,3 16 1337 49,5 59,4 17 607 41,6 53,2 18 720 34,8 49,4 19 414 50,0 52,5 20 840 42,3 52 21 1260 32,5 53 22 1934 27,9 44 23 1100 38,4 60,7 24 2616 32,3 46,1 25 970 48,4 55,7 26 1200 39,2 58 27 700 26,6 46,4 28 1200 34,8 53,9 29 650 29,9 45,5 30 1500 27,2 46,3 Решение: Предварительно для решения задачи строим график зависимости продуктивности коров от количества расходуемого на них корма. По графику делаем предположение о линейной связи урожайности и качества почв, имеющей вид y = a + bx. Составляем вспомогательную таблицу 16. Рис. 2. Зависимость между расходом кормов и продуктивностью коров. Таблица 16 № п/п Удой, y Расход кормов, x y2 x2 yx 1 43,30 54,20 1874,89 2937,64 2346,86 2 26,60 46,40 707,56 2152,96 1234,24 3 34,80 53,90 1211,04 2905,21 1875,72 4 26,10 40,20 681,21 1616,04 1049,22 5 32,80 48,20 1075,84 2323,24 1580,96 6 32,30 53,40 1043,29 2851,56 1724,82 7 29,90 45,50 894,01 2070,25 1360,45 8 51,40 60,70 2641,96 3684,49 3119,98 9 31,00 47,80 961,00 2284,84 1481,80 10 46,30 60,10 2143,69 3612,01 2782,63 11 29,60 47,10 876,16 2218,41 1394,16 12 29,60 41,40 876,16 1713,96 1225,44 13 29,10 43,10 846,81 1857,61 1254,21 14 23,70 39,40 561,69 1552,36 933,78 15 27,20 46,30 739,84 2143,69 1259,36 16 49,50 59,40 2450,25 3528,36 2940,30 17 41,60 53,20 1730,56 2830,24 2213,12 18 34,80 49,40 1211,04 2440,36 1719,12 19 50,00 52,50 2500,00 2756,25 2625,00 20 42,30 52,00 1789,29 2704,00 2199,60 21 32,50 53,00 1056,25 2809,00 1722,50 22 27,90 44,00 778,41 1936,00 1227,60 23 38,40 60,70 1474,56 3684,49 2330,88 24 32,30 46,10 1043,29 2125,21 1489,03 25 48,40 55,70 2342,56 3102,49 2695,88 26 39,20 58,00 1536,64 3364,00 2273,60 27 26,60 46,40 707,56 2152,96 1234,24 28 34,80 53,90 1211,04 2905,21 1875,72 29 29,90 45,50 894,01 2070,25 1360,45 30 27,20 46,30 739,84 2143,69 1259,36 Сумма 1049,10 1503,80 38600,45 76476,78 53790,03 Для нахождения параметров уравнения взаимосвязи решаем систему уравнений: Подставляя данные из таблицы 5, получим: a = (1049,1-1503,8b) / 30 = 34,97 - 50,1b ; 1503,8( 34,97- 50,1b) + 76476,78b = 53790,03 ; 52587,886 - 75340,38b + 76476,78b = 53790,03 ; 1136,4b = 1202,144 ; b =1,058 ; a = 34,97 - 50,1 * 1,058 = -18,036 . Уравнение взаимосвязи имеет вид: y = 1,058x - 18,036 . При линейной связи тесноту определяем по формуле парного коэффициента регрессии: . Предварительно составляем таблицу 17. Таблица 17 № п/п Удой Расход x-x y-y (x-x) (y-y) 1 43,30 54,20 8,33 4,07 69,3889 16,59204 2 26,60 46,40 -8,37 -3,73 70,0569 13,88804 3 34,80 53,90 -0,17 3,77 0,0289 14,23804 4 26,10 40,20 -8,87 -9,93 78,6769 98,53871 5 32,80 48,20 -2,17 -1,93 4,7089 3,712044 6 32,30 53,40 -2,67 3,27 7,1289 10,71471 7 29,90 45,50 -5,07 -4,63 25,7049 21,40604 8 51,40 60,70 16,43 10,57 269,9449 111,7954 9 31,00 47,80 -3,97 -2,33 15,7609 5,413378 10 46,30 60,10 11,33 9,97 128,3689 99,46738 11 29,60 47,10 -5,37 -3,03 28,8369 9,160711 12 29,60 41,40 -5,37 -8,73 28,8369 76,15471 13 29,10 43,10 -5,87 -7,03 34,4569 49,37404 14 23,70 39,40 -11,27 -10,73 127,0129 115,0614 15 27,20 46,30 -7,77 -3,83 60,3729 14,64338 16 49,50 59,40 14,53 9,27 211,1209 85,99471 17 41,60 53,20 6,63 3,07 43,9569 9,445378 18 34,80 49,40 -0,17 -0,73 0,0289 0,528044 19 50,00 52,50 15,03 2,37 225,9009 5,632711 20 42,30 52,00 7,33 1,87 53,7289 3,509378 21 32,50 53,00 -2,47 2,87 6,1009 8,256044 22 27,90 44,00 -7,07 -6,13 49,9849 37,53604 23 38,40 60,70 3,43 10,57 11,7649 111,7954 24 32,30 46,10 -2,67 -4,03 7,1289 16,21404 25 48,40 55,70 13,43 5,57 180,3649 31,06204 26 39,20 58,00 4,23 7,87 17,8929 61,98938 27 26,60 46,40 -8,37 -3,73 70,0569 13,88804 28 34,80 53,90 -0,17 3,77 0,0289 14,23804 29 29,90 45,50 -5,07 -4,63 25,7049 21,40604 30 27,20 46,30 -7,77 -3,83 60,3729 14,64338 ? 1049,10 1503,80 1913,42 1096,3 Среднее 34,97 50,13 63,78 36,54 1. Средние квадратические отклонения: ; . Откуда коэффициет корреляции равен: . Связь между данными отсутствует. ЛИТЕРАТУРА Статистика: Курс лекций / Харченко Л.П., Долженкова В.Г., Ионин В.Г. и др.; Под. ред. к.э.н. В.Г. Ионина. - Новосибирск: Изд-во НГАЭиУ, М.: ИНФРА-М, 1998. - 310с. Пискунов Н.С. Дифференциальное и интегральное исчисления для втузов, т.2: Учебное пособие для втузов. - 13-е изд., - М.: Наука, Главная редакция физико-математической литературы, 1985. - 560с. Математическая статистика: Учебник / Иванова В.М., Калинина В.Н., Нешумова Л.А. и др. - 2-е изд., перераб. и доп. - М.: Высш. школа, 1981. - 371с., ил. 1 См.: Овсиенко В. Выбор формы средней и о некоторых ошибках, допускаемых в этом вопросе // Вестник статистики. 1989. №2. Работа на этой странице представлена для Вашего ознакомления в текстовом (сокращенном) виде. Для того, чтобы получить полностью оформленную работу в формате Word, со всеми сносками, таблицами, рисунками, графиками, приложениями и т.д., достаточно просто её СКАЧАТЬ. |
|
Copyright © refbank.ru 2005-2024
Все права на представленные на сайте материалы принадлежат refbank.ru. Перепечатка, копирование материалов без разрешения администрации сайта запрещено. |
|