logo
УЧЕБНИК-Шеремет

11.5. Корреляционно-регрессионный анализ

Корреляционно-регрессионный анализ классический метод стохастического моделирования хозяйственной деятельности. Он изуча­ет взаимосвязи показателей хозяйственной деятельности, когда зависи­мость между ними не является строго функциональной и искажена влия­нием посторонних, случайных факторов. При проведении корреляцион­но-регрессионного анализа строят различные корреляционные и регрес­сионные модели хозяйственной деятельности. В этих моделях выделяют факторные и результативные показатели (признаки). В зависимости от количества исследуемых показателей различают парные и многофак­торные модели корреляционно-регрессионного анализа.

Основной задачей корреляционно-регрессионного анализа явля­ется выяснение формы и тесноты связи между результативным и фак­торным показателями. Под формой связи понимают тип аналитической формулы, выражающей зависимость результативного показателя от из­менений факторного. Различают связь прямую, когда с ростом (сниже­нием) значений факторного показателя наблюдается тенденция к росту (снижению) значений результативного показателя. В противном случав между показателями существует обратная связь. Форма связи может быть прямолинейной (ей соответствует уравнение прямой линии), когда наблюдается тенденция равномерного возрастания или убывания резуль­тативного показателя, в противном случае форма связи называется кри­волинейной (ей соответствует уравнение параболы, гиперболы и др.).

ОСНОВНЫЕ МОДЕЛИ КОРРЕЛЯЦИОННОГО АНАЛИЗА. Такими моделями являются: коэффициент парной корреляции, коэффициент част­ной корреляции, коэффициент множественной корреляции, коэффици­ент детерминации.

Линейный коэффициент парной корреляции (р) определяется по формуле:

где х, у значения факторного и результативного показателей соответственно;

х, у — средние значения соответствующих показателей;

σX, σY - средние квадратические отклонения (стандартные отклонения показателей х и у);

n — количество наблюдений в совокупности.

Значение коэффициента парной корреляции изменяется в пре­делах от -1 до +1. Знак «+» означает наличие прямой связи между пока­зателями. Знак «-» — наличие обратной связи. Значение коэффициента от 0 до 1 характеризует степень приближения корреляционной зависи­мости между показателями и к функциональной. При р = 1 между пока­зателями существует функциональная связь. При р = 0 линейная связь отсутствует. В целях упрощения расчетов на практике применяются и другие формулы коэффициента парной корреляции, представляющие собой некоторые преобразования исходной формулы.

Часто в анализе хозяйственной деятельности при изучении связи между показателями х и у требуется исключить воздействие третьего показателя z, выступающего как общий фактор изменения анализируе­мых показателей. Для этого используется коэффициент частной кор­реляции (rx,y,z), свойства которого совпадают со свойствами коэффици­ента парной корреляции:

где rxy, rxz, ryz коэффициенты парной корреляции между соответствующими по­казателями.

Коэффициент множественной корреляции (R) характеризует тесноту связи между результативным показателем и набором фактор­ных показателей:

где σ2 общая дисперсия эмпирического ряда, характеризующая общую вариацию результативного показателя (у) за счет факторов;

σост2 — остаточная дисперсия в ряду у, отражающая влияния всех факто­ров, кроме х;

у — среднее значение результативного показателя, вычисленное по ис­ходным наблюдениям;

s — среднее значение результативного показателя, вычисленное по уравнению регрессии.

Коэффициент множественной корреляции принимает только поло­жительные значения в пределах от 0 до 1. Чем ближе значение коэффи­циента к 1, тем больше теснота связи. И, наоборот, чем ближе к 0, тем за­висимость меньше. При значении R < 0,3 говорят о малой зависимости между величинами. При значении 0,3 < R < 0,6 говорят о средней тесноте связи. При R > 0,6 говорят о наличии существенной связи.

Квадрат коэффициента множественной корреляции называется коэффициентом детерминации (D): D = R2. Коэффициент детермина­ции показывает, какая доля вариации результативного показателя свя­зана с вариацией факторных показателей. В основе расчета коэффици­ента детерминации и коэффициента множественной корреляции лежит правило сложения дисперсий, согласно которому общая дисперсия (σ2) равна сумме межгрупповой дисперсии (δ2) и средней из групповых дис­персий σi2):

σ2 = δ2 + σi2.

Межгрупповая дисперсия характеризует колеблемость результа­тивного показателя за счет изучаемого фактора, а средняя из групповых дисперсий отражает колеблемость результативного показателя за счет всех прочих факторов, кроме изучаемого.

Математические модели корреляционного анализа в форме коэф­фициентов имеют ограниченные аналитические возможности. Зная лишь направление ковариации показателей и тесноту связи, невозмож­но определить закономерности формирования уровня результативного показателя под влиянием исследуемых факторов, оценить интенсив­ность их влияния, классифицировать факторы на основные и второсте­пенные. Для этих целей используются модели регрессионного анализа. Линейная модель (уравнение) регрессионного анализа может быть пред­ставлена в виде

у = bo + b1x1 + b2x2 +... + bnxn,

где у — результативный показатель;

x1, x2, ..., xn — факторные модели;

b0, b1, b2, ..., bn — коэффициенты регрессии.

Коэффициенты регрессии показывают интенсивность влияния факторов на результативный показатель. Если проведена предвари­тельная стандартизация факторных показателей, то b0 равняется сред­нему значению результативного показателя в совокупности. Коэффици­енты b1, b2, ..., bn показывают, на сколько единиц уровень результативно­го показателя отклоняется от своего среднего значения, если значения факторного показателя отклоняются от среднего, равного нулю, на одно стандартное отклонение. Таким образом, коэффициенты регрессии ха­рактеризуют степень значимости отдельных факторов для повышения уровня результативного показателя. Конкретные значения коэффициен­тов регрессии определяют по эмпирическим данным согласно методу наименьших квадратов (в результате решения систем нормальных урав­нений).

Аналитические достоинства регрессионных моделей заключаются в том, что, во-первых, точно определяется фактор, по которому выявля­ются резервы повышения результативности хозяйственной деятельно­сти; во-вторых, выявляются объекты с более высоким уровнем эффек­тивности; в-третьих, возникает возможность количественно измерить экономический эффект от внедрения передового опыта, проведения организационно-технических мероприятий.

Рассмотрим теперь задачу 1 из заданий по анализу регрессии, приведенную на с. 300—301. Построим линейную регрессионную модель по методу наименьших квадратов. Обозначим через ti, год выпуска авто­мобилей, а через Ni — объем выпуска в этом году. Данные, представлен­ные в таблице, изобразим на графике, представленном ниже.

В качестве функции линейной регрессии возьмем

Ni = а + bti, i = 1,2,...,32.

Критерий метода наименьших квадратов в этом случае имеет вид

Выпуск автомобилей по годам (N — тыс. шт.)

Один из математических результатов теории линейной регрессии говорит, что оценка N, является несмещенной оценкой с минимальной дисперсией в классе всех линейных несмещенных оценок.

Остаточная дисперсия вычисляется по формуле

Современный факторный анализ направление многомерного статистического анализа, которое позволяет выявить внутренние, не­посредственно неизмеримые переменные (факторы) между коррелиру­ющими показателями хозяйственной деятельности. Различают два ос­новных метода современного факторного анализа: метод главных компонент и классический факторный анализ.

Модель метода главных компонент выглядит так:

zj = aj1F1 + aj2F2 +...+ ajnFn,

где zj исходные показатели;

F1, F2, ..., Fn — компоненты (факторы);

ajn — факторные нагрузки на j-ю переменную.

Модель классического факторного анализа выглядит несколько иначе:

zj = aj1F1 + aj2F2 +...+ ajmFm + ajFj + uj,

где исходная переменная zj линейно зависит от m общих факторов F1, F2, ..., Fm (обычно m намного меньше n) и характерного фактора иj. Общие факторы описывают корреляции между параметрами, характерный фактор учитывает оставшуюся дисперсию исходных показателей.

Основные этапы современного факторного анализа:

• качественный предварительный анализ экономических явлений и постановка задачи факторного анализа;

• составление массивов исходной информации;

• вычисление и анализ начальной корреляционной матрицы;

• нахождение прямого факторного решения;

• нахождение интерпретируемого факторного решения:

• вычисление факторных коэффициентов;

• содержательная интерпретация факторов;

• анализ и использование полученных результатов. (При помощи такого анализа выявляют и измеряют независимые скрытые факторы для построения аналитической модели.);

• выявление наиболее информативных показателей деятельности;

• соединение информации о независимых аспектах явления в один обобщающий показатель;

• классификация и ранжирование объектов по обобщающим фак­торам;

• комплексная оценка хозяйственной деятельности.