Эмпирическое корреляционное отношение равное 1.2 свидетельствует. Количественная оценка тесноты связи по эмпирическим данным: эмпирический коэффициент детерминации, эмпирическое корреляционное отношение

💖 Нравится? Поделись с друзьями ссылкой

Для измерения тесноты связи применяется несколько показателœей. При парной связи теснота связи определяется, прежде всœего, корреляционным отношением, ĸᴏᴛᴏᴩᴏᴇ обозначается η. Квадрат корреляционного отношения - ϶ᴛᴏ отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всœех причин и условий. Квадрат корреляционного отношения принято называть коэффициентом детерминации.

ыми явлениями и их признаками: ­­­­­­­­­­­­­________________ или жестко детермини

где k- число групп

N – число наблюдений

y i – исходные значения результативного признака

y j – средние значения результативного признака для данной группы

y – среднее значение признака

f j – численность группы

Указанная выше формула применяется при расчете показателя тесноты связи по аналитической группировке. При вычислении корреляционного отношения по уровню связи применяется формула:

Сумма квадратов в числителœе ­- ϶ᴛᴏ объясненная связью с фактором х (факторами) дисперсия результативного признака у. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на базе уравнения регрессии.

В случае если уравнение выбрано неверно или сделана ошибка при расчете его параметров, то сумма квадратов в числителœе может оказаться больше чем в знаменателœе, и отношение утратит тот смысл, который должно иметь. Чтобы избежать ошибочного результата͵ лучше вычислять корреляционное отношение по следующей формуле:

В корне указанной формулы лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:

D общ = D межгр +D внутригр

Согласно этому правилу можно вместо межгрупповой (факторной) дисперсии использовать разность:

D общ –D внутригр

что дает:

При расчете η не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу. В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как

D общ = D кор +D ост

Важнейшее положение, ĸᴏᴛᴏᴩᴏᴇ следует теперь усвоить любому, желающему правильно применять метод корреляционно-регрессионого анализа, состоит в интерпретации формул (1.2) и (1.3). Это положение гласит:

Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака (признаков). Меры тесноты связи измеряют долю вариации результативного признака, которая связанна с вариацией факторного признака (признаков).

Эмпирическое корреляционное отношение - понятие и виды. Классификация и особенности категории "Эмпирическое корреляционное отношение" 2017, 2018.

Эмпирическое корреляционное отношение

Теснота или сила связи между двумя признаками может быть измерена показателем, называемым эмпирическим корреляционным отношением. Этот показатель назван эмпирическим, поскольку он может быть рассчитан на основе обычной группировки по факторному и результативному признаку, то есть на основе корреляционной таблицы. Эмпирическое корреляционное отношение получается из правила сложения дисперсий, согласно которому , где
- общая дисперсия;
- межгрупповая дисперсия;
- внутригрупповая (средняя из частных) дисперсия. Межгрупповая дисперсия является мерой колеблемости, обусловленной факторным признаком. Средняя из частных дисперсий является мерой колеблемости, обусловленной всеми остальными(кроме факторного) признаками. Тогда отношение
выражает долю колеблемости, возникающей за счет факторного признака, в общей колеблемости. Квадратный корень из этого отношения и называется эмпирическим корреляционным отношением:
.

Отсюда следует правило, что чем больше межгрупповая дисперсия, тем сильнее факторный признак влияет на вариации результативного признака. Составляющие отношения дисперсий вычисляются по данным корреляционной таблицы по следующим формулам:

;
,

где - частные средние; - общая средняя; - итоги по признаку ; - итоги по признаку ;
- число наблюдений. То же соотношение сохраняется и для условных значений , полученных числовым преобразованием .

Само отношение дисперсий (подкоренное выражение) называется коэффициентом детерминации (оно равно также квадрату эмпирического корреляционного отношения). Эмпирическое корреляционное отношение изменяется в широких пределах (от 0 до 1). Если оно равно нулю, значит факторный признак на корреляционный не влияет. Если =1, значит, результативный признак полностью зависит от факторного. Если же эмпирическое корреляционное отношение представляет дробь, близкую единице, то говорят о тесной связи между факторным и результативным признаками. Если эта дробь мала (близка нулю), то говорят о слабой связи между ними.

Коэффициент линейной корреляции и индекс корреляции

Мерой тесноты связи между двумя статистически связанными признаками служит коэффициент линейной корреляции или просто коэффициент корреляции. Он имеет тот же смысл, что и эмпирическое корреляционное отношение, но может принимать как положительное, так и отрицательное значение. Коэффициент корреляции имеет строгое математическое выражение для линейной связи. Положительное значение будет указывать на прямую связь между признаками, отрицательное – на обратную.

Парный коэффициент корреляции в случае линейной формы связи вычисляют по формуле

а его выборочное значение – по формуле

При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять по следующей формуле:

Величина коэффициента корреляции изменяется в интервале
.

При
между двумя переменными существует функциональная связь, при
- прямая функциональная связь. Если
, то значение Х и У в выборке некоррелированы; в случае, если система случайных величин
имеет двумерное нормальное распределение, то величины Х и У будут и независимыми.

Если коэффициент корреляции находится в интервале
, то между величинами Х и У существует обратная корреляционная связь. Это находит подтверждение и при визуальном анализе исходной информации. В этом случае отклонение величины У от среднего значения взяты с обратным знаком.

Если каждая пара значений величин Х и У чаще всего одновременно оказывается выше (ниже) соответствующих средних значений, то между величинами существует прямая корреляционная связь и коэффициент корреляции находится в интервале
.

Если же отклонение величины Х от среднего значения одинаково часто вызывают отклонения величины У вниз от среднего значения и при этом отклонения оказываются все время различными, то можно предполагать, что значение коэффициента корреляции стремится к нулю.

Следует отметить, что значение коэффициента корреляции не зависит от единиц измерения и выбора начала отсчета. Это означает, что если переменные Х и У уменьшить (увеличить) в К раз либо на одно и то же число С, то коэффициент корреляции не изменится.

Для упрощения расчетов меры тесноты корреляционной связи часто применяется индекс корреляционной связи, который определяется по следующим формулам:

,
,

где
- остаточная дисперсия, характеризующая вариацию результативного признака под влиянием прочих неучтенных факторов.

Множественная корреляция

Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование. Показатель тесноты связи между результативным и двумя или более факторными признаками называется множественным или совокупным коэффициентом корреляции и обозначается R. Совокупный коэффициент предполагает наличие линейной связи между каждой парой признаков, которая может быть выражена при помощи парных коэффициентов корреляции. Если находится совокупная мера тесноты связи между результативным признаком () и двумя факторными признаками( и ), то расчет совокупного коэффициента корреляции ведется по формуле:

,

Где подстрочные знаки обозначают, между какими признаками изучается парная связь.

В формулах расчетов парных коэффициентов корреляции изменяются лишь символы, обозначающие тот или иной фактор. Так, если коэффициент корреляции между и вычисляется по формуле , то коэффициент корреляции между и вычисляется: ; между и - так:

Расчетная часть

Задание 31

    Имеются следующие данные по десяти предприятиям за отчетный период:

Таблица 2

Предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

Для изучения связи между размером среднегодовой стоимости основных производственных фондов и выпуском продукции вычислите линейное уравнение связи.

2. По приведенным данным: а) вычислите: линейный коэффициент корреляции; б) проверьте правильность выбора формы связи, исчислив индекс корреляции.

    С помощью табличного процессора Microsoft Excel построим рабочую таблицу:

Таблица 3

Расчет сумм для вычисления параметров уравнения прямой

239,74 *1236 = 539,1 распределения вероятностей... экономического анализа , решаемые на основе регрессионных экономических моделей. Рассмотрим у – результативный признак, а х – факторные признаки. Методы корреляционно -регрессионного анализа ...

  • Программа дисциплины «Компьютерные методы анализа социологических данных» (Введение в математическую статистику и анализ данных) Для направления 040200. 68 "Социология"

    Программа дисциплины

    Применения. 11 3 2 6 Дисперсионный анализ 9 2 2 5 Парный и множественный регрессионный анализ 9 2 2 5 Свойства коэффициентов... пользователя SPSS 11.0 Сиськов В.И. Корреляционный анализ в экономических исследованиях . М. 1975. Эддоус М., Стэнсфилд...

  • Г. Л. Савицкая анализ хозяйственной деятельности предприятия

    Документ

    Передового опыта, новейшие методы экономических исследований . Анализ должен быть комплексным. Комплексность исследо... на уровень среднечасовой выработки корреляционно -регрессионный анализ . В многофакторную корреляционную модель среднечасовой выра­ботки...

  • Эмпирическое корреляционное отношение

    Теснота или сила связи между двумя признаками может быть измерена показателем, называемым эмпирическим корреляционным отношением. Этот показатель назван эмпирическим, поскольку он может быть рассчитан на основе обычной группировки по факторному и результативному признаку, то есть на основе корреляционной таблицы. Эмпирическое корреляционное отношение получается из правила сложения дисперсий, согласно которому , где - общая дисперсия; - межгрупповая дисперсия; - внутригрупповая (средняя из частных) дисперсия. Межгрупповая дисперсия является мерой колеблемости, обусловленной факторным признаком. Средняя из частных дисперсий является мерой колеблемости, обусловленной всеми остальными(кроме факторного) признаками. Тогда отношение выражает долю колеблемости, возникающей за счет факторного признака, в общей колеблемости. Квадратный корень из этого отношения и называется эмпирическим корреляционным отношением: .

    Отсюда следует правило, что чем больше межгрупповая дисперсия, тем сильнее факторный признак влияет на вариации результативного признака. Составляющие отношения дисперсий вычисляются по данным корреляционной таблицы по следующим формулам:

    ; ,

    где - частные средние; - общая средняя; - итоги по признаку ; - итоги по признаку ; - число наблюдений. То же соотношение сохраняется и для условных значений , полученных числовым преобразованием .

    Само отношение дисперсий (подкоренное выражение) называется коэффициентом детерминации (оно равно также квадрату эмпирического корреляционного отношения). Эмпирическое корреляционное отношение изменяется в широких пределах (от 0 до 1). Если оно равно нулю, значит факторный признак на корреляционный не влияет. Если =1, значит, результативный признак полностью зависит от факторного. Если же эмпирическое корреляционное отношение представляет дробь, близкую единице, то говорят о тесной связи между факторным и результативным признаками. Если эта дробь мала (близка нулю), то говорят о слабой связи между ними.

    Суть состоит в следующем: этот показатель измеряет меру зависимости вариации одной величины от многих других. Он применяется для оценки качества линейной регрессии.

    Формула расчета:

    R^2 \equiv 1-{\sum_i (y_i — f_i)^2 \over \sum_i (y_i-\bar{y})^2},

    • \bar{y} – ср. арифметическое зависимой переменной;
    • fi – знач. зависимой переменной, предполагаемое по уравнению регрессии;
    • yi – значение исследуемой зависимой переменной.

    Детерминация, что это такое — определение

    Коэффициент детерминации – часть дисперсии переменной (зависимой), которая обуславливается конкретной моделью зависимости. Так эта единица поможет вычесть долю необъясненной дисперсии в дисперсии зависимой переменной.

    Данный показатель может принимать значения в пределах от 0 до 1. Чем его значение ближе к 1, тем связаннее результативный признак с исследуемыми факторами.

    Т.к. преступление является результатом связи поведения и личностных качеств, этот показатель в деятельности заинтересованных органов рассчитывается для оценки качества преступного поведения, дает представление, что послужило вероятностной причиной преступления, что является мотивацией, какие этому были причины и условия.

    Коэффициент детерминации, что показывает?

    Этот коэффициент показывает варианты результативного признака от влияния факторного признака, он тесно связан с числом корреляции. Если связь отсутствует, то показатель равняется нулю, при ее наличии – единице.
    Есть определение детерминизма как принципа устройства мира. Основой этого представления является взаимосвязанность всех явления. Это учение отрицает существование вещей вне взаимосвязи с миром.

    Противоположностью является индетерминизм, он связан с отрицанием объективных отношений детерминации, или отрицанием причинности.

    Генетический детерминизм – вера в то, что любой организм развивается под генетическим контролем.

    Под детерминантами преступности в криминологии понимают социальные явления, действия которых могут вызвать преступность.

    С помощью расчетов такого рода можно оценить вероятностное социокультурное влияние различных факторов на развитие личности и предположить, как себя будет вести человек, например, в деловом общении, объективно оценить, подходит ли он для государственного управления, или воинской службы.

    Так же коэффициент определяет, правильно ли выбран индекс для подсчета коэффициентов бета и альфа. Если в % цифра ниже 75 к определенному индексу, значения бета и альфа к нему будут некорректны.

    Индекс детерминации

    Индекс детерминации – это квадрат инд. корреляции нелинейных связей. Этим значением характеризуют, на какое количество процентов моделью регрессии объясняются варианты показателей результативной переменной по отношению к своему среднему уровню.

    Формула



    Коэффициент детерминации скорректированный

    Суть данного понятия состоит в следующем: этот индекс показывает долю дисперсии (общей) результативной переменной, объясняющей вариантами факторных переменных, включаемых в модель регрессии: (с увеличением, уменьшением).

    Величина 0,86 характеризует существенную связь между группировочным и результативным признаками.

    Величина называется коэффициентом детерминации и показывает долю межгрупповой дисперсии в общей дисперсии.

    Наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков. Такое изучение вариации достигается, как и для долей количественных признаков, посредством вычисления и анализа следующих видов дисперсий.

    Внутригрупповая дисперсия доли определяется по формуле

    . (3.17)

    Средняя из внутригрупповых дисперсий рассчитывается как

    . (3.18)

    Формула межгрупповой дисперсии имеет следующий вид:

    , (3.19)

    где n i – численность единиц в отдельных группах;

    –доля изучаемого признака во всей совокупности, которая определяется по формуле

    . (3.20)

    Общая дисперсия имеет вид

    . (3.21)

    Три вида дисперсии связаны между собой следующим образом:

    . (3.22)

    Пример 3.4

    Определим групповые дисперсии, среднюю из групповых, межгрупповую и общую дисперсии по данным табл. 3.3.

    Таблица 3.3

    Численность и удельный вес одной из категорий крупного рогатого скота фермерских хозяйств района

    Решение

    Определим долю дойных коров в целом по трем хозяйствам:

    ;

    Общая дисперсия доли дойных коров:

    Внутригрупповые дисперсии:

    ; ;
    .

    Средняя из внутригрупповых дисперсий:

    Межгрупповая дисперсия:

    Используя правило сложения дисперсий, получаем: 0,1025+0,0031=0,1056. Пример решен правильно.

    Пример 3.5

    По данным выборочного обследования заработной платы работников бюджетной сферы получены следующие показатели (табл. 3.4).

    Таблица 3.4

    Определите:

      среднюю заработную плату по двум отраслям;

      дисперсии заработной платы:

    а) среднюю из групповых дисперсий (отраслевых),

    б) межгрупповую (межотраслевую),

      коэффициент детерминации;

      эмпирическое корреляционное отношение.

    Решение

      Средняя заработная плата работников по двум отраслям рассчитывается по формуле (2.10):

    руб.

      Дисперсии заработной платы:

    а) средняя из групповых дисперсий по (3.14)

    б) межгрупповая дисперсия согласно (3.12)

    .

    в) общая дисперсия, полученная на основании правила сложения дисперсий (3.15):

      Коэффициент детерминации равен величине

    ; (3.23)

    т.е.
    , или 44,24%.

    Он показывает, что оплата труда на 44,24% зависит от отраслевой принадлежности работников и на 55,76% – от внутриотраслевых причин.

    По формуле (3.16) эмпирическое корреляционное отношение
    ,

    что свидетельствует о существенном влиянии на дифференциацию заработной платы отраслевых особенностей.

    Рассказать друзьям