На каждый день | Теория вероятности

ОСНОВЫ ТЕОРИИ КОРРЕЛЯЦИИ

Нередко наблюдаются случайные величины, между которыми имеется некоторая зависимость. Например, прочность бетона как-то зависит от количества воды, вводимой в бетонную смесь; однако прочность зависит также от соотношения между количествами цемента и заполнителей, так что при данном количестве воды возможны различные прочности. Зависимость такого рода не функциональная, поскольку каждому значению аргумента соответствует некоторое распределение другой переменной; эта зависимость статистическая.

Допустим, что в табл. 1 приведены численные результаты наблюдений над двумя переменными: в ней даны значения обеих переменных и числа появлений соответствующих пар значений.

Таблица 1
Y N

 

 

По такой таблице могут быть вычислены различные числовые характеристики, используемые в формулах и уравнениях теории корреляции. Например, полные средние значения обеих переменных х0, у0 отыскиваются по формулам

Непосредственное изучение статистической таблицы может дать лишь поверхностное представление о зависимости между обеими переменными (даже в пределах наблюденной выборки). Лучшее представление может дать сопоставление средних значений одной величины со всеми значениями другой. Такая зависимость называется корреляционной. О структуре этой зависимости первоначально судят по отображению статистической таблицы на чертеже.

Нередко оказывается, что построенные точки группируются вдоль некоторой прямой, так что искомую связь предполагают линейной. Тогда ищут функцию в форме у=ах+b и подбирают коэффициенты по способу наименьших квадратов, причем оказывается, что искомая прямая проходит через точку (х0, y0). Линейное уравнение приводят к виду у-y0yx(x-х0), называемому уравнением регрессии у на x:; здесь и вычисляется по статистической таблице.

Полезно (даже, если по физическому смыслу переменные неравноправны) составить также уравнение регрессии х на у: взаимное расположение обеих прямых дает довольно ясное представление о тесноте линейной зависимости. Для уточнения тесноты образуют выражение, симметричное относительно обеих переменных и называемое коэффициентом корреляции,

При r=0 линейной корреляции нет (прямые параллельны координатным осям); при ?r?=1 имеется функциональная зависимость (прямые совпадают); при 0<?r?<1 есть линейная корреляционная зависимость; с возрастанием ?r? теснота связи возрастает.

При ?r?=0,4 считают линейную связь слабой и ищут другую связь, о структуре которой заключают по расположению точек, отображающих статистическую таблицу. И в этом случае подбирают коэффициенты намеченной связи по способу наименьших квадратов и проверяют тесноту связи по корреляционному отношению, получаемому из той же статистической таблицы.

Поделитесь ссылкой в социальных сетях