Положителна корелация срещу отрицателна корелация
Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна на една променлива въз основа на промяната на другата променлива. В статистиката корелацията е свързана с концепцията за зависимост, която е статистическата връзка между две променливи.
Коефициентът на корелация на Pearson или коефициентът на корелация на продукта-момент на Pearson или просто коефициентът на корелация се получава по следните формули.
За население:
За проба:
и следващият израз е еквивалентен на горния израз.
и
са стандартни оценки съответно на X и Y.
е средната стойност и s X и s Y са стандартните отклонения на X и Y.
Коефициентът на корелация на Пиърсън (или просто коефициентът на корелация) е най-често използваният коефициент на корелация и валиден само за линейна връзка между променливите. r е стойност между -1 и 1 (-1 ≤ r ≤ +1). Ако r = 0, не съществува връзка и ако r ≥ 0, връзката е право пропорционална и стойността на една променлива се увеличава с другата. Ако r ≤ 0, една променлива намалява с увеличаване на другата и обратно.
Поради условието на линейност, коефициентът на корелация r също може да се използва за установяване наличието на линейна връзка между променливите.
Каква е разликата между положителната и отрицателната корелация?
• Когато има положителна корелация (r> 0) между две случайни променливи, една променлива се движи пропорционално на другата променлива. Ако една променлива се увеличава, другата се увеличава. Ако една променлива намалява, намалява и другата.
• Когато има отрицателна корелация (r <0) между двете случайни променливи, променливите се движат, противопоставящи се една на друга. Ако една променлива се увеличава, другата намалява и обратно.
• Линия, приближаваща положителна корелация, има положителен градиент, а линия, приближаваща отрицателна корелация, има отрицателен градиент.