Асоциация срещу корелация
Асоциацията и корелацията са два метода за обяснение на връзката между две статистически променливи. Асоциацията се отнася до по-обобщен термин и корелацията може да се разглежда като специален случай на асоциация, когато връзката между променливите е линейна по своя характер.
Какво е асоциация?
Статистическият термин асоциация се определя като връзка между две случайни променливи, което ги прави статистически зависими. Той се отнася по-скоро до обща връзка, без да се споменава спецификата на връзката, и не е необходимо да бъде причинно-следствена връзка.
Използват се много статистически методи за установяване на връзката между две променливи. Коефициентът на корелация на Пиърсън, съотношението на шансовете, корелацията на разстоянието, Ламбда на Гудман и Крускал и rho (ρ) са само няколко примера.
Какво е корелация?
Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна на една променлива въз основа на промяната на другата променлива. В статистиката корелацията е свързана с концепцията за зависимост, която е статистическата връзка между две променливи
Коефициентът на корелация на Пиърсън или просто коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤ + 1). Това е най-често използваният коефициент на корелация и валиден само за линейна връзка между променливите. Ако r = 0, не съществува връзка и ако r≥0, връзката е право пропорционална; стойността на една променлива се увеличава с нарастването на другата. Ако r≤0, връзката е обратно пропорционална; едната променлива намалява с увеличаването на другата.
Поради условието на линейност, коефициентът на корелация r също може да се използва за установяване наличието на линейна връзка между променливите.
Коефициентът на корелация на ранга на Spearman и коефициентът на корелация на ранга на Kendrall измерват силата на връзката, с изключение на линейния фактор. Те вземат предвид степента, в която една променлива се увеличава или намалява с другата. Ако и двете променливи се увеличават заедно, коефициентът ще бъде положителен и ако една променлива се увеличава, докато другата намалява, стойността на коефициента ще бъде отрицателна.
Коефициентите на корелация на ранга се използват само за установяване на типа на връзката, но не и за подробно изследване като коефициента на корелация на Пиърсън. Те се използват и за намаляване на изчисленията и за по-независими резултати от ненормалността на разглежданите разпределения.
Каква е разликата между асоцииране и корелация?
• Асоциацията се отнася до общата връзка между две случайни променливи, докато корелацията се отнася до повече или по-малко линейна връзка между случайните променливи.
• Асоциацията е концепция, но корелацията е мярка за асоцииране и се предоставят математически инструменти за измерване на величината на корелацията.
• Коефициентът на корелация на продуктовия момент на Пиърсън установява наличието на линейна връзка и определя естеството на връзката (независимо дали са пропорционални или обратно пропорционални).
• Коефициентите на корелация на ранга се използват, за да се определи само естеството на връзката, с изключение на линейността на връзката (тя може или не може да бъде линейна, но ще покаже дали променливите се увеличават заедно, намаляват заедно или едната се увеличава, докато другата намалява или обратно).