Регресия срещу корелация
В статистиката е важно определянето на връзката между две случайни величини. Дава възможност да се правят прогнози за една променлива спрямо други. Регресионният анализ и корелация се прилагат в прогнозите за времето, поведението на финансовия пазар, установяването на физически взаимоотношения чрез експерименти и в много по-реални сценарии.
Какво е регресия?
Регресията е статистически метод, използван за изчертаване на връзката между две променливи. Често, когато се събират данни, може да има променливи, които зависят от другите. Точната връзка между тези променливи може да бъде установена само чрез методите на регресия. Определянето на тази връзка помага да се разбере и предскаже поведението на една променлива спрямо другата.
Най-честото приложение на регресионния анализ е да се оцени стойността на зависимата променлива за дадена стойност или диапазон от стойности на независимите променливи. Например, използвайки регресия, можем да установим връзката между цената на стоката и потреблението въз основа на данните, събрани от произволна извадка. Регресионният анализ произвежда регресионната функция на набор от данни, която е математически модел, който най-добре отговаря на наличните данни. Това може лесно да бъде представено чрез разпръснат сюжет. Графично регресията е еквивалентна на намирането на най-подходящата крива за дадения набор от данни. Функцията на кривата е функцията на регресия. Използвайки математическия модел, търсенето на стока може да бъде прогнозирано за дадена цена.
Следователно, регресионният анализ се използва широко при прогнозиране и прогнозиране. Също така се използва за установяване на връзки в експериментални данни, в областите на физиката, химията и много природни науки и инженерни дисциплини. Ако връзката или функцията за регресия е линейна функция, тогава процесът е известен като линейна регресия. В разпръснатия график той може да бъде представен като права линия. Ако функцията не е линейна комбинация от параметри, тогава регресията е нелинейна.
Какво е корелация?
Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация определя количествено степента на промяна в една променлива въз основа на промяната в другата променлива. В статистиката корелацията е свързана с концепцията за зависимост, която е статистическата връзка между две променливи.
Коефициентът на корелация на Pearsons или просто коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤ + 1). Това е най-често използваният коефициент на корелация и валиден само за линейна връзка между променливите. Ако r = 0, не съществува връзка и ако r≥0, връзката е право пропорционална; т.е. стойността на една променлива се увеличава с нарастването на другата. Ако r≤0, връзката е обратно пропорционална; т.е. една променлива намалява с увеличаването на другата.
Поради условието на линейност, коефициентът на корелация r също може да се използва за установяване наличието на линейна връзка между променливите.
Каква е разликата между регресия и корелация?
Регресията дава формата на връзката между две случайни величини, а корелацията дава степента на сила на връзката.
Регресионният анализ създава регресионна функция, която помага за екстраполиране и прогнозиране на резултатите, докато корелацията може да предостави информация само в каква посока може да се промени.
По-точните модели на линейна регресия се дават от анализа, ако коефициентът на корелация е по-висок. (| r | ≥0,8)