Проба срещу население
Население и извадка са два важни термина в предмета „Статистика“. С прости думи, популацията е най-голямата колекция от предмети, които ни интересува да проучим, а извадката е подмножество от популация. С други думи, извадката трябва да представлява популацията с по-малко, но достатъчен брой елементи. Една популация може да има няколко проби с различни размери.
Проба
Пробата може да се състои от два или повече елемента, които са избрани от популацията. Най-ниският възможен размер за извадка е два, а най-високият ще бъде равен на размера на популацията. Има няколко начина за избор на извадка от популация. Теоретично изборът на „произволна извадка“е най-добрият начин за постигане на точни изводи за популацията. Този тип извадки се наричат още вероятностни, тъй като всеки елемент от популацията има еднаква възможност да бъде включен в извадка.
Техниката "Обикновено произволно вземане на проби" е най-известната техника на произволно вземане на проби. В този случай елементите, които ще бъдат избрани за извадката, се избират произволно от популацията. Такава извадка се нарича „Обикновена случайна извадка“или SRS. Друга популярна техника е „систематично вземане на проби“. В този случай елементите за извадка се избират въз основа на определен систематичен ред.
Пример: Всеки 10-ти човек от опашката е избран за проба.
В този случай систематичният ред е на всеки 10-ти човек. Статистикът е свободен да дефинира този ред по смислен начин. Съществуват и други техники за произволно вземане на проби като клъстерни проби или стратифицирани извадки и методът на подбор е малко по-различен от горните два.
За практически цели могат да се използват неслучайни проби като проби за удобство, проби за преценка, проби от снежни топки и целенасочени проби. Нещо повече, елементите, избрани за неслучайни извадки, се отнасят до шанс. Всъщност всеки елемент от популацията няма еднаква възможност да бъде включен в неслучайни извадки. Този тип извадки се наричат също не-вероятностни.
Население
Всяка колекция от обекти, които са интересни за изследване, просто се определя като „популация“. Населението е основата за пробите. Всеки набор от обекти във Вселената може да бъде популация, въз основа на декларацията за проучване. Като цяло популацията трябва да бъде сравнително голяма по размер и да е трудно да се направят изводи за някои характеристики, като се разглеждат отделно нейните елементи. Измерванията, които трябва да бъдат изследвани в популацията, се наричат параметри. На практика параметрите се изчисляват чрез използване на статистически данни, които са съответните измервания на пробата.
Пример: Когато се изчислява средната оценка по математика на 30 ученици в клас от средната оценка по математика на 5 ученика, параметърът е средна оценка по математика на класа. Статистиката е средната оценка по математика на 5 ученици.
Проба срещу население
Интересна връзка между извадката и популацията е, че популацията може да съществува без извадка, но пробата може да не съществува без популация. Този аргумент допълнително доказва, че извадката зависи от популация, но интересно е, че повечето изводи за популацията зависят от извадката. Основната цел на извадката е да изчисли или изведе някои измервания на популация възможно най-точно. По-висока точност може да се заключи от общия резултат, получен от няколко проби от една и съща популация, а не от една проба. Друго важно нещо, което трябва да знаете, е, че когато избирате повече от една извадка от популация, един елемент може да бъде включен и в друга извадка. Този случай е известен като „проби със заместители“. Освен това,инвестирането на съответните измервания на популацията от извадка и получаването на почти подобна продукция е златна възможност да се спестят разходите и стойността на времето.
От решаващо значение е да се знае, че когато размерът на извадката се увеличава, точността на оценката за параметъра на популацията също се увеличава. Логично, за да има по-добри оценки за популацията, размерът на извадката не трябва да бъде твърде малък. Освен това, случайните проби също трябва да се считат за по-добри. Ето защо е от решаващо значение да се обърне внимание на размера и случайността на извадката, за да бъде представителна, за да се получат най-добри оценки за популацията.