Ключовата разлика между клъстерирането и класификацията е, че клъстерирането е техника на обучение без надзор, която групира подобни екземпляри въз основа на характеристики, докато класификацията е контролирана техника на обучение, която присвоява предварително дефинирани маркери на екземпляри въз основа на характеристики.
Въпреки че групирането и класификацията изглеждат подобни процеси, има разлика между тях въз основа на тяхното значение. В света на извличането на данни клъстерирането и класификацията са два вида методи на обучение. И двата метода характеризират обектите в групи по една или повече характеристики.
СЪДЪРЖАНИЕ
1. Общ преглед и ключова разлика
2. Какво е клъстериране
3. Какво е класификация
4. Равно до сравнение - Клъстеринг срещу класификация в таблична форма
5. Резюме
Какво е клъстериране?
Клъстерирането е метод за групиране на обекти по такъв начин, че обектите със сходни характеристики се обединяват и обектите с различни характеристики се разделят. Това е често срещана техника за статистически анализ на данни за машинно обучение и извличане на данни. Анализът и обобщаването на изследователските данни също е област, която използва групиране.
Фигура 01: Клъстериране
Клъстерирането принадлежи към ненаблюдавано извличане на данни. Това не е единичен специфичен алгоритъм, но е общ метод за решаване на задача. Следователно е възможно да се постигне групиране с помощта на различни алгоритми. Подходящият алгоритъм на клъстера и настройките на параметрите зависят от отделните набори от данни. Това не е автоматична задача, но е итеративен процес на откриване. Следователно е необходимо да се модифицират обработката на данни и моделирането на параметри, докато резултатът постигне желаните свойства. K-означава клъстериране и Йерархично клъстериране са два често срещани алгоритми за клъстериране при извличане на данни.
Какво е класификация?
Класификацията е процес на категоризация, който използва набор от данни за обучение за разпознаване, разграничаване и разбиране на обекти. Класификацията е контролирана учебна техника, при която са налични набор от обучения и правилно дефинирани наблюдения.
Фигура 02: Класификация
Алгоритъмът, който прилага класификация, е класификаторът, докато наблюденията са екземплярите. Алгоритъмът на най-близкия съсед и алгоритмите на дървото за вземане на решения са най-известните алгоритми за класификация в извличането на данни.
Каква е разликата между клъстерирането и класификацията?
Клъстерирането е учене без надзор, докато класификацията е контролирана техника на обучение. Той групира подобни екземпляри въз основа на характеристики, докато класификацията присвоява предварително дефинирани маркери на екземпляри въз основа на характеристики. Клъстерирането разделя набора от данни на подмножества, за да групира екземплярите с подобни функции. Той не използва етикетирани данни или набор от обучения. От друга страна, категоризирайте новите данни според наблюденията на учебния набор. Комплектът за обучение е етикетиран.
Целта на клъстерирането е да групира набор от обекти, за да открие дали има някаква връзка между тях, докато класификацията има за цел да открие към кой клас принадлежи новият обект от набора от предварително дефинирани класове.
Резюме - Клъстериране срещу класификация
Клъстерирането и класификацията могат да изглеждат сходни, тъй като и двата алгоритъма за извличане на данни разделят набора от данни на подмножества, но те са две различни техники за обучение при извличането на данни, за да се получи надеждна информация от колекция от сурови данни. Разликата между клъстерирането и класификацията е, че клъстерирането е техника на обучение без надзор, която групира подобни екземпляри въз основа на характеристики, докато класификацията е контролирана техника на обучение, която присвоява предварително дефинирани маркери на екземпляри въз основа на характеристики.
С любезното съдействие на изображението:
1. "Клъстер-2" от Клъстер-2.gif: произведение на производна на hellisp: (Public Domain) чрез Wikimedia Commons 2. "Магнетизъм" от Джон Aplessed - Собствена работа. (Public Domain) чрез Wikimedia Commons