A classificazione hè una tecnica di data mining que assigna categurìi à una recopilazione di dati per aiutà in preghjunzioni e analisi più precisos. Chjamata ancu chjamata Camera di Decisione , a qualificazione hè unu di parechje metudi propiu di fà l'analizamentu di e grande datu assai datu effettivi.
Perchè Classificazione?
Basi assai grande sò diventà a norma in u mondu oghje di "grandi dati". Imagine una basa di dati cù parechje terabytes di data-una terabyte hè unu trillò bytes di data.
Cumpagnia di Facebook sola 600 terabytes di novi data ogni ghjornu (per di 2014, l'ultima ora averebbe dichjarà specì). U primu sfida di grande dati hè cumu per fà sensu di questu.
U voluminu di pocu hè micca u solu prublema: i big dati pò avè tene diverse, unstructured è rapidamente cambiante. Pigliate a audio è video di dati, publicità messaggi soziale, dati 3D o datu geospatiali. Stu tipu di dati ùn hè micca categorizatu o urganizatu.
Per affruntà stu sfida, hè stata sviluppata una varietà di metudi automaticali per svinzione infurmazione utili, frà elle classificazione .
A so classificazione. Works
À u periculu di passà troppu in u tech-parlate, discendemu cumu a classificazione travaglia. L'urdinamentu hè di creà un settore di reguli di classificazione chì rispunderanu una question, fate una decisione o predica cumpressu. Cumu iniziu, un sanu di data di furmazione hè sviluppatu chì cuntene un certu settore di attributi, ben ancu u probativu risultatu.
U travagliu di l'algoritmu di qualificazione hè di scopre chì quellu settore di attributi alcuna a so cunclusione.
Scenario : Forsi una cumpagnia di cuscenza di cippu pruvatu di circà chì e pruspettivi deve ricevenu una offerta di carte di crèditu.
Questu pò esse u so settore di data di furmazione:
Nome | Età | Genere | Renda Annuali | Oferta di qualità |
---|---|---|---|---|
John Doe | 25 | M | $ 39,500 | Innò |
Jane Doe | 56 | F | $ 125,000 | Iè |
I Colunelli di "predictore" Edite , Sexe , e Renda Annuali determinanu u valore di u "attribuite predictore" Cuntribuzione di Cunsigliu . In un settore di furmazione, l'attributu predictore hè cunnisciutu. U algoritmu di classificazione hà da tandu di scunnicà quandu u valore di l'attributu predictore hè stata missiunatu: quale rilazioni contru entre i preputenti è a decisione? Cumplementà un settu di reguli di preditzioni, in norme una struttura / sta stissa, per esempiu:
SI (Età> 18 OR Edite <75) E Renda Annuali> 40.000 CITU Oferta di Cree una Credit = sì
Ovveriamente, questu hè un esemplariu simplice è l'algoritmu chì averia bisognu di un esame di u megliu di u megliu di l'altri ducumenti da quì. Cumplementu, e règule di predizione hè prubabile di esse più più cumplessu, cumprese sottucerezi per capisce i detti attributi.
Cumplementu, l'algoritmu hè datu un "cunfusione predichendu" di l'analisi, ma sta set manca l'attributu di prevenzione (o decisione):
Nome | Età | Genere | Renda Annuali | Oferta di qualità |
---|---|---|---|---|
Jack Frost | 42 | M | $ 88.000 | |
Maria Murray | 16 | F | $ 0 |
Questa predittore data aghjusta à calculà a precisione di e reguli di predicazione, è e regule sò rimettutu finu à chì u sustegnu cunsidereghja i prepizzioni efficace è utili.
Ogni ghjornu à ghjornu Esempi di Classificazione
A classificazione è altre tecniche minerale di dati, ghjè detras di a nostra attività di ghjornu per cunsumatori.
I pritimi di u tempu puderanu utilizà a classificazione per informarlle se u ghjornu serà chiuvutu, soleil o nuvole. A professione medica puderia analizà e cundizzioni di salute per prevede risultati medichi. Un tipu di metu di classificazione, Naive Bayesian, usa a probabilità condicionale per categorizà email spam. Da a scumunicazione di fraudulare à i prudutti di pruduzzione, a classificazione hè nantu à a scena ogni ghjornu chì analizeghja e pritighjate pruduci.