Classificazione in Data Mining

A classificazione hè una tecnica di data mining que assigna categurìi à una recopilazione di dati per aiutà in preghjunzioni e analisi più precisos. Chjamata ancu chjamata Camera di Decisione , a qualificazione hè unu di parechje metudi propiu di fà l'analizamentu di e grande datu assai datu effettivi.

Perchè Classificazione?

Basi assai grande sò diventà a norma in u mondu oghje di "grandi dati". Imagine una basa di dati cù parechje terabytes di data-una terabyte hè unu trillò bytes di data.

Cumpagnia di Facebook sola 600 terabytes di novi data ogni ghjornu (per di 2014, l'ultima ora averebbe dichjarà specì). U primu sfida di grande dati hè cumu per fà sensu di questu.

U voluminu di pocu hè micca u solu prublema: i big dati pò avè tene diverse, unstructured è rapidamente cambiante. Pigliate a audio è video di dati, publicità messaggi soziale, dati 3D o datu geospatiali. Stu tipu di dati ùn hè micca categorizatu o urganizatu.

Per affruntà stu sfida, hè stata sviluppata una varietà di metudi automaticali per svinzione infurmazione utili, frà elle classificazione .

A so classificazione. Works

À u periculu di passà troppu in u tech-parlate, discendemu cumu a classificazione travaglia. L'urdinamentu hè di creà un settore di reguli di classificazione chì rispunderanu una question, fate una decisione o predica cumpressu. Cumu iniziu, un sanu di data di furmazione hè sviluppatu chì cuntene un certu settore di attributi, ben ancu u probativu risultatu.

U travagliu di l'algoritmu di qualificazione hè di scopre chì quellu settore di attributi alcuna a so cunclusione.

Scenario : Forsi una cumpagnia di cuscenza di cippu pruvatu di circà chì e pruspettivi deve ricevenu una offerta di carte di crèditu.

Questu pò esse u so settore di data di furmazione:

Training Data
Nome Età Genere Renda Annuali Oferta di qualità
John Doe 25 M $ 39,500 Innò
Jane Doe 56 F $ 125,000

I Colunelli di "predictore" Edite , Sexe , e Renda Annuali determinanu u valore di u "attribuite predictore" Cuntribuzione di Cunsigliu . In un settore di furmazione, l'attributu predictore hè cunnisciutu. U algoritmu di classificazione hà da tandu di scunnicà quandu u valore di l'attributu predictore hè stata missiunatu: quale rilazioni contru entre i preputenti è a decisione? Cumplementà un settu di reguli di preditzioni, in norme una struttura / sta stissa, per esempiu:

SI (Età> 18 OR Edite <75) E Renda Annuali> 40.000 CITU Oferta di Cree una Credit = sì

Ovveriamente, questu hè un esemplariu simplice è l'algoritmu chì averia bisognu di un esame di u megliu di u megliu di l'altri ducumenti da quì. Cumplementu, e règule di predizione hè prubabile di esse più più cumplessu, cumprese sottucerezi per capisce i detti attributi.

Cumplementu, l'algoritmu hè datu un "cunfusione predichendu" di l'analisi, ma sta set manca l'attributu di prevenzione (o decisione):

Predictor Data
Nome Età Genere Renda Annuali Oferta di qualità
Jack Frost 42 M $ 88.000
Maria Murray 16 F $ 0

Questa predittore data aghjusta à calculà a precisione di e reguli di predicazione, è e regule sò rimettutu finu à chì u sustegnu cunsidereghja i prepizzioni efficace è utili.

Ogni ghjornu à ghjornu Esempi di Classificazione

A classificazione è altre tecniche minerale di dati, ghjè detras di a nostra attività di ghjornu per cunsumatori.

I pritimi di u tempu puderanu utilizà a classificazione per informarlle se u ghjornu serà chiuvutu, soleil o nuvole. A professione medica puderia analizà e cundizzioni di salute per prevede risultati medichi. Un tipu di metu di classificazione, Naive Bayesian, usa a probabilità condicionale per categorizà email spam. Da a scumunicazione di fraudulare à i prudutti di pruduzzione, a classificazione hè nantu à a scena ogni ghjornu chì analizeghja e pritighjate pruduci.