Nu este suficient sa faci predictii. Uneori, trebuie sa generati o intelegere profunda. Doar pentru ca modelezi ceva nu inseamna ca stii cu adevarat cum functioneaza. In invatarea automata clasica, algoritmul scuipa predictii, dar in unele cazuri, acest lucru nu este suficient de bun. Dr. George Cevora explica de ce cutia neagra a IA poate sa nu fie intotdeauna adecvata si cum sa treaca de la predictie la intelegere.

[Articol asociat: Importanta AI explicabila]

Deci, de ce ai nevoie de AI explicabila? Cevora prezinta doua motive principale pentru care companiile au adesea nevoie de explicabilitate

Cum putem intelege cu adevarat aceste date? Putem folosi concepte stiintifice clasice, cum ar fi rationamentul inductiv, dar, ca oameni de stiinta a datelor, sistemele complexe sunt prea mari pentru a le putea intelege. Piesele interactioneaza, dar putem intelege doar piese mici. Masinile pot capta imaginea de ansamblu. Sistemele inductive nu se preteaza acestor seturi largi de date, in timp ce rationamentul deductiv ne poate ajuta sa obtinem concluzii pe care altfel le-am putea rata.

De exemplu, Cevora analizeaza un set de date care prezinta case cu valoare ridicata si cu valoare scazuta. In invatarea automata traditionala, el ar incerca sa prezica care case ar fi de mare valoare. In schimb, se uita la motivele pentru care anumite case sunt mai valoroase decat altele. Acest tip de invatare automata a cutiei albe poate ajuta la dezvaluirea modelelor care altfel nu ar fi disponibile.

Exista mai multe instrumente pentru cresterea explicabilitatii datelor.

Reducerea dimensiunii este o parte cruciala a intelegerii datelor, deoarece mintea noastra nu poate intelege nimic mai mult decat 3D. Patru dimensionalitate produce date pe care nu le putem intelege cu adevarat, asa ca, in schimb, eliminam spatiul extrinsec pentru a intelege tiparele din spatiul intrinsec. Ganditi-va la toate citirile vremii din toate datele din mai multe statii meteo fata de motivele din spatele pentru care datele arata asa cum arata. Reducerea informatiilor la descrierea simpla este uneori numita invatare multipla.

Cand reduce aceste tipare meteorologice, Cevora subliniaza cateva modalitati diferite de a reduce dimensionalitatea intr-un sens non-topografic. PCA nu functioneaza deoarece nu exista modele liniare reale cu vremea. T-SNE ar putea fi o metoda mai buna, dar presupune ca distantele sunt distribuite in T. Izometria s-ar putea rupe si pentru ceva precum vremea, deoarece vremea este foarte neliniara.

Illumr ar folosi aici metode topologice. Datele neliniare pot parea in continuare liniare pe o scara foarte mica, oferindu-va o perspectiva mai buna asupra datelor care nu urmeaza un model liniar. Masuratorile sunt luate in unitati arbitrare si nu exista o relatie directa intre acele distante mici si ceea ce se intampla.

TDA este bun la pastrarea caracteristicilor locale, care ar putea ilumina noi perspective asupra datelor. Structureaza datele intr-un mod util si va poate ajuta sa clarificati care sunt factorii fundamentali ai fiecarui grup.

[Articol asociat: Dictionarul stiintei datelor 2019 – Termeni cheie pe care trebuie sa ii cunoasteti]

Trebuie sa intelegeti ce face masina dvs. in multe cazuri, din motive precum justificarea, lizibilitatea umana si reducerea discriminarii. Este vital sa va vedeti seturile de date ca un indiciu pentru a intelege factorii fundamentali pentru ceea ce cauzeaza predictia sau tiparul. Desi este posibil sa nu fie util tot timpul, este din ce in ce mai necesar pe masura ce algoritmii nostri devin mai inteligenti. Trebuie sa pastram verificarea umana a analizei datelor si sa intelegem, nu doar sa prezicem.

Acest videoclip a fost realizat la ODSC London 2018 – participati la ODSC East 2019 in perioada 30 aprilie – 3 mai pentru mai mult continut unic! Abonati-va la canalul nostru YouTube pentru mai multe videoclipuri realizate la conferintele anterioare.