visualize_ML este un pachet python realizat pentru a vizualiza cativa pasi implicati in timp ce rezolvati o problema de invatare automata. Se bazeaza pe biblioteci precum matplotlib pentru vizualizare si sklean, scipy pentru calcule statistice.
Cuprins:
- Cerinte
- Instalare
- Sa codificam
- explora modulul
- modul de relatie
- A contribui
- Sarcini de facut
- Licenta
- Drepturi de autor
Cerinta
- python 2.x sau python 3.x
Instalare
Instalati dependentele necesare pentru matplotlib
Instalati-l folosind pip
Sa Codificam
In timp ce abordati o problema de invatare automata, unii dintre pasii initiali implicati sunt explorarea datelor, analiza urmata de selectarea caracteristicilor. Mai jos sunt modulele pentru aceste sarcini.
1) Explorarea datelor
In aceasta etapa, exploram variabilele una cate una folosind analiza Uni-variate, care depinde daca tipul variabilei este categoric sau continuu. Pentru a rezolva acest lucru, avem modulul explore .
>>> explorati modulul
Variabile continue : in cazul variabilelor continue , traseaza histograma pentru fiecare variabila si ofera statistici descriptive pentru acestea.
Variabile categorice : in cazul variabilelor categorice cu 2 sau mai multe clase, traseaza graficul cu bare pentru fiecare variabila si ofera statistici descriptive pentru acestea.
Parametri Tip Descriere data_input Dataframe Aceasta este intrarea Dataframe cu toate datele. (In acest moment, intrarea poate fi doar o intrare dataframe.) Lista nume_categorii (implicit = []) Numele tuturor coloanelor variabilei categorice cu mai mult de 2 clase, pentru a distinge lista cu variabile continue Lista simpla implica faptul ca nu exista caracteristici categorice cu mai mult de 2 clase. drop list implicit = [] Numele coloanelor care trebuie abandonate. PLOT_COLUMNS_SIZE int (implicit = 4) Numarul de parcele de afisat vertical in fereastra de afisare. Dimensiunea randului este ajustata corespunzator. bin_size int (implicit = “auto”) Numarul de cosuri pentru histograma afisata in categoria categorica vs. wspace float32 (implicit = 0,5) Umplutura orizontala intre subplot pe fereastra de afisare. hspace float32 (implicit = 0.
Fragment de cod
porno caliente porno online gratis
fontanero cachondo hombres masturbando a mujeres
pajas entre amigos torrent porno
trio amateur español madres viciosas
sexso sexporn
videos porno para mujeres gratis video sexo gratis
xxxgay abuelas folladas por el culo
maduras en grupo sexo maduras españolas
penes de abuelos mamadas españolas
jovencitos follando con maduras sexo muy duro
viejas mexicanas follando tias cachondas
porno español jovencita porno gay trios
follada en la playa tetonas españolas
mamadas en la playa comicxxx
comic porno español castin porno
videos actrices españolas desnudas españolas guarras
videos chicas gratis mamasxxx
masturbacion en grupo pareja española follando
orgias de maduros mamadas gay
incesto abuela y nieto porno online
csv”) explore.plot (df, [“Survived”, ” Pclass “,” Sex “,” SibSp “,” Ticket “,” Embarked “], drop = [” PassengerId “,” Name “])
vezi setul de date
Nota: in timp ce se traseaza toate randurile cu valori NaN si coloanele cu valori ale caracterelor sunt eliminate (cu exceptia cazului in care valorile sunt adevarate si false), sunt reprezentate numai datele numerice.
2) Selectarea caracteristicilor
Aceasta este una dintre sarcinile provocatoare pentru o sarcina ML. Aici trebuie sa facem analize bi-variate pentru a afla relatia dintre doua variabile. Aici, cautam asocierea si disocierea intre variabile la un nivel de semnificatie predefinit.
Modulul relatie ajuta la vizualizarea analizei efectuate pe diverse combinatii de variabile si vedeti relatia dintre ele.
>>> modul relatie
Variabile continue vs variabile continue: Pentru a efectua analiza bi-variabila, se fac grafice de dispersie , deoarece modelul lor indica relatia dintre variabile. Pentru a indica puterea relatiei dintre ei, folosim corelatia dintre ei.
Graficul afiseaza coeficientul de corelatie impreuna cu alte informatii.
- -1: corelatie liniara negativa perfecta
- +1: corelatie liniara pozitiva perfecta si
- 0: Fara corelatie
Variabile categorice vs variabile categorice : diagramele de coloane stivuite sunt realizate pentru a vizualiza relatia. Testul Chi patrat este utilizat pentru a obtine semnificatia statistica a relatiei dintre variabile. Returneaza probabilitatea pentru distributia calculata chi-patrat cu gradul de libertate. Pentru mai multe informatii despre Chi Test, consultati acest lucru
Probabilitatea de 0: indica faptul ca ambele variabile categorice sunt dependente
Probabilitatea de 1: arata ca ambele variabile sunt independente.
Graficul afiseaza valoarea p_ impreuna cu alte informatii. Daca este mai putin de 0,05, se afirma ca variabilele sunt dependente.
Variabile categorice vs variabile continue: Pentru a explora relatia dintre variabilele categorice si variabile continue, diagramele casetei sunt desenate la fiecare nivel de variabile categorice. Daca nivelurile sunt mici ca numar, acesta nu va arata semnificatia statistica. Testul ANOVA este utilizat pentru a obtine semnificatia statistica a relatiei dintre variabile.
Graficul afiseaza valoarea p_ impreuna cu alte informatii. Daca este mai putin de 0,05, se afirma ca variabilele sunt dependente.
Pentru mai multe informatii despre testul ANOVA, consultati acest lucru
Parametri Tip Descriere data_input Dataframe Acesta este intrarea Dataframe cu toate datele (in acest moment intrarea poate fi doar o intrare dataframe.) Target_name String Numele coloanei tinta. lista nume_categorii (implicit = []) Numele tuturor coloanelor de variabile categorice cu mai mult de 2 clase, pentru a le distinge cu variabilele continue Lista simpla implica faptul ca nu exista caracteristici categorice cu mai mult de 2 clase. drop list implicit = [] Numele coloanelor care trebuie abandonate. PLOT_COLUMNS_SIZE int (implicit = 4) Numarul de parcele de afisat vertical in fereastra de afisare. Dimensiunea randului este ajustata corespunzator. bin_size int (implicit = “auto”) Numarul de cosuri pentru histograma afisata in categoria categorica vs. wspace float32 (implicit = 0,5) Umplutura orizontala intre subplot pe fereastra de afisare.
Fragment de cod
vezi setul de date
Nota: in timp ce se traseaza toate randurile cu valori NaN si coloanele cu valori nenumerice sunt eliminate, sunt reprezentate numai datele numerice. Sunt permise doar variabile de taget categorice cu valori de sir.
A contribui
Daca doriti sa contribuiti si sa adaugati o functie noua, nu ezitati sa trimiteti cererea Pull aici
Acest proiect este inca in curs de dezvoltare, astfel incat sa raportati orice erori sau sa solicitati functii noi, accesati pagina Probleme
Sarcini de facut
-
Faceti intrarea compatibila cu alte formate precum Numpy.
-
Vizualizati cele mai bune linii de potrivire si limitele de decizie pentru diferite modele pentru a usura sarcina de reglare a parametrilor .
si multe altele!
Licenta
Licentiat sub licenta MIT (MIT).
Drepturi de autor
ayush1997 (c) 2016








