AllenDowney / ElementsOfDataScience

158

Elements of Data Science este o introducere in stiinta datelor pentru persoanele fara experienta in programare. Scopul meu este sa prezint un subset mic si puternic de Python care va permite sa faceti lucrari reale in stiinta datelor cat mai repede posibil.

Nu presupun ca cititorul stie ceva despre programare, statistici sau stiinta datelor. Cand folosesc un termen, incerc sa-l definesc imediat si cand folosesc o caracteristica de programare, incerc sa-l explic.

Aceasta carte este sub forma de caiete Jupyter. Jupyter este un instrument de dezvoltare software pe care il puteti rula intr-un browser web, deci nu trebuie sa instalati niciun software. Un blocnotes Jupyter este un document care contine text, cod Python si rezultate. Asadar, il puteti citi ca pe o carte, dar puteti, de asemenea, sa modificati codul, sa il rulati, sa dezvoltati noi programe si sa le testati.

Caietele contin exercitii in care poti exersa ceea ce inveti. Majoritatea exercitiilor sunt menite sa fie rapide, dar cateva sunt mai substantiale.

Licenta pentru aceasta carte este Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0).

Acest material este o lucrare in curs, asa ca sugestiile sunt binevenite. Cel mai bun mod de a oferi feedback este sa faceti clic aici si sa creati o problema in acest depozit GitHub.

Studii de caz

In plus fata de caietele de mai jos, programa Elements of Data Science include aceste studii de caz:

Studiu de caz privind alinierea politica: Folosind datele din Studiul social general, acest studiu de caz exploreaza schimbarea opiniilor cu privire la o varietate de subiecte in randul respondentilor la sondaj din Statele Unite. Cititorii aleg una dintre cele 120 de intrebari ale sondajului si vad cum s-au schimbat raspunsurile de-a lungul timpului si cum au legatura aceste schimbari cu alinierea politica (conservatoare, moderata sau liberala).
Studiu de caz de recidiva: Acest studiu de caz se bazeaza pe o lucrare bine cunoscuta, „Machine Bias”, care a fost publicata de Politico in 2016. Se refera la COMPAS, un instrument statistic utilizat in sistemul de justitie penala pentru a evalua riscul ca un inculpat sa sa comita o alta infractiune daca este eliberat. Articolul ProPublica conchide ca COMPAS este nedrept fata de inculpatii negri, deoarece este mai probabil sa fie clasificati gresit ca fiind un risc ridicat.

videos porno casero españa fiestas porno
peliculas eroticas alemanas porno tv
miakalifa porni
maturehd amas de casa follando
se corre en el coño de su hija pornox
me gusta follar española follando
video sexo porno fiestas
amas de casa infieles incesto x
maduras masturbandose largeporntube
incesto subtitulado español tias corriendose
abuelas tragando leche todoporno
comic maduras pilladas desnudas
videos porno corridas internas madresxxx
fiestas porno maduras folladoras
mature.com maduras en la playa
porno gratis viejas mujer masturbandose
vecina mirona masturbaciones
videos actrices españolas desnudas p0rno
pajas caseras michelle jenner desnuda
se folla a su cuñada maduras sex

Un articol de raspuns din Washington Post sugereaza ca „De fapt nu este atat de clar”. Folosind datele din articolul original, acest studiu de caz explica (multe) valori utilizate pentru evaluarea clasificatorilor binari, arata provocarile definirii corectitudinii algoritmice si incepe o discutie despre contextul, etica si impactul social al stiintei datelor.
Bite Size Bayes: o introducere in probabilitate, cu accent pe teorema lui Bayes.
Date astronomice in Python: o introducere in SQL folosind datele de la telescopul spatial Gaia ca exemplu.

Caietele

Pentru fiecare dintre caietele de mai jos, aveti trei optiuni:

Daca vizualizati notebook-ul pe NBViewer, il puteti citi, dar nu puteti rula codul.
Daca rulati notebook-ul pe Colab, veti putea rula codul, efectuati exercitiile si salvati versiunea modificata a notebook-ului intr-un Google Drive (daca aveti unul).
Sau, daca descarcati notebook-ul, il puteti rula in propriul mediu. Dar, in acest caz, depinde de dvs. sa va asigurati ca aveti bibliotecile de care aveti nevoie.

Caietul 1

Variabile si valori : primul caiet explica modul de utilizare a Jupyter si introduce variabile, valori si calcul numeric.

Faceti clic aici pentru a rula acest notebook pe Colab