In aprilie – mai 2019, Universitatea din California, San Diego, Esri si Microsoft si-au unit fortele pentru a preda cursul DSC 170 – Stiinta datelor spatiale din campusul La Jolla, condus de dr. Ilya Zaslavsky, directorul Laboratorului de sisteme de informatii spatiale, San Diego Supercomputer Center.

A fost o prima ocazie de acest gen pentru studenti sa invete despre concepte, metodologii, aplicatii din lumea reala si cazuri de utilizare si, cel mai important, sa castige o experienta practica practica de utilizare a instrumentelor Deep Learning cu date geospatiale brute pentru veniti la informatii, extrageti cunostinte si produceti informatii valoroase.

Ca parte a clasei, studentilor li s-a oferit acces la masini virtuale puternice Azure Cloud, echipate cu GPU-uri NVDIA Quadro GP100, pentru a invata si finaliza formarea ciclului complet al unui model Single Shot MultiBox Detector (SSD) pentru a detecta palmieri si case in imagini aeriene.

Array

In acest exercitiu, elevii si-au creat propriul set de antrenament folosind aplicatia desktop ArcGIS Pro 2.3.2, apoi au exportat setul in formatul Pascal VOC acceptat de majoritatea cadrelor de invatare automata.

Array

Apoi, cu ajutorul ArcGIS API pentru Python 1.6.1, studentii si-au instruit propriile modele de retea neuronala convolutionala SSD pentru a detecta si clasifica obiecte in imaginile de intrare.

Etichetarea datelor in ArcGIS Pro este simpla si rapida.

Array

Studentii au aflat despre arhitectura retelei SSD, au experimentat prin iteratii multiple cu constructorul SSD in cautarea celei mai bune precizari de detectare si clasificare, au gasit o valoare optima a ratei de invatare si au monitorizat pregatirea pentru semne de supradaptare.

Pierderi de instruire si validare de la una dintre trimiterile elevilor.

Dupa ce modelul SSD a fost instruit cu succes, studentii au fost rugati sa-l aplice pe o zona geografica mult mai mare folosind instrumentul de procesare incorporat „Detecteaza obiecte folosind invatarea profunda”, care permite realizarea eficienta a placilor si deducerea in serie a rasterelor extrem de mari.

Studentii au experimentat post-procesarea suprimarii non-maxime pe langa detectiile brute si li s-a cerut sa argumenteze despre pasii suplimentari pentru a imbunatati precizia detectiei.

Una dintre trimiterile studentilor: utilizarea modelului instruit MultiBox Single Shot Detector in ArcGIS Pro pentru a gasi automat mii de palme si sute de cladiri in imagini aeriene.

Straturile de caracteristici rezultate, cu detectii de palmieri si case, au fost publicate pe ArcGIS Online ca servicii de functii gazduite si trimise in acest mod pentru notare. Caietele Jupyter ale elevilor cu codul de instruire si validare Single Shot Detector au fost trimise spre evaluare prin Gradescope.

In medie, fiecare student a petrecut aproximativ 5-6 ore de GPU in timp ce experimenta, antreneaza si ruleaza inferente cu diferite modele de detectoare cu un singur foc.

Ca rezultat, am primit un feedback puternic si pozitiv din partea studentilor si a facultatii, cateva aplicatii de stagiu solide si o cerere de repetare si extindere a acestor exercitii practice in ofertele de curs viitoare.

Intr-una dintre prelegeri, studentii au lucrat printr-un exemplu remarcabil de instruire a unui scikit-learn Random Forest Regressor care prezice ratele astmului copiilor, folosind date partiale de recensamant din Connecticut. Regresorul instruit a fost ulterior folosit pentru a prezice ratele de astm pentru zonele de recensamant care nu au avut valorile ratei populate.

Rezultatele cu scikit-learn Random Forest Regressor nu au fost ideale, dar totusi destul de bune: R² pe setul de test a fost la 0,704, cu urmatoarea importanta a variabilelor explicative (acestea au fost adaugate la datele originale ale recensamantului folosind Serviciu ArcGIS Online GeoEnrichment):

1. Tigari fumate in ultimele 12 luni: Procent = 34%

2. ACS HHs: Inc la / peste nivelul saraciei: procent = 33%

3. Rata somajului din 2018 = 20%

4. Venitul mediu al gospodariei din 2018 = 5%

5. Educatie 2018: diploma de liceu, procent = 4%

6. 2018 Educatie: Licenta, Procent = 4%

Apoi, setul celor sase variabile explicative de mai sus a fost extins pentru a include distante pana la drumuri, densitatea drumului si rasterele de proximitate a poluarii stabilind relatia geospatiala intre fiecare zona de recensamant si graficul de transport, precum si surse de poluare a aerului.

Deoarece scikit-learn Regressor nu functioneaza cu date raster scoase din cutie, studentilor li s-au demonstrat rezultatele utilizarii instrumentului de clasificare si regresie bazat pe padure din caseta de instrumente Statistica spatiala pentru a forma un nou Regresor forestier aleatoriu ArcGIS. Rezultatele au fost cu adevarat impresionante – cu rasterele de costuri suplimentare, ArcGIS Random Forest Regressor a reusit sa atinga R² de 0,876 pe setul de testare – imbunatatirea cu peste 17% fata de scikit-learn Regressor original care nu se bazeaza pe componentele geospatiale ale datele!

Raster de densitate a drumului utilizat la instruirea ArcGIS Random Forest Regressor pentru a stabili relatia geospatiala intre zonele de recensamant si graficul de transport.

Iata importanta variabilelor explicative, conform modelului de clasificare si regresie bazat pe padure ArcGIS:

1. Venitul mediu al gospodariei din 2018 = 27%

2. ACS HHs: Inc Sub nivelul saraciei: Procent = 22%

3. Tigari fumate in ultimele 12 luni: Procent = 16%

4. Rata somajului din 2018 = 8%

5. Educatie 2018: Licenta: Procent = 7%

6. DENSITATEA RADIALA (raster) = 6%

7. AIRQUALITYEBK (raster) = 4%

8. DISTANCETOAIRTOXICRELEASES (raster) = 4%

9. DISTANCETOPRIMARYSECONDARYROADS (raster) = 3%

10. Educatie 2018: Diploma de liceu: Procent = 3%

Valoarea geospatialului : studentilor li s-a demonstrat o crestere remarcabila de 17% a preciziei de predictie, fata de rezultatele initiale obtinute cu variabile non-spatiale, prin adaugarea de rasteri de proximitate la Regresorul forestier aleatoriu.

Multumiri speciale lui John Meza si echipei sale, echipei Microsoft Azure pentru ca au lucrat la configurarea masinilor virtuale pentru studentii UC San Diego pentru a instrui retelele neuronale.

Instructori de clasa: Ilya Zaslavsky, Dmitry Kudinov

Asistenti didactice : Ashin George, Hammadabdullah Ayyubi