Neo4j Graph Data Science isi propune sa contribuie la construirea de turnuri complexe de date construite logic …

Array

[+] relatii.

Adrian Bridgwater

Datele sunt peste tot, tot timpul. Oricine urmareste stirile de stiri nocturne care analizeaza mandatele guvernamentale in legatura cu COVID-19 (Coronavirus) vor fi vazut un pachet de selectie de grafice prezentate pe masura ce oamenii de stiinta ilustreaza numarul de infectii, internari in spitale si mortalitati care se intampla in intreaga lume.

Array

In timp ce aceste valori de baza ale datelor sunt fundamental importante, ceea ce incearca sa ne atraga atentia multi dintre purtatorii de cuvant stiintifici (cum ar fi ofiterul sef medical din Marea Britanie, profesorul Chris Whitty) sunt tendintele, directiile extrapolate si zonele de partinire care apar in intreaga lume punctele de date fiind masurate.  

Lucrul despre date, intr-adevar, nu este doar cantitate sau calitate ..

Array

. ci relatiile.

Pot sa am mai multe date, va rog, domnule?

„O conceptie gresita obisnuita in stiinta datelor este ca mai multe date maresc acuratetea si reduc falsurile pozitive”, a explicat Alicia Frame, manager de produs principal si cercetator de date la Neo4j.

„In realitate, multe modele de stiinta a datelor trec cu vederea cele mai predictive elemente din cadrul datelor – conexiunile si structurile care se afla in interior. Neo4j pentru Graph Data Science a fost conceput in acest scop – pentru a imbunatati acuratetea predictiva a invatarii automate sau pentru a raspunde la intrebari de analiza care anterior nu erau raspunsate, folosind relatiile inerente in datele existente. ” 

Frame si echipa nu au folosit (din fericire) focarul COVID-19 ca un carlig de stiri initial, dar tehnologia companiei are o oarecare relevanta pentru tipul de analiza a datelor pe care incercam acum sa-l realizam in timp ce privim relatiile complexe dintre oameni , locul, etnia si agentii patogeni. 

Relatii subutilizate, peste tot

Ca specialist in tehnologia bazelor de date grafice, Neo4j spune ca produsul sau Graph Data Science este primul mediu in domeniul stiintei datelor construit pentru a valorifica puterea predictiva a relatiilor pentru implementarile intreprinderii. Permite oamenilor de stiinta de date (care lucreaza pentru a sprijini oamenii de stiinta din domeniul medical … si, de asemenea, analistii in domeniul stiintelor de afaceri) sa utilizeze relatii predictive, dar in mare masura subutilizate si structuri de retea pentru a raspunde problemelor mai dificile.

Exemple de tip de analiza a datelor aici includ „dezambiguizarea utilizatorului” (cand doua sau mai multe persoane cu aceleasi caracteristici masurate creeaza aceleasi valori ale datelor in locuri diferite si, prin urmare, arata in mod aparent la fel, dar in mod clar nu sunt) in mai multe platforme si puncte de contact, identificand interventii timpurii pentru nevoile complicate ale utilizatorilor si prezicand frauda prin secvente de comportament aparent inofensiv.

„Neo4j pentru Graph Data Science combina un spatiu de lucru pentru analiza graficului nativ si o baza de date cu grafice cu algoritmi de grafic scalabili si vizualizare grafica pentru o experienta fiabila, usor de utilizat. Acest cadru permite oamenilor de stiinta de date sa operationalizeze cu incredere analize mai bune si modele de invatare automata care deduc comportamentul pe baza datelor conectate si a structurilor de retea ”, noteaza Frame si echipa.

Compania foloseste de fapt exemplul analizei fraudei, cum ar fi detectarea fraudei de identitate, inelelor de frauda si evaziunea fiscala. Chiar si cea mai mica imbunatatire predictiva se traduce prin economii de milioane de dolari. Neo4j pentru Graph Data Science faciliteaza realizarea acestor imbunatatiri incrementale fara a modifica conductele de invatare automata existente.

Semanatul insamantarii deterministe 

Aceasta tehnologie va rula algoritmi grafici optimizati pe zeci de miliarde de noduri cu caracteristici de productie, cum ar fi insamantarea determinista, care ofera valori de pornire si rezultate consistente pentru fluxuri de lucru de invatare automata reproductibile. 

Dr. Alexander Jarasch, seful managementului datelor si cunostintelor la Centrul German pentru Cercetarea Diabetului (DZD) si colaborator pe COVIDgraph.org, a explicat cum Neo4j pentru Graph Data Science ofera o experienta in stiinta datelor cu parametri logici si Neo4j Bloom pentru explorarea cuprinzatoare a graficelor . 

„Nimic nu este mai presant astazi decat intelegerea COVID-19”, a spus Jarasch. „Graficele ne ofera capacitatea de a reuni informatiile esentiale din jurul acestei boli confuzive si de a oferi o imagine sintetizata a datelor eterogene. Intelegerea de astazi a acestui virus este grav impiedicata de cercetari minime evaluate de colegi si de absenta studiilor clinice pe termen lung. Neo4j pentru Graph Data Science ne va ajuta sa identificam unde trebuie sa orientam cercetarea biomedicala, resursele si eforturile. ” 

Tehnologiile bazelor de date grafice nu sunt in niciun caz un panaceu pentru criza actuala sau intr-adevar pentru orice problema de afaceri extrem de complexa, dar puteti fi siguri ca comunitatea stiintifica foloseste aceste tehnici in cautarea continua a inocularilor, vaccinurilor si a unui remediu mai larg. 

Adoptati teoria graficelor in apropiere, dar faceti acest lucru numai atunci cand a fost observat si un nivel adecvat de distantare sociala. Acum, te rog sa te speli pe maini.