Importul setului de date Buzzfeed TrumpWorld in Neo4j

Am dat peste acest tweet de Sanchez Castro (@SCHZCAS) pe care sunt mai mult decat fericit sa il sustin.

Hei @ neo4j, te rog, fa asta inca o data !!! #panamapapers # neo4j

https://t.co/B8pjxNKCyA

– sanchezcastro (@SCHZCAS) 15 ianuarie 2017

Ca parte a articolului Buzzfeed Help Us Map TrumpWorld, cei patru jurnalisti de investigatie, John Templon, Alex Campbell, Anthony Cormier si Jeremy Singer-Vine au cerut publicului sa ii ajute sa cartografieze si sa analizeze datele pe care le-au investigat, confirmat si publicat:

Acum cerem publicului sa ne foloseasca datele pentru a gasi conexiuni pe care probabil le-am pierdut si pentru a ne oferi un context pe care nu il intelegem in prezent. Speram ca ne veti ajuta – si publicul – sa aflam mai multe despre TrumpWorld si modul in care aceasta gama fara precedent de companii ar putea afecta politica publica.

Configurati cu baza de date locala

Privind datele

Articolul Buzzfeed legat in tweet indica o foaie de calcul Google cu date colectate si verificate / cercetate despre relatiile organizatiilor Trump cu alte organizatii, in total avem 770 de organizatii (incepand de astazi) cu 611 relatii. Aceleasi date sunt disponibile ca fisier CSV si GraphML in GitHub Repository.

Datele sunt, din fericire, disponibile ca documente publice Google, deci putem folosi vechiul nostru truc de a incarca adresa URL de descarcare CSV cu LOAD CSV in Neo4j.

Sa aruncam o privire mai intai asupra datelor, aici ca exemplu:

CU ‘https://docs.google.com/spreadsheets/u/1/d/1Z5Vo5pbvxKJ5XpfALZXvCzW26Cl4we3OaN73K9Ae5Ss/export?format=csv&gid=1996904412’ AS url LOAD CSV WITH HEADERS OF rand. “Tipul entitatii A”, randul. “Entitatea B”, randul. “Tipul entitatii B”, randul. Conexiunea, randul. “Sursa (sursele)” LIMIT 5

╒════════════════════════════════════╤════════════ ═════════╤═══════════════════════════════╤════════ ═════════════╤════════════════╤═══════════════════ ══════════════════════════════════════════════════ ═════════════════╕ │ “rand.` Entitate A` „│” rand.` Entitate A Tastati „„ │ “rand.` Entitate B`„ │ “rand. `Entitate B Tip`„ │ ”rand.Conexiune„ │ ”rand.` Sursa (e)` „│ ╞═════════════════════════ ═══════════╪═════════════════════╪════════════════ ═══════════════╪═════════════════════╪════════════ ════╪═════════════════════════════════════════════ ═════════════════════════════════════════╡ │ “4 SHADOW TREE LANE MEMBER CORP . ” │ “Organizatie” │ “4 SHADOW TREE LANE LLC” │ “Organizatie” │ “Proprietate” │ “https://www.documentcloud.org/documents/2838696-Trump-2016-Financial-Disclosure.

Cele mai des mentionate organizatii gasite de aceasta interogare:

CU ‘https://docs.google.com/spreadsheets/u/1/d/1Z5Vo5pbvxKJ5XpfALZXvCzW26Cl4we3OaN73K9Ae5Ss/export?format=csv&gid=1996904412’ AS url INCARCARE CSV CU CAPURI DIN RAND DE tipul UR rand ca rand. = “Organizatie” SI rand. “Tip Entitate B” = “Organizatie” UNWIND [rand. “Entitate A”, rand. “Entitate B”] AS org RETURN org, count (*) ORDER BY count (*) DESC LIMIT 10

Vedem suspectul obisnuit deasupra.

╒══════════════════════════════╤══════════╕ │ “org” │ “numar (*) „│ ╞══════════════════════════════╪══════════╡ │” CAPITAL PENTRU “│” 84 “│ ├───────────────────────────────────────── ┤ │ “FUNDATIA FAMILIEI MERCER” │ “41” │───────────────────────────────────── ────┤ │ “40 WALL STREET LLC” │ “40” │ ──────────────────────────────── ─────────┤ │ “DJT HOLDINGS LLC” │ “35” │ ├───────────────────────────── ──┼──────────┤ │ “FIRME KUSHNER” │ “30” │ ├───────────────────────── ─────┼──────────┤ │ “TRUMP HOTELS & CASINO RESORTS│” 28 “│ │, INC.” │ │ ├───────────────────────────────────────┤ │ “TRUMP TOWER COMERCIAL LLC “│” 21 “│ ├────────────────────────────────────────── │ “TRUMP ORGANIZATION LLC”

Ce fel de relatii exista in date:

CU ‘https://docs.google.com/spreadsheets/u/1/d/1Z5Vo5pbvxKJ5XpfALZXvCzW26Cl4we3OaN73K9Ae5Ss/export?format=csv&gid=1996904412’ AS url INCARCARE CSV CU HEADERS AS rand. ) ORDINE BY count (*) DESC

╒═════════════════════════════════════════════════ ══════ … ═╤══════════╕ │ “tip” … │ “numar (*)” │ ╞════════════ ═══════════════════════════════════════════ … ═╪══ ════════╡ │ „Presedinte (incepand cu depunerea FEC din 2016)” … │ „475” ├ ────────────────────── ────────────────────────────────── … ─┼──────────┤ │ „Proprietate” … │ „323” │ ├───────────────────────────────────── ────────────────── ..

porno muy duro pono gay
incesto madre hijos randy dave
jovencita caliente descargar pelis pornos
maduras lesbianas tetonas peliculas porno vintage
sexo con cincuentonas maduras españolas masturbandose
cine xxx porno portugues
corridas en la playa incesto real casero
porno de abuelas corridas dentro de la boca
shakira follando videos de follar
mamadas de españolas orgia porno español
comedias porno corridas de viejas
madresxxx porno con argumento
incesto abuelas sexo videos gratis
trios gays anita teen pillada por torbe
porno español años 70 coñosxxx
madre follada a la fuerza porno viejas en español
tias cachondas porno esp
el mejor video porno madres viciosas
cerdas com gratis porno india
tetas en la playa peludas porno

. ─┼─────────┤ │ “Director” … │ “126” │ ├─── ────────────────────────────────────────────────── ── … ─┼──────────┤ │ „Investitor” … │ „120” │ ├─────────────────── ───────────────────────────────────── … ─┼───────── ─┤ │ „Membru raportat” … │ „103” │ ├────────────────────────────────── ───────────────────── … ─┼──────────┤ │ “Fost director” … │ “66 “│ …. … │” \ “Kushner si Cui au avut un dialog amplu in desfasurare … i│” 1 “official officialte oficial al Casei, \” per Bloomberg “… │ │ ├── ────────────────────────────────────────────────── ─── … ─┼──────────┤ │ „Marino a functionat ca functionar de drept al lui Barry” … │ „1” ├ ├───────────── ────────────────────────────────────────── … ─┼─── ───────┤ │ „Fost director de informare afro-americana” … │ „1” │ ├──────────────────────── ─────────────────────────────── … … ─┼────────── ┤ “Fost director de avans “… │” 1 “│ ├────────────────────────────────────── ────────────────── … ─┼─────────┤ │ “Vicepresedinte executiv si avocat special al lui Donald … │” 1 „│ ├─────────────────────────────────────────────── ──────── … ─┼──────────┤ │ “Ziya \”a primit o serie de contractii de milioane de dolari … │ “1” │ ├───────────────────────────────── ────────────────────── … ─┼──────────┤ │ „Relatii cu membrii fostului director adjunct” … │ „1” │ └───────────────────────────────────────────── ────────── … ─┴──────────┘

In timp ce unii dintre ei, precum Ownership sau Investor, sunt altii simpli (Ziya “a acordat o serie de contracte de milioane de dolari catre Azarpassillo,” pentru The New Yorker) sunt foarte specifice si probabil ca nu reprezinta o alegere buna pentru tipul de relatie pentru interogare pe.

Deci, avem doua optiuni , una ar putea fi sa folosim o relatie generica si sa punem toate informatiile despre conexiune intr-o proprietate sau, alternativ , facem o curatare / unificare si avem un set mai bogat de relatii.

Import simplu, direct de date

Ne uitam aici la varianta mai simpla, pentru a obtine rapid rezultate. Abordarea de unificare este demonstrata aici, pentru cei dintre voi care doresc sa aiba un model de grafic putin mai interesant.