Acasă Adult69 Modul de invatare a masinii se poate transforma Dating online: Interviu Kang...

Adult69

Modul de invatare a masinii se poate transforma Dating online: Interviu Kang Zhao | DataScienceWeekly.org

144

De curand am luat cunostinta de Kang Zhao, profesor asistent la departamentul de stiinte de management, Tippie College of Business, Universitatea din Iowa. Activitatea sa aplicand Machine Learning in lumea intalnirilor online a generat o acoperire semnificativa (Forbes, MIT Technology Review, UPI, printre altele), asa ca am dorit sa stim mai multe! …

Buna Kang, in primul rand va multumesc pentru interviu. Sa incepem cu fundalul tau …

I – Care este cea de 30 de secunde bio?

A – Asa cum ati mentionat, sunt profesor asistent la departamentul de Stiinte Management, Tippie College of Business, Universitatea din Iowa. Cercetarea mea se concentreaza pe analiza afacerilor si calculul social, in special in contextul retelelor sociale si al social media. Detin si un doctorat in stiinte si tehnologie a informatiei de la Universitatea Penn State.

I – Cum v-ati interesat stiinta datelor / invatarea masinii?

A – Asta dateaza din zilele mele de scoala. Am fost implicat in proiecte de cercetare care au exploatat date din retelele sociale online si din social media. Este uimitor faptul ca in zilele noastre toate interactiunile pe scara larga si distribuite intre oameni sunt disponibile online datorita avansarilor retelelor de socializare online / site-urilor de social media. Aceste date nu numai ca dezvaluie cu cine vorbeste (de exemplu, ne ajuta sa construim o retea sociala obisnuita bazata pe „cunoastere” sau o interactiune simpla), ci si timpul si continutul comunicarii lor online, care ne permit sa construim alte retele sociale bazate pe privind natura interactiunilor (cum ar fi reteaua de asistenta, reteaua de raspandire a informatiilor). Toate acestea m-au facut sa cred ca disponibilitatea acestor date va aduce o perspectiva complet noua in studiul comportamentelor si interactiunilor sociale ale oamenilor.

I – Care a fost primul set de date cu care va amintiti ca ati lucrat? Ce ai facut cu asta?

A – Primul meu proiect de cercetare folosind un set de date din lumea reala a vizat colectarea si analizarea datelor despre agentiile umanitare si retelele lor. Scara datelor a fost de fapt „minuscula” (mai multi mega octeti), dar datele ne-au aratat cateva tipare interesante privind asemanarile topologice intre diferite retele dintre aceste organizatii (de exemplu, retelele de comunicare si colaborare), ceea ce ne-a inspirat sa dezvoltam o simulare pentru modelarea co-evolutiei retelelor multirelationale.

Kang, context si context foarte interesant – va multumim pentru partajare! In continuare, haideti sa vorbim mai multe despre invatarea automata in retelele sociale si pe social media.

I – Ce va emotioneaza cel mai mult cu privire la reunirea invatarii automate si a retelelor sociale / social media?

A – Este vorba despre oportunitatea de a face o predictie mai buna. Cu date la scara mai mare din mai multe surse despre modul in care oamenii se comporta intr-un context de retea devenind disponibile, exista o multime de oportunitati de a aplica algoritmi ML pentru a descoperi tipare cu privire la modul in care oamenii se comporta si a prezice ce se va intampla in continuare. O astfel de predictie poate ajuta la validarea / testarea teoriilor existente despre comportamentele sociale ale oamenilor la o scara inedita. De asemenea, este posibil sa derivam noi teorii despre stiintele sociale din date dinamice prin studii de calcul. In plus, componenta educationala este de asemenea interesanta, deoarece industria are nevoie de forta de munca cu abilitati de analiza a datelor. Acesta este si motivul pentru care noi, la Universitatea din Iowa, am inceput un program de licenta in Business Analytics si intentionam sa derulam si un program de master in acest domeniu.

I – Care sunt cele mai mari domenii de oportunitate / intrebari pe care doriti sa le abordati?

A – Vreau sa inteleg si sa prezic mai bine dinamica retelelor sociale la diferite scari. De exemplu, formarea legaturii diadice la nivel microscopic, fluxul de informatii si influenta la nivel mezoscopic, precum si modul in care topologiile retelei afecteaza performanta retelei la nivel macroscopic.

I – Ce metode de invatare a masinii ati gasit cele mai utile?

A – Depinde intr-adevar de context si este greu sa gasesti un glont de argint pentru toate situatiile. De obicei, incerc mai multe metode si ma declar cu cea cu cele mai bune performante.

I – Cu ce instrumente / aplicatii preferate sa lucrezi?

A – Folosesc JUNG, un cadru Java pentru analiza graficului, Mallet pentru modelarea subiectelor, lingpipe pentru analiza textului si Weka pentru lucrari de extragere a datelor.

I – Ce publicatii, site-uri web, bloguri, conferinte si / sau carti sunt utile lucrarii dvs.?

A – De obicei, fiu atent la reviste precum Sisteme inteligente IEEE, numeroase tranzactii IEEE si ACM, Sisteme de asistenta la decizii, printre multe altele. In ceea ce priveste conferintele, am gasit urmatoarele lucruri utile pentru propria mea cercetare: ICWSM, WWW, KDD si Atelierul privind tehnologiile si sistemele informationale. De asemenea, ma bucur de mai multe conferinte legate de calculul social, precum SocialCom si SBP.

Imbunatatirea capacitatii noastre de a face predictii este cu siguranta foarte convingator! Acum, sa discutam cum se aplica acest lucru in unele dintre cercetarile dvs. …

I – Lucrarile dvs. recente privind dezvoltarea unui algoritm „Netflix style” pentru site-urile de intalnire au primit multa acoperire de presa … ce intrebare / problema incercati sa rezolvati?

A – Incercam sa abordam recomandarile utilizatorilor pentru situatia unica a retelelor sociale reciproce si bipartite (de exemplu, intalnirea, cautarea unui loc de munca). Ideea este de a recomanda partenerii de intalniri carora le va placea un utilizator si le va place inapoi. Cu alte cuvinte, un partener recomandat trebuie sa corespunda gustului utilizatorului, precum si atractivitatii.

I – Cum a ajutat Machine Learning?

A – Pe scurt, am extins tehnica clasica de filtrare colaborativa (folosita in mod obisnuit in recomandarile pentru Amazon.com sau Netflix) pentru a se potrivi atat pentru gust, cat si pentru atractivitate.

I – Ce raspunsuri / perspective ai descoperit?

A – Comportamentele oamenilor in abordarea si raspunsul la ceilalti pot oferi informatii valoroase despre gustul, atractivitatea si neatractivitatea lor. Metoda noastra poate surprinde aceste caracteristici in selectarea partenerilor de intalnire si poate face recomandari mai bune.

Nota pentru editor – Daca sunteti interesat de mai multe detalii in spatele abordarii, atat articolul recent al lui Forbes, cat si o caracteristica din MIT Technology Review sunt foarte interesante. Iata cateva aspecte importante:

Motor de recomandare (din MIT Tech Review) – Acesti tipi au construit un motor de recomandare care nu numai ca iti evalueaza gusturile, dar iti masoara atractivitatea. Apoi foloseste aceste informatii pentru a recomanda datele potentiale care pot raspunde, daca initiati contactul. Echivalentul de intalnire [al modelului Netflix] este de a analiza partenerii la care ati ales sa le trimiteti mesaje, apoi de a gasi alti baieti sau fete cu un gust similar si sa va recomanda date potentiale pe care le-au contactat, dar pe care nu le-ati facut. Cu alte cuvinte, recomandarile sunt de forma: „baietilor carora le-a placut aceasta fata le plac si aceste fete” si „fetelor care le placeau acest baiat le placeau si acesti baieti”.

Problema acestei abordari este ca nu tine cont de atractivitatea ta. Daca persoanele pe care le contactati nu raspund niciodata, atunci aceste recomandari sunt de mica folos. Asadar, Zhao si co adauga o alta dimensiune la motorul lor de recomandare. De asemenea, analizeaza raspunsurile pe care le primiti si le folosesc pentru a va evalua atractivitatea (sau neatractivitatea). Evident, baietii si fetele care primesc mai multe raspunsuri sunt mai atractive. Atunci cand tine cont de acest aspect, va poate recomanda date potentiale care nu numai ca se potrivesc gustului dvs., dar si celor care sunt mai susceptibile sa va considere atractive si, prin urmare, sa va raspunda. „Modelul are in vedere„ gustul ”utilizatorului in alegerea celorlalti si„ atractivitatea ”in a fi ales de altii”, spun ei.

Machine Learning (de la Forbes) – „Actiunile dvs. reflecta gustul si atractivitatea dvs. intr-un mod care ar putea fi mai exact decat ceea ce includeti in profilul dvs.”, spune Zhao. Algoritmul echipei de cercetare in cele din urma va „invata” ca, in timp ce un barbat spune ca ii plac femeile inalte, el continua sa contacteze femeile scurte si isi va schimba unilateral recomandarile de intalnire pentru el fara notificare, in acelasi mod in care algoritmul Netflix afla ca esti intr-adevar un devotat dram de dulap, chiar daca pretindeti ca iubiti actiunea si stiinta.

„In modelul nostru, utilizatorii cu gust similar si (un) atractivitate vor avea scoruri de similaritate mai mari decat cei care impartasesc doar gust comun sau atractivitate”, spune Zhao. „Modelul are in vedere si potrivirea atat a gustului, cat si a atractivitatii la recomandarea partenerilor de intalnire” … Dupa ce este folosit algoritmul echipei de cercetare, rata de reciprocitate se imbunatateste pana la aproximativ 44% – un salt mai bun de 50%.

In cele din urma, pentru mai multe detalii tehnice, lucrarea completa poate fi gasita aici.

Nota editorului – Inapoi la interviu! ..

I – Care sunt urmatorii pasi / unde altfel s-ar putea aplica acest lucru?

R – Vrem sa imbunatatim in continuare metoda cu diferite seturi de date, fie din intalniri sau din alte retele sociale reciproce si bipartite, cum ar fi cautarea unui loc de munca si admiterea la facultate. Cum sa integram in mod eficient profilurile personale ale utilizatorilor in recomandari pentru a evita problemele de pornire la rece, fara a afecta generalizarea metodei, este de asemenea o intrebare interesanta pe care dorim sa o abordam in cercetarile viitoare.

Toate acestea suna grozav – noroc cu urmatorii pasi!… Lucrati si la alte lucruri – munca dvs. asupra influentei sentimentale in retelele de socializare online (elaborarea unui „bun indice samaritean” pentru comunitatile supravietuitoare de cancer) a fost bine documentata … ne puteti spune ceva mai multe despre aceasta lucrare?

I – Ce intrebare / problema incercati sa rezolvati?

A – Am incercat sa gasim cine sunt utilizatorii influenti intr-o OHC (Online Health Community). Aici ne masuram in mod direct influenta cuiva, adica capacitatile cuiva de a modifica sentimentele altora in discutiile cu filet.

I – Cum a ajutat Machine Learning?

A – Analiza sentimentelor sta la baza noii noastre metrici. Am dezvoltat un clasificator de sentimente (folosind Adaboost) special pentru OHC-uri in randul supravietuitorilor de cancer. Nu am folosit lista de cuvinte in afara raftului, deoarece analiza sentimentelor ar trebui sa fie specifica contextului. Unele cuvinte pot avea un sentiment diferit in acest context decat de obicei. De exemplu, cuvantul „pozitiv” poate fi un lucru rau pentru un supravietuitor de cancer daca diagnosticul este pozitiv. Rata de precizie a clasificatorului nostru este aproape de 80%.

I – Ce raspunsuri / perspective ai descoperit?

A – Atunci cand gasesc utilizatori influenti, volumul contributiilor unuia a facut probleme, dar modul in care ceilalti reactioneaza la contributiile cuiva este, de asemenea, extrem de valoros, deoarece prin astfel de reactii, influenta interpersonala este reflectata si astfel masurata.

I – Care sunt urmatorii pasi / unde altfel s-ar putea aplica acest lucru?

A – Am dori sa investigam in continuare natura asistentei in cadrul OHC-urilor, astfel incat sa putem construi profiluri comportamentale ale utilizatorilor si sa proiectam mai bine astfel de comunitati pentru a-si ajuta membrii.

Foarte interesant – asteapta cu nerabdare sa urmaresti pe viitor toate diferitele cai de cercetare! In cele din urma, este timpul de sfaturi! …

I – Cum arata viitorul invatarii automate?

A – Aceasta este o intrebare grea. Nu stiu raspunsul exact, dar cred ca ML se va dezvolta pe doua directii. Primul ar fi pe partea algoritmului – algoritmi mai buni si mai eficienti pentru datele mari, precum si invatarea automata care imita inteligenta umana la un nivel mai profund. Al doilea ar fi in ceea ce priveste cererea – cum sa faci ML sa fie inteleasa si disponibila publicului larg? Cum de a face algoritmi ML la fel de usor de utilizat ca MS Word si Excel?

I – Exista cuvinte de intelepciune pentru studentii sau practicienii de invatare automata?

A – Nu sunt sigur daca cuvintele mele sunt de o intelepciune reala, dar as spune pentru un incepator, este cu siguranta important sa intelegem algoritmii ML. Intre timp, este la fel de important sa dezvoltam mentalitatea corecta – un om de stiinta de date trebuie sa fie capabil sa vina cu idei / intrebari interesante si importante atunci cand i se ofera anumite date. Cu alte cuvinte, trebuie sa invatam cum sa raspundem la intrebarea – „Acum avem datele, ce putem face cu ea?”. Acest lucru este foarte valoros in era datelor mari.

Kang – Multumesc mult pentru timpul acordat! Mi-a placut foarte mult sa aflati mai multe despre cercetarea dvs. si despre aplicarea acesteia la problemele din lumea reala.

Kang poate fi gasit online la pagina sa de cercetare si pe twitter.

Cititorilor, multumim ca te-ai alaturat!

PSI Daca v-a placut acest interviu si doriti sa aflati mai multe despre

ceea ce este nevoie pentru a deveni un om de date
de ce abilitati am nevoie
ce tip de lucru se desfasoara in prezent in domeniu

apoi consultati Data Scientists at Work – o colectie de 16 interviuri cu unii dintre cei mai influenti si inovatori oameni de stiinta din lume, care se adreseaza fiecaruia de mai sus si mai mult! 🙂

Modul de invatare a masinii se poate transforma Dating online: Interviu Kang Zhao | DataScienceWeekly.org

Populare

Afacere proprie, angajat la stat sau angajat la privat? Pro &...

Cum alegi cel mai bun brad de Crăciun?

Afla cum iti poti lansa o mica afacere folosind un spatiu...

Top 10 cele mai supraevaluate filme din toate timpurile

10 regizori care au facut un film de groaza si au...

10 documentare care au schimbat perceptia publicului

Top 10 interviuri controversate cu celebritati din toate timpurile

Top 10 cele mai memorabile momente ale premiilor Oscar

Cum se schimba viata atunci cand intri in cercurile sociale ale...

10 povesti ciudate din lumea rap pe care sa le cunosti