Modelul de inteligenta artificiala a aratat o mare promisiune in ceea ce priveste predictia pacientilor tratati in spitalele pentru afaceri ale veteranilor din SUA vor avea o scadere brusca a functiei renale. Dar a venit si cu o problema cruciala: femeile au reprezentat doar aproximativ 6% dintre pacientii ale caror date au fost folosite pentru a antrena algoritmul si s-a comportat mai grav atunci cand au fost testate pe femei.

Deficientele acelui algoritm cu profil inalt, construit de compania sora Google DeepMind, evidentiaza o problema de care cercetatorii care invata in masini lucreaza in medicina sunt din ce in ce mai ingrijorati. Si este o problema care poate fi mai plina de viata – si mai insidioasa – decat au realizat expertii anterior, sugereaza noi cercetari.

Studiul, condus de cercetatorii din Argentina si publicat luni in jurnalul PNAS, a constatat ca atunci cand pacientii de sex feminin au fost excluse sau subreprezentate in mod semnificativ in datele de instruire utilizate pentru a dezvolta un model de invatare automata, algoritmul s-a comportat mai rau in diagnosticarea lor atunci cand au fost testate peste tot o gama larga de afectiuni medicale care afecteaza zona toracica. Acelasi tipar a fost vazut atunci cand barbatii au fost lasati in afara sau subreprezentati.

publicitate

„Este o poveste atat de valoroasa despre modul in care prejudecata intra in algoritmi”, a spus Ziad Obermeyer, de la Universitatea din California, Berkeley, medic care studiaza invatarea masinii si aplicatiile sale de politica clinica si de sanatate. „Combinarea rezultatelor lor, cu faptul ca seturile de date pe care acesti algoritmi sunt instruiti adesea nu acorda atentie acestor masuri de diversitate, se simte cu adevarat importanta”, a adaugat Obermeyer, care nu a fost implicat in studiu.

Cercetatorii din Argentina s-au concentrat pe una dintre cele mai populare aplicatii ale AI in medicina: analizarea imaginilor pentru a incerca sa faca un diagnostic. Sistemele examinate au fost insarcinate cu analizarea unei imagini cu raze X a regiunii toracice pentru a detecta prezenta sau absenta a 14 afectiuni medicale, inclusiv hernii, pneumonii si o marire a inimii.

publicitate

Cercetatorii au evaluat trei algoritmi de invatare a masinilor open-source – cunoscute sub numele de DenseNet-121, ResNet si Inception-v3 – care sunt utilizate pe scara larga experimental in comunitatea de cercetare, dar nu sunt inca dislocate comercial pentru a fi utilizate in clinica. Cercetatorii si-au propus sa antreneze modelele pe datele din doua seturi de date open-source – intretinute de Institutele Nationale de Sanatate si Universitatea Stanford – care contin imagini cu radiografie toracica de la zeci de mii de pacienti.

Aceste doua seturi de date sunt echilibrate in mod rezonabil in functie de sex – 56,5% din imaginile din setul de date NIH sunt de la pacienti barbati, comparativ cu aproximativ 60% din setul de date Stanford – si astfel intr-un cadru de cercetare normala, cercetatorii AI care folosesc aceste seturi de date nu ar fi avut sa-ti faci griji mult in legatura cu sexul in datele lor de pregatire.

Insa, in scopul experimentului lor, cercetatorii au introdus in mod intentionat skew-ul, uitandu-se la doar un subset al acelor imagini defalcate cu strictete de-a lungul liniilor sexului biologic. Au creat cinci seturi de date de instruire diferite, care prezinta defalcari diferite: 100% imagini de la pacienti de sex feminin, 100% imagini de la pacienti barbati, 75% imagini de la pacienti de sex feminin si 25% imagini de la pacienti de sex masculin, 75% imagini de la pacienti de sex masculin si 25% imagini de la pacienti de sex masculin pacienti de sex feminin si o despartire de 50/50. (Cercetatorii au contabilizat marimea esantionului folosind acelasi numar de imagini in fiecare set de date.)

Cercetatorii au instruit algoritmii pe fiecare set de date, apoi i-au testat pe imagini de la pacienti barbati sau femei. Tendinta a fost clara: in conditiile medicale, algoritmii s-au comportat mai prost atunci cand au fost testate la pacientii al caror sex a fost subreprezentat in datele de instruire. Si faptul ca a fost suprareprezentat, de asemenea, nu parea sa aduca niciun avantaj sexului: atunci cand modelul a fost instruit exclusiv sau mai ales pe femei, nu s-a comportat mai bine atunci cand a fost testat pe femei, comparativ cu datele de formare au fost impartite uniform pe sexe.

Enzo Ferrante, autorul principal al studiului, a declarat ca cercetarea s-a inspirat in parte dintr-un rasturnare declansat in 2015, cand un algoritm de recunoastere a imaginilor Google – instruit inadecvat pe imaginile persoanelor cu pielea inchisa la culoare – a caracterizat in mod gresit fotografii ale oamenilor negri drept gorile.

Concluziile publicate in lucrarea PNAS ar trebui sa reiteasca cercetatorilor AI cat de important este sa folositi date de instruire diverse care „includ toate caracteristicile persoanelor in care veti testa modelul”, a spus Ferrante, care studiaza calcularea imaginii medicale la un nivel de varf. universitate si un institut de cercetare lider in Argentina.

Cercetarea nu a interogat de ce, mai exact, un model instruit pe barbati s-a agravat atunci cand a fost testat pe femei. O parte din aceasta este probabil fiziologica – piepturile barbatilor si femeilor sunt anatomice diferite, pana la urma – dar pot exista si alti factori in joc.

De exemplu, femeile pot fi diagnosticate sau pot lua radiografii mai devreme sau mai tarziu in evolutia bolii lor in comparatie cu barbatii, ceea ce ar putea afecta modul in care acele imagini apar in total in datele de instruire, a spus Irene Chen, doctorand. student la Laboratorul de Informatica si Inteligenta Artificiala al MIT care studiaza echitabil in invatamant automat pentru luarea deciziilor clinice si nu a fost implicat in lucrarea PNAS.

Aceste diferente potentiale in modul in care barbatii si femeile sunt diagnosticate reprezinta „un mecanism mult mai tulburator, deoarece inseamna ca aceste prejudecati sunt incorporate in rezultatele care sunt codificate in setul de date”, a spus Obermeyer.

In anumite cazuri, provocarile reprezentarii sexului echitabil in datele de instruire sunt mai mari. Pentru unele boli si populatii, chiar si cei mai constienti cercetatori ai AI nu au de ales decat sa lucreze cu un set de date extrem de inclinat in ceea ce priveste sexul.

Luati autismul, care este diagnosticat intr-un ritm semnificativ mai mare la baieti decat la fete, in parte datorita faptului ca afectiunea se manifesta diferit intre sexe. Iar cercetatorii care studiaza populatiile militare – cum ar fi echipa DeepMind, care si-a dezvaluit algoritmul pentru a prezice o afectiune a rinichilor in vara trecuta in jurnalul Nature – trebuie sa lucreze, de asemenea, cu date care intepenesc foarte mult barbatii.

Pe partea de basculare, cercetatorii care dezvolta algoritmi pentru utilizarea in cancerul de san trebuie sa se analizeze aproape in totalitate de la pacientii de sex feminin – iar modelele lor nu pot functiona la fel de bine atunci cand sunt utilizate la barbatii cu cancer de san. Mai mult, s-ar putea dovedi dificil sa construiti algoritmi pentru afectiunile medicale care afecteaza comunitatea intersex, la fel ca in cazul altor afectiuni rare, deoarece nu exista doar suficienti pacienti care sa furnizeze datele de instruire necesare pentru ca modelele sa fie exacte.

Companiile au fost construite si cariere academice dedicate sa gaseasca modalitati tehnice de a face fata acestor provocari.

escorte in tasnad http://86f.wolftraxpercussion.com/__media__/js/netsoltrademark.php?d=escortelux.vip/
escorte rin grand hotel http://backupmypc.com/__media__/js/netsoltrademark.php?d=escortelux.vip/
escorte total sibiu http://plaidgiraffe.com/__media__/js/netsoltrademark.php?d=escortelux.vip/
escorte teiul doamnei http://garagedoorsofmemphis.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/alba
escorte filias http://ny-departmentofhealth.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/arad
site-uri de escorte http://hardwoodpurchasinghdbk.net/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/arges
escorte focsanni http://www.f-score.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/bacau
escorte de ias http://www.videodl.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/bihor
escorte recomandate http://koura.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/bistrita-nasaud
escorte care au orgasm http://aimretirement.biz/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/botosani
escorte racadau http://arcaman.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/braila
escorte bacau mature http://greekvirginoliveoil.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/garbau
publi24 escorte http://osservamedia.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/geaca
filme porno escorte http://litparade.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/gherla
siteuri de escorte http://newenglandsurveysystems.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/gilau
topic escorte http://oneelevengroup.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/huedin
escorte amatoare bucuresti http://guo.funmovie.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/iara
escorte noi oradea http://www.1000truefans.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/iclod
escorte anuntul.ro http://doctorwoo.com/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/izvoru-crisului
escorte tenerife http://usliabilityinsurance.org/__media__/js/netsoltrademark.php?d=escortelux.vip/escorte/cluj/jichisu-de-jos

Un prim pas cheie, au spus cercetatorii consultati de STAT, este constientizarea limitarilor impuse de seturile de date de instruire care nu sunt reprezentative. „Ar trebui sa le comunicam, ar trebui sa le cuantificam si apoi ar trebui sa lucram cu clinicienii si cu oricine doreste sa utilizeze acesti algoritmi pentru a descoperi o modalitate de a se acomoda cu oricare dintre limitarile inteligentei artificiale”, a spus Chen.

Lucrarea PNAS este cea mai recenta cercetare pentru a explora impactul prejudecatii in algoritmi pentru utilizare clinica. Intr-o lucrare postata pe un server de preimprimare la inceputul acestui an, o echipa condusa de cercetatori de la Universitatea din Toronto a examinat, de asemenea, datele radiografiei toracice utilizate pentru antrenarea algoritmilor de diagnostic; ei au descoperit ca factori precum sexul, varsta, rasa si tipul de asigurare al pacientilor din datele de instruire au fost asociate cu cat de bine au functionat modelele.

Intr-o lucrare difuzata publicata toamna trecuta, o echipa condusa de cercetatori de la Universitatea din Chicago a gasit prejudecati rasiale intr-un algoritm al grupului UnitedHealth utilizat pe scara larga de sistemele de sanatate din SUA pentru a identifica pacientii care ar putea avea nevoie de sprijin suplimentar. Algoritmul, vandut de unitatea OptH de la UnitedHealth, s-a bazat pe datele privind cererile de asigurare si proiectiile de costuri care au ajuns sa clasifice pacientii albi ca fiind mai bolnavi decat colegii lor negri – chiar daca pacientii negri erau la fel de bolnavi.

Aceasta face parte dintr-o serie lunga de articole care exploreaza utilizarea inteligentei artificiale in asistenta medicala, finantata partial dintr-o subventie din  fondul Commonwealth .