• 21.01.2020
  • 4 minute de citit

In acest articol

Aflati despre confidentialitatea diferentiala in invatarea automata si cum functioneaza.

Pe masura ce creste cantitatea de date pe care o organizatie le colecteaza si le foloseste pentru analize, creste si preocuparile privind confidentialitatea si securitatea. Analizele necesita date. De obicei, cu cat sunt utilizate mai multe date pentru instruirea modelelor, cu atat sunt mai precise. Cand informatiile personale sunt utilizate pentru aceste analize, este deosebit de important ca datele sa ramana private pe toata durata utilizarii lor.

Cum functioneaza confidentialitatea diferentiala

Confidentialitatea diferentiala este un set de sisteme si practici care ajuta la pastrarea datelor individuale in siguranta si private.

In scenariile traditionale, datele brute sunt stocate in fisiere si baze de date. Cand utilizatorii analizeaza date, utilizeaza de obicei datele brute. Aceasta este o preocupare, deoarece ar putea aduce atingere confidentialitatii unei persoane. Confidentialitatea diferentiala incearca sa rezolve aceasta problema adaugand „zgomot” sau aleatorie la date, astfel incat utilizatorii sa nu poata identifica puncte de date individuale. Cel putin, un astfel de sistem ofera o negare plauzibila. Prin urmare, confidentialitatea persoanelor este pastrata cu impact limitat asupra acuratetei datelor.

In sistemele private diferentiate, datele sunt partajate prin cereri numite interogari . Atunci cand un utilizator trimite o interogare pentru date, operatiunile cunoscute sub numele de mecanisme de confidentialitate adauga zgomot datelor solicitate. Mecanismele de confidentialitate returneaza o aproximare a datelor in locul datelor brute. Acest rezultat de pastrare a confidentialitatii apare intr-un raport . Rapoartele constau din doua parti, datele reale calculate si o descriere a modului in care au fost create datele.

Valori de confidentialitate diferentiale

Confidentialitatea diferentiala incearca sa protejeze impotriva posibilitatii ca un utilizator sa produca un numar nedefinit de rapoarte pentru a dezvalui in cele din urma date sensibile. O valoare cunoscuta sub numele de epsilon masoara cat de zgomotos sau privat este un raport. Epsilon are o relatie inversa cu zgomotul sau confidentialitatea. Cu cat epsilonul este mai mic, cu atat datele sunt mai zgomotoase (si private).

Valorile Epsilon nu sunt negative. Valorile sub 1 ofera o negare deplina plauzibila. Orice lucru peste 1 vine cu un risc mai mare de expunere a datelor reale. Pe masura ce implementati sisteme private diferentiate, doriti sa produceti rapoarte cu valori epsilon cuprinse intre 0 si 1.

O alta valoare direct corelata cu epsilon este delta . Delta este o masura a probabilitatii ca un raport sa nu fie complet privat. Cu cat este mai mare delta, cu atat este mai mare epsilonul. Deoarece aceste valori sunt corelate, epsilon este utilizat mai des.

Limitati interogarile cu un buget de confidentialitate

Pentru a asigura confidentialitatea in sistemele in care sunt permise mai multe interogari, confidentialitatea diferentiala defineste o limita de tarif. Aceasta limita este cunoscuta sub numele de buget de confidentialitate . Bugetele de confidentialitate impiedica recrearea datelor prin mai multe interogari. Bugetelor de confidentialitate li se aloca o suma epsilon, de obicei intre 1 si 3 pentru a limita riscul de reidentificare. Pe masura ce se genereaza rapoarte, bugetele de confidentialitate tin evidenta valorii epsilon a rapoartelor individuale, precum si a agregatului pentru toate rapoartele. Dupa ce un buget de confidentialitate este cheltuit sau epuizat, utilizatorii nu mai pot accesa date.

Fiabilitatea datelor

Desi mentinerea confidentialitatii ar trebui sa fie obiectivul, exista un compromis in ceea ce priveste utilizabilitatea si fiabilitatea datelor. In analiza datelor, precizia poate fi considerata ca o masura a incertitudinii introduse prin erori de esantionare. Aceasta incertitudine tinde sa se incadreze in anumite limite. Acuratetea dintr-o perspectiva diferentiala de confidentialitate masoara in schimb fiabilitatea datelor, care este afectata de incertitudinea introdusa de mecanismele de confidentialitate. Pe scurt, un nivel mai ridicat de zgomot sau confidentialitate se traduce prin date care au un epsilon, o precizie si o fiabilitate mai mici.

Biblioteci de confidentialitate diferentiale open-source

SmartNoise este un proiect open-source care contine diferite componente pentru construirea sistemelor private diferentiate la nivel global. SmartNoise este alcatuit din urmatoarele componente de nivel superior:

  • Biblioteca SmartNoise Core
  • Biblioteca SmartNoise SDK

SmartNoise Core

Biblioteca de baza include urmatoarele mecanisme de confidentialitate pentru implementarea unui sistem privat diferentiat:

Analiza descrierii componentelor O descriere grafica a calculelor arbitrare. Validator O biblioteca Rust care contine un set de instrumente pentru verificarea si derivarea conditiilor necesare pentru ca o analiza sa fie privata in mod diferentiat. Runtime Mediul pentru executarea analizei. Runtime de referinta este scris in Rust, dar runtimes poate fi scris folosind orice cadru de calcul, cum ar fi SQL si Spark, in functie de nevoile dvs. de date. Legaturi Legaturi de limba si biblioteci de ajutor pentru a construi analize. In prezent SmartNoise ofera legaturi Python.

SDK SmartNoise

Biblioteca de sistem ofera urmatoarele instrumente si servicii pentru lucrul cu date tabulare si relationale:

Descriere componenta Biblioteca de acces la date care intercepteaza si proceseaza interogari SQL si produce rapoarte. Aceasta biblioteca este implementata in Python si accepta urmatoarele surse de date ODBC si DBAPI:

  • PostgreSQL
  • SQL Server
  • Scanteie
  • Preston
  • Panda

Serviciu de executare a serviciului care ofera un punct final REST pentru a servi cereri sau interogari impotriva surselor de date partajate. Serviciul este conceput pentru a permite compunerea modulelor de confidentialitate diferentiale care functioneaza la cereri care contin valori delta si epsilon diferite, cunoscute si sub numele de cereri eterogene. Aceasta implementare de referinta explica impactul suplimentar al interogarilor asupra datelor corelate. Evaluator Evaluator stocastic care verifica incalcarile confidentialitatii, acuratetea si partinirea. Evaluatorul accepta urmatoarele teste:

  • Test de confidentialitate – Determina daca un raport respecta conditiile de confidentialitate diferentiala.
  • Test de precizie – Masoara daca fiabilitatea rapoartelor se incadreaza in limitele superioare si inferioare, avand in vedere un nivel de incredere de 95%.
  • Test de utilitate – Determina daca limitele de incredere ale unui raport sunt suficient de apropiate de date, maximizand totusi confidentialitatea.
  • Test de partinire – Masoara distributia rapoartelor pentru interogari repetate pentru a se asigura ca acestea nu sunt dezechilibrate

Pasii urmatori

Cum sa construiti un sistem privat diferentiat in Azure Machine Learning.

Pentru a afla mai multe despre componentele SmartNoise, consultati depozitele GitHub pentru mostrele SmartNoise Core, SDK SmartNoise si SmartNoise.

dorcel film streaming martina smeraldi fakehub
sofia siena porno martina smeraldi film porno
video cento x cento martina smeraldi fisting
malena la.pugliese video martina smeraldi fuck
malena cumshot martina smeraldi full video
malena la pugliese streaming video martina smeraldi gang bang
video porno centopercento martina smeraldi gangbang
gemma porno martina smeraldi hard
martina smeraldi max felicitas porn martina smeraldi hd
due cazzi enormi martina smeraldi hot
malena hard video martina smeraldi lesbian
porn italia hd martina smeraldi lesbo
melena e rocco martina smeraldi malena porn
free italian porn video martina smeraldi malena porno
michelle ferrari cum martina smeraldi max
porno a roma martina smeraldi max felicitas porn
video veronica le bon martina smeraldi max felicitas porno
porno hd malena martina smeraldi naked
ramon porno martina smeraldi porn
mogliettina porno martina smeraldi porn hub