A l’era digital en la qual vivim, cada vegada és més necessari que l’avanç de la tecnologia no comprometi la seguretat de la informació personal i compleixi amb la protecció de dades.
Per això, les dades sintètiques es presenten com una eina que pretén equilibrar la recopilació i l’ús de dades, i la necessitat d’aquestes, amb la privacitat de les persones. Pel que es converteixen en una alternativa prometedora per protegir les dades personals en segons quins contextos.
Què són les dades sintètiques?
Les dades sintètiques són conjunts de dades generades artificialment, és a dir dades no reals, que imiten les característiques estadístiques i de comportament i les propietats de conjunts de dades reals.
Aquestes dades no contenen informació personal identificable, com ho fan les dades reals, i es creen a partir d’algoritmes i tècniques avançades.
Per això són tan valuoses per empreses i investigadors, ja que a partir d’aquestes dades sintètiques poden desenvolupar i provar models, algoritmes o aplicacions mantenint la confidencialitat i respectant la privacitat.
També poden utilitzar-se com a tècnica de privacitat, quan s’usa per crear conjunts de dades no personals amb la mateixa utilitat que les personals.
En definitiva, les dades sintètiques poden ajudar a superar l’escassetat de dades i millorar tant la qualitat com la diversitat de les dades.
Quins tipus de dades sintètiques existeixen?
Actualment, existeixen dos tipus de dades sintètiques:
- Dades totalment sintètiques: S’han sintetitzat totes les variables del conjunt de dades original (totes les dades no són reals).
- Dades parcialment sintètiques: Només s’han sintetitzat algunes de les variables, per exemple, les més sensibles. Pel que contindrien dades originals amb sintètiques, però tot i així no poden ser identificables.
Com les dades sintètiques contribueixen a la protecció de dades personals?
Les dades sintètiques poden funcionar com una Privacy Enhanced Technology (tecnologia de privacitat millorada), ja que permet minimitzar o evitar el processament de dades personals, aconseguint resultats tan bons com els obtinguts amb dades personals originals.
Les dades sintètiques no han de contenir informació que permeti identificar a una persona, per més que es generi a partir de dades personals reals. Pel que s’han convertit en una eina poderosa per complir amb la protecció de dades, i permetre que les dades personals no estiguin exposades i puguin usar-se en moltes aplicacions.
Alguns dels motius pels quals aquestes dades sintètiques contribueixen a la protecció de dades són:
Preservació de la privacitat:
Les dades sintètiques permeten que les organitzacions puguin realitzar anàlisi i entrenar models sense haver d’exposar informació personal identificable i, per tant, preservant la privacitat dels individus. Ja que es generen dades que imiten patrons estadístics, però no contenen dades específiques dels individus.
Compliment normatiu:
Utilitzant aquest tipus de dades sintètiques, les organitzacions poden complir amb els reglaments de privacitat, com el RGPD, sense haver de sacrificar la qualitat de les dades.
A més, això redueix el risc a cometre infraccions i a rebre sancions per vulnerar la protecció de dades.
Anonimització sense pèrdua d’utilitat:
Es generen conjunts de dades que mantenen les mateixes propietats estadístiques que les dades reals, però sense la informació identificable, sense comprometre la identitat dels individus i respectant el seu anonimat. A la vegada que es manté la utilitat per l’anàlisi i desenvolupament.
Entrenament de models sense riscos:
En l’àmbit de l’aprenentatge automàtic i la intel·ligència artificial, les dades sintètiques són essencials per entrenar models sense exposar dades personals reals que podrien contenir informació sensible.
Això és rellevant en sectors com la salut, on la sensibilitat de les dades requereix més preocupacions.
Innovació responsable:
La utilització de dades sintètiques fomenta la innovació responsable, ja que permet l’avanç tecnològic sense posar en risc la privacitat. Això fa que la investigació i el desenvolupament pugui prosperar sense témer per la vulneració de la privacitat.
En conclusió, les dades sintètiques permeten que s’evolucioni en tecnologia i privacitat a la vegada. Utilitzant dades sintètiques de manera ètica i transparent complim amb els reglaments de protecció de dades i permetem una innovació sostenible i respectuosa amb la privacitat en el món digital.
L’equip de PymeLegal