AWS Clean Rooms lanserar generering av syntetiska dataset för ML-modeller
Amazon Web Services har lanserat en ny funktion i sin tjänst AWS Clean Rooms. Den möjliggör skapandet av integritetsskyddande syntetiska dataset för träning av maskininlärningsmodeller.

Amazon Web Services (AWS) har introducerat en ny funktion i sin tjänst AWS Clean Rooms, som gör det möjligt för organisationer och deras partners att generera integritetsskyddande syntetiska dataset. Dessa dataset kan sedan användas för att träna regressions- och klassificeringsmodeller inom maskininlärning (ML).
Utvecklingen av ML-modeller har länge präglats av en grundläggande spänning mellan behovet av användbar data och skyddet av individers integritet. För att skapa exakta modeller krävs tillgång till detaljerad data, men användningen av individuell data från flera parter medför betydande integritetsrisker och regelefterlevnadsutmaningar.
Den nya funktionen adresserar dessa utmaningar genom att tillåta skapandet av syntetiska versioner av känsliga dataset. Dessa syntetiska dataset bevarar de statistiska egenskaperna hos den ursprungliga datan, samtidigt som de inte exponerar originalinformationen. Detta öppnar nya möjligheter för modellträning i scenarier där integritetsskydd tidigare har varit ett hinder.
Funktionen är integrerad i AWS Clean Rooms ML och använder avancerade ML-tekniker. Den gör det möjligt att besvara frågor om till exempel vilka kundegenskaper som indikerar en hög sannolikhet för konvertering, utan direkt åtkomst till enskilda signaler som kan strida mot integritetspolicyer eller regulatoriska krav.