anonyMiserad Datainsamling för trafikSäkerhet - MIDAS
En studie om anonymiserad datainsamling för trafiksäkerhet. Anonymiseringen har i detta projekt fokuserats till ansikten och nummerskyltar.
Beskrivningen av projektet nedan är ett exempel på ett avslutat projekt som beviljats medel från Skyltfonden. Texten uppdateras därför inte. Datumet på sidan uppdateras däremot regelbundet.
När datakrävande metoder som Machine Learning blir allt mer populära tillkommer också ett behov av att samla in stora naturtrogna dataset. Detta kan, emellertid, även riskera att personuppgifter, i till exempel formen av bilder på personer, samlas in utan deras uttryckliga medgivande.
Anonymiseringsalgoritmer är en möjlighet att kunna lösa denna utmaning, men enklare varianter riskerar att även ta bort viktig information som gör datan värdelös för Machine Learning syften. Ett exempel är då delar av bilden klipps bort. Om ett nätverk skulle tränas att förslagsvis detektera fotgängare utifrån bilder med bortklippt ansikten är det sannolikt att nätverket lär sig att leta efter dessa bortklippta delar snarare än fotgängare.
Vi föreslår därför en anonymiseringsmetod som bevarar viktig icke-personlig information och ersätter den borttagna informationen med datorgenererade alternativ. Anonymiseringen har i detta projekt fokuserats till ansikten och nummerskyltar. I fallet för ansikten är det första steget att detektera var i bilden det finns och separera det från resterande del av bilden. Sedan datorgenereras en bild på ett nytt ansikte. Det genererade ansiktet anpassas till att ha samma form som det ursprungliga ansiktet och appliceras i dess ställe.
Vi har utvärderat metoden kvantitativt och kvalitativt. Från den kvantitativa evalueringen gick det att utläsa att en annan Machine Learning algoritm som känner igen bilder på kända personer gick från en identifikationsträffsäkerhet på 100 % till 7 % efter anonymisering. I den kvalitativa utvärderingen skapades en enkät där deltagarna fick gissa vem det var som hade anonymiserats i en uppsättning av bilder på anonymiserade kända personer. Av helkroppsbilder kunde deltagarna känna igen 50,5 % av personerna och i bilder som klippts så att endast ansiktet är kvar 21,6 %. Detta kan jämföras med en detektion för originalbilderna på 87,8 % för helkroppsbilderna och 78,4 % i de oklippta ansiktsbilderna. De element som deltagarna ansåg hade störst betydelse för att göra detektionerna var hår och kläder, vilka inte har anonymiserats. Därav hade ett intressant framtida arbetsområde varit att expandera till andra igenkännbara markörer som hår och kläder.
Rapporten är framtagen med ekonomiskt bidrag från Skyltfonden, Trafikverket. Ståndpunkter och slutsatser i rapporten reflekterar författaren och överensstämmer inte med nödvändighet med Trafikverkets ståndpunkter och slutsatser inom rapportens ämnesområde.
Kontakt: RISE Research Institutes of Sweden, Cristofer Englund tfn +46 70 856 02 27 e-post cristofer.englund@ri.se alternativt Martin Torstensson tfn +46 73 055 60 84 e-post martin.torstensson@ri.se
Trafikverkets beteckning: TRV 2019/108645, anonyMiserad Datainsamling för trafikSäkerhet - MIDAS
Projektet slutrapporterades april 2021.
Slutrapport: anonyMiserad Datainsamling för trafikSäkerhet - MIDAS (pdf, 983 kB)