Vad är differentiell integritet och hur håller det mina data anonym?
Apple strävar efter att se till att de data som samlar in från dig är privata. På vilket sätt? Genom att använda något som heter "Differential Privacy."
Vad är differentiell sekretess?
Apple förklarar det som sådant:
Apple använder Differential Privacy-teknik för att upptäcka användningsmönster för ett stort antal användare utan att äventyra enskild integritet. För att dölja en persons identitet lägger Differential Privacy till matematiskt brus till ett litet urval av individens användningsmönster. När fler människor delar samma mönster börjar generella mönster komma fram, vilket kan informera och förbättra användarupplevelsen.
Filosofin bakom differentiell sekretess är den här: En användare vars apparat, oavsett om det är en iPhone, iPad eller Mac, lägger till en beräkning till en större pool av aggregerade data (en stor bild som bildas av olika mindre bilder), bör inte avslöjas som källan, än mindre vilka data de bidrog med.
Apple är inte det enda företaget som gör det, antingen - både Google och Microsoft använde det ännu tidigare. Men Apple publicerade det genom att prata om det i detalj vid sin 2016 WWDC-nyckel.
Så hur skiljer det sig från andra anonymiserade data, frågar du? Tja, anonymiserade data kan fortfarande användas för att döma personlig information om du vet tillräckligt om en person.
Låt oss säga att en hackare kan komma åt en anonymiserad databas som avslöjar ett företags löneavgift. Låt oss säga att de också vet att Medarbetare X flyttar till ett annat område. Hackaren kunde då enkelt fråga databasen före och efter att Medarbetare X flyttar och enkelt dras av sin inkomst.
För att skydda Employee Xs känsliga uppgifter, ändrar differentiell sekretess data med matematiskt "brus" och andra tekniker, så att du om du frågar databasen får bara en approximation av hur mycket (eller någon annan) Medarbetare X betalades.
Därför bevaras hans integritet på grund av skillnaden mellan de data som tillhandahålls och det buller som läggs till det, så det är då oklart att det är praktiskt taget omöjligt att veta om den data du tittar på faktiskt är en viss individs.
Hur fungerar Apples olika personuppgifter?
Differentiell integritet är ett relativt nytt koncept, men tanken är att den kan ge ett företag en skarp insikt utifrån uppgifter från sina användare utan att veta vad exakt Dessa uppgifter säger eller från vem det härrör från.
Apple förlitar sig till exempel på tre komponenter för att få det att fungera för olika sekretessskydd på din Mac eller iOS-enhet: hashing, subsampling och ljudinsprutning.
Hashing tar en sträng text och gör den till ett kortare värde med en fast längd och blandar dessa nycklar upp i irreversibelt slumpmässiga strängar med unika tecken eller "hash". Detta döljer dina data så att enheten inte lagrar någon av den i sin ursprungliga form.
Subsampling betyder att i stället för att samla varje ord en persons typer, kommer Apple endast att använda ett mindre urval av dem. Låt oss till exempel säga att du har en lång textkonversation med en vän som liberellt använder emoji. I stället för att samla hela samtalet kan subsampling istället bara använda de delar som Apple är intresserad av, som emoji.
Slutligen injicerar din enhet brus och lägger till slumpmässiga data i originaldatasetet för att göra det mer vagt. Det betyder att Apple får ett resultat som har blivit maskerat någonsin så lite och därför inte helt exakt.
Allt detta händer på din enhet, så det har redan förkortats, blandats upp, samplats och suddat innan det ens skickas till molnet för att Apple ska analysera.
Var används Apples olika sekretess?
Det finns en mängd olika fall där Apple makt vill samla in data för att förbättra sina appar och tjänster. Just nu använder Apple dock bara Differential Privacy på fyra specifika områden.
- När tillräckligt med folk ersätter ett ord med en viss emoji blir det ett förslag för alla.
- När nya ord läggs till i tillräckligt många lokala ordböcker för att betraktas som vanligt kommer Apple att lägga till det till andras ordlista också.
- Du kan använda ett sökord i Spotlight, och det kommer då att ge appförslag och öppna den länken i appen eller låta dig installera den från App Store. Till exempel, säg att du söker efter "Star Trek", som föreslår IMDB-appen. Ju fler människor öppnar eller installerar IMDB-appen, desto mer kommer det att visas i allas sökresultat.
- Det kommer att ge mer exakta resultat för Lookup Hints i Notes. Till exempel, säg att du har en anteckning med ordet "äpple" i den. Du gör en sökning och det ger dig resultat inte bara för ordbordsdefinitionen utan även Apples webbplats, Apple Stores, etc. Förmodligen ju fler människor knappar på vissa resultat, ju högre och oftare kommer de att visas i Lookup för alla andra.
Låt oss använda emojis som ett exempel. IOS introducerade en ny emoji-ersättningsfunktion på iMessage. Skriv ordet "kärlek" och du kan ersätta det med en hjärtemoji. skriv ordet "hund" och-du gissade det-du kan ersätta den med en hund-emoji.
På samma sätt är det möjligt för din iPhone att förutsäga vilken emoji du vill ha om det, om du skriver ett meddelande "Jag ska gå hunden" kommer din iPhone att rekommendera hunden emoji.
Så, Apple tar alla de små bitarna av iMessage-data som samlar in, granskar dem som helhet och kan härleda mönster från vad folk skriver och i vilket sammanhang. Det betyder att din iPhone kan ge dig smartare val eftersom det drar nytta av alla de textkonversationer som andra skapar och tycker, "det här är förmodligen den emoji du vill ha."
Det tar en by (av Emoji)
Nackdelen med Differential Privacy är att det inte ger exakta resultat i småprover. Det är kraften i att göra specifika data vaga så att den inte kan tillskrivas någon användare. För att det ska fungera och fungera bra måste många användare delta.
Det är som att titta på en bitmappad bild upp extremt nära. Du kan inte se vad det är om du tittar på bara några bitar, men när du går tillbaka och tittar på det hela blir bilden tydligare och mer definierad, även om den inte är superhög upplösning.
För att förbättra emoji-ersättning och förutsägelse (bland annat) behöver Apple därför samla iPhone- och Mac-data från hela världen för att ge den en allt tydligare bild av vad människor gör och därigenom förbättra sina appar och tjänster. Det vänder sig till alla dessa randomiserade, bullriga, crowdsourced data, och gruvor det för mönster-som hur många användare använder persikosemoji istället för "rumpa".
Så kraften i Differential Privacy beror på att Apple kan undersöka stora mängder aggregerad data samtidigt som det säkerställs att det inte är någon som är klokare om vem som skickar dem den data.
Hur man väljer bort olika sekretess i iOS och macOS
Om du fortfarande inte är övertygad om att Differential Privacy är rätt för dig, har du lycka till. Du kan välja bort direkt från enhetens inställningar.
På din iOS-enhet, tryck på öppna "Inställningar" och sedan "Sekretess".
På skärmen Sekretess trycker du på "Diagnostik och användning".
Slutligen, på skärmen Diagnostics & Usage, tryck på "Skicka inte".
På MacOS öppnar du Systeminställningar och klickar på "Säkerhet och sekretess".
Klicka på fliken "Sekretess" i fönstret Säkerhet och sekretess, och se till att "Skicka diagnostik och användningsdata till Apple" är avmarkerad. Observera att du måste klicka på låsikonen i nedre vänstra hörnet och ange ditt systemlösenord innan du kan göra den här ändringen.
Självklart finns det mycket mer till Differential Privacy, både i teorin och applikation, än denna förenklade förklaring. Köttet och potatisen är beroende av en viss allvarlig matematik och kan därför bli ganska tung och komplicerad.
Förhoppningsvis ger det dig en uppfattning om hur det fungerar och att du känner dig mer säker på att företagen samlar in vissa uppgifter utan rädsla för att identifieras.