Ingen X-aggeration: Hvordan bedrifter kan samle informasjon og fortsatt bevare personvern


Bedrifter og enkeltpersoner er ofte i strid, bekymret enten med å samle inn informasjon eller med å bevare personvern. Nettbutikker og tjenester er alltid ivrige etter å vite mer om sine kunders inntekt, alder, smak - mens de fleste av oss ikke er ivrige etter å avsløre mye. Math foreslår en vei ut av dette bindet. For

Bedrifter og enkeltpersoner er ofte i strid, bekymret enten med å samle inn informasjon eller med å bevare personvern. Nettbutikker og tjenester er alltid ivrige etter å vite mer om sine kunders inntekt, alder, smak - mens de fleste av oss ikke er ivrige etter å avsløre mye.

Math foreslår en vei ut av dette bindet. For noen år siden utviklet Rakesh Agrawal og Ramakrishnan Srikant, begge data miningforskere, en ide som gjør at sannheten blir mindre bekymringsfull. Ideen fungerer hvis selskapene er tilfreds med nøyaktige aggregerte data og ikke detaljer om enkeltpersoner. Slik går det: Du gir det numeriske svaret på visse påtrengende online spørsmål, men et tilfeldig tall legges til (eller trekkes fra) det, og bare summen (eller forskjellen) blir sendt til selskapet. Statistikken som trengs for å gjenopprette omtrentlige gjennomsnitt fra de innleverte tallene, er ikke så vanskelig, og personvernet ditt er bevart.

Så si at du er 39 og blir spurt din alder. Nummeret som sendes til nettstedet, kan være hvor som helst i området 19 til 59, avhengig av et tilfeldig tall mellom -20 og +20 som genereres (av selskapet hvis du stoler på det, av et uavhengig nettsted eller av deg). Lignende fudgefaktorer vil gjelde for inntekter, postnummer, år med skolegang, familiestørrelse og så videre, med passende intervaller for det genererte tilfeldige tallet.

Et annet, eldre eksempel fra sannsynlighetsteori illustrerer en variant av ideen. Tenk deg at du er på en organisasjonss nettsted, og organisasjonen ønsker å finne ut hvor mange av sine abonnenter som helst har X-ed, med X å være noe pinlig eller ulovlig. Ikke overraskende, mange vil lyve hvis de svarer på spørsmålet i det hele tatt. Nok en gang kommer tilfeldig masking til redning. Nettstedet spør spørsmålet, "Har du noen gang X-ed? Ja eller nei, "men ber om at du, før du svarer på det, videresender en mynt. Hvis mynten lander hoder, ber vi om at du bare svarer ja. Hvis mynten lander haler, blir du bedt om å svare sannferdig. Fordi et ja svar kanskje bare viser en mynts landingshoder, ville folk antakelig ha liten grunn til å lyve.

Matematikken som trengs for å gjenopprette en tilnærming av prosentandelen av respondenter som har X-ed, er lett. For å illustrere: Hvis 545 av 1000 svar er ja, ville vi vite at om lag 500 av disse yessene var resultatet av myntenes landingshoder fordi omtrent halvparten av alle myntflipene ved en tilfeldighet ville være hoveder. Av de andre ca 500 personer som mønt landede haler, svarte 45 av dem også ja. Vi konkluderer med at fordi 45 eller så av de omtrent 500 som svarte sannheten har X-ed, er prosentandelen av X-ers omtrent 45/500 eller 9 prosent.

I noen situasjoner ville varianter av denne lavteknologiske teknikken, sammen med passende lovgivning, virke - eller så tenker denne 6'9'-X-eren.

OM AUTOREN (S)

Paulos er professor i matematikk ved Temple University (www.math.temple.edu/paulos).

Siste nytt

Hva har en ubåt, en rakett og en fotball til felles?Storms kan øke hastigheten på ozonet over USADel 8: Håndtering av Habitat DestructionEr naturgass mer klimavennlig?  Forskere kart Tusenvis av lekkasjer i Washington, DCStamcellebehandling for hjertesvikt får en Gull-Standard-prøveTviler Cloud Claims of Metallic HydrogenMenneskelig overbefolkning: Fortsatt et problem av bekymring?Batter Up: Shattering Sticks Opprett fare i MLB Ballparks