Social media, privacy en social semantic web… Weten wat niet wordt gedeeld.

social semantic datamining

Als ontwikkelaar van social media software wordt me vrij vaak de volgende stelling voorgeschoteld: “Als ik mijn profiel op een sociale netwerksite afscherm, dan is mijn privacy toch gewaarborgd? Dan weet je toch niets van mij?” Een zeer onjuiste aanname als je begrijpt dat er een verschil is tussen “niets weten” en “niets kunnen weten”. De uitleg doet het vaak goed op borrels en lezingen, dus allicht ook op de Yocter Social Media Blog.

Sociale netwerken en privacy

Er zijn allerlei sociale netwerken die allen verschillend omgaan met privacy. Of het nu gaat om Facebook, Twitter, Hyves of welk sociaal netwerk dan ook, allen worden door privacy waakhonden geregeld van van alles en nog wat beticht. Deze waakhonden claimen ‘gevaarlijke lekken’ te hebben ‘ontdekt’, waar het echter (mijns inziens) in veel gevallen echter gaat om verkregen inzicht over hoe verbanden kunnen worden gelegd die op sociale netwerken eng en gevaarlijk lijken, terwijl ze in het normale leven al millennia worden toegepast en uitgebuit. Ik ga dan ook niet specifiek in op een sociaal netwerk of wie op welke manier profielen beschermt, maar wil graag aantonen hoe Yocter met slimme software en op legale wijze (!!) meer over een beschermd profiel te weten kan komen. Deels om u te behoeden maar uiteraard ook om u inzicht te geven hoe deze informatie relevant kan zijn voor het bedrijfsleven.

Wat is een beschermd profiel?

Godfried van Loo - FacebookZelf heb ik een afgeschermd Facebook profiel. Als je niet bent ingelogd zie je helemaal niets, maar na een account te hebben aangemaakt en in te loggen zul je wanneer we geen vrienden zijn naast mijn naam en een profiel foto alsnog meer over mij te weten komen (als we even aannemen dat het analyseren van mijn profiel foto wel erg veel werk wordt om daar informatie uit te halen).
Je ziet niet wie mijn vrienden zijn, hoe oud ik ben, of ik een relatie heb, of ik van lezen houd… niets van dat alles. Het enige wat je zeker kunt weten, is dat ik een account bij Facebook heb.

Social semantic datamining (1)

Maar zoals in de introductie aangekondigd, gaat het niet om wat je weet, maar wat je kunt weten. Ik zal aan de hand van mijn eigen Facebook profiel uitleggen hoe ik met social semantic datamining (zoals ik het zelf noem) veel meer informatie kan achterhalen.

Social Semantic Datamining: Het verzamelen van data en door het leggen van verbanden in het social media landschap een zelf lerende database aanleggen

Social semantic datamining betekent zoveel als: “Het verzamelen van data en door het leggen van verbanden in het social media landschap een zelf lerende database aanleggen”. Dit klinkt ingewikkelder dan het is. Open maar eens wat foto albums van een willekeurig persoon of ga door een stapel ontvangen kerstkaarten, en je weet binnen een paar minuten meer over iemand dan die persoon zelf kan (of wil) vertellen.

social mediaKortom, wat we nodig hebben om meer over mij te weten te komen is data. Veel data. Nu deel ik niet wie mijn vrienden zijn, maar dat wil niet zeggen dat mijn vrienden hetzelfde doen. Immers, mijn vrienden heb ik niet in de hand en die delen wel dat ik een vriend ben, zoals Mladen en Samù bijvoorbeeld. Kortom, als ik niet wil zeggen wie mijn vrienden zijn, dan kijk je gewoon bij naar mensen die zeggen dat ze vrienden met mij zijn.

Als we vervolgens ook de vrienden van die vrienden verzamelen en zo een paar tientallen of honderdtallen profielen bij elkaar hebben die wel informatie delen, kijken we naar andere informatie die wordt gedeeld. Zoals de gemiddelde leeftijd van deze groep, het percentage mensen dat een relatie heeft, wat voor soort relaties dat zijn (homo, hetero, verloofd, getrouwd…), hoe groot het gemiddelde aantal vrienden is, wat de politieke voorkeur is en in het geval van Facebook, waar deze groep mensen fan van is. Met andere woorden, door een enorme hoeveelheid data te verzamelen van wat mijn vrienden en de vrienden van mijn vrienden delen, beginnen we een aardig beeld te krijgen van wie ik zelf ben.

Vertel mij wie uw vrienden zijn, en ik vertel u wie gij zijt.

Als we via bovenstaande methode van een paar honderd mensen gegevens kunnen verzamelen, kunnen we al een aardig beeld vormen van wie ik ben. Immers:

  • De gemiddelde leeftijd van deze groep ligt rond de 30
  • Het grootste deel van deze groep is man
  • Er zitten meer hetero mannen bij dan homoseksuele mannen
  • Er zitten niet bijzonder veel mensen tussen die hebben aangegeven fan te zijn van een voetbalclub
  • De meeste van deze mensen wonen in Nederland

Kortom, door simpelweg de informatie te gebruiken van mensen om mij heen, kunnen we zeer aannemelijke conclusies maken (verbanden trekken dus). Met andere woorden: Zo afgeschermd als mijn profiel lijkt, is het helemaal niet.

Social semantic datamining (2)

Als je van Pulp Fiction houdt, ben je geïnteresseerd in liberale boeken in het Nederlands of Engels en eet je daar graag aardbeien bij.

Maar we kunnen nog veel verder komen als we de verzamelde informatie vergelijken met informatie verzameld uit andere zoektochten. Stel andere datamining resultaten hebben ons het volgende geleerd (dit is puur als voorbeeld, lees dit dus niet als waarheden):

  • 80% van de mensen die van de film Pulp Fiction houdt, houdt ook van aardbeien.
  • 70% van de mensen die in Nederland wonen, spreken Engels
  • 90% van de mensen die van aardbeien houden, stemmen liberaal
  • 80% van de Nederlandser die Engels spreken EN van aardbeien houden EN fan zijn van Pulp Fiction, lezen veel boeken

Met deze gegevens is ineens veel meer aannemelijk te maken. Is iemand fan van Pulp Fiction? Dan zouden we in combinatie met social semantic datamining (1) precies kunnen weten welke boek-advertentie bol.com deze persoon zou moeten voorhouden.

Gevaarlijk of nuttig?

Social semantic datamining is een zeer interessante tak van sport en niet voor niets een steeds belangrijker onderdeel in de binnenkort te lanceren social media management tool SocialDrums (ok, schaamteloze reclame. Excuses.) Of het gevaarlijk is en/of nuttig laat ik graag aan jullie over. Reacties zijn uiterst welkom en ik beloof geen social semantic datamining op je los te laten :-)

UPDATE

Na reactie en op verzoek van Sander van den Hoven, een aanvullend voorbeeld om de toepassing van social semantic dataminig te illustreren:

(1). Stel , een nieuw frisdrank merk heeft een Facebook Fanpage waar 200 leden fan zijn. Met social semantic datamining zou het bedrijf kunnen bepalen op welk festival ze met een grote promotie-stand willen gaan staan deze zomer. Door te analyseren welke festival de eigen fanbase en de vrienden van de fanbase (gaan) bezoeken.

(2). Je kunt nog verder gaan door vervolgens de groep die je middels de datamining bijeen hebt gebracht te blijven analyseren. Zodra iemand aangeeft daadwerkelijk naar het festival te gaan (bijvoorbeeld door een status update of door fan te worden van bv Lowlands 2011) sla je zijn naam + profielfoto op maar ook die van zijn vrienden. Je analyseert vervolgens deze groep apart waardoor je weet wat deze groep bindt (bijvoorbeeld wat zij het meest gemeen hebben, zoals allemaal fan van Ajax). Dit alles is volledig te automatiseren waardoor je eenmaal op het festival een groot scherm hebt waar je de foto van deze persoon en zijn vrienden in combinatie met bijvoorbeeld het logo van Ajax erbij en de tekst: He Sander, kom je met je vrienden even een drankje doen?”

(3). Als hij daadwerkelijk met zijn vrienden komt, maak je een foto van de groep en vraagt hem (ter plekke) lid te worden van de Fanpage. Na het festival vraag je deze persoon de mensen in de foto te ‘taggen’. De volgende ronde semantic datamining is door te zoeken naar combinaties waar exact deze groep ook samenkomt. Bijvoorbeeld andere foto’s van vakanties waar exact deze groep op staat zoals een vakantie op Ibiza. Dit herhaal je een paar honderd keer en je hebt een zeer mooie targeted groep om samen met een bekende tour operator gezamenlijk een aanbieding te doen aan deze groep.

(Geschreven door Godfried van Loo, Creative Director & Founder Yocter b.v.)

GD Star Rating
loading...
GD Star Rating
loading...

Google HomeView – StreetView, maar dan in huis. Waar ligt de grens?

google privacy

Dat Google StreetView nogal wat kritiek in Europa krijgt is wellicht geen nieuws. De privacy zou namelijk regelmatig worden geschonden. Europese toezichthouders eisen nu zelfs dat Google de originele foto’s die het voor zijn dienst StreetView maakt na zes maanden en niet pas na 12 maanden wist. Ook moet Google het publiek waarschuwen voordat het zijn camerawagens de straat op stuurt. Daarnaast wil men dat er geen foto’s van gevoelige aard gemaakt mogen worden. In dat kader kunnen allerlei twijfelgevallen om verwijdering vragen maar wil je via Twitter weten dat je op minder fraaie wijze zichtbaar bent in een Google product?

Om aan deze kritiek een cynische noot toe te voegen is er in Duitsland nu een parodie gemaakt naar aanleiding van deze haast ‘obsessieve’ wijze waarop Google alles in de wereld in kaart wil brengen. De parodie circuleert op YouTube en in het filmpje is te zien hoe zogenaamde Google-medewerkers bij mensen aanbellen met de reden dat ze voor ‘Google HomeView’ op pad zijn gestuurd om de interieurs van huizen vast te leggen.

Omdat Jeff Jarvis (mediagoeroe en Amerikaanse journalist) na het zien van het hilarische filmpje het tipte bij derden, circuleert het filmpje nu ook in de USA, waardoor het kijkersaantal in een keer een enorme boost kreeg.

Het filmpje toont dat de missie van Google (“organize the world’s information and make it universally accessible and useful”) ook te ver kan doorslaan. Immers, als je alle informatie wilt ontsluiten dan zou Google HomeView uitstekend in deze missie passen. Google BedroomView, Google BankingView, Google ExtremelyPersonalView etc zou met een goed verhaal zomaar kunnen worden gelanceerd.

(Kijk ook zeker het filmpje bij 1:39)

Waar ligt de Google grens? Moet Google lekker zelf weten wat ze maken en lanceren en moet de discussie wat wel en niet te ver gaat achteraf, of zou dat preventief moeten worden afgesproken?

GD Star Rating
loading...
GD Star Rating
loading...
UA-9036473-24