Social media, privacy en social semantic web… Weten wat niet wordt gedeeld.

social semantic datamining

Als ontwikkelaar van social media software wordt me vrij vaak de volgende stelling voorgeschoteld: “Als ik mijn profiel op een sociale netwerksite afscherm, dan is mijn privacy toch gewaarborgd? Dan weet je toch niets van mij?” Een zeer onjuiste aanname als je begrijpt dat er een verschil is tussen “niets weten” en “niets kunnen weten”. De uitleg doet het vaak goed op borrels en lezingen, dus allicht ook op de Yocter Social Media Blog.

Sociale netwerken en privacy

Er zijn allerlei sociale netwerken die allen verschillend omgaan met privacy. Of het nu gaat om Facebook, Twitter, Hyves of welk sociaal netwerk dan ook, allen worden door privacy waakhonden geregeld van van alles en nog wat beticht. Deze waakhonden claimen ‘gevaarlijke lekken’ te hebben ‘ontdekt’, waar het echter (mijns inziens) in veel gevallen echter gaat om verkregen inzicht over hoe verbanden kunnen worden gelegd die op sociale netwerken eng en gevaarlijk lijken, terwijl ze in het normale leven al millennia worden toegepast en uitgebuit. Ik ga dan ook niet specifiek in op een sociaal netwerk of wie op welke manier profielen beschermt, maar wil graag aantonen hoe Yocter met slimme software en op legale wijze (!!) meer over een beschermd profiel te weten kan komen. Deels om u te behoeden maar uiteraard ook om u inzicht te geven hoe deze informatie relevant kan zijn voor het bedrijfsleven.

Wat is een beschermd profiel?

Godfried van Loo - FacebookZelf heb ik een afgeschermd Facebook profiel. Als je niet bent ingelogd zie je helemaal niets, maar na een account te hebben aangemaakt en in te loggen zul je wanneer we geen vrienden zijn naast mijn naam en een profiel foto alsnog meer over mij te weten komen (als we even aannemen dat het analyseren van mijn profiel foto wel erg veel werk wordt om daar informatie uit te halen).
Je ziet niet wie mijn vrienden zijn, hoe oud ik ben, of ik een relatie heb, of ik van lezen houd… niets van dat alles. Het enige wat je zeker kunt weten, is dat ik een account bij Facebook heb.

Social semantic datamining (1)

Maar zoals in de introductie aangekondigd, gaat het niet om wat je weet, maar wat je kunt weten. Ik zal aan de hand van mijn eigen Facebook profiel uitleggen hoe ik met social semantic datamining (zoals ik het zelf noem) veel meer informatie kan achterhalen.

Social Semantic Datamining: Het verzamelen van data en door het leggen van verbanden in het social media landschap een zelf lerende database aanleggen

Social semantic datamining betekent zoveel als: “Het verzamelen van data en door het leggen van verbanden in het social media landschap een zelf lerende database aanleggen”. Dit klinkt ingewikkelder dan het is. Open maar eens wat foto albums van een willekeurig persoon of ga door een stapel ontvangen kerstkaarten, en je weet binnen een paar minuten meer over iemand dan die persoon zelf kan (of wil) vertellen.

social mediaKortom, wat we nodig hebben om meer over mij te weten te komen is data. Veel data. Nu deel ik niet wie mijn vrienden zijn, maar dat wil niet zeggen dat mijn vrienden hetzelfde doen. Immers, mijn vrienden heb ik niet in de hand en die delen wel dat ik een vriend ben, zoals Mladen en Samù bijvoorbeeld. Kortom, als ik niet wil zeggen wie mijn vrienden zijn, dan kijk je gewoon bij naar mensen die zeggen dat ze vrienden met mij zijn.

Als we vervolgens ook de vrienden van die vrienden verzamelen en zo een paar tientallen of honderdtallen profielen bij elkaar hebben die wel informatie delen, kijken we naar andere informatie die wordt gedeeld. Zoals de gemiddelde leeftijd van deze groep, het percentage mensen dat een relatie heeft, wat voor soort relaties dat zijn (homo, hetero, verloofd, getrouwd…), hoe groot het gemiddelde aantal vrienden is, wat de politieke voorkeur is en in het geval van Facebook, waar deze groep mensen fan van is. Met andere woorden, door een enorme hoeveelheid data te verzamelen van wat mijn vrienden en de vrienden van mijn vrienden delen, beginnen we een aardig beeld te krijgen van wie ik zelf ben.

Vertel mij wie uw vrienden zijn, en ik vertel u wie gij zijt.

Als we via bovenstaande methode van een paar honderd mensen gegevens kunnen verzamelen, kunnen we al een aardig beeld vormen van wie ik ben. Immers:

  • De gemiddelde leeftijd van deze groep ligt rond de 30
  • Het grootste deel van deze groep is man
  • Er zitten meer hetero mannen bij dan homoseksuele mannen
  • Er zitten niet bijzonder veel mensen tussen die hebben aangegeven fan te zijn van een voetbalclub
  • De meeste van deze mensen wonen in Nederland

Kortom, door simpelweg de informatie te gebruiken van mensen om mij heen, kunnen we zeer aannemelijke conclusies maken (verbanden trekken dus). Met andere woorden: Zo afgeschermd als mijn profiel lijkt, is het helemaal niet.

Social semantic datamining (2)

Als je van Pulp Fiction houdt, ben je geïnteresseerd in liberale boeken in het Nederlands of Engels en eet je daar graag aardbeien bij.

Maar we kunnen nog veel verder komen als we de verzamelde informatie vergelijken met informatie verzameld uit andere zoektochten. Stel andere datamining resultaten hebben ons het volgende geleerd (dit is puur als voorbeeld, lees dit dus niet als waarheden):

  • 80% van de mensen die van de film Pulp Fiction houdt, houdt ook van aardbeien.
  • 70% van de mensen die in Nederland wonen, spreken Engels
  • 90% van de mensen die van aardbeien houden, stemmen liberaal
  • 80% van de Nederlandser die Engels spreken EN van aardbeien houden EN fan zijn van Pulp Fiction, lezen veel boeken

Met deze gegevens is ineens veel meer aannemelijk te maken. Is iemand fan van Pulp Fiction? Dan zouden we in combinatie met social semantic datamining (1) precies kunnen weten welke boek-advertentie bol.com deze persoon zou moeten voorhouden.

Gevaarlijk of nuttig?

Social semantic datamining is een zeer interessante tak van sport en niet voor niets een steeds belangrijker onderdeel in de binnenkort te lanceren social media management tool SocialDrums (ok, schaamteloze reclame. Excuses.) Of het gevaarlijk is en/of nuttig laat ik graag aan jullie over. Reacties zijn uiterst welkom en ik beloof geen social semantic datamining op je los te laten :-)

UPDATE

Na reactie en op verzoek van Sander van den Hoven, een aanvullend voorbeeld om de toepassing van social semantic dataminig te illustreren:

(1). Stel , een nieuw frisdrank merk heeft een Facebook Fanpage waar 200 leden fan zijn. Met social semantic datamining zou het bedrijf kunnen bepalen op welk festival ze met een grote promotie-stand willen gaan staan deze zomer. Door te analyseren welke festival de eigen fanbase en de vrienden van de fanbase (gaan) bezoeken.

(2). Je kunt nog verder gaan door vervolgens de groep die je middels de datamining bijeen hebt gebracht te blijven analyseren. Zodra iemand aangeeft daadwerkelijk naar het festival te gaan (bijvoorbeeld door een status update of door fan te worden van bv Lowlands 2011) sla je zijn naam + profielfoto op maar ook die van zijn vrienden. Je analyseert vervolgens deze groep apart waardoor je weet wat deze groep bindt (bijvoorbeeld wat zij het meest gemeen hebben, zoals allemaal fan van Ajax). Dit alles is volledig te automatiseren waardoor je eenmaal op het festival een groot scherm hebt waar je de foto van deze persoon en zijn vrienden in combinatie met bijvoorbeeld het logo van Ajax erbij en de tekst: He Sander, kom je met je vrienden even een drankje doen?”

(3). Als hij daadwerkelijk met zijn vrienden komt, maak je een foto van de groep en vraagt hem (ter plekke) lid te worden van de Fanpage. Na het festival vraag je deze persoon de mensen in de foto te ‘taggen’. De volgende ronde semantic datamining is door te zoeken naar combinaties waar exact deze groep ook samenkomt. Bijvoorbeeld andere foto’s van vakanties waar exact deze groep op staat zoals een vakantie op Ibiza. Dit herhaal je een paar honderd keer en je hebt een zeer mooie targeted groep om samen met een bekende tour operator gezamenlijk een aanbieding te doen aan deze groep.

(Geschreven door Godfried van Loo, Creative Director & Founder Yocter b.v.)

GD Star Rating
loading...
GD Star Rating
loading...
Social media, privacy en social semantic web... Weten wat niet wordt gedeeld., 9.5 out of 10 based on 2 ratings
Be Sociable, Share!

9 Responses to “Social media, privacy en social semantic web… Weten wat niet wordt gedeeld.”

  1. Pieter says:

    Sjonge, een zeer interessante blog!

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  2. Beste Godfried,

    Ik ben het deels met je eens. De mogelijkheid is er zeker om d.m.v. informatie die je kunt genereren uit de profielen van jouw vrienden, ook meer informatie over jou kunt krijgen. Dit wordt inderdaad helemaal mogelijk gemaakt wanneer jouw vrienden alle informatie met iedereen delen.
    Echter, het voorbeeld dat je geeft met de gemiddelde gegevens van jouw vrienden wil natuurlijk niets zeggen over jouw eigen profiel. Dat de leeftijd gemiddeld 30 jaar is en dat er vooral mannen in jouw vriendenkring zitten, neemt de mogelijkheid natuurlijk niet weg dat jij een 12-jarig meisje bent (mocht je dit niet van de foto af kunnen leiden). Daarnaast zijn dit denk ik ook niet de gegevens die je per se wil verbergen, maar dat is weer een andere discussie.
    Ik vind het voorbeeld van Pulp Fiction op deze manier ook wel erg kort door de bocht, maar ik vind het wel erg interessant dat een bedrijf gegevens kan analyseren om zo te kijken wat ze aan wie aan kunnen bieden. Ik denk ook dat dit in de nabije toekomst steeds meer onderdeel zal gaan uitmaken van de marketing-strategieën van B2C-companies.

    Met vriendelijke groet,
    Sander van den Hoven

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  3. @Sander
    Kan ik me zeker in vinden hoor. Ik wil ook niet zeggen dat deze methode waarheden aan het licht brengt, maar wel “aannemelijk suggesties”. De eenvoudige voorbeelden waren ook bedoeld om het artikel laagdrempelig en begrijpelijk te houden.

    Ik wilde aantonen dat met deze manier dingen aan het licht kunnen worden gebracht waarvan de profiel-eigenaar allicht dacht dat het onbekend was. Het achterhalen van een leeftijd is dan misschien niet het meest spannende, maar ongetwijfeld kunnen er dingen op deze manier aannemelijk genoeg worden bevonden om bepaalde advertenties te tonen die je in eerste instantie niet zou verwachten.

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  4. @Godfried
    Dat ben ik wel met je eens. Sowieso ben ik het eens met het hele idee wat je schetst in je verhaal. Ik vind alleen de voorbeelden niet overtuigend genoeg om dit idee te onderbouwen. Wellicht heb je meer (ingewikkelde) voorbeelden die minder voor de hand liggen..?

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  5. Een interessante toepassing voor bedrijven:

    (1). Stel , een nieuw frisdrank merk heeft een Facebook Fanpage waar 200 leden fan zijn. Met social semantic datamining zou het bedrijf kunnen bepalen op welk festival ze met een grote promotie-stand willen gaan staan deze zomer. Door te analyseren welke festival de eigen fanbase en de vrienden van de fanbase (gaan) bezoeken.

    (2). Je kunt nog verder gaan door vervolgens de groep die je middels de datamining bijeen hebt gebracht te blijven analyseren. Zodra iemand aangeeft daadwerkelijk naar het festival te gaan (bijvoorbeeld door een status update of door fan te worden van bv Lowlands 2011) sla je zijn naam + profielfoto op maar ook die van zijn vrienden. Je analyseert vervolgens deze groep apart waardoor je weet wat deze groep bindt (bijvoorbeeld wat zij het meest gemeen hebben, zoals allemaal fan van Ajax). Dit alles is volledig te automatiseren waardoor je eenmaal op het festival een groot scherm hebt waar je de foto van deze persoon en zijn vrienden in combinatie met bijvoorbeeld het logo van Ajax erbij en de tekst: He Sander, kom je met je vrienden even een drankje doen?”

    (3). Als hij daadwerkelijk met zijn vrienden komt, maak je een foto van de groep en vraagt hem (ter plekke) lid te worden van de Fanpage. Na het festival vraag je deze persoon de mensen in de foto te ‘taggen’. De volgende ronde semantic datamining is door te zoeken naar combinaties waar exact deze groep ook samenkomt. Bijvoorbeeld andere foto’s van vakanties waar exact deze groep op staat zoals een vakantie op Ibiza. Dit herhaal je een paar honderd keer en je hebt een zeer mooie targeted groep om samen met een bekende tour operator gezamenlijk een aanbieding te doen aan deze groep.

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  6. Kijk, dit zijn interessante voorbeelden. Je hebt me overtuigd :)
    Ik zie nu inderdaad ook de negatieve kant van het verhaal. Nu komt de inbreuk op iemands privacy ook goed naar voren; ik kan me voorstellen dat je liever niet zo nauw gevolgd wordt. Voor bedrijven is dit wel echt een “goede” manier om zo tot je doelgroep te komen. Erg interessant onderwerp, vooral in combinatie met de voorbeelden die je zojuist gaf.

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  7. Mooi :-)
    Voor de volledigheid heb ik het voorbeeld maar direct ook onder het artikel gezet. Dank voor je aandringen op een ander voorbeeld. Maakt het zo zeker vollediger en overtuigender.

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  8. Wilko says:

    Zeer interessant verhaal! Vooral de nieuwe voorbeelden vind ik zeer duidelijk!

    GD Star Rating
    loading...
    GD Star Rating
    loading...
  9. Jesper says:

    Interessant inderdaad. Ook omdat veel mensen achteloos een online spoor achterlaten. Bovendien gaan veel sites niet bepaald secuur om met de persoonlijke gegevens van hun gebruikers. Zo kun je je Skype account niet eens verwijderen. Als ik ergens een account voor nodig heb, check ik altijd eerst de zwarte lijst op http://www.accountkiller.com of ik mijn profiel ook weer fatsoenlijk kan verwijderen.

    GD Star Rating
    loading...
    GD Star Rating
    loading...

Leave a Reply

UA-9036473-24