Social media, privacy en social semantic web… Weten wat niet wordt gedeeld.

social semantic datamining

Als ontwikkelaar van social media software wordt me vrij vaak de volgende stelling voorgeschoteld: “Als ik mijn profiel op een sociale netwerksite afscherm, dan is mijn privacy toch gewaarborgd? Dan weet je toch niets van mij?” Een zeer onjuiste aanname als je begrijpt dat er een verschil is tussen “niets weten” en “niets kunnen weten”. De uitleg doet het vaak goed op borrels en lezingen, dus allicht ook op de Yocter Social Media Blog.

Sociale netwerken en privacy

Er zijn allerlei sociale netwerken die allen verschillend omgaan met privacy. Of het nu gaat om Facebook, Twitter, Hyves of welk sociaal netwerk dan ook, allen worden door privacy waakhonden geregeld van van alles en nog wat beticht. Deze waakhonden claimen ‘gevaarlijke lekken’ te hebben ‘ontdekt’, waar het echter (mijns inziens) in veel gevallen echter gaat om verkregen inzicht over hoe verbanden kunnen worden gelegd die op sociale netwerken eng en gevaarlijk lijken, terwijl ze in het normale leven al millennia worden toegepast en uitgebuit. Ik ga dan ook niet specifiek in op een sociaal netwerk of wie op welke manier profielen beschermt, maar wil graag aantonen hoe Yocter met slimme software en op legale wijze (!!) meer over een beschermd profiel te weten kan komen. Deels om u te behoeden maar uiteraard ook om u inzicht te geven hoe deze informatie relevant kan zijn voor het bedrijfsleven.

Wat is een beschermd profiel?

Godfried van Loo - FacebookZelf heb ik een afgeschermd Facebook profiel. Als je niet bent ingelogd zie je helemaal niets, maar na een account te hebben aangemaakt en in te loggen zul je wanneer we geen vrienden zijn naast mijn naam en een profiel foto alsnog meer over mij te weten komen (als we even aannemen dat het analyseren van mijn profiel foto wel erg veel werk wordt om daar informatie uit te halen).
Je ziet niet wie mijn vrienden zijn, hoe oud ik ben, of ik een relatie heb, of ik van lezen houd… niets van dat alles. Het enige wat je zeker kunt weten, is dat ik een account bij Facebook heb.

Social semantic datamining (1)

Maar zoals in de introductie aangekondigd, gaat het niet om wat je weet, maar wat je kunt weten. Ik zal aan de hand van mijn eigen Facebook profiel uitleggen hoe ik met social semantic datamining (zoals ik het zelf noem) veel meer informatie kan achterhalen.

Social Semantic Datamining: Het verzamelen van data en door het leggen van verbanden in het social media landschap een zelf lerende database aanleggen

Social semantic datamining betekent zoveel als: “Het verzamelen van data en door het leggen van verbanden in het social media landschap een zelf lerende database aanleggen”. Dit klinkt ingewikkelder dan het is. Open maar eens wat foto albums van een willekeurig persoon of ga door een stapel ontvangen kerstkaarten, en je weet binnen een paar minuten meer over iemand dan die persoon zelf kan (of wil) vertellen.

social mediaKortom, wat we nodig hebben om meer over mij te weten te komen is data. Veel data. Nu deel ik niet wie mijn vrienden zijn, maar dat wil niet zeggen dat mijn vrienden hetzelfde doen. Immers, mijn vrienden heb ik niet in de hand en die delen wel dat ik een vriend ben, zoals Mladen en Samù bijvoorbeeld. Kortom, als ik niet wil zeggen wie mijn vrienden zijn, dan kijk je gewoon bij naar mensen die zeggen dat ze vrienden met mij zijn.

Als we vervolgens ook de vrienden van die vrienden verzamelen en zo een paar tientallen of honderdtallen profielen bij elkaar hebben die wel informatie delen, kijken we naar andere informatie die wordt gedeeld. Zoals de gemiddelde leeftijd van deze groep, het percentage mensen dat een relatie heeft, wat voor soort relaties dat zijn (homo, hetero, verloofd, getrouwd…), hoe groot het gemiddelde aantal vrienden is, wat de politieke voorkeur is en in het geval van Facebook, waar deze groep mensen fan van is. Met andere woorden, door een enorme hoeveelheid data te verzamelen van wat mijn vrienden en de vrienden van mijn vrienden delen, beginnen we een aardig beeld te krijgen van wie ik zelf ben.

Vertel mij wie uw vrienden zijn, en ik vertel u wie gij zijt.

Als we via bovenstaande methode van een paar honderd mensen gegevens kunnen verzamelen, kunnen we al een aardig beeld vormen van wie ik ben. Immers:

  • De gemiddelde leeftijd van deze groep ligt rond de 30
  • Het grootste deel van deze groep is man
  • Er zitten meer hetero mannen bij dan homoseksuele mannen
  • Er zitten niet bijzonder veel mensen tussen die hebben aangegeven fan te zijn van een voetbalclub
  • De meeste van deze mensen wonen in Nederland

Kortom, door simpelweg de informatie te gebruiken van mensen om mij heen, kunnen we zeer aannemelijke conclusies maken (verbanden trekken dus). Met andere woorden: Zo afgeschermd als mijn profiel lijkt, is het helemaal niet.

Social semantic datamining (2)

Als je van Pulp Fiction houdt, ben je geïnteresseerd in liberale boeken in het Nederlands of Engels en eet je daar graag aardbeien bij.

Maar we kunnen nog veel verder komen als we de verzamelde informatie vergelijken met informatie verzameld uit andere zoektochten. Stel andere datamining resultaten hebben ons het volgende geleerd (dit is puur als voorbeeld, lees dit dus niet als waarheden):

  • 80% van de mensen die van de film Pulp Fiction houdt, houdt ook van aardbeien.
  • 70% van de mensen die in Nederland wonen, spreken Engels
  • 90% van de mensen die van aardbeien houden, stemmen liberaal
  • 80% van de Nederlandser die Engels spreken EN van aardbeien houden EN fan zijn van Pulp Fiction, lezen veel boeken

Met deze gegevens is ineens veel meer aannemelijk te maken. Is iemand fan van Pulp Fiction? Dan zouden we in combinatie met social semantic datamining (1) precies kunnen weten welke boek-advertentie bol.com deze persoon zou moeten voorhouden.

Gevaarlijk of nuttig?

Social semantic datamining is een zeer interessante tak van sport en niet voor niets een steeds belangrijker onderdeel in de binnenkort te lanceren social media management tool SocialDrums (ok, schaamteloze reclame. Excuses.) Of het gevaarlijk is en/of nuttig laat ik graag aan jullie over. Reacties zijn uiterst welkom en ik beloof geen social semantic datamining op je los te laten :-)

UPDATE

Na reactie en op verzoek van Sander van den Hoven, een aanvullend voorbeeld om de toepassing van social semantic dataminig te illustreren:

(1). Stel , een nieuw frisdrank merk heeft een Facebook Fanpage waar 200 leden fan zijn. Met social semantic datamining zou het bedrijf kunnen bepalen op welk festival ze met een grote promotie-stand willen gaan staan deze zomer. Door te analyseren welke festival de eigen fanbase en de vrienden van de fanbase (gaan) bezoeken.

(2). Je kunt nog verder gaan door vervolgens de groep die je middels de datamining bijeen hebt gebracht te blijven analyseren. Zodra iemand aangeeft daadwerkelijk naar het festival te gaan (bijvoorbeeld door een status update of door fan te worden van bv Lowlands 2011) sla je zijn naam + profielfoto op maar ook die van zijn vrienden. Je analyseert vervolgens deze groep apart waardoor je weet wat deze groep bindt (bijvoorbeeld wat zij het meest gemeen hebben, zoals allemaal fan van Ajax). Dit alles is volledig te automatiseren waardoor je eenmaal op het festival een groot scherm hebt waar je de foto van deze persoon en zijn vrienden in combinatie met bijvoorbeeld het logo van Ajax erbij en de tekst: He Sander, kom je met je vrienden even een drankje doen?”

(3). Als hij daadwerkelijk met zijn vrienden komt, maak je een foto van de groep en vraagt hem (ter plekke) lid te worden van de Fanpage. Na het festival vraag je deze persoon de mensen in de foto te ‘taggen’. De volgende ronde semantic datamining is door te zoeken naar combinaties waar exact deze groep ook samenkomt. Bijvoorbeeld andere foto’s van vakanties waar exact deze groep op staat zoals een vakantie op Ibiza. Dit herhaal je een paar honderd keer en je hebt een zeer mooie targeted groep om samen met een bekende tour operator gezamenlijk een aanbieding te doen aan deze groep.

(Geschreven door Godfried van Loo, Creative Director & Founder Yocter b.v.)

GD Star Rating
loading...
GD Star Rating
loading...

Het semantisch web in begrijpelijke taal

semantic web w3c

Het semantisch web… Wat is dat nu weer? Je hoort en leest er steeds meer over. Internet bedrijven, wetenschappers, overheden… Iedereen lijkt er druk mee maar wat is het semantic web in begrijpelijke taal? Waar komt het vandaan en wanneer “is het er dan”?

Semantisch wil zoveel zeggen als “de betekenis lerend”. Het semantisch web zou je grofweg kunnen definiëren als een web van verbanden. Verbanden gelegd tussen informatie op het internet, waardoor nieuwe inzichten kunnen ontstaan. Neem de volgende vier zinnen:

Voorbeeld: Het belang van verbanden leggen

  1. semantic web bpTony Hayward is de CEO van BP
  2. De CEO van BP zit op een zeilboot in de Golf van Mexico
  3. Er vaart slechts één boot in de Golf van Mexico
  4. Er is een zeilboot omgeslagen in de Golf van Mexico

Elk van deze vier zinnen is op zichzelf niet bijzonder spannend maar als we deze vier zinnen achter elkaar lezen, is te concluderen dat de CEO van BP (nog erger) in de problemen zit. Nu staan de vier zinnen handig genoeg toevallig achter elkaar in één blogpost, maar wat nu als elk van deze 4 nieuwsitems op totaal verschillende websites hadden gestaan?

Mens versus software

In bovenstaande voorbeeld is het voor een mens eenvoudig verbanden te leggen en tot bovenstaande conclusie te komen. Voor een computer is dit echter niet zo eenvoudig en al helemaal niet als deze vier zinnen los van elkaar op verschillende plekken hadden gestaan. Hoe had een computer of internet spider dit verband kunnen leggen? Dat is vrijwel onmogelijk. Tenzij we speciaal voor een computer wat extra informatie zouden kunnen geven. Informatie die de informatie beschrijft. Speciaal voor computers.

Beschrijvende informatie in onzichtbare broncode: snippets en microformats

semantisch web w3cDe broncode van een webpagina bevat naast de getoonde informatie ook informatie over opmaak zoals lettertype, afbeeldingen, animaties, links en menu’s. Met links worden websites aan elkaar gekoppeld en vindbaar maar voor het Semantic Web zijn een paar links niet genoeg. Het is slechts een verwijzing. Voor computers/software/spiders is het belangrijk te begrijpen wat de relatie van de verwijzing is tot het artikel. En daarvoor zijn zogenoemde ‘rich snippets’ en microformats bedacht. Het zijn stukjes broncode die informatie omschrijven of juist verrijken door de informatie aan andere gerelateerde informatie te koppelen.

Voorbeeld: Wat gebeurt er in de familie van X?

semantisch web familieAls je je familie aan iemand voorstelt, vermeld je daarbij ook vaak de relatie tot jou. “Dit is mijn moeder, mijn broer, neef, kleinkind, etc”. Als je met je hele familie zou afspreken dat iedereen op zijn/haar eigen blog slechts één link plaatst naar een ander familielid en de link omschrijft met microformats, dan is het voor een computer (dan wel spider) mogelijk om te bepalen “wie jouw hele familie is”. Als een verre achterneef een kindje krijgt, is het dus geen kunst meer vast te stellen dat “er in jouw familie een kindje is geboren”. En dat allemaal doordat je één link naar een ander familielid hebt geplaatst.

Semantisch web is er al

semantic web zorgkaart nederlandHet semantisch web klinkt als een belofte. Als “iets in de toekomst” wat we hopelijk nog gaan meemaken. Maar het semantisch web is er al, het moet alleen nog groeien. Hoe meer webbouwers gebruik zullen maken van snippets en microformats en niet alleen links plaatsen, maar ook ook verbanden verklaren, hoe groter het semantisch web wordt. Grote maar ook kleine internet partijen doen al mee. Uiteraard maken bedrijven als Google, Yahoo en Facebook steeds meer gebruik van het semantic web maar ook andere partijen ontdekken het belang ervan. Berichten als “Health sites use semantic technologies to provide better results” zullen we dan ook steeds vaker gaan tegenkomen. Uitgever Bohn Stafleu van Loghum, onderdeel van Springer Media, heeft bijvoorbeeld bij de ontwikkeling van zorgkaartnederland.nl ook al microformats toegepast liet Product Manager Jos Groenendaal mij weten. Onzichtbare stukjes broncode als je de website bezoekt, maar voor zoekmachines als Google (die de verbanden ook al in zoekresultaten laat zien) bijzonder gewaardeerd.

Scoutle.com

semantic web scoutle“Semantisch” wil natuurlijk niet altijd zeggen dat websites “gebruik maken van rich snippets en microformats volgens bepaalde afspraken”. Het in 2008 gelanceerde semantisch bloggersnetwerk Scoutle.com (ontwikkeld door ondergetekende) legt zelf verbanden en leert middels algoritmes de blogosfeer kennen, maar dan geautomatiseerd en zonder gebruik te maken van microformats of snippets. Scoutle leert juist door te kijken naar zowel bloggers als bezoekers van blogs en berekent daarbij voorkeuren en verbanden die worden gelegd.

Semantic Ready: belang van meedoen aan het semantisch web

semantic web belangHet moge duidelijk zijn dat het belang om je blog of website “Semantic Ready” te maken groeit want je wilt natuurlijk dat ook jouw website gaat opvallen en meedoet als computers verbanden gaan leggen. Terugdenken aan het voorbeeld van de familie… Wat als een familielid niet in het link-kringetje voorkomt? Dan zou die door de computer simpelweg worden uitgesloten. Het is dus voor elke website van belang ook in te gaan zetten op het semantic web. Want deze intelligente boot wil je niet missen.

(Geschreven door Godfried van Loo, Creative Director en Founder van Yocter b.v.)

GD Star Rating
loading...
GD Star Rating
loading...
UA-9036473-24