Introduzione

L’universo digitale in cui ognuno di noi è immerso genera importanti conseguenze su diversi livelli della nostra esistenza e dello stare in società. La tecnologia si è oggi completamente fusa con il mondo offline producendo influenze sulla realtà che si ripropongono attraverso un meccanismo di feedback sul mondo della rete. Dominio delle piattaforme, Internet è un enorme magazzino di dati relativi ad ogni individuo, dati che vengono impiegati per scopi di varia natura e secondo modalità più o meno trasparenti.

Una delle più diffuse applicazioni del dato è la personalizzazione dell’esperienza degli utenti in rete, le cui implicazioni per brand e consumatori sono di duplice natura. Numerose ricerche, infatti, testimoniano l’efficienza della profilazione sul web in termini di praticità e fluidità di navigazione dell’utente, che senza l’impiego del dato troverebbe l’esplorazione della rete un’impresa particolarmente ardua. Parallelamente, altrettante sono le voci di denuncia circa le modalità di utilizzo dei dati, accusati di contribuire alla costruzione di una realtà filtrata con profonde conseguenze non solo l’esperienza online degli individui bensì anche sulla loro complessiva esperienza di vita.

Il presente articolo esplora gli impieghi del dato in rete, personificato principalmente nella forma dei cookie, per analizzarne le ripercussioni critiche in termini di manipolazione dell’esperienza. Viene anzitutto introdotto il quadro teorico di riferimento e approfondite le principali teorie ad esso relate in letteratura. Lo sguardo muove poi sull’indagine degli aspetti tecnologico, storico e strutturale sottostanti l’impiego dei cookie, di cui viene fornita un’attenta disamina. L’obiettivo è quello di introdurre il tema della profilazione dell’utente, cui viene riservata la parte centrale dello scritto con l’approfondimento delle teorie e delle implicazioni di quello che è un processo ormai accessibile a qualsiasi realtà presente sul web.

Profilazione e personalizzazione emergeranno come sistemi legati a doppio filo in quello che è il contesto digitale che ci circonda. A questa parte segue, infine, la presentazione di un caso studio reale sulla profilazione e la conseguente personalizzazione della piattaforma di streaming on-demand “Netflix”, che funge da sonda per giungere ad una riflessione conclusiva circa il reale impatto della profilazione sul web in termini culturali.

Quadro teorico

La filter bubble

Innanzitutto, è bene definire cosa si intende con il termine “Filter Bubble”, o meglio “Bolla di Filtraggio”: Eli Pariser lo definisce come «un personale ecosistema di informazioni creato dagli algoritmi», un metodo di ricerca filtrata che tuttavia secondo lui rischia di indirizzare l’utente verso determinate informazioni, togliendo invece lui la possibilità di entrare in contatto con nuove idee e nuovi argomenti, apportando così un danno alla società, rendendo le persone più vulnerabili a manipolazioni. Quando parliamo di bolla di filtraggio dunque, parliamo di un sistema di personalizzazione dei risultati delle ricerche sui vari siti, i quali registrano i comportamenti dell’utente.

Si tratta di siti che sono in grado di utilizzare le informazioni raccolte sugli utenti (quali ad esempio le ricerche condotte in passato o la propria posizione) per elaborare una scelta selettiva di informazioni da mostrare all’utente stesso. Esempio lampante di ciò sono la ricerca personalizzata di Google, o le notizie personalizzate che ci vengono quotidianamente proposte all’interno dei vari canali social quali Facebook o Instagram.

Il termine ‘bolla di filtraggio’ è stato coniato dall’attivista precedentemente citato Eli Pariser, che nel 2011 pubblicò il libro “The Filter Bubble: What the Internet is Hiding from You”. All’interno di questo libro egli illustra come gli utenti della rete internet vengano quotidianamente esposti ad una serie di informazioni create ad hoc per loro, in base agli interessi che essi stessi hanno manifestato durante le precedenti ricerche.

Questo genere di attività si rivela quindi molto utile per aziende e brand, perché offre loro la possibilità di creare pubblicità mirate agli interessi manifestati dall’utente.

Ad oggi certo non è più un mistero il fatto che le informazioni fornite in rete siano filtrate e personalizzate sulla base di interessi individuali.

Ma come nascono le cosiddette bolle di filtraggio?

Quante volte ci siamo trovati, durante la navigazione su un sito web, ad accettare gli oramai rinomati “cookies”. La grande maggioranza dei siti web oggi conserva i cookies e i dati di navigazione degli utenti, al fine di offrire loro un’esperienza personalizzata durante la navigazione online. La stessa cosa capita in realtà anche all’interno delle piattaforme social, grazie al sistema degli algoritmi, che tiene da conto le preferenze espresse dal singolo, come ad esempio i like o le varie interazioni compiute. È inevitabile infatti trovarsi dinanzi a consigli personalizzati in base ad acquisti appena compiuti o articoli visualizzati su negozi e-commerce.

Tutto questo sembrerebbe portare a un fenomeno noto come “isolamento ideologico”; questa nostra tendenza a interagire in rete quasi sempre e solo con chi ha le nostre stesse opinioni o i nostri stessi gusti, porta l’individuo a isolarsi in una sua personale bolla di informazioni, limitando così la sua conoscenza a informazioni del tutto simili l’una con l’altra. La “Filter Bubble” tuttavia causa un effetto quasi dannoso per l’utente, convincendolo che i propri interessi sono gli unici che esistono, rendendolo quindi estraneo a idee, temi e informazioni diverse. Ciò dunque permette la diffusione di un’informazione limitata e poco equilibrata.

Inoltre, sono diverse le implicazioni che tutto ciò comporta a livello di privacy, ma sotto questo punto di vista sono stati realizzati interventi specifici come ad esempio la normativa sui cookies o il GDPR.

La profilazione dell’utente

Più in generale si può quindi parlare di profilazione dell’utente. Con questo termine intendiamo l’insieme di attività di raccolta e di elaborazione dei dati dei vari utenti, per poi suddividerli in categorie in base ai loro interessi e comportamenti. Si tratta di uno strumento appartenente a quello che ad oggi viene definito come ‘marketing mirato’, che sfrutta tecniche come queste per ottenere analisi più accurate circa potenziali clienti.

Va detto che, al giorno d’oggi, tecniche come queste sono state semplificate grazie all’aumento dell’uso da parte della società di piattaforme social. Un esempio concreto a riguardo, è il pulsante “mi piace” inserito all’interno della piattaforma Facebook, il cui uso consente una semplice ed efficace profilazione dell’utente.

In Italia vige una precisa regolamentazione delle pratiche di profilazione, messa in atto dal Garante per la protezione dei dati personali. L’individuo può essere profilato solo previo consenso di quest’ultimo. Più precisamente, la regolamentazione della profilazione è stata estesa anche alla rete a partire dal 2015. Esistono quindi norme precise per poter fornire servizi e\o promozioni personalizzate; ogni soggetto che realizza servizi in rete deve infatti: tutelare la privacy sia di quegli utenti che vengono autenticati, sia di quelli non autenticati, presentare l’informativa sul trattamento dei dati in maniera chiara ed esaustiva, deve inoltre definire i tempi di conservazione dei dati in base alle finalità perseguite, e infine ogni trattamento di dati con un fine diverso dalla fornitura del servizio deve avere il consenso da parte dell’utente.

Ogni utente deve quindi, per legge, decidere se dare il proprio consenso per la raccolta dei propri dati personali, chiaramente dopo aver avuto una precisa spiegazione. La violazione dei dati personali può comportare una sanzione che può arrivare fino a 20 milioni di euro, o per quanto riguarda le imprese, fino al 4% del fatturato annuo se questo supera la precedente cifra.

Strumenti e metodi di raccolta dati

Vediamo ora nel dettaglio quali sono effettivamente i metodi di raccolta dei dati personali:

I metadati

Partendo dal presupposto che ogni giorno vengono caricate su Internet immense quantità di dati, esistono proprio per questa ragione metodi di interpretazione dei metadati.

Una tale mole di dati è chiaro che può essere processata solo da una macchina, ma va tenuto da conto il fatto che al computer manchino le facoltà cognitive di base, proprie invece dell’essere umano. Ad oggi tuttavia, sono stati creati metodi avanzati per imitare queste capacità in modo automatico. Uno di questi è l’interpretazione dei metadati, ovvero dei riferimenti associati a ciascun file: un esempio del loro funzionamento, può essere una canzone in formato mp3. Essa infatti può contenere non solo l’audio ma anche il nome dell’artista, il titolo dell’album e varie altre informazioni.

In questo caso, utilizzando i metadati, si ha la possibilità di isolare una certa tipologia di brani, e quindi ascoltare tutti i brani di uno stesso autore, o dello stesso album e via dicendo. Esistono metadati che fanno inevitabilmente parte del file, e altri che vengono scritti al momento della modifica del file stesso. Naturalmente, non tutti gli apparecchi sono in grado di produrre gli stessi metadati, e di conseguenza, non tutti i software sono in grado di leggere tutti i metadati.

Va inoltre detto che i metadati non nascono con il digitale, anche se è ovvio che sia stato proprio questo ad averne generato un aumento esponenziale di utilizzo. Si è soliti pensare che i metadati vengano prodotti solo quando si creano dei contenuti, ma non è esattamente così. Ad oggi infatti, l’utente crea metadati anche nel momento in cui naviga online; cliccare un determinato link o visitare una pagina di un sito sono tutte azioni che permettono al sito di agevolare la nostra ricerca. Tutte le azioni compiute sul sito infatti, verranno trascritte in dei server che registrano la comunicazione avvenuta tra server e utente, che porteranno ovviamente con sé dei metadati.

Page tagging

Sono state poi create anche alcune tecniche di monitoring che consentono una prima analisi di comportamento dell’utente.

Una delle più efficaci è senza dubbio il page tagging, una tecnica che permette di indicizzare determinate aree o elementi di una pagina, quali paragrafi, immagini o altro e di tracciare come l’utente interagisce con essi, calcolando ad esempio il tempo in cui ci si sofferma su una certa area durante lo scroll della pagina.

Esempio concreto di quanto affermato, riguarda la piattaforma Facebook; come dichiarato dagli stessi Termini di Servizio del social, la piattaforma è in grado di calcolare quali sono i post che ci piacciono di più, le tematiche che ci potrebbero interessare o ancora i profili che visitiamo più spesso. L’esperienza dell’utente viene quindi analizzata in maniera approfondita, con (anche) il fine di poter apportare modifiche e migliorie alla piattaforma.

I cookie

Un altro strumento di raccolta dati, e forse ad oggi quello più conosciuto, riguarda i cookie.  Si tratta in realtà di semplicissimi file di testo che contengono informazioni lette dai server che si visitano. Informazioni che, chiaramente, vengono aggiornate a ogni visita.

Sempre a proposito dei cookie, sono state emanate delle direttive riguardo la loro gestione da parte dell’Unione Europea.  Le varie compagnie progettano dunque cookie ad hoc per ottenere informazioni quanto più precise possibili.

I big data

Quando si parla di big data, come suggerito dal termine stesso, si parla fondamentalmente di un grande database. Oracle denominava le quattro caratteristiche principali dei big data come le quattro “V”: volume, velocità, varietà, valore.

Il volume è la quantità di dati che viene raccolta. La velocità indica invece il tempo di ingresso di nuove informazioni e la capacità di elaborare quest’ultime in tempi piuttosto brevi. La varietà è invece una caratteristica dei big data che si trovano a gestire diversi tipi di contenuti. Infine il valore, come noto infatti i big data riscuotono un enorme successo per la loro fondamentale importanza.

Il principio dietro al quale si celano i big data è dunque quello di avere delle banche dati enormi che permettano di avere una visione numerica e precisa di quanto accade.

Digital footprint e digital shadow

La digital footprint non è altro che l’insieme delle tracce che lasciamo dopo le nostre ricerche in rete. Parte di queste tracce vengono da noi lasciate involontariamente: ad esempio le informazioni circa l’hardware che stiamo utilizzando, gli orari in cui utilizziamo il computer o, quando utilizziamo il GPS, quali luoghi abbiamo visitato.

La digital shadow invece è la figura completa che si è in grado di creare una volta analizzati i dati della footprint. Corrisponde sostanzialmente all’idea che ci si fa delle altre persone, in base a quanto e come si espone in rete. Essa è inoltre un elemento molto rilevante per gli hacker.

I concetti di foot print e digital shadow sono due concetti non molto distanti l’uno dall’altro, ma che spesso vengono confusi. Fondamentalmente essi sono il resoconto di tutti i metodi analizzati in precedenza.

Tracking on the web

La nascita delle applicazioni del web, quali i social network rendono la rete un ambiente chiuso, Facebook ne è l’esempio. Gli utenti passano infatti il tempo all’interno di un dominio.

In altri termini: le singole piattaforme creano spazi chiusi che nella letteratura angloamericana si definiscono “walled garden” o “giardino recintato” che si manifestano su almeno quattro livelli diversi:

    • Linguistico
    • Sociale
    • Ideologico
    • Tecnico

Il livello linguistico vede un indebolimento della lingua inglese che, dal 2011, perde la sua egemonia culturale all’interno del web.

Il sorgere di nuovi problemi e di integrazione sono materia più complessa a livello sociale. I gruppi sociali online tendono a riprodurre le loro tendenze offline su Internet. Ciò viene definito “omofilia”, la propensione delle persone a ricercare e mantenere i contatti con i propri simili a livello culturale, sociale ed economico.

L’uso smisurato di Internet ha portato a proporre un modello più rigido e bloccato: segregazione ideologica, cioè la tendenza delle persone a selezionare le fonti di informazione in base alle proprie idee pregresse. Questo per ricercare la conferma delle proprie opinioni.

La frequentazione di interlocutori allineati alle proprie idee sta portando a una radicalizzazione tale da produrre un allontanamento ulteriore del confronto con le diversità. Questo rischia di creare una pericolosa frantumazione perché i simili tendono a riconoscersi nel piccolo ambiente e producono quindi una solidarietà ristretta piuttosto che allargata, come avviene ad esempio con i blog.

La spiegazione tecnica di tale fenomeno viene ad esempio da Google, il quale sta operando una sorta di bolla intorno ad ogni singolo utente. Cioè l’atto di segmentare l’utenza attraverso le tracce rilevate da questa sorta di “bolla”. L’innovazione portata dal Google segna il passaggio da una fase in cui egli stesso inizialmente forniva a tutti la stessa versione della realtà, mentre ora i risultati vengono creati su misura di ogni profilo di un singolo utente: omologazione, quindi individualizzazione.
Ma che cos’è il filter bubble? È un percorso che traccia le azioni degli utenti su Interne, le quali vengono raccolte e inglobate all’interno del sistema.

Queste azioni sono ad esempio quelle di ricerca di informazioni di ogni genere, le interazioni tra diversi utenti o il tempo che si trascorre a guardare un video. Ciò significa che le azioni che vengono svolte oggi, diventeranno poi le nostre future bolle un domani.

Ma qualcuno di noi si è mai accorto di questa bolla di filtraggio? No, il filter bubble è qualcosa di cui nessuno è realmente conscio, è un processo che, al contrario, e quindi inconsciamente, ogni utente subisce ogni giorno. È però, anche ciò di cui pubblicità e commercio si servono per vendere. È un sistema che non permette di uscire dalla sfera personale, fisica e ideologica della persona.

Curioso è il termine scelto per questo meccanismo “Filter Bubble”. Colui che lo ha inventato è Eli Pariser e lo ha descritto nel suo libro The Filter Bubble: What the Internet Is Hiding from You. Nel libro viene descritto un mondo immaginario in rete, all’interno della quale la persona vive la propria vita quotidiana e fantastica sul mondo digitale senza segreti e in cui tutte le ricerche future sono influenzate e filtrate dalle sue ricerche precedenti. Tuttavia, tutto ciò non è così surreale o qualcosa di immaginario, ma rappresenta esattamente l’attuale mondo contemporaneo.

Così, proprio tramite i cookie, si traccia il comportamento degli utenti, si memorizzano i risultati e li si adatta ad ogni singolo utente sulla base degli algoritmi. I cookie sono delle informazioni che vengono raccolte dai server ai clienti e che vengono poi successivamente immagazzinate. Qual è il loro obiettivo? La loro funzione è, nello specifico, relativa a più ambiti quali ad esempio quella di offrirci informazioni in maniera più veloce, conoscere ciò che un utente vuole e suggerirlo prima che questo possa chiederlo. Possono avere anche scopo commerciale e quindi di analisi, ma anche di intercettazione di un luogo.  Una visione alquanto interessante, ma al contempo anche molto preoccupante. Perché? I Big Data possono tornare molto utili in situazioni futili o di svago, ma in altri casi anche molto svantaggiosi. Basti pensare alla presenza su social network come Facebook, ad esempio. Infatti sulla piattaforma gli utenti navigano alla ricerca di più notizie come trovare amici di vecchia e nuova data, gruppi di appartenenza, pagine di informazione o pagine aziendali.

Qual è quindi il meccanismo che sta alla base dei cookie? Proprio questo: se un utente si relaziona che una pagina sportiva condividendone i contenuti e/o commentandoli, successivamente verrà inondato di informazioni riguardanti lo stesso argomento. Questo perché il Filter Bubble conosce le mosse che l’utente svolge in rete. E se applicassimo tutto quello che è stato poco innanzi sopra detto non solo a Facebook, ma a tutta la rete? I cookie quindi, fanno parte di un metodo di profilazione. Questa serve a segmentare il comportamento degli utenti grazie alla raccolta delle attività e dei loro dati personali e alla loro elaborazione.

L’applicazione nel settore commerciale, attraverso la profilazione, offre la possibilità di creare servizi personalizzati come ad esempio pubblicità comportamentale. Tuttavia per realizzare ciò, risulta fondamentale sapere che i Big Data devono essere utilizzati secondo una finalità legata ad un principio di pertinenza e di proporzionalità seguendo tre elementi guida. Quali? Primo fra tutti:

    • il trattamento automatizzato il quale afferma che: «La protezione delle persone fisiche dovrebbe applicarsi sia al trattamento automatizzato che al trattamento manuale dei dati personali, se i dati personali sono contenuti o destinati a essere contenuti in un archivio». Inoltre «Non dovrebbero rientrare nell’ambito di applicazione del presente regolamento i fascicoli o le serie di fascicoli non strutturati secondo criteri specifici, così come le rispettive copertine». «In definitiva, pertanto, il GDPR si applica ai trattamenti interamente o parzialmente automatizzati e semplicemente per il fatto di avere questa caratteristica, oppure, al trattamento manuale sempre che i dati siano successivamente archiviati» (Agenda Digitale)
    • Eseguito su dati personali.
    • Con lo scopo di valutare aspetti personali di una persona fisica.

Risulta evidente, da quanto sopra descritto, che il trattamento dei dati è una vera e propria analisi che ha la facoltà di analizzare le preferenze o i comportamenti che riguardano il soggetto interessato e non un semplice trattamento dell’utente in rete. È necessario adottare però delle misure di sicurezza analizzando i rischi che si possono correre quando si trattano i dati personali degli utenti. È quindi opportuno considerare adeguatamente la formazione del personale, la nomina degli amministratori di sistema e le procedure di disaster recovery.

Pertanto, diventa fondamentale valutare il rischio di discriminazione, danni alla reputazione e il furto d’identità. Dalla elaborazione dei big data, si possono rilevare dei dettagli informativi molto invasivi, occorre quindi fare a monte una valutazione di impatto prima di essere impiegati in quantità significativa.

Il rischio della profilazione è che possa arrecare danni alle persone fisiche, al contrario in ambito commerciale il rischio è quello della “price discrimination”. Ciò significa creare disuguaglianza sociale o discriminare le minoranze. L’informazione sulla logica alla base della profilazione non può non tener conto della direttiva Trade Secrets dell’Unione europea. Il suo fine è perciò, quello di proteggere i segreti commerciali, noti come “trade secrets”. Alla base della profilazione, quindi, è previsto l’obbligo della conoscenza del regolamento europeo.

La profilazione e i cookie

La profilazione è il processo di costruzione di profili utenti generati dall’analisi dei dati, attraverso degli algoritmi. Nel marketing questa tecnica diventa fondamentale in quanto permette di colpire il target in modo molto più efficace, recapitando messaggi pubblicitari che vadano incontro agli interessi degli utenti, alle loro abitudini e alle caratteristiche del singolo destinatario.

Un metodo per tessere i profili degli utenti in modo da poter realizzare dei messaggi pubblicitari mirati, sono i cookie di profilazione. Questi strumenti hanno lo scopo preciso di capire le preferenze di ciascun utente, creando quindi la possibilità di sottoporre a ogni utente dei contenuti targettizzati, che siano quindi di loro interesse e conseguentemente più efficaci.

Ma come sono nati i cookie? Quali sono stati i loro primi utilizzi e quali le loro evoluzioni?

Definizione di cookie e magic cookie

I cookie sono un biglietto identificativo del client, che gli permette di essere riconosciuto in modo univoco dal server. Il client siamo noi, gli utenti che navigano la rete e il server in questo caso è il sito che stiamo visitando e il suo gestore.

I cookie quindi sono come dei gettoni che vengono utilizzati dalle applicazioni per recuperare delle specifiche informazioni dagli utenti che la utilizzano. Il termine cookie è l’abbreviazione di cookie web, ad indicare l’utilizzo di questo particolare strumento nell’ambito di Internet.

I cookie web appartengono alla categoria dei magic cookie che sono dei token digitali, ossia dei brevi pacchetti di dati che vengono scambiati tra più programmi in comunicazione tra loro. I contenuti memorizzati in questi token sono definiti “opachi” in quanto non sono significativi per il programma destinatario. Questi dati e queste informazioni per essere interpretate devono attendere il momento in cui esse vengono restituite al mittente originario.

Spesso al termine cookie si associa l’idea di una serie di file che contengono informazioni sensibili e rilevanti, in realtà essi sono semplicemente delle stringhe di testo, che possono essere memorizzate all’interno di un file o in altro modo, e che semplicemente identificano il singolo browser tra i molti che hanno visitato un determinato sito.

I primi utilizzi dei cookie

Il termine cookie, o meglio magic cookie, deriva da “fortune cookie”, cioè i biscotti della fortuna cinesi, popolari in tutto il mondo per nascondere al loro interno un messaggio. L’analogia, come viene spiegato nel seguente video, si basa sul fatto che i magic cookie contengono varie informazioni.

I magic cookie venivano impiegati nell’ingegneria informatica dagli anni ’80: uno dei primi programmi ad utilizzare un metodo di autenticazione tramite cookie fu X Window System, un gestore grafico che veniva utilizzato soprattutto nei sistemi operativi basati su GNU e su Linux. In questo modo attraverso delle informazioni memorizzate all’interno di un file di proprietà dell’utente il programma era in grado di identificare chi lo stava utilizzando e di autorizzarlo quindi a lavorare su quella specifica macchina. I cookie, infatti, possono essere utilizzati come un biglietto identificativo, un ticket di riconoscimento che è difficile da falsificare e che può quindi essere utilizzato come prova di autenticazione o come autorizzazione.

Nel 1994, il programmatore statunitense Lou Montulli ha avuto l’idea di applicare i cookie anche nel campo della web communication. In quel periodo Lou Montulli lavorava presso la Netscape, che stava sviluppando un sistema di e-commerce per la compagnia di telecomunicazioni MCI. La MCI non voleva che i propri server dovessero conservare dati sulle transizioni, così chiese alla Netscape di trovare un metodo per immagazzinare quei dati sulle transizioni nei computer di ogni utente. I cookie divennero la soluzione per risolvere il problema di un carrello virtuale affidabile.

Il 13 ottobre del 1994 è stata pubblicata la versione 0.9 beta di NCSA Mosaic (inizialmente chiamato Mosaic Navigator), web browser che interagiva tramite la tecnologia dei cookie. Così, Lou Montulli insieme a John Giannandrea (informatico scozzese) hanno scritto la prima specifica dei cookie di Netscape Navigator.

La prima volta che vennero utilizzati i cookie, al di là delle sperimentazioni, è stato per determinare se i visitatori del sito web della Netscape avessero già visitato il sito in precedenza (più avanti nell’articolo ne verrà spiegato esattamente il funzionamento).

La domanda per il brevetto della tecnologia dei cookie è stata depositata nel 1995 da Montulli.

Dopo essere stati implementati in Netscape 0.9 beta nel 1994, i cookie sono stati integrati in Internet Explorer 2, browser rilasciato nell’ottobre del 1995.

L’introduzione dei cookie è rimasta pressoché sconosciuta al grande pubblico per molto tempo. Inoltre, i cookie venivano accettati di default attraverso i parametri di navigazione, perciò gli utenti non venivano informati della loro presenza. Alcuni utenti vennero al corrente dell’esistenza dei cookie nel primo trimestre del 1995, ma il grande pubblico ne ha preso conoscenza solo il 12 febbraio 1996, quando il Financial Times ha pubblicato un articolo a questo proposito. Nello stesso anno, l’argomento cookie ha ricevuto parecchie attenzioni da parte dei media a causa della loro invadenza della vita privata. I cookie furono oggetto di discussione nelle due consultazioni della Federal Trade Commission nel 1996 e nel 1997.

Lo sviluppo della specifica ufficiale dei cookie era già in corso. Le prime discussioni su questa specifica ufficiale ebbero luogo nel 1995 attraverso la mailing list www-talk.

Fu creato un gruppo di lavoro dell’Internet Engineering Task Force per indagare sul loro funzionamento e il loro impiego. Questo gruppo di lavoro ha preso la specifica di Netscape come punto di partenza per analizzare questa tecnologia. Nel febbraio del 1996, hanno determinato che i cookie fossero effettivamente una minaccia per la protezione della vita privata. Il gruppo di lavoro lavorò quindi a una loro specifica in cui hanno descritto i loro studi a riguardo.

 

Col tempo anche il protocollo http, comunemente utilizzato per il trasferimento di risorse e di contenuti di vario tipo tramite la rete, è stato adattato e integrato con dei meccanismi particolare per la gestione dei cookie. Grazie a queste implementazioni è possibile realizzare una comunicazione in grado di mantenere in memoria informazioni relative allo stato. Quando per esempio visitiamo un sito e eseguiamo il login ne vedremo una versione diversa, creata appositamente per gli utenti registrati. Il sito e il suo dominio però sono sempre gli stessi, sia prima che dopo il login, la differenza sta nel cookie che comunica al server un cambiamento di stato da utente non registrato, a utente loggato. Questo dettaglio viene trasmesso ad ogni richiesta che l’utente fa all’interno del sito e quest’ultimo è quindi in grado di rispondere ogni volta con i contenuti corretti.

I cookie nel protocollo http sono utilizzati dai server web principalmente per identificare l’utente client, permettergli l’accesso a specifiche risorse altrimenti nascoste e memorizzare informazioni utili lato server.

A partire dal 2015, in Italia tutti hanno potuto notare il banner che appare quando si apre un sito web, che informa sull’utilizzo dei cookie. Infatti, in quell’anno sono entrate ufficialmente in vigore le normative relative ai cookie.

Cookie e http

Come è stato scritto precedentemente, uno dei primi usi dei cookie nel protocollo http risale al 1994 quando il sito di Netscape cominciò ad utilizzarli per ottenere informazioni aggiuntive sui propri visitatori. In particolare l’interesse dell’azienda era capire se gli utenti stavano visitando per la prima volta il sito oppure no. Alla prima visita il server di Netscape salvava sotto forma di cookie una stringa alfanumerica nel pc client dell’utente che doveva essere rimandata al sito ogni volta che ne venisse fatta richiesta. Ad ogni ulteriore visita il browser interrogato dal server rispondeva con questa stringa permettendo così al gestore del sito di sapere quanti utenti erano alla prima visita e quanti alle successive.

Il funzionamento dei cookie può quindi essere semplificato in questo modo:

    1. L’utente client invia una richiesta al server per visitare il sito.
    2. Il server riceve la richiesta http e invia in risposta le informazioni per visualizzare il sito e un allegato aggiuntivo contenente il cookie.
    3. Il web browser riceve la risposta, mostra i contenuti all’utente e salva in una cartella il cookie ricevuto.
    4. Alle successive richieste il web browser allegherà il cookie salvato e lo manderà al server.

All’interno dei cookie possono essere memorizzate informazioni di vario tipo, legate alle preferenze sull’aspetto grafico, alla lingua, ai dati di navigazione e a molti altri aspetti.

Come funzionano

Entrando nel dettaglio quando un client intende visitare un particolare dominio deve mandare una richiesta http al server. Questo riceve la richiesta e manda una risposta al client per permettergli di visualizzare il sito. All’interno di questa risposta viene aggiunto il cookie, sotto forma di header aggiuntivo.

Il client riceve la risposta, nota la presenza del cookie e lo memorizza in una cartella apposita, assieme a tutti gli altri cookie che sta conservando. All’interno del cookie è presente una stringa di testo arbitraria, una data di scadenza oltre la quale il cookie non deve più essere considerato valido, e un pattern per riconoscere i domini a cui rimandarlo. In una sola risposta http possono essere mandati più cookie.

Il browser web a questo punto rimanderà il cookie al server, senza alcuna modifica, allegandolo a tutte le richieste http che soddisfano il pattern, entro la data di scadenza. Il server che riceve il cookie di ritorno può scegliere se assegnarne uno di nuovo, inviandolo al client e sovrascrivendo quello esistente.

Ogni pagina web e ogni dominio, come una sua porzione, può impostare dei cookie diversi: una pagina Internet può infatti contenere più oggetti che provengono da molti domini diversi e ognuno di essi può avere i propri cookie. I browser che usiamo per navigare la rete contengono molte centinaia di cookie.

Il funzionamento dei cookie dipende interamente dal browser di navigazione che l’utente usa. Alcuni permettono un controllo più specifico, come Opera e Firefox, altri invece hanno a disposizione opzioni più rudimentali, come Internet Explorer.

I diversi utilizzi

I cookie servono a raccogliere informazioni e a monitorare la navigazione su Internet e proprio per questo spesso essi sono oggetto di discussione per quanto riguarda il diritto alla privacy. I gestori dei siti web devono sempre redigere una cookie policy dove specificano nei dettagli la politica dei propri cookie e di quelli di terze parti.

È utile specificare che il cookie è una stringa di testo di piccole dimensioni e non un programma. È un insieme di dati che quindi non è in grado di eseguire alcuna azione malevola sul computer client. Capita però che a volte i cookie scaricati da un determinato sito vengano riconosciuti come spyware dal computer, questo di solito accade quando le informazioni memorizzate al suo interno rendono possibile l’individuazione e l’identificazione dell’utente.

Oggi tutti i siti permettono agli utenti di decidere autonomamente se accettare o meno i cookie. Se questi vengono rifiutati però alcuni oggetti presenti nella pagina non saranno in grado di funzionare e alcuni strumenti del sito saranno inutilizzabili.

Nel dettaglio i cookie possono essere utilizzati per:

    • Associare i carrelli della spesa virtuali ai relativi utenti, aggiungendo o togliendo elementi in qualsiasi momento e caricando il giusto carrello ad ogni sessione nel sito.
    • Permettere al server di capire se un utente ha eseguito o meno il login all’interno del sito.
    • Memorizzare le preferenze dell’utente riguardo la visualizzazione e la personalizzazione delle pagine web.
    • Tracciare i percorsi di navigazione degli utenti all’interno dei siti o tra siti diversi, salvando informazioni come gusti e preferenze.
    • Memorizzare e analizzare le visite degli utenti, i percorsi che compiono e i problemi riscontrati, in modo da poter migliorare la gestione del sito stesso.
    • Condividere informazioni di rete sociali con altri utenti (mi piace, commenti e condivisioni) sui social network).

A seconda dello scopo e dell’utilizzo si possono identificare molte tipologie di cookie che verranno esaminate più avanti. Tra queste troviamo per esempio il cookie di sessione e il cookie tecnico.

Il cookie di sessione contiene un identificativo di sessione univoco che permette di riconoscere l’utente ad ogni richiesta che fa al sito, fornendogli così contenuti opportuni e personalizzati. Grazie a questo identificativo le informazioni memorizzate sul client sono limitate. Tramite i cookie di sessione si richiamano le informazioni memorizzate nel server, più complete e più esaustive per migliorare l’esperienza dell’utente. La quantità ridotta di informazioni che viaggia in questo modo permette di ottenere tempi di caricamento dei siti più rapidi.

Il cookie tecnico è il cookie principale, quello che serve per memorizzare le opzioni per tutti gli altri cookie. Esso contiene i consensi che l’utente dà per permettere poi l’invio e la ricezione dei successivi pacchetti di informazioni.

Dettagli tecnici dei cookie

Come visto prima i cookie non sono dei file di testo, ma sono delle stringhe di testo che possono essere memorizzate in dei file testuali e che sono composte da alcuni attributi principali:

    • Il nome o il valore del cookie.
    • La scadenza: è un attributo opzionale che definisce dopo quando tempo il cookie può essere eliminato perché non ritenuti più valido. Può essere inserito un periodo di tempo ben definito, può essere eliminato immediatamente o può essere persistente, e quindi senza scadenza.
    • La modalità di accesso: può avvenire solo tramite protocollo http o anche attraverso altri linguaggi presenti nella pagina, in particolare tramite script di vario tipo.
    • Il livello di sicurezza: indica se il cookie può essere trasmesso liberamente o se deve essere utilizzato un protocollo criptato (https).
    • Il dominio e il percorso: definiscono l’ambito di visibilità del cookie e specificano il dominio e il percorso ai quali esso deve essere inviato.

Tipologie di cookie

I cookie, come visto prima, possono avere molte funzioni diverse e hanno al loro interno molteplici caratteristiche. Per questo motivo è difficile raggruppare questo strumenti all’interno di categorie specifiche e ben definite. Vediamo di seguito alcune delle classificazioni dei cookie più frequente, che si basano sul ciclo di vita, sulla provenienza, sulla funzionalità e sui diversi attributi impostabili.

Per quanto riguarda il ciclo di vita dei cookie essi possono essere distinti tra:

    • Cookie di sessione: non hanno una data di scadenza e vengono eliminati alla chiusura del browser web.
    • Cookie persistenti: hanno una data di scadenza specifica o non vengono eliminati, essi trasmettono informazioni al server ogni qual volta l’utente acceda ad una specifica risorsa o ad un particolare dominio.

In base alla provenienza dei cookie si parla invece di:

    • Cookie di prima parte: provengono direttamente dal dominio che si sta visitando e sono gestiti direttamente dal responsabile del sito.
    • Cookie di terze parti: provengono da domini diversi rispetto a quello in cui l’utente si trova e vengono generati dai contenuti di siti web esterni.

I cookie possono essere distinti anche in base alla funzionalità per la quale sono stati pensati:

    • Cookie tecnici: servono per la navigazione nei siti e per facilitare l’accesso e la fruizione del sito stesso.
    • Cookie statistici: aiutano ad ottimizzare il sito analizzando il comportamento degli utenti al suo interno.
    • Cookie per la memorizzazione delle preferenze: servono a favorire l’utilizzo corretto del sito da parte degli utenti, memorizzando informazioni come per esempio le preferenze sulla lingua.
    • Cookie pubblicitari: servono per fornire spazi pubblicitari e per profilare in modo anonimo l’utente tipo che li visualizza.
    • Cookie di social network: consentono di condividere anche con altri utenti i contenuti del sito che si sta visitando.

A seconda delle funzionalità di ogni singolo cookie variano gli attributi contenuti al suo interno. In base a come questi vengono impostati si parla di:

    • Secure cookie: può essere trasmesso solo attraverso una connessione crittografata.
    • Http Only cookie: possono essere utilizzati solo se trasmessi tramite il protocollo http.
    • Same Site cookie: consentono l’invio dei cookie solo alle richieste che provengono dalla stessa fonte.
    • Super Cookie: utilizza un nome di dominio di origine di primo livello (.com) a differenza dei cookie tradizionali che provengono da un nome di dominio di secondo livello (example.com). Questa particolare tipologia viene bloccata nella maggior parte dei casi in quanto permette e facilita un uso malintenzionato dello strumento.
    • Zombie cookie: viene ricreato automaticamente dopo essere eliminato.

Risultati, effetti e conseguenze

La profilazione è quindi una tecnica di raccolta dati che fa in modo che quando un utente entra in un sito non sia solo un numero tra i tanti, ma che gli vengano offerti contenuti e servizi pertinenti attraverso un’interfaccia personalizzata.

Un concetto da non confondere con la customizzazione che vuol dire offrire una serie di caratteristiche all’utente tra cui lui può scegliere.

Personalizzazione: vantaggi

In questo caso parliamo di personalizzazione poiché significa personalizzare un’esperienza individuale in tempo reale grazie ai dati forniti dalla cronologia di ricerca, dal GPS e dal comportamento di acquisto. Sono quindi azioni di decisione dell’azienda, non dell’utente.

Pensiamo in ambito di retail, sono due le possibilità che si possono trovare: un sito di un brand di abbigliamento che crea una homepage personalizzata secondo i tuoi interessi e gusti, d’altra parte possiamo incontrare un sito con un’offerta generica, non pertinente.

Il trattamento del dato è un tema sensibile che ha creato e crea ancora oggi molte discussioni tra le diverse linee di pensiero, ma vediamo, grazie ad alcune ricerche, che l’utilizzo del dato per la personalizzazione è fonte di successo per i retailer:

    • I rivenditori hanno meno di otto secondi per coinvolgere un utente sul proprio sito Web o app. (Microsoft, 2015)
    • Il 33% dei clienti che abbandona i rapporti commerciali lo fa perché manca la personalizzazione. (Accenture, 2018)
    • L’81% dei consumatori desidera che i marchi li conoscano e capiscano quando affrontarli. (Accenture, 2017)
    • Nel 2016, le promozioni personalizzate della home page hanno influenzato l’85% dei consumatori ad acquistare, mentre le raccomandazioni personalizzate del carrello hanno influenzato il 92% degli acquirenti online. (Kibo, 2017)

Questi dati ci permettono di capire che su un sito la personalizzazione non è vista come invadente, ma al contrario è apprezzata poiché il brand viene percepito come una vera e propria persona incline a conoscere tutti i suoi utenti per rendere loro un’esperienza curata e avvolgente. Allo stesso tempo si può definire come anticipazione: quando l’utente arriva sul sito web infatti, si trova esattamente quello di cui ha bisogno e risparmia così del tempo, risorsa sempre più preziosa nell’ambiente digitale.

Nella vita frenetica del XXI secolo, la personalizzazione è uno strumento che impara e si adatta, così da stare al passo con la velocità e le esigenze delle persone per offrire soluzioni significative, facili e immediate.

Se l’azienda crea questo livello superiore di esperienza per i suoi utenti ne trae considerevoli vantaggi come un ritorno di immagine, un aumento di fidelizzazione e un conseguente rialzo delle entrate.

Democrazia o capitalismo?

Una delle caratteristiche della rete è il decentramento. Infatti, se prima il potere era centralizzato su alcune autorità centrali, ora, grazie al protocollo TCP/IP la rete è caratterizzata da comunicazioni bidirezionali che la rendono democratica. Ciò vuol dire che ogni utente si inserisce in rete liberamente.

Questa apparente democrazia ha fatto sì che l’utente mettesse addirittura la propria identità sul web, soprattutto con la nascita del web 2.0 quindi con i social network. Da qui è infatti nata una fitta rete di informazioni e dati personali che hanno poi permesso la raccolta dati per la personalizzazione di cui parliamo.

Se da un lato è evidente che la personalizzazione porti vantaggi per aziende e anche per i consumatori, c’è un’altra prospettiva da considerare: ci sono dei limiti.

Oggi ci troviamo nella società dell’informazione in cui chi ha il potere, non è chi possiede oro o petrolio, ma è colui che ha accesso a dati e informazioni.

Tra questi ci sono Google e Facebook. Ma la rete è democrazia o capitalismo? Negli ultimi anni infatti, i due colossi del web si sono creati delle forme di monopolio poiché sono coloro che hanno accesso ai nostri dati. Proprio Google e Facebook infatti, nel 2019 si sono battuti per l’acquisizione di FitBit, una tra le aziende più note di braccialetti e orologi smart. Un evento che potrebbe passare inosservato se non che Google ha pagato 2,1 miliardi di euro proprio per inserirsi nel mercato definito come l’oro del futuro: i dati sanitari. Gli smartwatch infatti, si stanno sviluppando con una velocità tale che, grazie a sensori sempre più precisi, saranno in grado di valutare lo stato di salute di ogni persona che lo indossa.

Capiamo quindi che siamo immersi in un processo a cui siamo abituati, sempre più personal. I computer da tubo catodici sono diventati personal computer, i telefoni sono diventati smartphone e gli orologi, anche questi ora sono smart. Lungo questi ultimi 20 anni infatti, i dispositivi digitali hanno subito uno sviluppo di miniaturizzazione e personalizzazione tali da diventare parte del nostro corpo. E troppo spesso non ci chiediamo neanche più il perché o le vere funzioni che questi hanno. Proprio per questo, l’apparente democrazia iniziale della rete ci ha invogliato a inserire la nostra identità e a entrare in questo circolo di normalità, per sfruttare poi proprio questo andamento per creare una forma di capitalismo.

Personalizzazione: svantaggi

Se una volta avevamo poche fonti da cui trarre informazioni, prodotti e servizi come il negozietto del paese per fare la spesa piuttosto che il telegiornale per ascoltare le notizie; oggi siamo tenuti ad ascoltare, elaborare, confrontare e cercare di sviluppare delle nostre idee e percezioni delle cose, scegliendo quale fonte sia più adatta e quale no. In questo, gli algoritmi che dovrebbero aiutarci, sembra stiano invece complicandoci il processo.

Ce la complicano per il semplice fatto che ci danno troppe informazioni e tutte “su misura per noi” nella misura in cui, qualcuno ha deciso cosa debba essere su misura per noi. (Rudy Bandiera)

Sulle ricerche fatte su Google infatti, a fronte della medesima query di ricerca, ogni persona visualizzerà dei risultati diversi, personalizzati come risultato della profilazione che Google ha eseguito su ogni diverso utente. Da un lato come abbiamo visto precedentemente potrebbe essere visto come un risultato positivo, che sia significativo e incline alla soggettività di ogni persona.

Pensiamo però a un sito web che offre allo stesso utente sempre lo stesso stile di abbigliamento o sempre la stessa categoria cinematografica. Il rischio reale è che ci offrano sempre le stesse cose, in linea con i nostri gusti, senza mai andare fuori dagli schemi. Il che non vuol dire offrire qualcosa di completamente assurdo, ma è strano pensare che potrebbero precluderci qualcosa che potrebbe invece interessare. E questo non è forse un limite culturale? In questa ottica si potrebbe pensare che la società stia crescendo sempre con gli stessi schemi, con gli stessi input, con una linea stabile di pensiero e quindi con un’esperienza limitata.

La personalizzazione vista da questa prospettiva potrebbe essere un limite o perché no, uno strumento di controllo.

Un cambio di paradigma non da poco.

Modalità in incognito

Tutto ciò che facciamo o diciamo online è rintracciabile. Potremmo trovare e testare svariate misure per rendere più difficile seguire le nostre tracce, ma ci sarà sempre una pista che riconduce a noi e alle nostre ricerche.

Una di queste modalità è la navigazione in incognito, o privata, utilizzata molto spesso da utenti molto attenti e interessati alla riservatezza della loro privacy.

La modalità in incognito, o navigazione privata, è una funzione di privacy presente in alcuni browser web. Quando si naviga in incognito il browser non salva né la cronologia di navigazione né i dati associati alla sessione, come ad esempio i cookie, che vengono cancellati proprio nel momento della chiusura della sessione.

Tutte le varie implementazioni sono ideate soprattutto per impedire che la cronologia e i dati associati a una particolare sessione di navigazione online rimangano sul dispositivo o vengano scoperti da altri utenti che utilizzano lo stesso dispositivo.

Uno dei primi browser web a includere questa particolare funzionalità è Safari, di Apple. Da lì poi questa funzione è stata adottata da diversi browser web fino a divulgarsi ufficialmente nel 2008 grazie alle principali agenzie di stampa e dei siti web di informatica.

Questa modalità di navigazione, quindi, tiene vuota la cronologia di navigazione dell’utente e cancella tutti i cookies una volta terminata la sessione, in modo che non possano essere recuperati in accessi successivi. La modalità di navigazione privata, però, non nasconde al nostro ISP o all’amministratore di rete i siti che visitiamo.

Tramite la tecnica del fingerprinter i provider Internet possono sapere chi è l’utente che sta navigando in incognito. Il fingerprinter è un sistema che memorizza diversi dati come: il tipo di dispositivo, il sistema operativo, la risoluzione dello schermo, la lingua, il processore grafico ecc., per creare un’identità univoca che gli permette di riconoscerci, nonostante l’attivazione della modalità incognita.

Gli utilizzi delle modalità di navigazione privata forniscono una sessione temporaneamente “pulita” all’utente. Secondo un recente sondaggio pubblicato dal sito DuckDuckGo, un motore di ricerca che offre ricerche anonime, il 18% degli utenti utilizza la navigazione privata soprattutto quando pratica shopping online.

Il 48% dei partecipanti, invece, utilizza la navigazione in incognito per cancellare e nascondere le ricerche che DuckDuckGo definisce “potenzialmente imbarazzanti”.

Durante la modalità di navigazione “normale” vengono registrati dei cookies sul nostro computer che contengono tutte le informazioni di quello che stiamo cercando in quel determinato istante. Attraverso queste informazioni i gestori dei servizi, come ad esempio compagnie aeree, albergatori ecc., possono sapere che siamo interessati a quelle specifiche date per un volo o per un albergo e, alla ricerca successiva, mostrarci molto spesso dei prezzi più alti. I cookies, però, hanno differenti utilizzi. Sono utili ai siti web per generare offerte istantanee, notizie o previsioni meteo in base alla nostra posizione; possono aiutare a modificare il layout di una pagina in base alle nostre preferenze o a cambiare la visualizzazione di una pagina se nel passato l’avevamo già visitata. Alcuni cookies riescono a controllare per quanto tempo ci soffermiamo in una determinata pagina o su un determinato elemento di un e-commerce. Per questo motivo, quando ritorniamo nel negozio online che abbiamo visitato, ci verranno presentati una serie di articoli simili o uguali a quelli che già avevamo guardato.

Usando la modalità in incognito, i cookies vengono eliminati nel momento della chiusura della finestra. Per cui, accedendo successivamente allo stesso sito web ed effettuando la medesima ricerca, ci verrà presentata una pagina “pulita” poiché ad essa abbiamo impedito di conoscere i nostri reali interessi.

Tutto questo, naturalmente, sarà possibile solamente se non verrà fatto alcun login in nessuna piattaforma o servizio: nel momento in cui accediamo, ad esempio, a Facebook o a Google, saremo nuovamente monitorati per scopi pubblicitari. È una precauzione molto importante per impedire agli inserzionisti di raccogliere le informazioni sui siti che stiamo visitando.

Se si vuole navigare in modo completamente anonimo senza correre rischi la soluzione migliore è sicuramente quella di utilizzare una VPN. Una VPN (Virtual Private Network) è una rete privata virtuale che garantisce privacy, anonimato e sicurezza attraverso un canale di comunicazione riservato, chiamato tunnel VPN, e creato sopra un’infrastruttura di rete pubblica. Installando questi VPN possiamo nascondere la nostra posizione e le nostre ricerche dalle possibili intrusioni esterne. I VPN gratuiti hanno funzionalità limitate, ma offrono un’ottima protezione nella maggior parte dei casi.

Case study: Netflix

Alla luce di quanto riportato finora, il tema della personalizzazione, appare indissolubilmente legato al web e alla rivoluzione digitale. Un topic di estremo interesse per la letteratura, che ha problematizzato l’argomento cercando di comprendere le modalità di customizzazione della rete non semplicemente nell’ottica del risultato in termini di esperienza per l’utente, ma anche indagandone a livello culturale risvolti e implicazioni. Oltre alla ricerca, marketing e ICT sono le discipline che più hanno studiato e implementato a livello pratico la personalizzazione per raggiungere gli obiettivi d’impresa, alle volte con modalità poco trasparenti nei confronti dei consumatori.

Un tema, quello della personalizzazione dell’esperienza, che nel nuovo contesto digitale in cui siamo immersi è all’ordine del giorno in ogni realtà presente sul web, dalle più piccole imprese fino ai colossi del mercato. Non sono solo Amazon, Google e Facebook, infatti, a progettare la navigazione e le modalità di fruizione che le persone adottano rispetto ai loro servizi, ma anche le medie e le piccole realtà imprenditoriali che, in un modo o nell’altro, si trovano faccia a faccia con i dati. Sì, i dati, atomi di conoscenza che risulterebbero a chiunque innocue e insignificanti, se non fosse per la loro capacità di trasformarsi in informazioni.

Il tema del dato, oggi, è la base su cui si costruisce l’intero ecosistema digitale nel quale siamo immersi, è sinonimo di conoscenza e quindi di potere. Come ogni forma di potere, tuttavia, non ha partito né significato intrinseco, e la sua forza può essere piegata a fin di bene o di male. Senza volersi addentrare in una discussione circa la natura etica dell’utilizzo del dato, dobbiamo però constatare come questo elemento sia oggi il più piccolo mattone alla base della straordinaria città che è il web.

 

I dati permettono il tracciamento, l’advertising, le comunicazioni e le inserzioni pubblicitarie mirate, il remarketing, il monitoraggio dell’utente, l’ottimizzazione di app, siti e piattaforme e, ultimo ma non per importanza, la personalizzazione dell’esperienza. Personalizzare l’esperienza significare cucire un vestito su misura per ogni cliente, rendere unico ogni suo punto di contatto con i brand e raggiungerlo nel luogo, nel momento e nelle modalità a lui più consone. Personalizzare l’esperienza sul web vuol dire creare un universo singolare al cui interno inserire l’utente e le sue azioni, in modo da strutturare scambi relazionali uomo-macchina univoci, irripetibili e personali.

Tag, cookie, pixel, e gli altri strumenti informatici che permettono la customizzazione dell’esperienza online degli individui sono anche la conditio sine qua non affinché l’utente possa navigare in rete. Questi dispositivi, è vero, nel complesso finiscono per creare la “filter bubble” di cui si è discusso precedentemente, escludendo parti di realtà agli occhi dell’utente che guarda ad un mondo filtrato dai servizi che utilizza per la ricerca, ma gli apparecchi di personalizzazione sono i navigatori satellitari senza cui la fruizione della rete sarebbe per chiunque impossibile.

Se Google non effettuasse una personalizzazione delle SERP per gli utenti a fronte delle loro query di ricerca, se Facebook non impiegasse i dati sulle relazioni e gli interessi degli iscritti per generare il loro newsfeed, e se Amazon non tenesse traccia dei prodotti già acquistati per proporne di nuovi, agli occhi del nostro sistema nervoso il web risulterebbe solamente come un groviglio infinitamente complesso e articolato, troppo complicato anche solo per essere degno di attenzione.

Il Recommender System di Netflix per la profilazione

Adottando un punto di vista commerciale, le aziende utilizzano i dati per la personalizzazione di prodotti e servizi cercando di proporre ai propri clienti soluzioni puntuali ai loro bisogni. Nel ramo delle big tech, oltre ai colossi del GAFA (Google, Amazon, Facebook, Apple) uno dei casi più interessanti di personalizzazione del prodotto è rappresentato da Netflix. L’azienda statunitense di streaming on-demand su abbonamento, infatti, offre una piattaforma digitale ricca di contenuti video e ha sviluppato uno dei sistemi di raccomandazione (Recommender System) tra i più avanzati sul mercato.

L’obiettivo di questi algoritmi, che non sono altro che applicazioni del data mining, è analizzare enormi volumi di dati per proporre agli utenti suggerimenti personalizzati sul loro comportamento, sui loro interessi e sulle loro attitudini al fine di ottimizzare la loro esperienza all’interno del sistema. Il fine ultimo del sistema di raccomandazione, infatti, è presentare un numero di alternative rilevanti tra le quali l’utente possa scegliere (Amatriain, X. “Big & Personal: data and models behind Netflix recommendations”).

Risultati di questo tipo sono possibili grazie all’incrocio di algoritmi e, ancora una volta, dati, elementi cruciali per la personalizzazione people-based. Per concretizzare nelle nostre menti un’idea della quantità e della qualità di dati necessaria a un sistema di raccomandazione simile, possiamo analizzare il diagramma schematico circa il funzionamento del Recommender System di Netflix.

Il Recommender System di Netflix © Netflix

Nel complesso, il sistema è composto da algoritmi di analisi dei dati, algoritmi di machine learning, algoritmi di computazione e modelli di training, tutti processi che dipendono da un unico input: i dati forniti (più o meno consapevolmente) dall’utente tramite le sue azioni con l’interfaccia.

La personalizzazione dell’esperienza su Netflix

All’interno del sistema di Netflix, la personalizzazione avviene su quasi ogni elemento della homepage, a partire dalla selezione degli elementi da posizionare nelle righe che raccolgono i contenuti, ordinati, presentati e organizzati secondo diverse variabili estrapolate dall’elaborazione dei dati degli utenti. Oltre alla funzionalità “Facebook connect”, che permette al sistema di rilevare le preferenze dei collegamenti e degli amici di ogni singolo utente, la selezione degli item da collocare nella pagina dipende da variabili quali le visualizzazioni recenti, i rating dei contenuti, le interazioni e i feedback dello spettatore.

All’interno di Netflix Tech Blog, il blog aziendale redatto dal reparto IT, l’azienda racconta (quasi) ogni implementazione, modifica e tentativo di miglioria all’algoritmo che gestisce la piattaforma. Senza la pretesa di esporre gli artifici tecnici facenti capo all’area tecnologica del processo, probabilmente di facile accesso solo per un pubblico di addetti ai lavori, è comunque interessante analizzare alcuni dei casi di personalizzazione più eclatanti al fine di comprendere le potenzialità dei dati rispetto all’ottimizzazione delle esperienze utente.

Una delle manipolazioni di maggior rilievo opera a livello di prodotto: se i media tradizionali legati al linguaggio audiovisivo, quindi principalmente il cinema, si sono per anni serviti di materiali comunicativi e promozionali statici, composti da testi e immagini definite e impiegate per la comunicazione globale, la personalizzazione di Netflix permette all’utente di visualizzare thumbnail (le copertine dei film) dinamiche, in grado di adattarsi e “customizzarsi” come risultato dell’analisi dei dati sull’utente.

We don’t have one product but over a 100 million different products with one for each of our members with personalized recommendations and personalized visuals” – Netflix Tech Blog

Così, al fine di proporre titoli che risultino rilevanti per lo spettatore, le thumbnail possono visualizzare un particolare attore del film in questione (definito sulla base della quantità di film già consumati in cui questi ha recitato da protagonista), una determinata scena della pellicola (modulata in base al genere cinematografico a cui l’utente è più avvezzo) e presentare il nome del film in una specifica posizione (determinata a seguito di test multivariati su campioni di utenti).

Esempio di personalizzazione delle thumbnail per la serie TV “Stranger Things” © Netflix

Le conseguenze della personalizzazione online

L’analisi di questo breve caso studio permette di trarre alcune considerazioni finali sul tema dell’articolo. Se la teoria della Filter Bubble precedentemente esposta è corretta, ovvero se le piattaforme digitali stessero operando un filtro attraverso cui mostrare la realtà ai propri utenti, le implicazioni in termini di etica e democrazia sarebbero immense. Senza addentrarsi nel campo della morale, è proprio l’esempio di Netflix che, per la natura del prodotto a cui la personalizzazione viene applicata, cioè le pellicole cinematografiche, rende possibile una disamina circa le conseguenze della bolla di filtraggio.

La piattaforma, infatti, attua una personalizzazione dell’esperienza utente estrema, non solo in termini di risultati di ricerca (film che compaiono o meno sull’interfaccia), tipologia di filtro propria di sistemi come quello che governa l’algoritmo di Google, ma anche in termini di presentazione degli stessi (thumbnail dinamiche). La riflessione che scaturisce dalla fotografia di questo scenario riguarda proprio il concetto di filtro.

Se il catalogo di Netflix fosse composto da, ad esempio, 100.000 titoli cinematografici, le evidenze finora presentate porterebbero a pensare che la piattaforma stia eliminando dall’esperienza di alcuni utenti parte di questi titoli come conseguenza del processo di raccomandazione. Il Recommendation System, infatti, che propone consigli personalizzati sulla base dell’esperienza maturata circa le modalità di interazione di un utente (film, generi, categorie e tipologie di contenuti visualizzati), sembra privare l’utente stesso della possibilità di navigare e selezionare titoli distanti dalle sue tendenze precedenti.

Il risultato, in termini cinematografici è l’esplorazione completa di un determinato genere di pellicole, a discapito però di molte altre tipologie di film che vengono escluse dal percorso dell’utente sulla piattaforma poiché lo stesso non vi ha mai dimostrato interesse. Se da un lato questo effetto ottimizza la fruizione del servizio di streaming on-demand, facilitando all’utente la scoperta di nuovi contenuti in linea con le sue preferenze, dall’altro questa partizione del catalogo priva l’individuo di parti di “realtà”, non mostrandogli quello che va oltre le sue attitudini standard.

Astraendo la riflessione appena esposta ad un contesto più ampio come quello dell’ambito culturale, l’analisi dei dati che viene effettuata dalle piattaforme grazie a tecnologie come i cookie, i tag e i pixel, rischia di creare una situazione di monotonia dove l’utente viene costantemente alimentato da contenuti che finiscono per confermare le sue preferenze e le sue credenze, bloccandolo in uno stallo culturale che impedisce la libera conoscenza e rischia di alimentare il confirmation bias. È proprio in ambito culturale, infatti, che la tecnologia alla base della personalizzazione del web mostra i suoi rischi principali. L’iterazione di contenuti animati dalla stessa ideologia rischia di creare cluster di utenti estremamente polarizzati sulle proprie opinioni e credenze, e poco disposti al dialogo e al confronto costruttivo, aprendo le porte a scenari estremamente complessi e delicati su piani di riflessione come quello politico, quello religioso e quello valoriale.

 


 

Autori: Andrea Lussignoli, Cristina Manzoni, Enrica Fellin, Federica Imbalzano, Giorgia Fasoli, Martina Guaita e Samuele Franceschetto, studenti di Web Marketing & Digital Communication presso l’Università IUSVE.

Andrea Lussignoli

Un po’ metereopatico, amo stare con gli altri sia online che offline. Da grande voglio fare il digital advertiser, nel frattempo leggo, studio e cerco di assorbire tutto quel che riguarda il marketing online.

Cristina Manzoni

Nata sotto il segno dei gemelli, ambivalente nel suo essere, comunicativa e socievole. Di natura profondamente curiosa, sempre alla ricerca di un qualcosa. Con la dote innata di riuscire a nascondere alcune parti della personalità grazie a ironia e tanto sarcasmo. 

Enrica Fellin

Ogni giorno dedico del tempo per ricercare i fatti, gli eventi e le cose più curiose nel web. Sono sempre a caccia d’ispirazione per trovare qualcosa di nuovo, innovativo e stupefacente da proporre sul mercato. 

Federica Imbalzano

Da sempre affascinata da tutto ciò che riguarda il digitale, amo mettermi in gioco per imparare e scoprire ogni giorno qualcosa di nuovo. Provare, rivoluzionare e migliorare sono per me le parole chiave per riuscire a creare qualcosa di davvero importante. 

Giorgia Fasoli

Empatica e disponibile quanto impulsiva e maniaca del controllo. Eternamente bambina, con tanta curiosità e voglia di giocare quanto intraprendente e pronta per ogni sfida.
Bipolarismi che definiscono un equilibrio…o forse no.

Martina Guaita

Curiosa, ottimista e spontanea. Da sempre amante dell’arte. In particolare negli anni la mia attenzione si è concentrata soprattutto sulla grafica. Semplicità, ordine ed equilibrio sono le parole che meglio esprimono la mia personalità e il mio stile. Mi piace organizzare ogni cosa, spesso anche esageratamente. Sono testarda, ma ascoltatrice. 

Samuele Franceschetto

Appassionato di computer, offro assistenza informatica nel tempo libero e mi trovo spesso a “smanettare” per risolvere problemi di ogni tipo. Quelle rare volte che mi allontano da uno schermo cerco di assaporare le bellezze della natura, dal mare alla montagna, e di immortalare gli scorci più belli con la fotografia.