PORTFOLIO Bitcoins

Bitcoin, social network e l’analisi semantica (parte 2)

Un approccio di tipo non convenzionale come l'analisi semantica delle conversazioni in rete può essere di aiuto per un problema di tipo non convenzionale, come la predittività dell'andamento delle criptomonete

 



Un approccio di tipo non convenzionale come l'analisi semantica delle conversazioni in rete può essere di aiuto per un problema di tipo non convenzionale, come la predittività dell'andamento delle criptomonete (i Bitcoin, in particolare).
Questo è il punto d'arrivo dello scenario presentato nell'articolo “Bitcoin, social network e l’analisi semantica” di Gian Piero Oggero, dove vengono chiarite le ragioni per cui la sola applicazione di metodi normalmente adottati dalla finanza tradizionale diventano invece non produttivi in un contesto innovativo come i Bitcoin.

Il volume delle transazioni in Bitcoin è aumentato molto negli ultimi mesi, generando un notevole interesse anche riscontrabile dall'aumento delle discussioni nel web da parte degli utenti, in particolare sui Social Network. Ed è proprio da questo primo dato oggettivo sul quale si fondano le analisi di questo articolo che, considerata la realtà complessa e caratterizzata da cambi repentini delle logiche su cui si basa, si preferisce essere prudenti: il termine predittività è quindi confinato alle possibilità di 'Nowcasting'.

La differenza principale tra un mercato Bitcoin ed i mercati finanziari tradizionali è la sua elevata volatilità: le transazioni non sono istantanee e possono essere necessari fino a 5 minuti per il loro completamento. In virtù di questa caratteristica diventa realistico poter monitorare le conversazioni con apposite piattaforme (come il Discover Environment di Damantic concepito per attività di Open Source INTelligence), al fine di identificare una possibile correlazione tra il volume (quantità di messaggi) e alla 'qualità' (positiva o negativa) delle relative conversazioni in rete rispetto al prezzo del Bitcoin.

Tra le attività preliminari al monitoraggio diventa cruciale la selezione delle sorgenti, ovvero delle fonti dei dati che si intende processare automaticamente. Per ciascuna delle fonti identificate si rivela inoltre necessaria un'attenta assegnazione di un relativo grado di autorità e attendibilità; banalmente un messaggio di un 'utente qualsiasi' non ha lo stesso peso, in termini di influenza sul mercato, di una comunicazione inviata da una società (Expedia, eBay, ecc) o un grande quotidiano (The Guardian, The NewYork Times, ecc ..), ma allo stesso tempo un gruppo di utenti con un elevato numero di 'followers' possono essere determinanti per 'spostare' il sentiment.

Durante il monitoraggio, ciascuna conversazione viene arricchita automaticamente con i metadati ottenuti dalla piattaforma semantica per il Trattamento Automatico del Linguaggio (TAL). Le nuove informazioni così ottenute, come la categoria del messaggio, il tema principale e il suo 'mood' ricavato dalla Sentiment Analysis, entrano così a far parte, insieme ad una collezione di dati storici di evoluzione dei prezzi Bitcoin, in una variante del filtro di Kalman [1], noto modello finanziario per la generazione di stime ottimali. Le informazioni rilevate in diversi istanti (time series data) vengono integrate con le informazioni di un dato istante (cross-section data) sfruttando così tutta l’informazione disponibile nei dati altrimenti divisi in dati numerici (quantitativi) e originati dalla comprensione delle conversazioni (qualitativi).

Per ragioni di spazio ci concentreremo qui sulle considerazioni generali ottenuti delle elaborazioni effettuate su Twitter che, per volume di conversazioni raccolte, si conferma ancora una volta un'importante cassa di risonanza per l'analisi della percezione degli utenti, configurandosi, anche autonomamente, come la principale sorgente per la determinazione del movimento dei Bitcoin.

Sono state identificate quattro proprietà emergenti:
  1. un equilibrio di tweets positivi e negativi è correlato ad un volume di scambi superiore;
  2. una maggiore quantità di tweets positivi è correlata ad un prezzo medio più alto;
  3. quando il volume degli scambi è stato (ed è) alto i valori emotivi catturati dai tweets sono genericamente più positivi;
  4. un rapporto di equilibrio e stabilità tra i valori emotivi e il volume degli scambi può riflettere un 'momentum' di speculazione nel mercato.
Riassumendo, l'insieme di queste proprietà riflettono come le 'emozioni virtuali' catturate dall'analisi dei messaggi che transitano sulla piattaforma di microblogging Twitter, possano essere interpretate come un indicatore aggiuntivo per una corretta interpretazione della fluttuazione dei valori di cambio del Bitcoin (o la criptonometa desiderata, a patto di generare un sufficiente numero di conversazioni).

In questo articolo abbiamo presentato alcune delle principali tecniche utilizzate dal team di ricerca applicata di Damantic per la previsione di prezzi delle criptomonete: il rapporto tra volume degli scambi e il numero di opinioni positive e negative ricavate dall'analisi dalle conversazioni si mostra in un equilibrio che può suggerire l'esistenza di una relazione più forte di una semplice casualità: la chiave di volta parrebbe essere la sofisticata combinazione di tecniche 'standard' per la modellizzazione di serie storiche con le possibilità offerte dalle nuove tecnologie di analisi semantica, con particolare riferimento alla Sentiment Analysis, verificando così la congettura che ogni criptomoneta è di fatto ‘una moneta sociale’.


(1) Per una trattazione approfondita della tecnica originale del filtro di Kalman si rimanda a R.E. Kalman, “A New Approach to Linear Filtering and Prediction Problems”, Transactions of the ASME–Journal of Basic Engineering, vol. 82, Series D, pp. 35–45, 1960


* Head of Data Scientist - Damantic
BLOG COMMENTS POWERED BY DISQUS