I Big Data sono una raccolta di dimensioni grandissime di dati, difficilmente contenibili in una memoria centrale di un elaboratore. I big data sono dataset enormi in cui i dati inclusi sono di formato molto differente tra loro e per questo, a volte, anche complessi da studiare.
Per definire i big data, spesso viene utilizzato il principio delle tre V:
- Velocità: i dati si muovono e vengono trasmessi a velocità elevate;
- Varietà: con ciò si entende la varietà di formato (testo, numeri, grafici…)
- Volume: i dati raccolti sono tantissimi, impossibili da quantificare.
Essi sono inoltre difficili da analizzare perché subiscono variazioni temporali che causano picchi periodici ed instabilità di trasmissione e raccolta e, per terminare, sono molto complessi in quanto non solo i dati sono molto diversi tra di loro ma anche perché derivano da fonti ed origini molto lontane e dissimili.