🌊 Cos'è un Data Lake

📥 Il bacino di raccolta universale

A differenza del Data warehouse (che è come un magazzino ordinato), il Data Lake è come un lago naturale: ci confluiscono fiumi di dati da ogni fonte, nel loro stato originale.


⚙️ Caratteristiche


🆚 Data Lake vs Data Warehouse

Caratteristica Data Lake 🌊 Data Warehouse 🏢
Dati Grezzi, non strutturati Puliti, strutturati
Utenti Data Scientists, Engineers Business Analysts
Schema On-Read (flessibile) On-Write (rigido)
Agilità Alta Bassa

⚠️ Il Rischio "Data Swamp"

Se butti tutto nel lago senza catalogarlo, diventa una palude.
Per questo serve:


🎯 Obiettivo

Avere un posto unico dove atterrano tutti i dati aziendali, pronti per essere esplorati o trasformati successivamente.

#DataLake #BigData #Storage #Architettura #Definizioni