BigQuery, il servizio di data warehousing gestito tramite Google Cloud, è una delle soluzioni più potenti e versatili per l’analisi dei dati su larga scala. La sua capacità di eseguire query complesse su grandi volumi di dati in tempi estremamente ridotti lo rende uno strumento indispensabile per molte aziende. Tuttavia, con grande potenza arriva anche la necessità di una gestione accurata dei costi.
Capire come vengono calcolati i costi di BigQuery è fondamentale per ottimizzare le spese e garantire che il budget dedicato all’analisi dei dati sia utilizzato in modo efficiente. In questo articolo esploreremo i principali fattori che influenzano i costi di BigQuery, come monitorarli e quali strategie adottare per mantenerli sotto controllo. Se sei un professionista del marketing digitale, un data analyst o un responsabile IT, questa guida ti fornirà le informazioni necessarie per gestire al meglio le spese legate all’uso di BigQuery.
Le Componenti di Costo
I costi di BigQuery si suddividono in due componenti principali:
- Costi di computing: comprendono le spese per l’elaborazione delle query, inclusi query SQL, funzioni definite dall’utente, script e alcune istruzioni del Data Manipulation Language (DML) e Data Definition Language (DDL).
- Costi di archiviazione: rappresentano le spese per memorizzare i dati caricati in BigQuery.
- Altri costi minori: BigQuery applica costi per altre operazioni come l’uso di BigQuery Omni, BigQuery ML, BI Engine e le operazioni di lettura e scrittura in streaming.
BigQuery offre anche un piano gratuito generoso che include 1 TB di query gratuite ogni mese (boom baby! 💥).
Consulenza Google BigQuery
Abbiamo creato un servizio di consulenza Google BigQuery per seguirti passo passo: dalla configurazione dello strumento, alla visualizzazione dei dati, all’estrazione di insights.
Modelli di Prezzi di Computing per BigQuery
BigQuery offre due principali modelli di prezzi per l’esecuzione delle query, consentendo alle organizzazioni di scegliere l’opzione più adatta alle loro esigenze:
Prezzi On Demand (per TiB)
Con il modello di prezzi on demand, i costi vengono addebitati in base al numero di byte elaborati da ogni query. Questo modello prevede:
- Addebiti basati sui dati elaborati: viene addebitato il volume di dati analizzati dalle query eseguite. Il primo terabyte (TiB) di dati elaborati ogni mese è gratuito.
- Flessibilità e Scalabilità: solitamente si possono ottenere fino a 2000 slot simultanei per progetto. BigQuery consente anche il bursting temporaneo oltre questo limite per accelerare le query più piccole, anche se in caso di alta contesa per la capacità on demand in una specifica località potrebbero essere disponibili meno slot.
Prezzi per Capacità (per Slot Ora)
Con il modello di prezzi per capacità, i costi vengono addebitati in base alla capacità di calcolo utilizzata, misurata in slot (CPU virtuali) nel tempo. Questo modello offre:
- Addebiti basati sulla capacità di calcolo: si paga per la capacità di calcolo utilizzata per eseguire le query, misurata in slot per ora.
- Impegni di capacità: è possibile utilizzare il gestore della scalabilità automatica di BigQuery o acquistare impegni slot, che rappresentano una capacità dedicata sempre disponibile per i carichi di lavoro a un prezzo inferiore.
- Prevedibilità dei costi: ideale per chi preferisce avere un costo prevedibile per le query. BigQuery offre tre versioni: Standard, Enterprise ed Enterprise Plus. La versione standard costa $0.044 all’ora per slot.
Cos’è uno Slot in BigQuery?
Nel contesto di Google BigQuery, uno “slot” rappresenta un’unità di capacità computazionale utilizzata per eseguire query SQL sui dati. BigQuery utilizza un modello di elaborazione distribuita, dove i dati della query sono suddivisi in molti pezzi che possono essere elaborati in parallelo. Ogni slot rappresenta una parte di questa capacità parallela disponibile. Più slot sono disponibili, più velocemente una query può essere completata grazie all’elaborazione parallela delle operazioni.
Confronto tra Modelli di Prezzi
Prezzi On-Demand
- Pagamento per dati elaborati: Non è necessario acquistare slot. Gli utenti pagano per la quantità di dati elaborati dalle loro query.
- Gestione Dinamica degli Slot: Google gestisce dinamicamente la quantità di slot disponibili per elaborare le query, offrendo flessibilità senza impegni a lungo termine.
Flat-Rate Pricing (Con Riserva di Slot)
- Acquisto di Slot Riservati: Un’organizzazione può acquistare una specifica quantità di slot per uso esclusivo, garantendo performance prevedibili e costi gestibili indipendentemente dalla quantità di dati elaborati.
- Slot Riservati: Disponibili 24/7, senza costi aggiuntivi per la quantità di dati elaborati.
- Slot Flessibili: Consentono di acquistare capacità di slot su base temporanea (giornaliera o mensile) senza impegni a lungo termine.
Prezzi di Archiviazione
I costi di archiviazione in BigQuery si riferiscono alle spese per memorizzare i dati caricati nel sistema. Ci sono due categorie principali di archiviazione che determinano i costi:
Archiviazione Attiva
L’archiviazione attiva include qualsiasi tabella o partizione di tabella che è stata modificata negli ultimi 90 giorni. Questa categoria rappresenta i dati che vengono frequentemente aggiornati o consultati, quindi il loro costo di archiviazione è maggiore rispetto ai dati a lungo termine. Il costo è di $0.02 per GiB al mese.
Archiviazione a Lungo Termine
L’archiviazione a lungo termine riguarda qualsiasi tabella o partizione di tabella che non è stata modificata per 90 giorni consecutivi. Una volta che i dati entrano in questa categoria, il costo di archiviazione si riduce automaticamente di circa il 50%. Nonostante il prezzo inferiore, non c’è alcuna differenza in termini di prestazioni, durabilità o disponibilità tra i dati in archiviazione attiva e quelli in archiviazione a lungo termine. Il costo è di $0.01 per GiB al mese.
Esempi di Calcolo dei Costi
Supponiamo di avere un account GA4 che cuba 50 milioni di eventi al trimestre (un sito con oltre 20.000 utenti attivi giornalmente). Per stimare i costi giornalieri dei dati di Google Analytics 4 (GA4), possiamo seguire questi passaggi:
- Determinare la dimensione media di un evento: supponiamo che sia di 1 KB.
- Calcolare il volume totale di dati per 50 milioni di eventi: 50 milioni di eventi * 1 KB per evento = 50 milioni di KB = 47.68 GB.
- Volume giornaliero (su 90 giorni): 47.68 GB / 90 ≈ 0.53 GB.
Esempio di costo di query in BigQuery
- BigQuery addebita $5 per TB di dati elaborati.
- 0.53 GB = 0.00053 TB.
- Costo di query = 0.00053 TB * $5 = $0.00265.
Costo per 12 Mesi
Facciamo un esempio di calcolo del costo totale di archiviazione per 12 mesi, supponendo di aggiungere 16.5 milioni di eventi GA4 ogni mese.
| Mese | Volume Dati (GB) | Costo Attiva ($) | Costo Lungo Termine ($) | Costo Totale ($) |
|---|---|---|---|---|
| Gennaio | 15,73 | 0,3146 | 0 | 0,3146 |
| Febbraio | 31,46 | 0,6292 | 0 | 0,6292 |
| Marzo | 47,19 | 0,9438 | 0 | 0,9438 |
| Aprile | 62,92 | 1,2584 | 0 | 1,2584 |
| Maggio | 78,65 | 1,2584 | 0,3146 | 1,573 |
| Giugno | 94,38 | 1,2584 | 0,6292 | 1,8876 |
| Luglio | 110,11 | 1,2584 | 0,9438 | 2,2022 |
| Agosto | 125,84 | 1,2584 | 1,2584 | 2,5168 |
| Settembre | 141,57 | 1,2584 | 1,573 | 2,8314 |
| Ottobre | 157,3 | 1,2584 | 1,8876 | 3,146 |
| Novembre | 173,03 | 1,2584 | 2,2022 | 3,4606 |
| Dicembre | 188,76 | 1,2584 | 2,5168 | 3,7752 |
Somma dei costi totali mensili: $24,74
Quindi, il costo totale di archiviazione per 12 mesi, supponendo di aggiungere 16.5 milioni di eventi GA4 ogni mese, è approssimativamente $25 per un account che cuba 50 milioni di eventi GA4 a trimestre.
Esempio dei costi di Query
Per calcolare un ipotetico costo annuale, ipotizziamo di voler effettuare una query sui dati del mese corrente e del mese precedente ogni giorno:
- Dati di base:
- Numero di eventi per mese: 16.5 milioni (di nuovo, un sito con oltre 20.000 utenti attivi giornalmente)
- Dimensione media di un evento: 1 KB;
- Volume totale di dati per mese: 15.73 GB.
- Volume per Query (dati di due mesi): 15.73 GB * 2 = 31.46 GB.
- Costo delle Query: $5 per TB di dati elaborati; 31.46 GB / 1024 = 0.03073 TB; Costo per query: 0.03073 TB * $5 = $0.15365.
Costo per 12 mesi
- Effettuando una query al giorno per 365 giorni:
- Volume mensile per query: 31.46 GB * giorni in un mese ≈ 31.46 GB * 30 = 943.8 GB.
- Volume totale annuale inferiore a 1 TB (1024 GB), quindi le query mensili rientrano nel limite gratuito.
- Volume per query: 31.46 GB.
- Costo per query: $0 (entro il limite gratuito di 1 TB al mese).
- Frequenza delle query: Una al giorno.
- Costo annuale: $0.
Calcolare e comprendere i costi di BigQuery è essenziale per ottimizzare l’uso delle risorse e garantire una gestione efficiente del budget. Con la giusta strategia e monitoraggio, è possibile sfruttare al meglio le capacità di BigQuery mantenendo i costi sotto controllo. Utilizza i calcolatori di costi di Google Cloud per ottenere stime precise basate sulle tue specifiche esigenze e dataset.

