Ciao, sono Monte.
Quando il sistema inizia a scricchiolare,
arrivo prima che diventi un'emergenza.
Software Engineer freelance specializzato in sistemi distribuiti. Aiuto team in crescita a riconoscere i segnali prima che diventino guasti.
Iscritto all'Ordine degli Ingegneri di Ravenna
Per chi è
Team in crescita che iniziano a sentire qualcosa che scricchiola.
Startup e aziende di prodotto che hanno superato la fase iniziale e ora si trovano davanti a sintomi che prima non c'erano.
Deploy che fanno paura
Ogni deploy è un evento. Si rimanda al venerdì pomeriggio per evitare il weekend di guardia. Quando una release fallisce, recuperare costa ore — non minuti.
Guasti difficili da interpretare
Qualcosa non funziona, ma non sai dove guardare. I log dicono una cosa, le metriche un'altra, gli utenti una terza. La diagnosi diventa archeologia.
Nessuno sa di chi è quel pezzo
Componenti senza owner chiaro. Pezzi di sistema che "funzionano e basta", finché non smettono. Conoscenza concentrata in poche teste — e quelle teste vanno in ferie.
Se due di queste te le sei già sentite addosso, il momento giusto per intervenire è prima della terza.
Il metodo
Tre pilastri in un ordine preciso. Si moltiplicano, non si sommano.
Saltare uno step non fa risparmiare tempo: sposta solo il dolore più avanti.
Progettare
Non si torna indietro senza pagare. Per questo le decisioni di design vengono prima di tutto.
Verificare
Sapere che funziona davvero — sotto carico, sotto attacco, nel tempo. Senza questo, automatizzare amplifica solo i guasti.
Automatizzare
Solo dopo aver progettato e verificato. L'automazione amplifica tutto quello che le sta sopra — errori compresi.
Ultimi articoli
Quello che imparo, lo scrivo.
ListObjects in Produzione: Caching, Pre-materializzazione e BatchCheck
Perché ListObjects diventa il collo di bottiglia in OpenFGA, e come risolverlo: caching con Redis, read model pre-materializzato, BatchCheck e strategie di invalidazione.
Burn-rate alerts: quando l'error budget brucia più veloce del previsto
Multi-window multi-burn-rate alerting da SRE Workbook cap. 5: alertare sul ritmo di consumo dell'error budget, non sulla soglia statica.
Gerarchie Profonde, Query Inverse e il Problema WHERE
Come gestire gerarchie a N livelli in OpenFGA, ottimizzare ListObjects con fast/slow path, e implementare Dynamic Data Masking come pattern complementare.
Prometheus predict_linear: alert predittivi di saturation in pratica
Come usare predict_linear in Prometheus per alert di saturation predittivi. USE vs Golden Signals, esempi reali (JVM, TLS, Kafka) e demo Docker Compose.
Dopo che l'Alert Scatta: Severity, Routing e il Contratto con Chi lo Riceve
Severity come contratto di routing, inhibit rules e runbook_url nel payload: i tre mattoni minimi che rendono un alert Alertmanager azionabile.
Parliamone.
30 minuti, gratuiti, per capire se possiamo lavorare insieme.