Spec-Driven Development e Cicli Autonomi per Sviluppo AI-Native: Spec Kit, GSD, BMAD, Ralph e il Codex Agent Loop

Pubblicato il 06/02/2026
Introduzione generale
Lo sviluppo del software sta attraversando una trasformazione profonda. I modelli di linguaggio e gli agenti AI non sono più semplici assistenti di completamento codice, ma veri e propri collaboratori intelligenti in grado di generare specifiche, piani, task e codice in modo autonomo. Tuttavia, perché questa trasformazione sia realmente produttiva, non bastano prompt efficaci: serve un processo strutturato, che renda esplicita l’intenzione, verifichi i risultati e coordini agenti, strumenti e test in modo circolare e automatizzato.
In questo contesto emergono diversi metodi e strumenti innovativi che provano a risolvere questi problemi:
- Spec-Driven Development (SDD) come paradigma generale;
- GitHub Spec Kit come toolkit per viverlo nella pratica;
- Get Shit Done (GSD) come sistema leggero e pratico per generare contesti di lavoro affidabili;
- BMAD-METHOD come framework agentico strutturato per sviluppo AI-driven;
- Ralph Loop come tecnica distillata di iterazione autonoma degli agenti;
- Codex agent loop come esempio industriale di agent orchestration raffinata.
Cos’è lo Spec-Driven Development
Lo Spec-Driven Development (SDD) è una filosofia di ingegneria del software che mette le specifiche come artefatto primario del ciclo di vita del prodotto, prima ancora del codice. Invece di scrivere codice e poi documentarlo, si parte dal “what / why” e si usa la specifica come base per generare test, piani di implementazione e poi codice vero e proprio.
Perché è importante
Tradizionalmente contenuti come i requisiti e le decisioni architetturali restano nascosti in email, chat o nel codice stesso, diventando contexto implicito difficile da mantenere e condividere. SDD punta a:
- esplicitare le decisioni tecniche e di prodotto;
- rendere il “perché” parte evolvibile del progetto;
- consentire agli agenti AI di comprendere cosa costruire e perché prima di generare codice;
- ridurre interpretazioni errate o “vibe coding” dove l’agente va a caso sul contesto.
In SDD, la specifica non è un documento statico ma diventa una sorgente di verità viva, che guida tutto il workflow: strategie, piani, task e implementazioni.
GitHub Spec Kit
GitHub Spec Kit è un toolkit open-source che concretizza il paradigma SDD fornendo:
- CLI di bootstrap (Specify CLI) per inizializzare un progetto SDD;
- template SDD per spec, piano tecnico e task, pensati per l’uso con agenti AI moderni;
- script di supporto per gestire lo scaffolding;
- una directory .specify con costituzione, checklist e prompt per agenti.
Elementi chiave di Spec Kit
- Spec: dove si descrive cosa si vuole e perché — parallelo moderne dei PRD, ma versionato insieme al codice.
- Plan: la traduzione di quelle specifiche in decisioni tecniche, stack, librerie, limitazioni, ecc.
- Tasks: unità atomiche di lavoro che un agente può implementare autonomamente.
Spec Kit rende esplicite queste fasi usando comandi sequenziali (/specify, /plan, /tasks) e promuove un approccio ciascun elemento prima della generazione codice.
GSD (Get Shit Done) Method
Get Shit Done (GSD) è un toolkit alternativo e più leggero orientato alla praticità e velocità produttiva rispetto a Spec Kit. È progettato per context engineering, cioè per generare contesti di prompt coerenti e robusti che permettano a agenti come Claude Code o OpenCode di lavorare in modo affidabile.
Come funziona GSD
Contrariamente ad altri sistemi che possono sembrare “cerimoniosi” o complicati, GSD:
- chiede all’utente di descrivere chiaramente cosa si vuole costruire;
- estrae automaticamente obiettivi, vincoli, criteri di successo e casi limite;
- costruisce una roadmap di ricerca → requisiti → piano → roadmap;
- genera task chiare che l’agente può eseguire una alla volta.
Vantaggi pratici
- molto efficace per sviluppatori singoli o team piccoli;
- riduce vibe coding tramite context engineering robusto;
- sfrutta XML prompt formatting e subagent orchestration sotto il cofano per produrre output affidabili senza troppe cerimonie.
In pratica, GSD è costruito attorno alla gestione del contesto e alla prevenzione della sua degradazione mentre l’agente lavora.
BMAD-METHOD
Il BMAD-METHOD (abbreviazione di Breakthrough Method for Agile AI-Driven Development) è un framework molto più ambizioso e strutturato di SDD, pensato come un vero e proprio metodo di ingegneria del software AI-first.
Architettura agentica
BMAD costruisce un team virtuale di agenti specializzati, ciascuno con un ruolo chiaramente definito:
- Analyst – ricerca e analisi concorrenti;
- Product Manager (PM) – trasforma idee in PRD dettagliati;
- Architect – definisce l’architettura tecnica;
- Developer / QA / UX ecc. – eseguono implementazione, test, design.
Processo in due fasi
BMAD segue un ciclo strutturato:
- Agentic Planning – definizione completa delle specifiche, della strategia, della struttura e dei criteri di accettazione.
- Context-Engineered Development – dove agenti collaborano per generare piani dettagliati e poi codice, con documentazione, test e governance integrati.
Cosa lo distingue
- la granularità di ruoli;
- la generazione automatica di artefatti tipici (PRD, diagrammi architetturali, user stories, criteri di accettazione);
- workflow adattivi e scalabili anche per progetti enterprise.
BMAD tenta di replicare un processo agile ma alimentato da agenti piuttosto che da team umani.
Ralph Loop
Ralph Loop è un pattern molto interessante di iterazione autonoma degli agenti, che prende il nome dal personaggio Ralph Wiggum per la sua filosofia semplice: continua a riprovare finché il lavoro non è completato.
Come funziona
A differenza dei metodi che mantengono un’unica context window per tutta la durata della generazione, Ralph:
- esegue un agente con un prompt e senza contesto storico;
- controlla se la iterazione ha completato il task;
- se non è completa, aggiorna lo stato esterno (git, JSON, progress.txt) e riavvia l’agente con nuovo contesto.
In altre parole, ogni iterazione parte “fresca” ma legge lo stato aggiornato del progetto dall’esterno (codice, file JSON, progress.txt), evitando così la degradazione del contesto nel modello.
Perché è potente
- evita la context rot tipica delle lunghe conversazioni con LLM;
- rende ogni iterazione deterministica e tracciabile;
- può fermarsi solo quando i criteri di uscita (test verdi, tutte le storie passes:true) sono soddisfatti.
Ralph è diventato popolare perché permette ai team di “lasciare lavorare l’agente” mentre si occupano di altri compiti, con feedback loop affidabili.
Il Codex Agent Loop
Il Codex agent loop descritto da OpenAI è un’illustrazione di come un agente AI orchestri interazioni tra modello, prompt e strumenti. Questo ciclo comprende:
- preparazione dell’input e delle istruzioni di sistema;
- invocazione del modello (inference);
- interpretazione dell’output per decidere se chiamare strumenti o terminare;
- gestione delle chiamate a strumenti e integrazione dei loro risultati nella successiva iterazione.
Nel contesto di strumenti come Codex CLI, questo loop è al centro dell’esperienza agente: il ciclo non è solo scrivi risposta e stop ma collabora, chiama strumenti, verifica risultati, riprende.
Cosa lo rende interessante
Pur non essendo strutturato come Ralph (che ha un’estensione esplicita per le iterazioni), il Codex agent loop:
- formalizza come un agente AI interagisce con toolchain reali;
- mostra come integrare strumenti e verifica in un’unica architettura;
- è un ottimo esempio di come orchestrare prompt, modello, strumenti e condizioni di uscita.
Conclusioni generali
Lo sviluppo software AI-assisted è oggi ben oltre la singola richiesta di completamento codice: richiede un processo metodico che renda
- l’intenzione esplicita e versionata;
- le decisioni tecniche condivise e revisibili;
- i task atomici verificabili;
- l’iterazione autonoma affidabile e tracciabile.
Spec-Driven Development è la filosofia che cerca di costruire contesto prima di codice. Tool come GitHub Spec Kit e GSD lo rendono praticabile; BMAD-METHOD lo organizza con ruoli e workflow completi; Ralph Loop ne esecuzionalizza l’autonomia; mentre il Codex agent loop mostra come orchestrare modello e strumenti in un ciclo reale.
Il futuro non è un assistente codificatore occasionale: è una pipeline agentica affidabile dove specifiche, piano, task e codice si fondono in un continuum produttivo. La sfida attuale è affinare questi modelli, standardizzare le best practice e integrare governance umana dove serve — per consegnare software di qualità, mantenibile e testato, generato e verificato dagli stessi agenti AI.
Contattami
Hai un'idea e vuoi capire se può funzionare? Vuoi parlare di tecnologia? Vuoi organizzare un talk?
Contattami