Guida pratica · AI agent

Il 95% dei progetti AI agent fallisce. Quasi mai per colpa dell’AI.

Falliscono perché si automatizza un processo che a monte non è mai stato standardizzato. Metti un agent sopra il caos e ottieni solo caos più veloce. Ecco come evitarlo: con il metodo, gli strumenti e un test che puoi usare oggi.

Raffaele Zarrelli·Founder, Yempik·29 maggio 2026·13 min di lettura
95%[1]
dei pilot AI senza ritorno misurabile
76%[2]
degli agent in crisi entro 90 giorni
14%[3]
arriva davvero in produzione
In sintesi
  • Il 95% dei progetti AI agent non rende: la causa è l’integrazione, non il modello.
  • Tra mille processi, parti dal vincolo: alto impatto e poca standardizzazione.
  • Metodo Standard-First, tre fasi (Discovery, Standard, Agent): l’AI è l’ultimo terzo.
  • Prima dei pezzi vengono i dati: un agente su dati sporchi agisce sull’errore.
  • La governance corre in parallelo: lente di rischio leggera subito, formale prima di scalare.
La diagnosi

Non automatizzi l’AI. Automatizzi il caos.

La narrazione dominante dice che basta scegliere il modello giusto e il fornitore giusto. È falso. La differenza tra chi riesce e chi brucia budget non sta quasi mai nella tecnologia: sta nel processo che le metti sotto.

Un agente è un moltiplicatore. Se il processo è chiaro e ripetibile, moltiplica i risultati. Se è confuso, non documentato, diverso ogni volta a seconda di chi lo esegue, l’agente moltiplica anche quello, più in fretta e su più casi. Chi parte da un problema definito ha successo nel 58% dei casi; chi parte da un mandato vago, nel 22%.[3]

E a volte la risposta onesta è non automatizzare affatto: ci sono casi in cui l’AI è la scelta sbagliata, e li abbiamo raccolti in quando NON serve l’AI.

La domanda giusta non è «quale AI uso?». È «questo processo è abbastanza solido da poterci costruire sopra?».

Da dove parti

Tra mille processi, trova il vincolo (non quello che fa più rumore)

La prima domanda non è «quale processo automatizzo», è «quale conviene toccare per primo». E quasi mai è il più visibile. Parti dai segnali.

I 5 segnali di un buon candidato
  • Volume e ripetitività alti: si ripete tante volte, sempre simile.
  • Alta variabilità: due persone lo eseguono in modo diverso.
  • Tanto tempo-uomo speso a mano, su attività a basso valore.
  • Errori e rilavorazioni frequenti.
  • È un collo di bottiglia: rallenta tutto ciò che viene dopo.

Questi segnali li raccogli in due modi: ascoltando chi il lavoro lo fa davvero (non chi lo descrive nei manuali) e leggendo i dati, con il process mining sui log dei gestionali, che mostra il flusso reale invece di quello immaginato. Tra tutti, il segnale che pesa di più è il vincolo. Vediamo perché.

Se vuoi il metodo completo per questa fase, con la checklist di dove guardare e una scorecard per dare un voto ai candidati, lo trovi in quale processo automatizzare per primo.

Quale processo

La regola dell’anello debole

La resistenza di una catena è quella del suo anello più debole. In un processo, l’output totale è deciso dal passaggio più lento. Automatizzare altrove non sposta niente.

Raccolta richieste
100/g
Qualifica lead
100/g
Preventivo su misura
40/g◆ collo di bottiglia
Invio e follow-up
100/g
Output reale dell'intero processo= 40/g , quanto regge l'anello più debole
Mettere un agent sui passaggi da 100/g non cambia nulla: il sistema resta fermo a 40. Conviene standardizzare (e poi automatizzare) solo l'anello che strozza il flusso.

Da qui, cosa standardizzare prima

Due assi. In orizzontale quanto il processo pesa sul business; in verticale quanto è già standardizzato oggi. Posiziona i tuoi workflow e leggi la mossa.

altoStandardizzazione attualebasso
Quick win Automatizza ora Lascia / monitora Standardizza prima
Report mensile
Ticket L1 ricorrenti
Note spese saltuarie
Preventivi su misura
Outbound vocale
Contenuti corsi
bassoImpatto sul businessalto
= casi reali Yempik: alto impatto, poca standardizzazione. Prima standardizzi, poi automatizzi

Automatizza ora

Alto impatto, già standard (es. ticket di primo livello ricorrenti): l’agent rende da subito.

Standardizza prima

Alto impatto, poco standard: è il quadrante del 95% che fallisce. Prima sistema il processo, poi automatizza.

Quick win

Basso impatto ma già standard (es. report mensile): automatizzalo solo se costa poco. Non è lì che si vince.

Lascia o monitora

Basso impatto e poco standard (es. note spese saltuarie): standardizzare costerebbe più di quanto rende.

Se un workflow è in basso a destra, il tuo progetto non è «comprare l’AI»: è far salire il pallino.

E non sempre la risposta giusta è un agente: a volte basta un chatbot o un’automazione no-code. La differenza, e quando conviene ciascuno, la trovi nel confronto tra agente AI, chatbot e no-code.

Il nodo nascosto

Il know-how vive nelle teste, non nei documenti

C’è un motivo per cui standardizzare è più difficile di quanto sembri: gran parte di ciò che fa funzionare un processo non è scritto da nessuna parte. Le stime serie parlano di circa l’80% del sapere operativo che resta tacito, nelle teste delle persone, non nei manuali.[4]

È la conoscenza del «come si fa davvero»: l’eccezione che il senior gestisce d’istinto, il criterio con cui si decide un caso limite, la regola non scritta su quando una pratica va passata a una persona. Un agent non può ereditare ciò che non è stato reso esplicito.

Standardizzare, prima ancora che scrivere procedure, significa far emergere quel sapere e trasformarlo in regole operative per l’agente, cioè le sue istruzioni di funzionamento. È il passaggio che quasi tutti saltano, ed è esattamente quello che separa una demo da un sistema in produzione.

Il metodo

Standard-First: prima il processo, poi l’agente

Lo chiamiamo Standard-First. Quattro fasi: Discovery (scegli il processo), Standard (lo rendi ripetibile), Agent (lo automatizzi) e Adoption (fai sì che il team lo usi davvero). Le prime tre stanno in circa sei mesi; la quarta parte dal lancio e non finisce. Nota dove cade la parola «agent»: non all’inizio. Ogni fase chiude con un artefatto che prima non esisteva.

Mesi 1-201

Discovery

Scegli un solo workflow: alto impatto sul business, basso grado di standardizzazione. Misuri come va oggi.

Alla fine esiste

Un workflow scelto con il motivo (impatto × standardizzazione) e la baseline misurata.

Mesi 3-402

Standard

Scrivi la procedura e i criteri di decisione, unifichi dati e know-how sparsi in una fonte di verità unica.

Alla fine esiste

Un processo ripetibile e misurabile: SOP, regole esplicite, una sola base di conoscenza.

Mesi 5-603

Agent

Solo ora costruisci l’infrastruttura AI agent e la mandi in test sul processo che adesso esiste davvero.

Alla fine esiste

Agent in test, metriche a confronto con la baseline e regole chiare di passaggio a umano.

Dal lancio, in continuo04

Adoption

Fai sì che il team usi davvero il nuovo flusso: champion, formazione nel lavoro, esempio dei leader.

Alla fine esiste

Adozione reale e misurata: l’output esiste perché le persone hanno adottato il sistema.

Standardizzare, oggi, non vuol dire mesi di manuali. Mappi il processo reale, rendi espliciti i criteri di decisione, unifichi i dati in una fonte di verità unica e fissi una baseline. L’AI accelera la parte più dura, far emergere il sapere tacito: lo estrai da chat, ticket e registrazioni invece che da settimane di interviste. Gli artefatti che restano sono concreti: un inventario, una SOP con criteri di decisione, una checklist per promuovere un processo da esperimento a produzione. Come si fa nel dettaglio lo spieghiamo in come standardizzare un processo.

C’è una scuola opposta, secondo cui conviene automatizzare subito e standardizzare strada facendo.[9] Per processi a basso rischio può funzionare. Per quelli core, ad alto impatto e ad alto rischio, è una scorciatoia che si paga: lì si standardizza prima.

E c’è una quarta fase che quasi tutti dimenticano: l’adoption. Un agente che nessuno usa è un costo a rendimento zero. Far sì che il team adotti davvero il nuovo flusso, con champion, formazione e metriche, è l’ultimo anello della catena: lo spieghiamo in come far adottare l’AI al team.

Le fondamenta

Prima dei pezzi vengono i dati

Prima ancora di parlare di tecnologia, c’è un substrato senza il quale tutto il resto crolla: i dati. È la regola del «garbage in, garbage out», e con gli agenti vale doppio. Un agente non si limita a darti un output sbagliato quando i dati sono sporchi: ci agisce sopra. Manda l’email al contatto duplicato, apre la pratica sul cliente sbagliato, decide su un dato vecchio. L’errore non resta sullo schermo, si propaga.

Per questo la «fonte di verità unica» che hai costruito standardizzando il processo non è un dettaglio: è il prerequisito numero uno. Dati duplicati, sparsi in tre sistemi diversi o mai aggiornati rendono inutile qualsiasi modello, per quanto avanzato.

Attenzione, però: «dati puliti» non significa il dataset perfetto prima di partire, quella è la scusa che blocca tutto per sempre. Significa dati abbastanza buoni e affidabili per quel workflow, con un processo che li mantiene puliti nel tempo. Pulizia come pratica continua, non come monumento da costruire prima di iniziare.

Un agente su dati sporchi non sbaglia e basta: agisce sull’errore, e lo moltiplica.

Sotto il cofano

Di cosa ha bisogno un agente per funzionare

Sopra le fondamenta dei dati, resta la parte tecnica. Un agente in produzione non è «il modello»: è un sistema di pezzi, e il modello è solo uno.[8]

Modello

genera e ragiona. È un pezzo, non il sistema.

Planning

scompone l’obiettivo in passi eseguibili.

Tool con contratti rigidi

azioni con input e output validati.

Memoria e retrieval

recupera il contesto senza perderlo dopo pochi turni.

Evals

test automatici prima della produzione.

Guardrail

limiti su cosa può fare, dire e toccare.

Observability

traccia ogni decisione, per capire e correggere.

Human-in-the-loop

una persona nei punti a rischio.

Orchestrazione

coordina i passi e gestisce gli errori.

Sotto, le fondamenta: dati puliti. Sopra, nove pezzi di cui il modello è solo uno. Gli altri otto sono ingegneria, ed è lì che si decide se l’agente regge in produzione o resta una demo.

Perché serve tutto questo? Perché senza, gli agenti si rompono in modi prevedibili: la ricerca ne ha catalogati 14, dal perdere il contesto al non capire quando hanno finito.[5] E il tool calling fallisce in una percentuale a doppia cifra dei casi.[6] Per questo si parte da un solo caso ad alto valore e si costruisce l’infrastruttura prima di scalare.

I guardrail non sono un’opzione. Sono il sistema.

Rischi e regole

La governance non è un dopo. È un parallelo.

Non è una fase zero che blocca tutto, né un ripensamento dopo l’incidente. Corre accanto al progetto, dosata. In fase di discovery fai una classificazione di rischio leggera: che dati tocca, che decisioni prende, quanto è grande il danno se sbaglia. Serve a due cose, scegliere il workflow giusto (a parità di valore, parti dal meno rischioso) ed evitare sorprese dopo.

La governance formale arriva prima di scalare, non prima di iniziare. I riferimenti esistono già: NIST AI RMF (volontario, definisce i rischi), ISO/IEC 42001 (primo standard certificabile) e, in Europa, l’EU AI Act (legge, piena applicazione sui sistemi ad alto rischio dal 2 agosto 2026) e DORA per il settore finanziario.[7] Un dettaglio che dice tutto: nessuno di questi è nato per l’AI agentica; il primo framework pensato per gli agenti autonomi è di Singapore, gennaio 2026.

Per le PMI il punto di partenza è più semplice di quanto sembri: lo abbiamo spiegato passo per passo in AI governance per le PMI, con classificazione del rischio, inventario d’esempio e un piano in 30 giorni.

Il minimo praticabile
  • Un inventario degli AI in uso: cosa, chi è l’owner, che dati tocca.
  • Una classificazione di rischio (per esempio A / B / C).
  • Criteri per promuovere un sistema da esperimento a produzione.
  • Una persona accountable per ogni sistema in produzione.

Se non sai rispondere in dieci secondi a «quanti strumenti AI usiamo e chi ne risponde», non hai un problema di tecnologia. Hai un problema di governance.

Due casi, una radice

Domini diversi, stesso errore evitato

Energy retailer · voce

Un agente vocale per l’outbound

Volevano la cosa più «AI» che ci sia: un agente vocale per le chiamate in uscita. Non si poteva fare, non perché mancasse la tecnologia, ma perché sotto non c’era un processo: nessuno script condiviso, gestione delle obiezioni a istinto, nessun criterio di passaggio a un operatore. Abbiamo prima reso esplicito e ripetibile il processo di chiamata, poi ci abbiamo costruito sopra la voce. La lezione: anche l’AI più avanzata si schianta se il processo non esiste. Prima il processo, poi la voce.

Società di formazione · contenuti

Generare contenuti corsi in scala

L’obiettivo era produrre materiali didattici (test, slide, contenuti normativi) in modo scalabile. Il blocco non era creativo: il sapere era sparso tra Excel, l’LMS e fonti diverse, senza una knowledge base unica. Senza una fonte di verità, scalare era impossibile. Prima abbiamo costruito quella base, poi la generazione in scala. Dominio diverso dal caso accanto, radice identica: manca lo standard a monte.

Altri progetti, con numeri e contesto, nei nostri case study.

Cosa fare lunedì mattina

Parti da qui, non dall’AI

Prima di valutare qualsiasi strumento, valuta il processo. Questo test ti dice in cinque minuti se sei pronto per un agente o se devi prima standardizzare.

Il test dei 5 minuti

Il tuo processo è pronto per un agent?

Pensa a un processo che vorresti automatizzare e rispondi. Basta un «no» per sapere da dove partire davvero.

  • Due persone diverse eseguirebbero questo processo allo stesso modo?
  • Esiste una procedura scritta che qualcuno potrebbe seguire senza di te?
  • Sai misurare l’output del processo oggi, con numeri e non a sensazione?
  • Le eccezioni sono sotto circa il 20% dei casi?
  • I dati e le informazioni che servono stanno in un posto solo e accessibile?
  • Sai dire con chiarezza quando il processo deve passare a una persona?

Hai un processo ad alto impatto ancora poco standardizzato?

È lì che si gioca tutto. In una call capiamo se è il candidato giusto e quale sarebbe il primo passo concreto. Se vuoi prima un’idea dei costi, vedi i prezzi.

Prenota una call
Domande frequenti

Le domande che ci fanno più spesso

Perché la maggior parte dei progetti AI agent fallisce?

Non per i modelli, ma per l’integrazione. Gli studi più citati del 2025 indicano che circa il 95% dei pilot di AI generativa non produce un ritorno misurabile e che la maggior parte degli agent non arriva in produzione. La causa ricorrente è automatizzare processi mai standardizzati: l’agent amplifica il disordine invece di ridurlo.

Quale processo conviene automatizzare per primo?

Quello ad alto impatto sul business ma ancora poco standardizzato va sistemato, non automatizzato subito. Usa due assi (impatto e grado di standardizzazione) e parti da ciò che è già ripetibile e misurabile. Spesso il punto giusto è l’anello che strozza il flusso, il collo di bottiglia, non il processo più visibile.

Quanto tempo serve per integrare un agente AI fatto bene?

Nel nostro metodo circa sei mesi: due mesi per individuare il workflow giusto e misurarne la baseline, due per standardizzarlo (procedure, criteri di decisione, una fonte di verità unica) e due per costruire l’infrastruttura agent e mandarla in test. L’AI è l’ultimo terzo del lavoro, non il primo.

Cosa significa “standardizzare” un processo prima di automatizzarlo?

Renderlo eseguibile allo stesso modo da chiunque: una procedura scritta con criteri di decisione espliciti, un output misurabile e una sola base di conoscenza, invece di sapere sparso tra teste, fogli Excel e strumenti diversi. Solo un processo così è una base solida su cui un agent può lavorare.

Di cosa ha bisogno un agente AI per funzionare, oltre al modello?

Prima di tutto dati affidabili: un agente su dati sporchi non si limita a sbagliare, agisce sull’errore. Poi il modello è solo un pezzo: servono planning, tool con input e output validati, memoria e retrieval, evals, guardrail, observability e una persona nei punti critici. La differenza tra una demo e la produzione non è il modello scelto, è l’ingegneria intorno.

Devo preoccuparmi della normativa sull’AI prima di partire?

In modo proporzionato. Già in fase di discovery conviene una classificazione di rischio leggera (che dati tocca, che decisioni prende, quanto è grande il danno se sbaglia): aiuta a scegliere il workflow giusto. La governance formale (NIST AI RMF, ISO/IEC 42001, e in Europa EU AI Act e DORA) serve prima di scalare, non prima di iniziare. Per le aziende regolate, però, alcune scadenze sono già vincolanti.

Nota di trasparenza

Questo articolo l’ho scritto io. Il metodo, i casi e le opinioni sono il risultato del mio lavoro, delle mie ricerche e dei progetti reali di Yempik. Per la stesura mi sono fatto aiutare da Claude Opus 4.8 su editing, chiarezza e impaginazione, perché un buon contenuto merita di essere anche leggibile. La sostanza è mia; lo strumento è dichiarato. Oggi quasi tutti usano l’AI per scrivere e quasi nessuno lo ammette: noi preferiamo dirlo.

Trasparenza

Fonti

  1. [1]MIT, “The GenAI Divide: State of AI in Business 2025” (95% dei pilot senza ritorno a P&L). Via Fortune, 2025. fortune.com
  2. [2]Analisi su 847 deployment di AI agent: 76% in crisi entro 90 giorni, Medium, 2026. medium.com
  3. [3]Why Agentic AI Projects Fail (problema definito 58% vs mandato vago 22%; ~14% in produzione), Ampcome, 2026. www.ampcome.com
  4. [4]Tacit Knowledge Is Your Next Competitive Moat (~80% del sapere operativo non documentato). California Management Review (Berkeley), 2026. cmr.berkeley.edu
  5. [5]MAST, “Why Do Multi-Agent LLM Systems Fail?” (14 modalità di fallimento). UC Berkeley, arXiv:2503.13657. arxiv.org
  6. [6]Why AI Agents Fail in Production (tool calling 3-15%, costi, osservabilità), Michael Hannecke, 2025. medium.com
  7. [7]Confronto framework di AI governance (NIST AI RMF, ISO/IEC 42001, EU AI Act); nessuno nato per l’AI agentica, Trustible, 2026. trustible.ai
  8. [8]Architettura degli agentic workflow: planning, tool, memoria, evals, guardrail, Vellum, 2026. www.vellum.ai
  9. [9]Automatizzare subito o standardizzare prima: come scegliere, UiPath, 2025. www.uipath.com