La crescente diffusione dei sistemi di Intelligenza artificiale nella Pubblica Amministrazione pone una questione cruciale: come garantire che le decisioni degli algoritmi siano comprensibili, controllabili e coerenti con l’interesse pubblico.
In questo contesto si inserisce il nuovo Studio del Cert dell’Agenzia per l’Italia Digitale, che introduce un approccio innovativo per analizzare e orientare il comportamento dei Modelli linguistici di grandi dimensioni (Llm), a partire dal cosiddetto meccanismo di refusal (rifiuto).
Il “rifiuto” nei Modelli di IA: da regola opaca a struttura analizzabile
I Modelli linguistici avanzati sono progettati per rifiutare richieste considerate inappropriate, pericolose o non conformi.
Per vedere questi contenuti è necessario essere registrati. Premere Login per accedere o per attivare un abbonamento gratuito di prova.


