Intelligenza artificiale e “geometria del rifiuto”: verso Modelli più controllabili e affidabili nella P.A.

La crescente diffusione dei sistemi di Intelligenza artificiale nella Pubblica Amministrazione pone una questione cruciale: come garantire che le decisioni degli algoritmi siano comprensibili, controllabili e coerenti con l’interesse pubblico.

In questo contesto si inserisce il nuovo Studio del Cert dell’Agenzia per l’Italia Digitale, che introduce un approccio innovativo per analizzare e orientare il comportamento dei Modelli linguistici di grandi dimensioni (Llm), a partire dal cosiddetto meccanismo di refusal (rifiuto).

Il “rifiuto” nei Modelli di IA: da regola opaca a struttura analizzabile

I Modelli linguistici avanzati sono progettati per rifiutare richieste considerate inappropriate, pericolose o non conformi.

Per vedere questi contenuti è necessario essere registrati. Premere Login per accedere o per attivare un abbonamento gratuito di prova.

La nostra attenzione alla verifica dei contenuti

Gli articoli e i contenuti prodotti dalla nostra redazione sono tutti verificati da esperti del settore. Seguendo una procedura di qualità certificata, i giornalisti della redazione operano a stretto contatto con gli esperti per verificare la correttezza delle informazioni pubblicate. L'obiettivo è quello di fornire a tutti i lettori informazioni verificate e attendibili.

Seguici sui social:

Iscriviti e resta aggiornato