Un video introduttivo di Andrej Karpathy sugli LLM

Lascio la presentazione di Andrej Karpathy al suo sito web, rischierei di omettere qualcosa. Pochi giorni fa Karpathy ha pubblicato sul suo canale youtube un video chiaro e illuminante sui Large Language Models.

Si tratta di una sintesi completa e accessibile sui modelli linguistici che stanno alla base di agenti conversazionali generativi come ChatGPT.

Se avete un'ora di tempo guardatelo, soprattutto se sapete poco o nulla dell'intelligenza artificiale che si nasconde dietro software come OpenAI ChatGPT, Google Bard, Meta Llama2 ecc ecc...

E' molto interessante il parallelismo proposto da Karpathy tra l'agire dell'IA generativa e il pensiero umano, riferendosi al libro di Daniel Kahneman Pensieri lenti e veloci. Kahneman, nobel per l'economia, nel suo libro si rifà alle teorie psicologiche di Keith Stanovich e Richard West che coniarono i termini Sistema 1 e Sistema 2 per identificare le due modalità di pensiero umano.

Sistema 1. Opera in fretta e automaticamente, con poco o nessuno sforzo e nessun senso di controllo volontario.

Sistema 2. Indirizza l’attenzione verso le attività mentali impegnative che richiedono focalizzazione, come i calcoli complessi. Le operazioni del sistema 2 sono molto spesso associate all’esperienza soggettiva dell’azione, della scelta e della concentrazione.

Il libro di Kahneman merita assolutamente una lettura e ve lo consiglio. Tornando a parlare di LLM sono sicuro che molti degli utenti di ChatGPT saranno sorpresi dal sapere che ChatGPT non possiede alcun meccanismo assimilabile al Sistema 2, ma opera soltando con una modalità analoga al nostro Sistema 1!

social