Lewis et al. hanno messo per iscritto l'idea originale nel 2020: combinare la memoria parametrica dentro un language model con la memoria non parametrica recuperata da qualche altra parte. Risolveva un problema reale. I modelli potevano finalmente smettere di inventarsi cose.
Da allora gran parte del RAG enterprise si è fermata a quel paper. Vector search più un LLM. Modalità di fallimento prevedibili quando la conoscenza va composta tra più fonti, quando le affermazioni si contraddicono, quando metà dei documenti ha diciotto mesi e nessuno si è preso la briga di segnalarlo.
La nostra linea di ricerca — Retrieve Is Not Enough — riguarda ciò di cui un sistema di retrieval ha bisogno una volta accettato che la ricerca per similarità è il pavimento, non il soffitto.