Paper: un nuevo mecanismo de atención lineal podría reducir el coste de los LLMs un 80%
Investigadores del MIT proponen RetroAttention, un mecanismo que escala linealmente con la longitud del contexto en lugar de cuadráticamente.
Dr. Javier Soto11 min

