Parámetros, transformers, modelos probabilísticos, tokens.... Teoricamente, las piezas que coponen los LLMs pueden quedar claras después de un par de lecturas, pero siempre me he quedado en el punto más conceptual.
Hoy, gracias a un colega del banco, he dado un paso a más a comprender cómo funcionan estas cajas negras.
En esta página (https://bbycroft.net/llm) van un poco más allá y tratan de explicarlo. Cuando digan "tratan" no es porque lo hagan mal, si no porque el tema es complejo de entender para una mente no puramente matemática:
Aqui se explican las principales fases de un prompt hacia un LLM, y de una forma muy visual tratan de explicar qué hace qué componente en cada fase de la consulta.
Ahora bien, si te interesa y no eres un teki sobre el tema, preparate para tener que dedicarle unas cuantas neuronas
Increíble que esto vaya a ser lo que nos destrone como especie.
Comentarios