LLM es la abreviatura de Large Language Model o modelo de lenguaje grande. Es la tecnología básica en la que están basadas la mayoría de mal llamadas inteligencias artificiales generativas, como por ejemplo ChatGPT.
El sistema consiste en la utilización de un enorme grupo de datos de varios gigabytes que son utilizados para entrenar un sistema cuya principal tarea es adivinar la siguiente palabra que tiene sentido utilizar en una frase, o el siguiente paso en la generación de una imagen.
La mayor parte de estos modelos LLM funcionan online, en un servidor remoto, porque todos esos datos se han de cargar en memoria RAM para que el sistema funcione suficientemente rápido. Sin embargo en Apple han trabajado duro para conseguir que la mayoría de sus IAs generativas funcionen localmente en un iPhone con una cantidad de RAM limitada, sin necesidad de conexión a Internet, principalmente por razones de privacidad. Esto se puede conseguir con sistemas de compresión y optimización en el trato de estos enormes bancos de datos.
Estos son todos los artículos en los que os contamos cosas acerca de los modelos LLMs.