¿Que tipo de IA es ChatGPT?

Concepto y funcionamiento de los modelos grandes de lenguaje (LLM)

Machine Learning y Deep Learning hacen posible la IA generativa.

En el siguiente esquema, del científico de la computación, Jeff Crume, se explica cómo el machine learning y el deep learning hacen posible la IA generativa (ChatGPT, DeepSeek, Claude, Gemini, etcétera).

DeepSeek, ChatGPT, Claude y otras aplicaciones similares son inteligencias Artificiales Generativas

Para comprender qué tipo de Inteligencia Artificial es la lA generativa (IAg) debemos comprender uno de sus componentes básicos: los modelos grandes de lenguaje que se conocen como LLM por las siglas en inglés referentes a Large Language Models.

Debido a lo anterior, de aquí en adelante nos referiremos a los "Modelos Grandes de Lenguaje" como LLM.

Los "modelos grandes de lenguaje"

Un modelo de lenguaje es un programa de computación que permite a una máquina aprender de forma automatizada el lenguaje humano a partir de bases de datos, libres digitales y sitios web.

En este sentido, a partir de ese aprendizaje, los LLM son capaces de responder preguntas, generar texto, crear canciones, responder preguntas, escribir historias, explicar cosas complicadas de forma sencilla, crear partituras, hacer poemas y ayudar con tareas escolares.

Según Claude (2024, 18 de julio) un modelo grande de lenguaje (en inglés LLM) es como un súper cerebro de computadora que ha leído muchísimos libros, artículos y paginas web.

AI respecto, Claude explica que un LLM es como tener un robot que ha memorizado la información de una biblioteca enorme y que puede entender y usar el lenguaje de una manera parecida a como Io hacemos los humanos.

Claude (2024, 18 de julio) lo describe con una analogía:

Un modelo grande de lenguaje es como en una máquina de hacer helados que puede crear cualquier saber que uno se imagine. Asi como esa máquina combinaría diferentes ingredientes para hacer nuevos sabores, el LLM combina toda la información que ha "leído" para crear nuevas frases y respuestas.

Qué es la IA generativa y cual es la diferencia con los LLM

La IA generativa es una forma de inteligencia artificial que aprende de una base de datos de forma autónoma para generar imágenes, música, videos y texto similares a los datos originales de los cuales aprendió. (Yu & Guo, 2023)

La diferencia entre IAg y los LLM es:

LLM se especializan en la generación de texto IAg tienen capacidades más amplias y pueden hacer más cosas además de generar texto. Por ejemplo, pueden generar videos, imágenes, diseños, música, códigos de programación, tablas de Excel, audios, presentaciones de PowerPoint.

Ejemplos de IA generativa que pueden hacer otro tipo de contenidos más allá de texto:

Sora (videos)
DALL—E (imágenes)
Midjourney (imágenes)
Stable Diffusion (imáagenes)
MuseNet (música)

Claude (2024, 18 de julio) explica Ia IA generetiva en una analogía:

Imagina una caja de herramientas. Un modelo grande de lenguaje sería come un Iápiz muy avanzado en esa caja. Puede escribir, borrar y dibujar, pero se limita a trabajar en papel. La IA generativa sería toda la caja de herramientas. Además del lápiz (modelo de lenguaje), tendría pinceles para pintar, instrumentos para hacer música, y otras herramientas para crear diferentes tipos de contenido.

Ejemplo de una IA en un bar:

¿Cómo funciona Ia IA Generativa a partir de los LLM?

De esta forma, ChatGPT utiliza dicho programa y sus algoritmos para aprender a "hablar" un idioma, por ejemplo, el español. Lo hace a través de entrenar con la interacción que tiene con sus propios usuarios y a partir de grandes cantidades de datos de texto en un idioma específico. Usa dicho conocimiento para predecir la probabilidad de que ciertas palabras o frases aparezcan en una oración o párrafo determinado.

Con lo anterior, un modelo de lenguaje come el ChatGPT puede realizar diferentes tareas relacionadas con el lenguaje, como la traducción automática, la generación de texto y la clasificación de texto.

Un componente de la IA generative son los denominados Modelos Grandes de Lenguaje (Large Language Models o LLM per sus siglas en inglés).

Un modelo de lenguaje es un programa de computación que permite a una máquina "aprender" de forma automatizada eI lenguaje humano.

Lo anterior, se realiza a través de un proceso denominado Procesamiento de Lenguaje Natural (Natural Language Processing o NLP por sus siglas en inglés).

AI respecto, los LLM son un tipo de IA que se entrena en bases de datos que incluyen grandes cantidades de texto para:

Aprender
Comprender y
Generar lenguaje humano.

Lo anterior, permite que los LLM puedan traducir, corregir, crear, resumir y analizar textos, asi como responder preguntas a partir de una entrada generada por une persona y que se conoce come prompt.

ChatGPT se define e si mismo como un modele de lenguaje:

ChatGPT es un modelo de lenguaje para generar respuestas en lenguaje natural (humano) a partir de preguntas y solicitudes de los usuarios.

ChatGPT utiliza el lenguaje natural y aprendizaje automático para comprender eI contexto y la intención detras de las solicitudes de los usuarios y producir respuestas relevantes y coherentes en tiempo real. OpenAI. (2023, 10 de abril)

De esta forma, ChatGPT utiliza dicho programa y sus algoritmos para aprender a "hablar" un idioma, por ejemplo, el español. Lo hace a través de entrenar con la interacción que tiene con sus propios usuarios y a partir de grandes cantidades de datos de texto en un idioma específico. Usa dicho conocimiento para predecir Ia probabilidad de que ciertas palabras o frases aparezcan en una oración o párrafo determinado.

Con Io anterior, un modelo de lenguaje como el ChatGPT puede realizar diferentes tareas relacionadas con el lenguaje, como Ia traducción automática, la generación de texto, argumentación y la clasificación de texto entre muchas otras cosas.

¿Qué tipo de IA es el ChatGPT?

¿Que tipo de IA es ChatGPT?

DeepSeek, ChatGPT, Claude y otras aplicaciones similares son inteligencias Artificiales Generativas

¿Cómo funciona Ia IA Generativa a partir de los LLM?

Universidad del Centro de México

CENTRO VIRTUAL JOSEFINO