Después de todas las especulaciones y
afirmaciones sobre las capacidades de GPT-4, la muy esperada cuarta iteración
de la familia de modelos de lenguaje GPT se lanzó el 14 de marzo de 2023.
GPT-4 no vino con algunas de las
características tan promocionadas que se rumoraba que tenía. Sin embargo, el
último modelo mejora significativamente el GPT-3.5 y sus predecesores. Pero ¿en
qué se diferencia GPT-4 de GPT-3.5? Te guiaré a través de algunas diferencias
claves entre GPT-4 y GPT-3.5.
1. GPT-4
vs. GPT-3.5: Creatividad
Una de las ventajas más pronunciadas
del modelo GPT-4 sobre GPT-3.5 es su capacidad para proporcionar respuestas más
creativas a las indicaciones. No me malinterpreten; GPT-3.5 es muy creativo.
Hay una larga lista de cosas creativas que puedes hacer con ChatGPT que usa el modelo. No obstante, ya supera a muchos modelos de lenguaje grandes en términos de creatividad.
Además, GPT-4 sube el listón aún más.
Aunque la ventaja creativa de GPT-4 puede no ser evidente cuando se trata de
resolver problemas básicos, la diferencia de creatividad entre ambos modelos se
hace evidente a medida que la tarea se vuelve más difícil y requiere un mayor
nivel de creatividad.
Por ejemplo, si les pides a ambos
modelos que completen una tarea creativa, como escribir un poema en inglés y en
francés en cada línea del poema, ChatGPT, con la tecnología del modelo GPT-4
más reciente, brindará mejores resultados. Mientras que la respuesta de GPT-4
usaría ambos idiomas en cada línea, GPT-3.5 alternaría entre ambos idiomas, con
cada línea usando un idioma y la siguiente usando el otro.
2. GPT-4
vs. GPT-3.5: Indicaciones visuales o de imagen
Mientras que GPT-3.5 solo puede
aceptar indicaciones de texto, GPT-4 es multimodal y puede aceptar
indicaciones de texto y visuales. Para ser claros, cuando decimos indicaciones
visuales, la imagen no tiene que ser una imagen de una indicación escrita,
puede ser una imagen de cualquier cosa. Entonces, desde una imagen de un
problema matemático escrito a mano hasta memes de Reddit, GPT-4 puede
comprender y describir casi cualquier imagen.
A diferencia de GPT-3, GPT-4 es tanto
un lenguaje como un modelo visual.
Durante la transmisión en vivo del
anuncio de GPT-4, un ingeniero de OpenAI alimentó el modelo con una captura de
pantalla de un servidor Discord. GPT-4 podría describir cada detalle, incluidos
los nombres de los usuarios en línea en ese momento. Una imagen de una maqueta
dibujada a mano de un sitio web de chistes también se envió al modelo con
instrucciones para convertirlo en un sitio web y, sorprendentemente, GPT-4
proporcionó un código de trabajo para un sitio web que coincidía con la imagen.
3. GPT-4
vs. GPT-3.5: respuestas más seguras
Si bien GPT-4 no es perfecto, las
medidas que adopta para garantizar respuestas más seguras son una actualización
bienvenida del modelo GPT-3.5. Con GPT-3.5, OpenAI adoptó un enfoque de seguridad más basado en la moderación. En otras palabras, algunas de las
medidas de seguridad fueron más una ocurrencia tardía. OpenAI monitoreó lo que
hicieron los usuarios y las preguntas que hicieron, identificó fallas e intentó
solucionarlas sobre la marcha.
Con GPT-4, la mayoría de las medidas
de seguridad ya están integradas en el sistema a nivel de modelo. Para entender
la diferencia, es como construir una casa con materiales resistentes desde el
principio en lugar de usar cualquier cosa que funcione y luego tratar de
reparar las cosas a medida que surgen las fallas. Según el informe técnico de
GPT-4 de OpenAI, GPT-4 produce respuestas tóxicas solo el 0.73 % de las veces
en comparación con el 6.48 % de respuestas tóxicas de GPT-3.5.
4. GPT-4
vs. GPT-3.5: veracidad de la respuesta
Uno de los defectos de GPT-3.5 es su
tendencia a producir información sin sentido y falsa con confianza. En la jerga
de la IA, esto se denomihna «alucinación de la IA» y puede generar
desconfianza en la información generada por la IA.
En GPT-4, la alucinación sigue siendo
un problema. Sin embargo, según el informe técnico de GPT-4, el nuevo modelo
tiene entre un 19 % y un 29% menos de probabilidades de alucinar en comparación
con el modelo GPT-3.5. Pero no se trata sólo del informe técnico. Las
respuestas del modelo GPT-4 en ChatGPT son notablemente más objetivas.
5. GPT-4
vs. GPT-3.5: Ventana de contexto
Una diferencia menos comentada entre
GPT-4 y GPT-3.5 es la ventana de contexto
y el tamaño del contexto. Una ventana de contexto es la cantidad de datos
que un modelo puede retener en su «memoria» durante una sesión de
chat y durante cuánto tiempo. GPT-4 tiene una ventana y un tamaño de contexto
significativamente mejores que su modelo predecesor.
En términos prácticos, esto significa
que GPT-4 puede recordar mejor el contexto de una conversación durante más
tiempo, así como las instrucciones dadas durante la conversación.
Un problema con GPT-3.5 es la
propensión del modelo a salirse del tema o no seguir las instrucciones a medida
que avanza en el curso de una conversación. Podría, por ejemplo, decirle al
modelo que se dirija a ti por tu nombre, y lo haría por un tiempo, pero luego
dejaría de seguir las instrucciones en el camino. Aunque este problema todavía
existe con el modelo GPT-4, es un problema menor debido a una mejor ventana de
contexto.
Otro problema es la limitación en el
volumen de texto que puedes usar en una indicación a la vez. Resumir texto
largo usando GPT-3 generalmente significa dividir el texto en varios fragmentos
y resumirlos poco a poco. La mejora en la longitud del contexto en el modelo
GPT-4 significa que puedes pegar archivos PDF completos de una sola vez y hacer
que el modelo lo resuma sin dividirlo en partes.
GPT-4: un
paso adelante de GPT-3.5
Sin lugar a dudas, GPT-4 es un paso
significativo respecto a sus modelos predecesores. Si bien todavía está plagado
de algunas de las limitaciones de GPT-3.5, las mejoras significativas en varias
áreas y la adición de nuevas capacidades hacen que el modelo sea un nuevo y
emocionante paso en la búsqueda de modelos de lenguaje de Inteligencia Artificial verdaderamente inteligentes.
Las 3 mejores alternativas a ChatGPT