Inteligencia Artificial: Más allá del hype 🙈

El fenómeno ChatGPT

Desde su lanzamiento, ChatGPT creció exponencialmente en adopción de usuarios. Le tomó solo dos meses llegar a 100 millones de usuarios activos, un número con el que muchas empresas sueñan y que a gigantes como Netflix le tomó 18 años alcanzar.

Pero más allá de estas cifras impresionantes, este éxito trajo consigo un optimismo renovado dentro del mundo tecnológico. Comenzaron a surgir con más fuerza competidores, entre los más relevantes:

  • Gemini de Google

  • Llama de Meta

  • Claude de Anthropic

  • Grok de xAI

IA en el mundo del emprendimiento

Este optimismo, por naturaleza, se contagió al mundo del emprendimiento. Hoy es casi un estándar escuchar "AI" en un pitch de alguna empresa. Y es que la democratización del acceso a este tipo de modelos redujo las barreras de entrada para el desarrollo de muchas aplicaciones.

Sin embargo, esto también ha llevado a que se piense que la IA lo solucionará todo, y ha resultado en un sobre nacimiento de empresas que son simplemente envolturas (wrappers) de un API de un Modelo de Lenguaje Grande (LLM).

El valor y el peligro de los "wrappers"

Antes es importante aclarar que es un "wrapper" o envoltura, que es la traducción directa.

La mayoría de empresas se crea utilizando servicios de terceros, por ejemplo:

  • No tiene mucho sentido que una empresa que necesita saber el clima de todas las ciudades desarrolle desde cero todo lo que sea necesario: la infraestructura (censores) y recopilación de datos.

  • Es por eso que ya existen empresas con las que puedes obtener esta información a través de APIs, que digamos, simplemente es una manera de comunicación entre aplicaciones.

Esto aplica para este caso:

  • No tiene mucho sentido que comiences un Large Language Model desde cero, no es imposible, pero el costo de hacerlo excede los mil millones de dólares para estar relativamente cerca de los grandes competidores.

  • Además, no necesariamente solo es negocio el LLM, sino las aplicaciones que se pueden desarrollar gracias a este.

Es por esto que la mayoría de empresas de "IA" están mayormente apalancándose de esta tecnología en usos específicos para sus empresas, además de añadiendo capas de valor. Más la mayoría no van mucho más allá.

Y si bien, me parece que hay valor en crear wrappers con estos modelos antes mencionados (Gemini, GPT, Llama, etc). Brindar una interfaz de usuario más amigable para ciertos casos de uso tiene definitivamente un valor. Sin embargo, es peligroso, tanto para el consumidor como para el emprendedor o emprendedora, creer ciegamente que todo lo que diga la IA será mágico.

He escuchado frecuentemente frases como "sí, solo le pondremos IA y esto hará el trabajo". Estos modelos no son mágicos, y de hecho, no necesariamente aplican para todos los casos. Un LLM es un tipo de modelo específicamente para ciertos casos de uso, pero existen otros como CNNs, RNNs, GANs, etc.

En mi caso, aunque trabajé como Software Engineer, tengo un gran desconocimiento del tema. Así que a finales del año pasado me di el tiempo de aprender conceptos básicos. Esto me ha ayudado a comprender un poco mejor el comportamiento de estos modelos y, en alguna medida, las limitaciones actuales.

Redes neuronales: El corazón de la IA actual

Parte central de los modelos actuales son las llamadas redes neuronales artificiales.

¿Qué son las redes neuronales y por qué son importantes?

Las redes neuronales artificiales son el intento de la humanidad por replicar, de manera simplificada, el funcionamiento de nuestro cerebro. Y aunque suene a ciencia ficción, la idea detrás de ellas es fácil de entender.

Imagina por un momento tu cerebro. Está compuesto por miles de millones de neuronas interconectadas. Estas neuronas se comunican entre sí mediante impulsos eléctricos, formando una red compleja que nos permite pensar, sentir y aprender. Cuando aprendes algo nuevo, como tocar la guitarra o hablar un nuevo idioma, lo que realmente está sucediendo es que ciertas conexiones entre neuronas se fortalecen.

Las redes neuronales artificiales intentan imitar este proceso de aprendizaje. Están formadas por "neuronas" digitales organizadas en capas y conectadas entre sí. Cada neurona recibe información, la procesa y decide si debe "activarse" y pasar información a las siguientes neuronas.

Un ejemplo sencillo: decidir si vas a leer este post

Para entender mejor cómo funciona una red neuronal simple, imaginemos una que debe decidir si debes o no invertir tiempo en leer este post. Esta red podría considerar tres factores principales:

1. ¿El tema te parece interesante? (x₁)

2. ¿Tienes tiempo al momento de abrir el mail? (x₂)

3. ¿Es algo práctico que puedes aplicar? (x₃)

Cada uno de estos factores sería una "entrada" para nuestra red neuronal. En el lenguaje de la IA, podríamos representar cada factor como un 1 (sí) o un 0 (no).

Ahora bien, no todos estos factores tienen la misma importancia. Quizás para ti, que sea un tema interesante es más crucial que si es práctico. En una red neuronal, esto se representa mediante "pesos". Podríamos asignar un peso mayor (digamos, 2) al si es un tema interesante, y pesos menores (1) a los otros factores.

Nuestra neurona artificial tomaría estos inputs, los multiplicaría por sus respectivos pesos, los sumaría y luego decidiría si "activarse" (leer el post) o no, basándose en si la suma supera cierto umbral que nosotros decidamos.

En este caso solo leeremos el post si:

  • El tema parece interesante (2) y tenemos tiempo ahora (1) o es algo aplicable (1). Dado que este caso nos daría una suma de 3, que es mayor a 2 (el umbral).

Este ejemplo simplificado ilustra los conceptos básicos de cómo una red neuronal procesa información y toma decisiones. Aunque es un modelo muy básico, nos da una idea de cómo las redes neuronales más complejas pueden procesar información y aprender patrones.

De lo simple a lo complejo: redes neuronales multicapa

Ahora, imagina que en lugar de una sola neurona, tenemos cientos o miles, organizadas en múltiples capas. Las primeras capas podrían procesar información básica (como identificar bordes en una imagen), mientras que las capas posteriores combinarían esta información para reconocer formas más complejas o tomar decisiones más elaboradas.

Esta estructura de múltiples capas es lo que permite a las redes neuronales realizar tareas sorprendentemente complejas, desde reconocimiento de voz hasta conducción autónoma.

¿Por qué es crucial entender esto?

Comprender los fundamentos de las redes neuronales nos da una base sólida para evaluar las capacidades y limitaciones de la IA actual. Nos ayuda a:

  • Anticipar posibles sesgos o limitaciones en sistemas de IA. Estos sesgos están de hecho creados por los pesos que tiene cada factor dentro de una red neuronal.

  • Imaginar nuevas aplicaciones innovadoras basadas en estas tecnologías.

Como hemos visto, detrás de la aparente magia de la IA hay principios comprensibles y limitaciones reales de las cuales cualquier persona, que tenga la voluntad de hacerlo, puede aprender 😉.