En la actualidad, la inteligencia artificial generativa (GenAI) ha irrumpido como una herramienta clave para las empresas que buscan optimizar sus procesos y aumentar su valor comercial. Sin embargo, a medida que los desarrolladores y las compañías consideran la adopción de esta tecnología, surge una cuestión central: ¿deberían optar por modelos de IA propietarios y cerrados, o por soluciones de código abierto que puedan ajustarse a las necesidades específicas de cada empresa? Este dilema, conocido como "El dilema del desarrollador de IA", presenta desafíos fundamentales en la toma de decisiones tanto a nivel técnico como empresarial.
La transición de GenAI del consumo al entorno empresarial
Cuando en 2022 OpenAI lanzó su modelo GPT-3 y la plataforma ChatGPT, el enfoque inicial de GenAI fue hacia el consumo individual, generando un gran interés entre los usuarios finales. No obstante, rápidamente las empresas comenzaron a explorar cómo aprovechar esta tecnología en sus propios entornos de negocio. A medida que la adopción crecía, en 2023 emergieron dos enfoques distintos para la implementación de GenAI en las empresas: el uso de grandes modelos cerrados, como los de OpenAI, y la adopción de modelos de código abierto, inspirados inicialmente por el modelo LLaMa de Meta.
Para principios de 2024, estos dos enfoques se habían consolidado. Por un lado, los modelos propietarios ofrecen soluciones todo en uno, donde las empresas acceden a tecnologías de IA a través de servicios en la nube que proporcionan no solo el modelo, sino también la infraestructura de datos, seguridad y computación necesaria. Por otro lado, los modelos de código abierto permiten a las empresas o desarrolladores adaptar soluciones más específicas utilizando datos propios y ajustando las funcionalidades del modelo a sus necesidades particulares.
Ventajas y desventajas de los modelos propietarios y los de código abierto
Ambos enfoques tienen ventajas y desventajas. Los grandes modelos propietarios, como GPT-4, ofrecen una alta versatilidad, lo que permite a las empresas realizar una amplia variedad de tareas sin necesidad de ajustar o entrenar el modelo para cada función específica. Esto facilita una rápida adopción inicial, especialmente cuando se busca minimizar los costos de inversión de capital (CapEx) en las primeras fases de implementación.
Sin embargo, los modelos de código abierto presentan una ventaja significativa a largo plazo: permiten una mayor personalización y adaptación a las necesidades cambiantes de la empresa. A medida que las herramientas de ajuste y personalización de IA continúan mejorando, se hace cada vez más sencillo para las organizaciones ajustar estos modelos sin la necesidad de tener una profunda experiencia en IA. Esto reduce las barreras para aprovechar el valor de la inteligencia artificial en tareas específicas, desde la implementación de modelos en la infraestructura actual de la empresa, hasta su integración en el perímetro de la red, en dispositivos cliente o en centros de datos.
Innovación en los modelos de IA compactos
Una de las tendencias más destacadas en el desarrollo de IA en 2024 ha sido la rápida mejora de los modelos compactos de código abierto. Estos modelos, que contienen significativamente menos parámetros que los grandes modelos propietarios, han demostrado un rendimiento comparable en una variedad de tareas especializadas. Por ejemplo, mientras que modelos como GPT-4 contienen cientos de miles de millones de parámetros, los modelos de código abierto con menos de 30 mil millones de parámetros pueden ofrecer un rendimiento similar cuando se aplican a dominios específicos. Este avance ha sido impulsado por un ciclo virtuoso de innovación en el ecosistema de código abierto, lo que ha permitido reducir los costos y aumentar la eficiencia de los modelos.
A pesar de que los modelos propietarios todavía superan en algunos aspectos a los modelos de código abierto, la brecha se está cerrando rápidamente. Esto es especialmente relevante en industrias donde se requiere la capacidad de ajustar rápidamente los modelos para responder a nuevas necesidades o cambios en el mercado. La capacidad de personalizar y ajustar estos modelos permite a las empresas responder de manera ágil a las demandas emergentes, lo que representa una ventaja competitiva importante.
Modelos incorporados vs. generación centrada en la recuperación
Un aspecto crucial en la adopción de GenAI es la fuente de los datos utilizados durante la inferencia. En los primeros modelos de IA, como la versión inicial de ChatGPT, no se utilizaban datos externos al modelo, lo que limitaba su capacidad de ofrecer información actualizada o personalizada. Sin embargo, en 2023, se introdujeron soluciones que permiten la integración de un front-end de recuperación de datos externos, lo que mejoró significativamente la precisión y relevancia de las respuestas generadas por estos modelos.
En la actualidad, los modelos de IA con recuperación aumentada de generación (RAG, por sus siglas en inglés) son esenciales para la implementación empresarial de GenAI. Estos modelos permiten acceder a datos externos en tiempo real, lo que es particularmente útil en entornos empresariales donde la información se actualiza constantemente. Además, la generación centrada en la recuperación (RCG) ofrece una ventaja adicional: en lugar de depender de la memoria paramétrica del modelo, el sistema se basa en la interpretación de la información recuperada, lo que aumenta la precisión y relevancia de las respuestas generadas.
Modelos generalistas frente a modelos especializados y personalizados
Una de las decisiones más importantes para las empresas que adoptan GenAI es si utilizar modelos generalistas o modelos especializados y personalizados. Los modelos generalistas, como GPT-4 o Claude 3, están diseñados para realizar una amplia gama de tareas, desde el desarrollo de código hasta la generación de resúmenes o la creación de contenido visual. Estos modelos son extremadamente versátiles y permiten a las empresas abordar una amplia variedad de necesidades con una única solución.
No obstante, muchas empresas optan por utilizar versiones más especializadas de GenAI para tareas específicas. Por ejemplo, en el sector sanitario, un modelo generalista puede no ser suficiente para realizar análisis médicos profundos o gestionar datos sensibles de pacientes. En lugar de ello, las empresas de salud prefieren utilizar modelos especializados para cada tarea, lo que les permite optimizar el rendimiento y garantizar la precisión en cada área de aplicación.
Los modelos personalizados, que se ajustan específicamente a las necesidades de una empresa, ofrecen una solución aún más precisa. Estos modelos se pueden entrenar utilizando datos internos de la empresa, lo que permite una mayor precisión y relevancia en las tareas específicas para las que se utiliza la IA. Además, el ecosistema de código abierto ofrece una amplia variedad de opciones para personalizar los modelos, desde la adaptación de modelos existentes hasta la creación de nuevas arquitecturas ajustadas a los requisitos de la empresa.
Ejecución de inferencias: servicios en la nube frente a entornos gestionados
Otro aspecto fundamental en la implementación de GenAI es el entorno de ejecución de las inferencias. En un enfoque propietario, las inferencias se realizan a través de llamadas a la API o consultas a un servicio en la nube, lo que facilita el acceso a la última versión del modelo sin necesidad de una infraestructura interna compleja. Esta solución, conocida como Generative-as-a-Service (GaaS), es especialmente adecuada para empresas que buscan implementar GenAI de manera rápida y con un costo operativo (OpEx) controlado.
Por otro lado, las empresas que eligen ejecutar inferencias en sus propios entornos gestionados pueden beneficiarse de una mayor seguridad y control sobre los datos. En este caso, las inferencias se ejecutan en la infraestructura computacional existente de la empresa, lo que permite una mayor personalización y optimización del modelo según las necesidades de la empresa. Si bien esta opción puede requerir una mayor inversión de capital (CapEx), es ideal para empresas que necesitan un uso continuo y estable de la tecnología de IA.
La adopción de la inteligencia artificial generativa es un proceso transformador que está siendo evaluado o implementado activamente por empresas de todos los sectores. A medida que los desarrolladores de IA consideran sus opciones, una de las preguntas más importantes que deben abordar es si utilizar modelos propietarios externos o confiar en el ecosistema de código abierto. Cada enfoque ofrece ventajas distintas en términos de flexibilidad, costo y control sobre los datos.
A largo plazo, muchos expertos creen que las empresas optarán por integrar modelos de código abierto en sus entornos computacionales internos. Esta estrategia les permitirá aprovechar el rápido avance del ecosistema de IA de código abierto, mientras mantienen el control sobre los costos y la implementación de la tecnología. Con el tiempo, este enfoque colaborativo y distribuido de la IA podría democratizar el acceso a la tecnología y garantizar prácticas éticas y transparentes en su desarrollo y uso.
En definitiva, la decisión entre un enfoque propietario o uno de código abierto depende de las necesidades específicas de cada empresa, pero las tendencias actuales sugieren que el código abierto está ganando terreno como la opción preferida para el desarrollo a largo plazo de soluciones de IA empresariales.