Se dice que una comunidad abierta no solo puede innovar a gran escala, sino que también puede comprender, compartir y resolver mejor los problemas a medida que surjan. Crédito de la imagen: Ilustración: Pixbay
Google anunció el año pasado que estaba trabajando con Google DeepMind para unir sus unidades de IA y planeaba acelerar el desarrollo de productos para alcanzar a empresas como Microsoft y OpenAI. El flujo de lanzamientos de las últimas semanas cumplió esa promesa.
Google reorganizó sus productos de IA, incluido su chatbot Bard, bajo la marca Gemini hace dos semanas, junto con el lanzamiento de Gemini Ultra, su IA más poderosa hasta la fecha. Una semana más tarde, presentaron Gemini Pro 1.5, un modelo Pro actualizado que se asemeja en gran medida al rendimiento de Gemini Ultra y también incluye una enorme ventana contextual para texto, imágenes y audio (la cantidad de datos que puede solicitar).
La empresa presentó dos nuevos modelos. Los modelos llamados Gemma y Gemini Ultra tienen un peso de 2 mil millones y 7 mil millones de parámetros, respectivamente. A diferencia de los modelos multimodales que se entrenan con una variedad de datos, incluidos texto, imágenes y audio, los modelos basados en texto superan a los modelos de tamaño similar y pueden funcionar en una computadora portátil, escritorio o en la nube, según Google. Google eliminó conjuntos de datos confidenciales como información personal antes del entrenamiento. Antes del lanzamiento, también ajustaron y probaron los modelos entrenados para reducir el comportamiento no deseado.
Según Google, los modelos fueron desarrollados y entrenados con la misma tecnología utilizada en Gemini; sin embargo, se lanzan bajo una licencia abierta.
No quiere decir que sean de código abierto. En cambio, la empresa está proporcionando los pesos del modelo a los desarrolladores para que los ajusten. Además, están desarrollando herramientas de desarrollo que ayudarán a mantener las aplicaciones seguras y hacerlas compatibles con los marcos y plataformas de IA más populares. Según Google, los modelos se pueden utilizar para un uso y distribución comercial responsable (como se define en los términos de uso) para cualquier tipo de organización.
Si bien Gemma está enfocada en OpenAI y Microsoft, es posible que también tenga en mente a Meta. Meta apoya un modelo más abierto para los lanzamientos de IA, especialmente a través de su modelo de lenguaje Llama 2. El conjunto de datos y el código utilizados para entrenar Llama 2 no han sido publicados por Meta, aunque a veces se confunde con un modelo de código abierto. Los modelos OLMo del Instituto Allen de IA (AI2) incluyen datos y código de entrenamiento. El lanzamiento de Gemma de Google tiene más similitudes con Llama 2 que con OLMo.
En una conferencia de prensa, Jeanine Banks de Google dijo: «Los modelos abiertos se han vuelto bastante omnipresentes ahora en la industria». Y con frecuencia se refiere a modelos de pesos abiertos, donde los desarrolladores e investigadores tienen mucho acceso para personalizar y ajustar los modelos, pero al mismo tiempo, los términos de uso (cosas como la redistribución, así como la propiedad de las variantes desarrolladas) varían según los términos de uso específicos del modelo. Después de observar algunas diferencias entre lo que normalmente llamaríamos código abierto, decidimos que era más apropiado llamar a nuestros modelos Gemma modelos abiertos.
A pesar de esto, Llama 2 ha tenido un impacto significativo en la comunidad de desarrolladores, y los modelos abiertos de empresas como la startup Mistral en Francia y otros están impulsando el rendimiento hacia modelos cerrados de última generación, como el GPT-4 de OpenAI. En contextos comerciales, los desarrolladores pueden personalizar mejor los modelos abiertos. Además, son muy útiles para los investigadores de IA con presupuestos limitados. Google desea otorgar créditos de Google Cloud para respaldar esta investigación. Los investigadores pueden solicitar créditos de hasta 500.000 dólares para proyectos más grandes.
La industria todavía discute cuán abierta debería ser la IA.
Según los partidarios de un ecosistema más abierto, los beneficios superan los riesgos. Se dice que una comunidad abierta no solo puede innovar a gran escala, sino que también puede comprender, compartir y resolver mejor los problemas a medida que estas surgen. OpenAI y otros han defendido un enfoque más cerrado, argumentando que un modelo más poderoso podría ser más peligroso en estado salvaje. Un enfoque intermedio podría permitir un ecosistema de IA abierto, pero requeriría una regulación más rigurosa.
Es evidente que la IA abierta y cerrada está avanzando rápidamente. A medida que avance el año, podemos anticipar más innovación de las grandes empresas y comunidades abiertas.
REFERENCIAS
Gemma: Open Models Based on Gemini Research and Technology. Gemma Team, Google DeepMind: https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf
Gemma: Introducing new state-of-the-art open models. Blog Google: https://blog.google/technology/developers/gemma-open-models/
Allen Institute for AI releases fully open-source large language model. Axios: https://www.axios.com/2024/02/01/allen-institute-for-ai-fully-open-source-large-language-model-olmo-7b
Open-Source AI Is Uniquely Dangerous But the regulations that could rein it in would benefit all of AI. IEEE Spectrum: https://spectrum.ieee.org/open-source-ai-2666932122
Publicaciones Relacionadas:
Publicaciones no Relacionadas.