Google se alía con Reddit para utilizar su contenido en el entrenamiento de los modelos de IA

El despliegue de IA que Google está realizando incide en todos los niveles: Gemini es el nuevo nombre de Google Bard, ha llegado a Android con una aplicación oficial, y ya mira al futuro con el modelo Gemini 1.5, que presume de superar a su rival GPT-4. Sin olvidarnos las funciones de IA que están llegando a toda la suite de Google Apps.

Todas estas novedades no han surgido de la nada: la empresa del buscador lleva años trabajando previamente para que todo funcione como debería. Y eso que aún parece estar un paso atrás de OpenAI. La solución pasa por seguir entrenando los modelos de IA para volverlos más inteligentes y no hay mejor manera de hacerlo que aliándose con Reddit para aprender de todo su contenido.

Google y Reddit, juntas por la Inteligencia Artificial

Como usuarios finales, únicamente nos fijamos en los productos que llegan a nuestras manos, como Google Gemini, el chatbot de la firma de Mountain View. Lo mismo sucede con las características que han llegado a los Galaxy S24 y Pixel 8, véase la función «Rodea para buscar» como ejemplo. Sin embargo, detrás de estas tecnologías están los modelos de lenguaje que van refinándose para ser más precisos en sus respuestas, así como para entender el lenguaje humano con mayor facilidad.

En Xataka Android

Open AI revienta el día grande de Google con Gemini 1.5: Sora puede crear vídeos increíbles con una frase

Google debe seguir entrenando los suyos, entre los que destaca el propio Gemini o el más reciente anunciado Gemma. No obstante, para esta tarea requiere nuevas fuentes de datos con el fin de que el entrenamiento sea lo más óptimo posible, pues sin información relevante, estas herramientas pierden su valor.

El problema está en que no todos permiten que terceros utilicen sus datos para entrenar la IA. Google pagará por ello y con un socio de lo más peculiar: Reddit. A principios de semana, un informe empezó a sonar con fuerza tras decir que una "gran empresa de IA no identificada" había llegado a un acuerdo con Reddit.

Finalmente, desvelamos el misterio, y es que Google podrá acceder a las API de Reddit con el fin de entrenar sus modelos de IA. Hoy mismo lo ha confirmado Reuters, y la propia Google también lo ha admitido. Así, tendrá acceso a una gigantesca cantidad de comentarios y publicaciones realizados por los usuarios. Curioso es, cuanto menos, cuando las API fueron el centro de los polémicos cambios que dejaron a apps de terceros sin funcionar.

Algo tuvo que ver el CEO de Reddit, quien consideró mala idea dar acceso gratuito a estas API a empresas que facturan por miles de millones. Por otro lado, la firma de Mountain View ha afirmado que podrá utilizar las API para rastrear contenidos "en tiempo real". Así, mejorará Vertex AI, una herramienta destinada a desarrolladores para entrenar modelos de aprendizaje automático.

Es un cambio bastante significativo que ayudará a Google a desarrollar sus herramientas de IA con mejor resultado. De hecho, en el medio especializado apuntan a otras posibles asociaciones en el futuro. Quién sabe, pues la IA ha llegado para quedarse, y cada día cobra más importancia.

Vía | Android Police

Imagen de portada | Stable Diffusion XL

En Xataka Android | La IA de Google en los Pixel 8: así de bien genera fondos de pantalla con sólo pedírselo