• Actores maliciosos han intentado clonar la IA Gemini de Google.
  • Se utilizaron más de 100.000 peticiones para entrenar modelos 'copia'.
  • Google considera esta práctica un robo de propiedad intelectual.

Google ha alertado sobre un intento a gran escala de replicar su modelo de inteligencia artificial, Gemini. Según la compañía, actores con motivaciones comerciales han solicitado al modelo más de 100.000 veces, utilizando respuestas en varios idiomas no ingleses para entrenar una versión más económica y similar. Esta técnica, conocida como 'destilación' o 'extracción de modelos', busca imitar las capacidades de una IA existente sin necesidad de invertir los miles de millones y años de desarrollo que Google empleó en Gemini. La empresa considera esta actividad como un robo de propiedad intelectual, aunque la propia Google ha enfrentado acusaciones similares en el pasado.

El método de 'destilación' para clonar IA

La práctica de entrenar un nuevo modelo de IA utilizando las respuestas de uno ya existente se conoce comúnmente como 'destilación'. Este proceso permite a desarrolladores con menos recursos crear modelos más pequeños y eficientes que imitan el comportamiento del modelo original. Al alimentar a la IA existente con miles de preguntas cuidadosamente seleccionadas y recopilar sus respuestas, se crea un conjunto de datos de entrada-salida. Este conjunto se utiliza luego para entrenar un modelo más económico que puede replicar muchas de las capacidades del modelo 'padre', sin acceder a su código o datos de entrenamiento originales. Google ha identificado una oleada de estos ataques dirigidos específicamente a los algoritmos de razonamiento simulado de Gemini.

Ataques dirigidos a la lógica de Gemini

Google ha señalado que muchas de estas campañas de destilación se han centrado en los algoritmos que permiten a Gemini realizar tareas de razonamiento simulado y procesar información paso a paso. La compañía afirmó haber identificado una campaña específica que involucró más de 100.000 peticiones y haber ajustado las defensas de Gemini en respuesta. Sin embargo, Google no ha detallado las contramedidas exactas implementadas para mitigar estas amenazas. Estos intentos de replicar modelos de IA resuenan con las preocupaciones sobre la seguridad y la propiedad intelectual en el ámbito tecnológico, un tema que Microsoft también aborda con herramientas para detectar "puertas traseras" en IA, como se detalla en la presentación de Microsoft sobre herramientas contra las 'puertas traseras' en la IA.

La IA y la propiedad intelectual en disputa

La línea entre la destilación estándar y el robo de propiedad intelectual es un tema complejo y en gran medida sin resolver legalmente. Mientras que la destilación es una técnica común en la industria para crear modelos más eficientes, su uso para clonar modelos propietarios sin permiso plantea serias cuestiones éticas y legales. Google ha prohibido explícitamente la extracción de datos de sus modelos de IA en sus términos de servicio. La empresa sospecha que los principales actores detrás de estos intentos son empresas privadas y investigadores que buscan una ventaja competitiva, aunque se niega a nombrar sospechosos.

Historial de acusaciones y defensas

Este incidente se suma a un historial de controversias en torno a la clonación de modelos de IA. En el pasado, el equipo de Bard de Google fue acusado de utilizar salidas de ChatGPT para entrenar su propio chatbot, lo que llevó a la renuncia de un investigador clave. Otros casos incluyen acusaciones de OpenAI contra DeepSeek por usar destilación y la creación de modelos como Alpaca a partir de salidas de GPT-3.5 con un coste mínimo. La accesibilidad pública de los modelos de IA dificulta la prevención total de estas prácticas, a pesar de las medidas de limitación de velocidad. El creciente desarrollo de la IA, impulsado en parte por el aumento en la demanda de hardware de alto rendimiento, también está impactando en otros sectores, como el aumento de precios de las GPUs, como se puede ver en el artículo sobre el impacto de la IA en los precios de las GPUs.