Home TecnologíaGitHub Copilot: Cambios en el uso de datos para entrenamiento de IA

GitHub Copilot: Cambios en el uso de datos para entrenamiento de IA

by Editor de Tecnologia

GitHub anuncia que, a partir del 24 de abril, modificará la forma en que utiliza los datos para su asistente de IA Copilot. Los datos de interacción de los usuarios de Copilot Free, Pro y Pro+ se utilizarán por defecto para entrenar y mejorar los modelos de IA, a menos que los usuarios opten explícitamente por no participar. Este cambio no se aplica a Copilot Business y Copilot Enterprise.

Neowin añade que, en la práctica, este cambio implica un modelo de exclusión voluntaria. Los usuarios que no tomen medidas antes del 24 de abril se incluirán automáticamente en el programa de entrenamiento. Esto traslada explícitamente la responsabilidad al usuario de ajustar activamente la configuración de privacidad, lo que podría generar un debate sobre la transparencia y el consentimiento informado.

Con esta medida, GitHub, una subsidiaria de Microsoft, sigue una tendencia más amplia dentro del sector de la IA. Los datos del mundo real son cada vez más importantes para mejorar el rendimiento del modelo. Según la compañía, el uso de interacciones reales conduce a sugerencias más precisas y contextualizadas, con el objetivo de ayudar a los desarrolladores a escribir código de manera más eficiente y segura.

Los datos que GitHub pretende utilizar incluyen, entre otros, la entrada y salida de Copilot, fragmentos de código, el contexto alrededor de la posición del cursor y los comentarios de los usuarios sobre las sugerencias. También se podría incluir información como las estructuras de archivos y las interacciones con funciones como el chat y las sugerencias en línea, cubriendo efectivamente prácticamente todas las interacciones que un usuario tiene con Copilot.

leer más  EE. UU. impulsa la robótica con incentivos para competir con China y fortalecer la industria.

Distinción entre datos almacenados y datos activos

Cabe destacar que GitHub distingue explícitamente entre los datos en reposo y las interacciones activas. El contenido de los repositorios privados no se utiliza a menos que se procese activamente a través de Copilot. Una vez que un usuario utiliza Copilot dentro de un repositorio privado, esos datos de interacción pueden utilizarse para el entrenamiento del modelo, a menos que el usuario haya optado por no participar.

Los usuarios que no deseen que se utilicen sus datos pueden desactivar esta opción a través de la configuración de privacidad. GitHub afirma que se respetarán las preferencias existentes. Los usuarios que previamente hayan optado por no compartir datos para la mejora del producto se excluirán automáticamente de este nuevo programa de entrenamiento.

La decisión se basa en parte en experimentos previos dentro de Microsoft, donde los datos de interacción de los empleados ya se utilizaban para mejorar los modelos. Según la compañía, esto ha llevado a tasas de aceptación más altas de las sugerencias y a un mejor rendimiento en varios lenguajes de programación. La empresa espera que la ampliación a un grupo de usuarios más amplio refuerce esta tendencia.

Además, Microsoft enfatiza que los datos recopilados pueden compartirse con empresas afiliadas dentro de su propia organización, pero no con proveedores externos de modelos de IA. Con esto, la compañía busca aliviar las preocupaciones sobre el intercambio de datos con terceros. No obstante, el uso de datos de desarrolladores para fines de entrenamiento sigue siendo un tema delicado.

GitHub afirma que el futuro del desarrollo de software asistido por IA depende de la información del mundo real. Al entrenar modelos con flujos de trabajo de desarrollo reales, la compañía pretende posicionar aún más a Copilot como un asistente confiable y productivo para los programadores.

leer más  Facebook: Crear y Configurar Página Móvil

También lee: Criticism surrounding the integration of Grok into GitHub Copilot

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.