GitHub actualizó la forma en que utiliza los datos para mejorar la asistencia de codificación basada en IA . A partir del 24 de abril, los datos de interacción de los usuarios de Copilot Free, Pro y Pro+ podrán utilizarse para entrenar y mejorar los modelos de GitHub, a menos que los usuarios decidan no participar. Los usuarios de Copilot Business y Copilot Enterprise no están incluidos en este cambio.
Los usuarios que ya hayan optado por no participar no necesitan realizar ninguna otra acción, ya que sus preferencias se mantienen.
Si los usuarios deciden participar, GitHub puede utilizar los datos de interacción para mejorar el rendimiento del modelo. Esto incluye una mejor comprensión de los flujos de trabajo de desarrollo, la generación de sugerencias de código más precisas y la identificación temprana de posibles problemas.
Anteriormente, GitHub entrenaba sus modelos con datos disponibles públicamente y ejemplos de código seleccionados. Ahora, cuando está permitido, la empresa utiliza datos de interacción del usuario para perfeccionar sus modelos.
La empresa puede recopilar las indicaciones enviadas a Copilot, las sugerencias generadas, los resultados aceptados o modificados, el contexto del código, los comentarios y la documentación, los nombres de los archivos, la estructura del repositorio y la retroalimentación sobre las sugerencias. Estos datos respaldan el funcionamiento del servicio y, si el usuario lo habilita, el entrenamiento del modelo.
Los datos de interacción de los usuarios de Copilot Business y Enterprise, los usuarios que han optado por no participar y los repositorios propiedad de la empresa no se utilizan para el entrenamiento. GitHub indica que el contenido de los repositorios privados, los problemas y las discusiones «en reposo» no se utilizan para entrenar los modelos. Copilot procesa el código durante su uso para proporcionar sugerencias, y los datos de estas interacciones solo se pueden utilizar para el entrenamiento si el usuario no ha optado por no participar.
La empresa puede compartir los datos utilizados para la mejora de modelos con sus filiales, incluida Microsoft. No comparte estos datos con proveedores independientes de modelos de IA.
“Creemos que el futuro del desarrollo asistido por IA depende de los datos de interacción del mundo real de desarrolladores como ustedes. Por eso estamos utilizando los datos de interacción de Microsoft para el entrenamiento de modelos y comenzaremos a utilizar también los datos de interacción de los empleados de GitHub”, dijo Mario Rodríguez , director de producto de GitHub .
“Si decides ayudarnos a mejorar nuestros modelos con tus datos de interacción, te lo agradecemos. Tus contribuciones marcan una diferencia significativa en la creación de herramientas de IA que benefician a toda la comunidad de desarrolladores. Si prefieres no participar, no hay problema; podrás seguir disfrutando plenamente de las funciones de IA que ya conoces y te encantan”, concluyó Rodríguez.
Fuente y redacción: helpnetsecurity.com