Para aquellos que regresan de unas cortas vacaciones lejos de las noticias, DeepSeek es un nuevo actor en el campo de la Inteligencia Artificial (IA). La startup china ciertamente ha tomado por asalto las tiendas de aplicaciones: en solo una semana después del lanzamiento, encabezó las listas como la aplicación gratuita más descargada en los EE. UU. Esto causó un revuelo en los mercados de valores que le costó mucho dinero a los accionistas de nVidia y Oracle.
Se ha dicho que DeepSeek es un proyecto de código abierto, pero técnicamente esto no es cierto porque solo los resultados del modelo y ciertos aspectos son de acceso público. Esto lo califica como un modelo de peso abierto. De todos modos, la diferencia importante es que los datos de entrenamiento subyacentes y el código necesario para la reproducción completa de los modelos no se divulgan en su totalidad.
Y son los datos los que preocupan a muchos. OpenAI ha acusado a DeepSeek de utilizar su modelo ChatGPT para entrenar al chatbot de inteligencia artificial de DeepSeek, lo que desencadenó bastantes memes. Aunque solo sea porque OpenAI había sido acusado anteriormente de utilizar datos que no eran suyos para entrenar a ChatGPT.
Las autoridades también han empezado a hacer preguntas. El regulador italiano de la privacidad, GPDP, ha pedido a DeepSeek que proporcione información sobre los datos que procesa en el chatbot y sus datos de entrenamiento. Dado que ve un riesgo para la privacidad de millones de ciudadanos italianos, GDPD ha exigido a DeepSeek que responda en un plazo de 20 días a preguntas sobre:
- ¿Qué datos personales se recogen?
- El origen de los datos
- Propósito de la colección
- Si los datos se almacenan en servidores en China
Según la agencia de prensa italiana ANSA, DeepSeek desapareció el 29 de enero de 2025 de las tiendas de aplicaciones de Google y Apple en Italia.
Y si todo esto no fuera suficientemente aterrador, los investigadores de Wiz han encontrado una base de datos de acceso público que pertenece a DeepSeek.
“Esta base de datos contenía un volumen significativo de historial de chat, datos de back-end e información confidencial, incluidos flujos de registros, secretos de API y detalles operativos”.
La base de datos no solo era accesible y legible, sino que también estaba abierta al control y a la escalada de privilegios dentro del entorno de DeepSeek. No se requería autenticación, por lo que cualquiera que tropezara con la base de datos podía ejecutar consultas para recuperar registros confidenciales y mensajes de chat en texto sin formato, e incluso robar contraseñas en texto sin formato y archivos locales.
No hace falta decir que este descuido puso a DeepSeek y a sus usuarios en riesgo.
Ya lo hemos dicho antes y probablemente tengamos que repetirlo muchas veces, pero la necesidad de avances rápidos en este campo está creando riesgos de privacidad que nunca antes habíamos visto, simplemente porque la seguridad es una cuestión de último momento para los desarrolladores. Por lo tanto, sin importar qué chatbot de IA prefieras, siempre ten en cuenta la información que le proporcionas: puede llegar a lugares inesperados e indeseables.
Fuente y redacción: thehackernews.com