👉 Esta actividad te ayuda a cumplir los siguientes controles:
ISO/IEC 42001:2023: A.4.3, A.7.2, A.7.3, A.7.4, A.7.5, A.7.6
¿Para qué me sirve esta actividad? 📚
Esta actividad es fundamental para establecer un marco de control sobre el activo más valioso de tus sistemas de inteligencia artificial: los datos. Este procedimiento te servirá para definir y aplicar acciones claras que aseguren la calidad, idoneidad y seguridad de los datos que usas para entrenar, validar y operar tus modelos de IA.
Al implementar este procedimiento, te aseguras de que tus sistemas de IA sean más robustos, confiables y justos, minimizando riesgos como el sesgo, la inexactitud y las vulnerabilidades de seguridad.
¿Qué tengo que hacer? 🚀
Para implementar una gestión de datos sólida para tus sistemas de IA, te recomendamos considerar ampliamente los pasos que se detallan en el template que te proporcionamos. El documento está diseñado para guiarte en la definición de cada etapa del ciclo de vida de los datos.
Ahora bien, como siempre decimos, para comenzar te recomendamos leer nuestro template en su totalidad para así comprender la información que deberás documentar posteriormente. Una vez leído todo el template, debes identificar qué es lo que está alineado a tus operaciones reales y qué no.
💡Notarás que varios de los pasos de este procedimiento mencionan el registro y/o actualización de un documento clave que llamamos Matriz de Gestión de Datos para IA. En dicha matriz se deberán documentar características y criterios esenciales sobre la gestión de los datos usados, centralizando así toda la información relevante.
Pero para más detalle, puedes consultar el artículo especial para esa actividad. Por ahora ¡sigamos con el procedimiento!
A continuación, te explicamos los puntos clave que deberás trabajar y adaptar al contexto de tu empresa usando el template:
Definición y selección de datos para desarrollo y mejora.
Los datos deben ser analizados antes de que entren o se usen en el sistema, por lo que en este paso se debe describir cómo se seleccionarán los conjuntos de datos necesarios para tu tecnología de IA.
Además, desde aquí, el inicio del procedimiento, es importante que se consideren los posibles riesgos para la privacidad y la seguridad asociados al uso de esa data.
Debes evaluar si los datos son representativos para evitar sesgos, si cuentan con la exactitud e integridad pertinente para lograr los objetivos esperados del sistema, etcétera.
Adquisición y selección final de datos.
En este paso se documenta formalmente de dónde vienen los datos y por qué se han elegido, o los criterios a considerar para realizar la adquisición.
Recomendamos especificar aquí los detalles y la información que deberás documentar sobre la adquisición de datos para lograr un cumplimiento normativo, como por ejemplo:
Las fuentes (¿son datos propios, comprados, públicos?).
Las características que tienen, si hay información demográfica que pueda generar sesgos.
Si se cuenta con los derechos pertinentes para usarlos (privacidad, derechos de autor), etcétera.
💡Este registro es tu respaldo para demostrar que has sido diligente en la obtención de tus datos. Además recuerda que la información definida en este paso debe estar alineada con lo que solicitas en tu Matriz de Gestión de Datos para IA.
Verificación de la calidad de los datos.
La calidad de un sistema de IA depende directamente de la calidad de sus datos. Por lo que este paso del procedimiento trata sobre establecer qué significa "calidad" para tu negocio, cuáles serán las métricas que usarás para evaluar esa "calidad" (por ejemplo exactitud, completitud, consistencia, etcétera) y cómo evaluarás el impacto que un posible sesgo en los datos podría tener en el rendimiento y la equidad del sistema.
Análisis de la procedencia de los datos.
Este análisis, el cual es un requisito normativo, implica poder rastrear el origen de los datos y todas las transformaciones que han tenido.
Mantener un registro de su procedencia (creación, actualizaciones, validaciones, etcétera) es fundamental para la transparencia y auditabilidad de tus sistemas de IA, así como para poder explicar los resultados que brinda.
Métodos de preparación de datos.
Es posible que los conjuntos de datos que deseas o requieres utilizar par tu sistemas de IA requieran primero ser "preparados" para lograr su objetivo previsto. Y por ello, en este paso se deben documentar las técnicas utilizadas, o aquellas que sepas que podrás utilizar para limpiar, transformar y enriquecer los datos.
Estas técnicas o métodos de preparación pueden incluir acciones como la corrección de errores, el manejo de valores faltantes, la normalización de escalas, la codificación de variables para que el modelo pueda entenderlos correctamente, entre otras. La justificación de por qué se elige un método sobre otro es parte importante de este paso.
Revisión y mantenimiento.
La necesidad de revisar periódicamente tanto este procedimiento como todos los registros que se generan es una parte esencial en el cumplimiento normativo y en el mantenimiento de tu sistema de IA.
El objetivo de este paso es definir las tareas a realizar que te permitan asegurar que este procedimiento siga siendo relevante, eficaz y esté actualizado con los cambios en la operación y/o en la tecnología.
El procedimiento que te proponemos en nuestro template está estructurado con los pasos necesarios para dar cumplimiento a los requisitos normativos. Dentro de él encontrarás también ejemplos y recomendaciones que te servirán para terminar tu procedimiento fácil y rápidamente, pero recuerda que debes ajustar todo lo que consideres pertinente para alinear el documento a tu empresa.
💡Los pasos a seguir para terminar la actividad dentro de la plataforma son los siguientes:
Una vez que nuestro equipo haya aprobado la actividad, debes subir el documento final en versión PDF (no editable).
Posteriormente, debes subir la evidencia de su aprobación.
Recomendamos que esta evidencia sea a través de una minuta de sesión de comité (en ese caso, debes subir el documento en PDF de la minuta), o con una captura de pantalla de la respuesta explícita de quién o quiénes lo aprobaron. Esto debe realizarse por algún medio de comunicación interno de la empresa, como Slack, Teams o el correo electrónico organizacional.
Y por último, debes subir la evidencia de su comunicación.
Al igual que la aprobación, la comunicación del documento puede ser por cualquier medio formal interno de la empresa. Para esto, debes subir una captura de pantalla donde se muestre que el documento fue comunicado a todos los colaboradores interesados.
Recomendaciones ✅
Involucra a un equipo multidisciplinario porque la gestión de datos para IA no es solo una tarea técnica. Involucra al área legal para revisar los derechos de uso, al área de negocio para validar la relevancia de los datos, y a los equipos de desarrollo para implementar los procesos.
Si tienes muchos sistemas de IA, no intentes documentar todo de golpe. Prioriza los sistemas más críticos y aquellos alcanzados por tu SGIA. Aplica el procedimiento de forma rigurosa en ellos, y con esto podrás ir probando su efectividad para luego ir permeándolo a otras áreas relevantes.
Utiliza otras herramientas para el versionado de datos, el monitoreo de la calidad y el registro de la procedencia, si lo consideras necesario. La automatización puede ayudarte mucho a reducir el error humano y facilitar la auditoría.
Recuerda que un sistema de IA bien documentado es más fácil de entender, mantener, auditar y mejorar. Asegúrate de que los registros de cada actividad de este procedimiento estén completos y accesibles.
¡Califica este artículo 👇, esto nos ayudará a mejorar nuestro contenido para ti! Recuerda que también puedes contactarnos por nuestro chat de soporte y te brindaremos la atención que necesites.
