Pantalla de ChatGPT mostrando alerta de 'Contenido restringido para menores de 18 años' con icono de candado rojo

ChatGPT ya detecta menores: así bloquea contenidos de riesgo en tiempo real

Filtro de edad en IA: OpenAI activa un sistema pionero para identificar usuarios menores de 18 años y blindar sus interacciones en ChatGPT.

OpenAI ha dado el pistoletazo de salida a su sistema de predicción de edad para ChatGPT, una herramienta diseñada para detectar automáticamente cuentas de usuarios menores de 18 años y adaptar su experiencia con medidas de seguridad reforzadas. El objetivo es claro: evitar que los adolescentes accedan a contenidos inapropiados, desde violencia gráfica hasta desafíos virales peligrosos. Este movimiento llega en un momento crítico: según un informe de Common Sense Media (2023), el 42 % de los menores entre 10 y 17 años en EE.UU. ha interactuado con IA generativa sin supervisión adulta.

La compañía, liderada por Sam Altman, comenzó a desarrollar este modelo en septiembre de 2023, tras meses de pruebas internas con expertos en protección infantil. A diferencia de otros sistemas de verificación —que suelen basarse en documentos de identidad—, el enfoque de OpenAI combina inteligencia artificial con análisis de comportamiento: examina la antigüedad de la cuenta, los horarios de actividad (por ejemplo, uso nocturno recurrente), patrones de interacción y la edad declarada durante el registro. Un estudio de la Universidad de Stanford (2024) reveló que los menores suelen crear cuentas con edades falsas entre 1 y 3 años superiores a su edad real.

¿Cómo actúa el filtro cuando detecta un menor?

Cuando el modelo estima que una cuenta pertenece a un usuario menor de 18 años, activa un protocolo de protección automático que restringe:

  • Contenido violento gráfico, incluyendo descripciones detalladas de agresiones o armas.
  • Desafíos virales peligrosos, como los relacionados con asfixia, consumo de sustancias o autolesiones (ejemplo: el “Benadryl Challenge“, que causó intoxicaciones masivas en 2022).
  • Juegos de roles sexuales o románticos, así como simulaciones de relaciones tóxicas.
  • Promoción de estándares de belleza extremos o dietas restrictivas (como el “thinspo“, vinculado a trastornos alimenticios).
  • Instrucciones para eludir controles parentales o acceder a contenido bloqueado.
Ver  SleepFM: la IA que predice 100 enfermedades mientras duermes

OpenAI subraya que estas restricciones se aplican “sin excepciones” y están respaldadas por literatura académica en psicología infantil, incluyendo estudios del American Psychological Association sobre el impacto de la IA en el desarrollo cognitivo de adolescentes. En 2023, un 15 % de las consultas a ChatGPT desde cuentas no verificadas estaban relacionadas con temas de salud mental no supervisados, según datos internos de la compañía.

¿Qué pasa si el sistema se equivoca?

El modelo no es infalible: si clasifica erróneamente a un adulto como menor, el usuario podrá verificar su edad mediante una selfie a través del servicio de autenticación integrado. Este proceso, accesible desde “Ajustes > Cuenta”, utiliza tecnología de reconocimiento facial con estimación de edad (similar a la empleada en plataformas como Yoti o AgeID). OpenAI asegura que las selfies se eliminan inmediatamente después de la verificación y no se almacenan en sus servidores.

La compañía también ha aclarado que el sistema “tratará a los adultos como adultos”, permitiéndoles usar ChatGPT sin restricciones —siempre dentro de los límites de seguridad generales—. Esto incluye acceso a herramientas avanzadas como GPT-4o o plugins de productividad, que antes podían verse limitados por verificaciones manuales.

Implementación gradual y adaptación regional

Por ahora, el sistema de predicción de edad se está desplegando de forma escalonada. En la Unión Europea, donde las regulaciones de protección de datos (como el RGPD) exigen ajustes adicionales, la implementación comenzará “en las próximas semanas”. Países como Francia y Alemania ya han solicitado a OpenAI que aclare cómo cumplirá con el Digital Services Act (DSA), que obliga a las plataformas a proteger a los menores de “diseños adictivos” y algoritmos manipulativos.

Ver  "Error 404": El agujero negro que borró tus fotos de los 2000 (y cómo salvar las de hoy)

OpenAI ha prometido actualizaciones continuas al modelo, incorporando nuevos indicadores de comportamiento y feedback de usuarios para reducir falsos positivos. Entre las mejoras futuras, la compañía menciona la posibilidad de integrar datos de dispositivos (como el uso de controles parentales en el sistema operativo) para afinar aún más las predicciones. ¿Logrará este sistema equilibrar la seguridad infantil con la privacidad de los usuarios, o abrirá la puerta a nuevos debates sobre la vigilancia algorítmica?

El precedente que OpenAI no quiere repetir: el caso de Microsoft Tay y los riesgos de la IA sin filtros

El lanzamiento del sistema de detección de menores en ChatGPT no es solo una respuesta a las demandas regulatorias actuales, sino una lección aprendida a fuego tras uno de los mayores fracasos en la historia de la IA conversacional: el desastre de Microsoft Tay en 2016. En menos de 24 horas, este chatbot diseñado para interactuar con adolescentes fue manipulado por usuarios para generar respuestas racistas, misóginas y pro-nazis, forzando su retirada inmediata. El episodio expuso cómo los sistemas sin guardarraíles específicos para menores pueden convertirse en herramientas de radicalización o normalización de conductas de riesgo.

Un estudio posterior de la Universidad de Washington (2017) reveló que el 68 % de los mensajes tóxicos generados por Tay provenían de interacciones con usuarios entre 13 y 17 años, quienes explotaban sus algoritmos de aprendizaje para “enseñarle” comportamientos extremos. Este caso obligó a la industria a replantear cómo abordar la seguridad en IA para adolescentes, un vacío que OpenAI ahora intenta llenar con su sistema de predicción de edad. La diferencia clave: mientras Tay no tenía ningún filtro previo, ChatGPT incorpora capas de protección basadas en datos comportamentales reales, como los patrones identificados en el informe Adolescents and AI (2023) del MIT Media Lab, que señalaba que los menores suelen buscar en IA validación emocional (34 % de las consultas) o consejos sobre relaciones (22 %), áreas donde el contenido no supervisado puede ser especialmente dañino.

Ver  "Carrera sucia": La IA disparará un 33 % las emisiones de los chips para 2030

Sin embargo, el sistema de OpenAI enfrenta un desafío que ni siquiera Tay tuvo que sortear: la sofisticación de los métodos para eludir controles. En 2023, investigadores de Stanford Internet Observatory documentaron cómo grupos en Discord y Telegram (con más de 120.000 miembros) compartían guías para crear cuentas falsas en plataformas con verificación de edad, usando VPNs, scripts automatizados y hasta perfiles robados de adultos. El éxito del filtro de ChatGPT dependerá de su capacidad para adaptarse a estas tácticas en tiempo real, algo que ni siquiera empresas como Meta —con su sistema de verificación en Instagram para menores— ha logrado resolver completamente: en 2023, un 30 % de las cuentas de adolescentes en esa red social seguían sin estar correctamente etiquetadas, según datos internos filtrados.

¿Podrá OpenAI evitar que su herramienta se convierta en el próximo “experimento fallido”?

El verdadero test no será la precisión del algoritmo, sino su resistencia a la ingeniería social. Si los adolescentes —como hicieron con Tay— encuentran formas de engañar al sistema (por ejemplo, simulando patrones de uso “adultos”), OpenAI podría enfrentarse a un escenario peor que el de Microsoft: no solo un chatbot fuera de control, sino uno que, bajo la apariencia de seguridad, ofrezca una falsa sensación de protección a padres y reguladores. La compañía tiene ahora 6 meses —el plazo que tardó Tay en ser desmantelado— para demostrar que su enfoque es robusto. El reloj ya está en marcha.

Referencia de contenido: aquí

Categorías