Aurelius es una plataforma descentralizada para generar datos de alineación de IA de alta calidad mediante el sondeo sistemático de modelos de lenguaje para descubrir fallos de seguridad y comportamientos en casos límite. Evalúa respuestas en múltiples dimensiones éticas y de seguridad utilizando herramientas de moderación de código abierto, jueces basados en LLM y métricas de alineación personalizadas. El objetivo es crear una base transparente y verificable para la investigación de alineación y construir un ecosistema a largo plazo donde diversas perspectivas ayuden a definir, medir y mejorar la seguridad de sistemas de IA cada vez más capaces.