La empresa matriz de Facebook lanza un modelo de IA que supervisa otros modelos de IA

Los modelos de IA recientemente lanzados tienen una herramienta de “Evaluador de autoaprendizaje”, que puede verificar el rendimiento de otros modelos de IA. En particular, esta herramienta promete reducir la participación humana en el desarrollo de la inteligencia artificial gracias a la inteligencia sobrehumana.

El lanzamiento se produce después de que Meta presentara la aplicación en un informe en agosto, detallando cómo la herramienta se basa en la misma técnica de "cadena de pensamiento" utilizada por la práctica recientemente desarrollada de OpenAI 1 para realizar juicios confiables sobre las respuestas de los modelos.

Công ty mẹ Facebook ra mắt mô hình AI giám sát mô hình AI khác- Ảnh 1. — Meta lanza un nuevo modelo de IA que podría reducir la participación humana en el desarrollo de IA.

La técnica implica dividir problemas complejos en pasos lógicos más pequeños, mejorando la precisión de las respuestas a problemas difíciles en materias como ciencias, codificación y matemáticas.

Los investigadores de Meta utilizaron datos generados íntegramente por IA para entrenar el modelo de evaluación, eliminando al mismo tiempo la intervención humana en esa etapa.

La capacidad de utilizar IA para evaluarla de manera confiable abre un camino viable hacia la creación de agentes de IA autónomos que puedan aprender de sus propios errores.

Muchos en el campo de la IA imaginan a estos agentes como asistentes digitales lo suficientemente inteligentes como para realizar una variedad de tareas sin intervención humana.

Meta enfrenta varias demandas de estados de EE. UU. que acusan a la compañía de causar problemas de salud mental en adolescentes al hacer que sus plataformas de Facebook e Instagram sean adictivas.

La jueza del Tribunal de Distrito de EE. UU. Yvonne González Rogers en Oakland denegó la solicitud de Meta de desestimar los reclamos presentados por los estados en dos demandas separadas presentadas el año pasado, una que involucraba a más de 30 estados, incluidos California y Nueva York, y el caso restante presentado por Florida.

Los modelos de automejora podrían eliminar la necesidad de un proceso a menudo costoso e ineficiente que se utiliza hoy en día, llamado aprendizaje de refuerzo a partir de la retroalimentación humana, que requiere el aporte de anotadores humanos que deben tener experiencia especializada para pegar datos con precisión y verificar respuestas a preguntas matemáticas y escritas complejas.

“Esperamos que, a medida que la IA mejore cada vez más en la verificación de su trabajo, sea incluso mejor que un ser humano. La idea de aprender por sí sola y poder hacerlo por sí sola es algo que esperamos que suceda”. “La evaluación es fundamentalmente importante para la idea de lograr niveles sobrehumanos de IA”, dijo Jason Weston, uno de los investigadores.

Otras empresas, incluidas Google y Anthropic, también han publicado investigaciones sobre el concepto de RLAIF (Aprendizaje de Refuerzo por Retroalimentación en IA). Sin embargo, a diferencia de Meta, esas empresas normalmente no lanzan modelos para uso público.

Otras herramientas de inteligencia artificial lanzadas por Meta el viernes incluyen una actualización del modelo de reconocimiento de imágenes Segment Anything de la compañía, una herramienta que acelera los tiempos de generación de respuestas LLM y un conjunto de datos que se puede utilizar para ayudar al descubrimiento de nuevos materiales inorgánicos.

Fuente: https://www.baogiaothong.vn/cong-ty-me-facebook-ra-mat-mo-hinh-ai-giam-sat-mo-hinh-ai-khac-192241019113020535.htm