Una captura de pantalla de Diplomacia proporcionada por un investigador de CICERO.
Agrandar / Una captura de pantalla de un juego en línea de diplomaciaincluyendo la ejecución de un diálogo de chat proporcionado por un investigador de Cicero.

El martes, Meta AI anunció el desarrollo de Cicero, que cree que es la primera IA en lograr un rendimiento a nivel humano en el juego de mesa de estrategia. diplomacia. Este es un logro notable, ya que el juego requiere habilidades profundas de negociación interpersonal, lo que implica que Cicero ha adquirido cierto dominio del idioma necesario para ganar el juego.

Incluso antes de que Deep Blue derrotara a Garry Kasparov en el ajedrez en 1997, los juegos de mesa eran una medida útil del rendimiento de la IA. Otra barrera cayó en 2015 cuando AlphaGo derrotó a Go Master Lee Sedol. Ambos juegos siguen un conjunto relativamente claro de reglas analíticas (aunque las reglas de inteligencia artificial de la computadora de Go generalmente se simplifican).

Pero con Diplomacia, Una gran parte del juego implica habilidades sociales. Los jugadores deben mostrar empatía, usar un lenguaje natural y construir relaciones para ganar, una tarea difícil para un jugador de computadora. Con eso en mente, Meta preguntó: «¿Podemos crear agentes más efectivos y flexibles que puedan usar el lenguaje para negociar, persuadir y colaborar con los humanos para lograr objetivos estratégicos, como lo hacen los humanos?».

Según Meta, la respuesta es sí. Cicero aprendió sus habilidades jugando una versión en línea de diplomacia en webDiplomacy.net. Con el tiempo, se convirtió en un maestro del juego, según los informes, obtuvo «más del doble del puntaje promedio» de los jugadores humanos y se ubicó en el 10 por ciento superior de los jugadores que jugaron más de un juego.

Para crear Cicero, Meta reunió modelos de IA para pensamiento estratégico (similar a AlphaGo) y procesamiento de lenguaje natural (similar a GPT-3) y los combinó en un solo agente. Durante cada juego, Cicero observa el estado del tablero, el curso de la conversación y predice cómo se comportarán los demás jugadores. Crea un plan que ejecuta a través de un modelo de lenguaje que puede generar un diálogo similar al humano que le permite coordinarse con otros jugadores.

Ein Blockdiagramm von Cicero, dem Bot, der <em>diplomacia</em> reproducciones, proporcionado por Meta.» src=»https://cdn.arstechnica.net/wp-content/uploads/2022/11/Visual_UnderTheHood-640×907.jpg» width=»640″ height=»907″ srcset=»https ://cdn.arstechnica.net/wp-content/uploads/2022/11/Visual_UnderTheHood-1280×1813.jpg 2x»/><figcaption class=
Agrandar / Un diagrama de bloques de Cicerón, el diplomacia-bot de juego proporcionado por Meta.

meta IA

Meta llama a las habilidades de lenguaje natural de Cicero un «modelo de diálogo controlable» donde se encuentra el corazón de la personalidad de Cicero. Al igual que GPT-3, Cicero se basa en un gran corpus de textos de Internet extraídos de la Web. «Para construir un modelo de diálogo controlable, comenzamos con un modelo de lenguaje similar a BART con 2700 millones de parámetros, entrenado previamente con texto de la web y ajustado con más de 40 000 juegos humanos en webDiplomacy.net», escribe Meta.

El modelo resultante dominó las complejidades de un juego complejo. «Cicero puede, por ejemplo, deducir que más adelante en el juego necesita el apoyo de un jugador en particular», dice Meta, «y luego desarrollar una estrategia para ganar el favor de esa persona, e incluso reconocer los riesgos y oportunidades que ese jugador ve». desde su particular punto de vista».

La investigación de Cicero de Meta apareció en la revista Science bajo el título «Juego a nivel humano en el juego de la diplomacia al combinar modelos de lenguaje con pensamiento estratégico».

En cuanto a aplicaciones más amplias, Meta sugiere que su investigación en Cicero podría «romper las barreras de comunicación» entre los humanos y la IA, p. B. Tener una conversación a largo plazo para enseñarle a alguien una nueva habilidad. O podría impulsar un videojuego en el que los NPC puedan hablar como humanos, comprender las motivaciones del jugador y adaptarse a medida que avanzan.

Al mismo tiempo, esta tecnología podría usarse para manipular a las personas haciéndose pasar por humanos y, según el contexto, engañándolos de formas potencialmente peligrosas. Con eso en mente, Meta espera que otros investigadores puedan desarrollar su código «de manera responsable» y dice que ha tomado medidas para detectar y eliminar «mensajes tóxicos en este nuevo dominio», probablemente relacionados con el diálogo, que Cicero aprendió de los textos de Internet, incluidos, siempre un riesgo para los grandes modelos lingüísticos.

Meta ha proporcionado un sitio web detallado para explicar cómo funciona Cicero y también ha abierto el código de Cicero en GitHub. En línea diplomacia Los fanáticos, y tal vez incluso el resto de nosotros, deberían prestar atención.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí