matemáticas

ChatGPT contra Rafa en Pasapalabra, ¿quién ganará?

Foto de perfil del autor de esta entrada

Darío O.

  • 29 mayo, 2023
  • ·
  • 7 min de lectura
El concursante de Pasapalabra, Rafa, con las manos en la cabeza tras ganar el bote de Pasapalabra.

En este artículo trataremos de juntar dos grandes temas del momento: ChatGPT y la victoria de Rafa en Pasapalabra, para ello, los enfrentaremos: ChatGPT contra Rafa, ¿quién ganará?

Antes de nada, cabe decir que el concursante de Pasapalabra, Rafa, se hizo el jueves con el mayor bote en la historia del programa: 2 272 000 euros. Lo hizo tras acertar del tirón las 25 preguntas del rosco. Sin lugar a duda, en su cabeza quedará por siempre la palabra “zabro”, que, según la RAE, significa “escarabajo de la familia de los carábidos que ataca los trigales, especialmente cuando los granos son tiernos.”

Una de las grandes inteligencias artificiales del momento es ChatGPT, que a través de un texto, te genera una respuesta lo más adecuada posible a dicho texto, bien sea una pregunta, una petición… Así, pedí a esta inteligencia artificial que resolviera el rosco, pregunta por pregunta y le diera un porcentaje de dificultad a cada pregunta.

Para hacer este experimento, introduciremos el siguiente prompt (entrada) inicial a ChatGPT, referido al concurso Pasapalabra:

“Actúa como un concursante de Pasapalabra. Yo te digo una pregunta. La primera letra del prompt será la inicial de la respuesta, por ejemplo, “M. Fruto del manzano”, donde la respuesta es “Manzana”, que empieza por M. Me tienes que contestar con dos cosas: la respuesta que crees que es correcta y el porcentaje de dificultad que le darías a esa pregunta. ¿Lo has entendido bien?”

Imagen de la interfaz de ChatGPT tras introducirle el prompt.

Después de su respuesta afirmativa, iba lanzándole las siguientes preguntas (una por cada prompt), a las que él me contestaba con su respuesta y un porcentaje de dificultad.

Las respuestas de ChatGPT al Rosco

Como bien sabemos, Rafa acertó todas las preguntas del rosco en Pasapalabra sin apenas tiempo para pensar, ¿sucederá lo mismo con ChatGPT? Marcaremos con una B las respuestas correctas de la inteligencia artificial de OpenAI y con una M las incorrectas.

PreguntaRafaChatGPT
A. Mecanismo para esparcir un líquido a presión, como el agua para el riego.AspersorAspersor (B)
B. Abertura delantera de un pantalón.BraguetaBragueta (B)
C. Galería que rodea el patio principal de una iglesia o convento.ClaustroClaustro (B)
D. Documento que expide un centro educativo o una corporación y que acredita un título o un grado académico.DiplomaDiploma (B)
E. Nombre del rey visigodo que gobernó entre los años 687 y 702 y limitó la actividad económica de los judíos.ÉgicaÉgica (B)
F. Brillo muy intenso.FulgorFulgor (B)
G. País asiático con capital en Tilfis.GeorgiaGeorgia (B)
H. Masa de harina con manteca muy sobada y que, al cocerse en el horno forma muchas hojas delgadas superpuestas.HojaldreHojaldre (B)
I. Esperanza cuyo cumplimiento parece especialmente atractivo.IlusiónIlusión (B)
J. Soldado de infantería de la guardia imperial turca reclutado a menudo entre hijos de cristianos.JenízaroJenízaro (B)
L. Daño o detrimento corporal causado por una herida, un golpe o una enfermedad.LesiónLesión (B)
M. Apellido del matemático que a principios del siglo XX introdujo el modelo de espacio tiempo en cuatro dimensiones.MinkowskiMinkowski (B)
N. Insignificante, sin importancia.NimioNimio (B)
Contiene la Ñ. Fútbol. Acción en la que se sortea a un contrario pasándole el balón entre las piernas.CañoCaño (B)
O. Cerro aislado que domina un llano.OteroOtero (B)
P. Juego que consiste en tirar unas bolas y otra más pequeña y ver quién se aproxima más a esta con las grandes.PetancaPetanca (B)
Contiene la Q. Se dice del triángulo que tiene todos sus lados iguales.EquiláteroEquilátero (B)
R. Satisfacción a una pregunta, duda o dificultad.RespuestaRespuesta (B)
S. Antiguo instrumento de metal consistente en un aro o herradura atravesado por varillas que sonaba agitándolo.SistroSistro (B)
T. Cada uno de los pasos o gestiones que se realizan de manera oficial para la conclusión o resolución de un asunto.TrámiteTrámite (B)
U. Lugar en que está situado algo.UbicaciónUbicación (B)
V. Casa de recreo aislada en el centro.VillaVilla (B)
Contiene la X. Enunciado o conjunto coherente de enunciados orales o escritos.TextoTexto (B)
Contiene la Y. Máquina o conjunto de máquinas que sirven para cambiar los decorados en el escenario de un teatro.TramoyaTelar (M)
Z. Escarabajo que ataca los trigales especialmente cuando los granos son tiernos.ZabroZabro (B)

Como podemos ver, ChatGPT ha fallado tan solo una pregunta: la penúltima. Es decir, ha acertado 24 preguntas de 25, ¡no se habría llevado el bote! Pero, tal y como habría dicho Roberto Leal, se ha quedado a una de 2 272 000 euros. Este es un claro ejemplo de cómo las inteligencias artificiales, en este caso ChatGPT, tienen todavía bastante por mejorar para poder ganar a un ser humano, al menos en el rosco de Pasapalabra.

Según ChatGPT, ¿cómo era el nivel de este Rosco de Pasapalabra?

Tal y como dije al principio, le pedí a esta inteligencia artificial que me dijera el porcentaje de dificultad de cada pregunta además de la respuesta que él creía correcta. A continuación podéis ver el porcentaje de dificultad que otorgó a cada pregunta.

PreguntaDificultad
A. Mecanismo para esparcir un líquido a presión, como el agua para el riego.70%
B. Abertura delantera de un pantalón.60%
C. Galería que rodea el patio principal de una iglesia o convento.70%
D. Documento que expide un centro educativo o una corporación y que acredita un título o un grado académico.40%
E. Nombre del rey visigodo que gobernó entre los años 687 y 702 y limitó la actividad económica de los judíos.70%
F. Brillo muy intenso.90%
G. País asiático con capital en Tilfis.50%
H. Masa de harina con manteca muy sobada y que, al cocerse en el horno forma muchas hojas delgadas superpuestas.50%
I. Esperanza cuyo cumplimiento parece especialmente atractivo.40%
J. Soldado de infantería de la guardia imperial turca reclutado a menudo entre hijos de cristianos.80%
L. Daño o detrimento corporal causado por una herida, un golpe o una enfermedad.60%
M. Apellido del matemático que a principios del siglo XX introdujo el modelo de espacio tiempo en cuatro dimensiones.60%
N. Insignificante, sin importancia.50%
Contiene la Ñ. Fútbol. Acción en la que se sortea a un contrario pasándole el balón entre las piernas.60%
O. Cerro aislado que domina un llano.40%
P. Juego que consiste en tirar unas bolas y otra más pequeña y ver quién se aproxima más a esta con las grandes.60%
Contiene la Q. Se dice del triángulo que tiene todos sus lados iguales.60%
R. Satisfacción a una pregunta, duda o dificultad.40%
S. Antiguo instrumento de metal consistente en un aro o herradura atravesado por varillas que sonaba agitándolo.30%
T. Cada uno de los pasos o gestiones que se realizan de manera oficial para la conclusión o resolución de un asunto.40%
U. Lugar en que está situado algo.50%
V. Casa de recreo aislada en el centro.60%
Contiene la X. Enunciado o conjunto coherente de enunciados orales o escritos.20%
Contiene la Y. Máquina o conjunto de máquinas que sirven para cambiar los decorados en el escenario de un teatro.70%
Z. Escarabajo que ataca los trigales especialmente cuando los granos son tiernos.90%

Haciendo la media aritmética de todos los porcentajes, obtenemos que, según ChatGPT, este rosco ha tenido una dificultad de un 56,4%. Pero, ¿cuál ha sido el porcentaje de otros roscos? ¿Eran más fáciles o más difíciles?

El nivel de otros Roscos de Pasapalabra

Rosco de Rafa - 01/03/2023

Hemos registrado las preguntas de un programa de Pasapalabra de una fecha aleatoria (elegida por ChatGPT) de Rafa y Orestes. En la siguiente tabla veremos la pregunta, las respuestas ofrecidas por la inteligencia artificial, la respuesta correcta y el nivel de dificultad. Lógicamente, ningún concursante consiguió contestar bien las 25 preguntas, pero, ¿ganará ChatGPT el bote en algún momento? Ahora lo veremos.

PreguntaChatGPTCorrecciónDificultad
A. Pedazo de cualquier materia sólida combustible que por la acción del fuego se pone incandescente y sin llama.Ascua (B)Ascua50%
B. Receptáculo de tela, papel o plástico usado en las tiendas para poner las mercancías.Bolsa (B)Bolsa30%
C. Arte marcial brasileña en la que se combinan el baile y la defensa personal.Capoeira (B)Capoeira50%
D. Globo de navegación aérea que lleva una o varias barquillas con motores y hélices y un timón para guiarloDirigible (B)Dirigible60%
E. Cada una de las láminas que cubren el cuerpo de algunos animales, principalmente el de los peces y reptiles.Escamas (B)Escamas40%
F. Amistad o afecto entre hermanos o entre quienes se tratan como tales.Fraternidad (B)Fraternidad50%
G. Apellido del compositor autor de la ópera “La ciudad ausente” con el veto del escritor Ricardo PigliaGandini (B)Gandini90%
H. Herir el amor propio o la dignidad de alguien.Humillar (B)Humillar70%
I. En deportes, primer partido de una eliminatoria que se disputa a doble encuentro.Ida (B)Ida50%
J. Sitio poblado de jaras.Jaraiz (M)Jaral70%
L. Se dice del día destinado a trabajar por oposición a festivo.Laborable (B)Laborable40%
M. Estado de los cuerpos mientras cambian de lugar o de posición.Movimiento (B)Movimiento50%
N. Caucho sintético utilizado para fabricar trajes de buceo.Neopreno (B)Neopreno60%
Contiene la Ñ. Cosa que sirve para atrae, persuadir o inducir con alguna falacia.Engaño (M)Señuelo50%
O. Ajuar, conjunto de muebles, enseres y ropas de uso común en casa.Omobono (M)Ostilla50%
P. Tiempo verbal que indicia que ya se ha llevado a cabo la acción expresada por el verbo.Pretérito (B)Pretérito60%
Contiene la Q. Médico especialista en enfermedades mentales.Psiquiatra (B)Psiquiatra30%
R. Coloquialmente, discurso largo, pesado y aburrido.Rollo (B)Rollo50%
S. Río de Sudán del Sur que se forma en la frontera con Etiopía por la unión de los ríos Pibor y Baro.Sobat (B)Sobat50%
T. Horquilla con mango a cuyos extremos se unen los de una goma para estirarla y disparar piedrecillas.Tirachinas (B)Tirachinas40%
U. Siglas del partido político español Unión de Centro Democrático disuelto en 1983.UCD (B)UCD60%
V. Persona que pertenece a un consejo, tribunal o junta y tiene derecho a opinar en ellos.Vocal (B)Vocal50%
Contiene la X. Avión o avioneta de alquiler destinado al tráfico no regular.Taxiex (M)Aerotaxi70%
Contiene la Y. Se dice de la fruta que no está madura.Agraz (M)Roya50%
Z. Participio del verbo zaherir.Zaherido (B)Zaherido70%

Nuevamente Rafa ha ganado a ChatGPT en Pasapalabra, en este caso, la inteligencia artificial ha tenido 20 aciertos y 5 fallos, mientras que Rafa tuvo 22 aciertos y 1 fallo.

Además, según ChatGPT, la dificultad de este rosco es de un 53,6%, supuestamente más fácil que el otro, pero, a pesar de ello, ha acertado menos que en el anterior rosco. Un poco raro todo, ¿no?

Rosco de Orestes - 01/03/2023

PreguntaChatGPTCorrecciónDificultad
A. Serie ordenada de las letras de un idiomaAlfabeto (B)Alfabeto50%
B. Asiento colgante cubierto de toldo que suele colocarse en jardines, playas y terrazasHamaca (M)Balancín70%
C. Opinión que se da a una persona sobre lo que debe o no debe hacer.Consejo (B)Consejo60%
D. Conjunto de documentos e informaciones referentes a una persona o asunto.Documento (M)Documentación50%
E. Grano con un puntito negro que se forma en la piel de la cara.Espinilla (B)Espinilla40%
F. Recipiente con tapa bien ajustada para guardar comida o llevarla fuera de casaFiambrera (B)Fiambrera60%
G. Nombre de las cuevas situadas junto a la localidad francesa de Aventignan, que cuentan con ejemplos de arte rupestreGargas (B)Gargas60%
H. Voz inglesa que se designa al hincha británico de comportamiento violento y agresivo.Hooligan (B)Hooligan50%
I. Explicación que precede a una obra literaria o discurso.Prólogo (M)Introducción50%
J. Persona que forma parte de un equipo deportivo.Jugador (B)Jugador20%
L. Ramaje, conjunto de ramas de las plantas.Linamen (B)Linamen30%
M. Mamífero nocturno volador que pasa el día colgado cabeza bajo y se orienta por la emisión de ultrasonidos.Murciélago (B)Murciélago50%
N. Unidad de velocidad para barcos y aviones equivalente a una milla náutica por hora.Nudo (B)Nudo50%
Contiene la Ñ. Utensilio en forma de pinzas o tenacillas que sirve para cortar las uñas.Añafil (M)Cortaúñas60%
O. Cada una de las curvas a manera de eses que se forman en algunas cosas flexibles como el pelo y las telas.Ondulación (B)Onda50%
P. Sumamente malo, que no puede ser peor.Pésimo (B)Pésimo50%
Contiene la Q. Pieza metálica o de otro material que se emplea para sujetar el pelo.Quica (M)Horquilla60%
R. Perteneciente o relativo a los riñonesRenal (B)Renal60%
S. Apellido del cineasta que dirigió la película “La Provinciana” protagonizada por Gina Lollobrigida.Soldati (B)Soldati40%
T. Prolongación muscularhueca y flexible de la nariz del elefante.Trompa (B)Trompa40%
U. Se dice del correo que recibe una preferencia tanto en el envío como en su entrega respecto del ordinario.Urgente (B)Urgente40%
V. Ministro de un soberano musulmán.Visir (B)Visir30%
Contiene la X. Espacio de terreno alrededor de una iglesia dentro del cual se gozaba del derecho de asilo y otros privilegios.Ejido (M)Dextro60%
Y. Gerundio del verbo abstraer.Abstrayendo (B)Abstrayendo30%
Z. Salir un barco del lugar que estaba fondeado o atracadoZarpar (B)Zarpar40%

Obtenemos que ChatGPT dice que este rosco de Pasapalabra tiene una dificultad del 47,6%, pero es el rosco donde ChatGPT menos preguntas ha acertado: 19 preguntas tan solo, mientras Orestes acertó 22 en este mismo rosco.

Conclusiones

Obtenemos las siguientes conclusiones tras los experimentos realizados con ChatGPT en el concurso Pasapalabra:

NOTA: Este experimento se ha realizado con el modelo de ChatGPT antiguo: GPT-3.5. El más actual es GPT-4.