Premios Goya 2024. Predicción

Este fin de semana se entregarán los Premios Goya 2024 en su edición número 38. En esta entrada analizamos con datos de acceso libre y machine learning las probabilidades de ganar de las 5 nominadas a Mejor Película.

Objetivo

El objetivo es calcular qué probabilidades de ganar tiene cada una de las 5 películas nominadas en 2024. Este artículo es una continuación, con ligeras variaciones, de un procedimiento que se viene aplicando desde 2019: artículo publicado para el año 2019.

 

Procedimiento

Los datos han sido recolectados de la web mediante scraping. Empiezan con la primera edición de los Premios Goya en 1987 y terminan el último año del que se conocen los ganadores, es decir, 2023.

Los datos recolectados cubren diferentes aspectos que pueden estar conectados con la elección del ganador: valoraciones de los críticos, votos otorgados por el público, los premios o nominaciones logrados por la película en otros certámenes, etc. Por tanto, se han incluido variables cuantitativas y cualitativas.

El código (Python) utilizado para construir el modelo está en github (año 2023), pero este año ha sufrido pocas modificaciones.

 

Variables relevantes (‘modelo 2000’)

Este año se ha utilizado un modelo solo con datos desde el año 2000 hasta 2023. Cómo se comentó en entradas anteriores, en la construcción del modelo se valoraron 2 alternativas: 1987 hasta la actualidad (todas las ediciones) y 2000 hasta la actualidad («modelo 2000»). Este año se ha utilizado este último modelo después de hacer pruebas con ambos.

Así, las variables que este modelo destaca que tienen mayor impacto en la elección del ganador son:

Importancia relativa de las variables que determinan el ganador del Goya a la mejor película

De las variables utilizadas estas han sido las relevantes:

  1. El número de votos recibidos.
  2. Si la película ha ganado los Premios Forqué.
  3. La puntuación media obtenida de los votantes de la web de la que se ha obtenido la información (FilmAffinity).
  4. Si la película ha ganado los Premios CEC (Círculo de Escritores Cinematográficos).
  5. El número de nominaciones a los Goya que ha recibido.
  6. El número de críticas (comentarios) que ha recibido la película.

 

Aciertos y fallos del modelo (‘modelo 2000’)

En la matriz de confusión el número total de películas es 150, de las cuales 139 han sido clasificadas correctamente (gana/no gana), y 11 han sido clasificadas erróneamente (8 son «falsos positivos» y 3 son «falsos negativos»).

Gráfica del rendimiento del modelo sobre todos los datos desde 1987 a 2023 (ROC, AUROC):

GradientBoosting – Goyas 1987-2023

 

Probabilidad de ganar de las películas nominadas

Las 5 nominadas al Premio Goya a la Mejor Película tienen las siguientes probabilidades de ganar, en orden descendente:

Probabilidad de ganar el Goya 2024

 

Parece que LA SOCIEDAD DE LA NIEVE es clara favorita para levantar el Goya. Habrá que esperar hasta el 10 de febrero, a partir de las 22:00.


Si tienes dudas, has visto algún error o quieres comentar cualquier cosa, ahora es el momento. Deja tu comentario.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *