Nuevo pronóstico sobre los Premios Goya. Con las herramientas de análisis y predicción de la ciencia de datos se examina la edición del año 2021 en la categoría de Mejor Película.
Objetivo
El objetivo de este artículo es pronosticar qué probabilidades tiene cada película nominada de ganar el Goya en la categoría de Mejor Película 2022. Sobre el procedimiento ver el artículo publicado para el año 2019.
Variables importantes (2000-2021)
En este año las variables más importantes han variado mucho. Lo cual no habla nada bien de la estabilidad del modelo o de lo modelizable que son los premios. Las variables más importantes son las siguientes:

De las variables utilizadas solo estas 7 resultan relevantes. Se ha añadido 1 variable respecto al modelo de 2019, a pesar de que en el modelo global (desde el principio de los Goyas) resultaba significativa también la variable el Premios Feroz de Comedia. De mayor a menor importancia las 7 variables son:
- Si la película ha ganado los Premios CEC (Círculo de Escritores Cinematográficos).
- El número de votos recibidos.
- Si la película ha ganado los Premios Forqué.
- La puntuación media obtenida de los votantes de la web de la que se ha sacado la información (FilmAffinity).
- El número de nominaciones a los Goya que ha recibido.
- El número de críticas (comentarios) que ha recibido la película.
- Si la película ha estado nominada en los Premios Forqué.
Hay que añadir que para lograr los datos de los premios CEC hemos tenido que variar la fuente, ya que la anterior web tenía los datos muy deteriorados. Se ha utilizado la página de Wikipedia correspondiente.
Aciertos y fallos del modelo (desde 2000)
El número de películas clasificadas correctamente (gana/no gana) es 88. Y el número de películas clasificadas erróneamente es 7. Recordamos que estos datos van solo desde el 2000 al 2021, ambos incluidos.
Gráfica del rendimiento del modelo sobre todos los datos desde el año 2000 (ROC, AUROC):

Y el Goya es para…

Aquí los datos utilizados para cada film:
