大数据预测——肖央电影《误杀2》最终票房
新闻热点 SPSSPRO小助手 · 1569浏览 · 2022-01-13 03:57
采用SPSSPRO免费数据分析平台中的线性回归模型训练票房预测模型

12月17日,肖央主演的电影《误杀2》正式上映,仅上映6天,票房便已冲上4.6亿元,不少媒体预测《误杀2》的总票房有可能突破10亿元。

为了让预测更严谨,本文将收集资料从大数据角度,利用数据分析对电影最终票房进行预测。

一、电影票房预测分析

1、影响票房因素提取

吴鹤沪先生(资深电影人,行业内公认的市场专家)在撰写的论文《小议影响电影市场票房的几大因素》中提到,影响票房主要有:影片本身质量、影片排映档期、影片宣传策划、映期社会环境、映期天气环境,此外还有影院建设、电影票价、影片数量和立法规范等。

通过这些可以发现,一部影片的票房受多方面、多因素影响,而影院行业常用的票房收入计算公式为“票房=总座位数×场次×上座率×平均票价×天数”。

综合以上,我们选择此次《误杀2》票房预测模型票房影响因素,包括:

电影评分,主流电影评分网站,评分越高表示电影口碑越佳,影片质量越好;

电影上映周期,周期越长,票房总数越多;

搜索指数,电影在各平台的搜索指数、热议指数;

1) 电影评分,范围为1-10,由观影观众给出,数值越大表示影片越受欢迎;

2) 平均票价,影片上映后的平均票价;

3) 上映档期,是否在贺岁档、暑期档、五一档或国庆档上映;

4) 电影类型,是否为喜剧、惊悚、剧情或科幻;

5) 电影上映总场次,电影在影院放映的场次;

6) 上映首周平均日票房,由上映首周的票房收入和首周上映天数得到;

7) 场均观影人次,上映后平均每场的观影人次;

根据特征筛选,我们最终筛选了5个有效指标(有效指标越多越好):豆瓣评分、平均票价、电影上映总场次、上映首周平均日票房、 场均观影人次

通过爬取数据,最终获得2021年所有影片相关指标数据。

image.png

2、回归模型分析预测票房

将以上选取的部分因素做为特征,作为票房预测的自变量,以电影总票房作为因变量

本文采用SPSSPRO免费数据分析平台中的线性回归模型训练票房预测模型,利用训练集训练得到模型,然后利用测试集对模型预测效果进行评价,主要通过R2来评价模型拟合效果,其数值越接近1表示模型的拟合效果越好。

image.png

一键输出分析报告

输出结果1:线性回归分析结果表

image.png

从F检验的结果分析可以得到,显著性P值为0.0**,水平上呈现显著性, 拒绝回归系数为0的原假设

同时模型的拟合度R2为0.88, 模型表现较为优秀, 因此模型基本满足要求

对于变量共线性表现,VIF全部小于10,因此模型没有多重共线性问题, 模型构建良好

模型的公式如下:

y总票房=-58157.634+0.034总场次+1.223首周票房+320.449平均票价+4170.933场均人数+665.635*豆瓣评分

输出结果2:拟合效果图

image.png

输出结果3:模型路径图

image.png

输出结果4:最终预测结果

image.png

最终预测结果为 110226.837,11亿元

《误杀2》以23.3%的排片,拿下了69.4%的票房,截止到当天,当日票房就超过了5亿。

而从专业票务软件的票房预测上,《误杀2》的预测内地总票房已经接近10亿,只要按照目前的发展势头,过10亿并不困难,毕竟前作票房13.33亿,有了前作的观众基础,再加上这一部吸引的新观众,达到10亿并不是没有可能。

最后:数据模型只能预测正常情况,非正常情况是没办法考虑的,正常而言,电影是上映一个月,所以准确而言,这次预测的是两部电影一个月的票房(到1月17号)。但如果延期上映则会影响票房,另外其他人工干预的情况也是没法估量的

相关推荐

默认标签
2025年第四届全国大学生数据分析实践赛

2025全国大学生数据分析实践赛报名须知

知识竞赛 原创 · 6373浏览 · 04-16 08:25
2025年第四届大学生数据分析科普竞赛实施方案

第四届大学生数据分析科普竞赛实施方案

知识竞赛 2025年第四届全国大学生数据分析实践赛组委会 · 6258浏览 · 03-04 09:37
第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!

第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!

知识竞赛 2024年第三届全国大学生数据分析实践赛组委会 · 2216浏览 · 01-07 08:34
0 条评论
    某人
    可输入 255
    SPSSPRO社区 扫码访问移动端