

12月17日,肖央主演的电影《误杀2》正式上映,仅上映6天,票房便已冲上4.6亿元,不少媒体预测《误杀2》的总票房有可能突破10亿元。
为了让预测更严谨,本文将收集资料从大数据角度,利用数据分析对电影最终票房进行预测。
一、电影票房预测分析
1、影响票房因素提取
吴鹤沪先生(资深电影人,行业内公认的市场专家)在撰写的论文《小议影响电影市场票房的几大因素》中提到,影响票房主要有:影片本身质量、影片排映档期、影片宣传策划、映期社会环境、映期天气环境,此外还有影院建设、电影票价、影片数量和立法规范等。
通过这些可以发现,一部影片的票房受多方面、多因素影响,而影院行业常用的票房收入计算公式为“票房=总座位数×场次×上座率×平均票价×天数”。
综合以上,我们选择此次《误杀2》票房预测模型票房影响因素,包括:
电影评分,主流电影评分网站,评分越高表示电影口碑越佳,影片质量越好;
电影上映周期,周期越长,票房总数越多;
搜索指数,电影在各平台的搜索指数、热议指数;
1) 电影评分,范围为1-10,由观影观众给出,数值越大表示影片越受欢迎;
2) 平均票价,影片上映后的平均票价;
3) 上映档期,是否在贺岁档、暑期档、五一档或国庆档上映;
4) 电影类型,是否为喜剧、惊悚、剧情或科幻;
5) 电影上映总场次,电影在影院放映的场次;
6) 上映首周平均日票房,由上映首周的票房收入和首周上映天数得到;
7) 场均观影人次,上映后平均每场的观影人次;
根据特征筛选,我们最终筛选了5个有效指标(有效指标越多越好):豆瓣评分、平均票价、电影上映总场次、上映首周平均日票房、 场均观影人次
通过爬取数据,最终获得2021年所有影片相关指标数据。
2、回归模型分析预测票房
将以上选取的部分因素做为特征,作为票房预测的自变量,以电影总票房作为因变量。
本文采用SPSSPRO免费数据分析平台中的线性回归模型训练票房预测模型,利用训练集训练得到模型,然后利用测试集对模型预测效果进行评价,主要通过R2来评价模型拟合效果,其数值越接近1表示模型的拟合效果越好。
一键输出分析报告
输出结果1:线性回归分析结果表
从F检验的结果分析可以得到,显著性P值为0.0**,水平上呈现显著性, 拒绝回归系数为0的原假设
同时模型的拟合度R2为0.88, 模型表现较为优秀, 因此模型基本满足要求
对于变量共线性表现,VIF全部小于10,因此模型没有多重共线性问题, 模型构建良好
模型的公式如下:
y总票房=-58157.634+0.034总场次+1.223首周票房+320.449平均票价+4170.933场均人数+665.635*豆瓣评分
输出结果2:拟合效果图
输出结果3:模型路径图
输出结果4:最终预测结果
最终预测结果为 110226.837,11亿元
《误杀2》以23.3%的排片,拿下了69.4%的票房,截止到当天,当日票房就超过了5亿。
而从专业票务软件的票房预测上,《误杀2》的预测内地总票房已经接近10亿,只要按照目前的发展势头,过10亿并不困难,毕竟前作票房13.33亿,有了前作的观众基础,再加上这一部吸引的新观众,达到10亿并不是没有可能。
最后:数据模型只能预测正常情况,非正常情况是没办法考虑的,正常而言,电影是上映一个月,所以准确而言,这次预测的是两部电影一个月的票房(到1月17号)。但如果延期上映则会影响票房,另外其他人工干预的情况也是没法估量的
相关推荐
第三届数据分析科普竞赛优秀协办单位及校园大使名单公布!