ARIMAX模型对酒店住客送物需求总量的预测算法
某知名大型品牌酒店为提高客户满意度,对存在的客户送物需求度进行预测以减少酒店送物不及时的问题。
编者按:本文标题为《ARIMAX模型对酒店住客送物需求总量的预测算法》,由辉驿科技公司董事长李军、盈兴科技总经理胡俊杰、为辉驿科技数据分析师潘哲凯共同创作,中国饭店协会酒店数字化专业委员会理事长张兴国对此文也做出了评估和建议,本文聚焦ARIMAX模型预测酒店住客的送物需求总量,为酒店运营提供了技术化的解题思路,值得行业关注。
简介
ARIMAX(Autoregressive Integrated Moving Average with Exogenous Variables)模型,是ARIMA模型的扩展,能够在模型中加入外生变量,从而提高模型预测的准确性。在本项目中,我们将利用ARIMAX模型预测酒店住客的送物需求总量,预测模型的外生变量包括:出租房数,上证指数涨跌幅%,经过温湿度计算的体感温度的平均值与标准差,这一天下雨的百分比。
业务背景
某知名大型品牌酒店为提高客户满意度,对存在的客户送物需求度进行预测以减少酒店送物不及时的问题。
业务目标
通过预测出未来每日送物需求总量,加上统计出的24小时的送物时段分布,以及计算得出的机器人每小时送物数量上限,已发现未来哪些时段存在送物机器人饱和的情况,并推荐酒店运营提前做出人员排班的处理来降低送物不及时的出现频率以提高住客满意度。
算法流程
1. 数据准备:获取历史送物需求数据,包括历史需求量,以及对应日期的上证指数涨跌幅,计算一天内体感温度的均值与标准差,和下雨百分比。

2. 数据预处理:对获取的数据进行清洗,处理缺失值
3. ARIMAX模型检验(选择的数据通过了以下检验,具有进行ARIMAX模型的可行性)
1.时间序列数据平稳性检验:
Augmented Dickey-Fuller Test
data: 客需需求
Dickey-Fuller = -4.7455, Lag order = 6, p-value = 0.01
alternative hypothesis: stationary
2.自相关检验

3.季节性检验

4.多重共线性检验

4. 建立ARIMAX模型:利用R中的autoarima,根据每次输入的时间范围以minimizeconditionalsum-of-squares为目标,自动优化(p, d, q)等参数。
5. 模型训练:2022/8/28至2023-07-10的时序数据中,随机选择100个,将这一时间点的前120天作为训练集,后7天作为测试集。以模拟正式使用场景。
6. 模型预测:将测试集的外生变量输入至对应训练数据生成的模型以得到对应测试集日期的客需需求预测结果
7. 模型评估:使用残差检验、RMSE等对模型以及测试集的结果进行准确性分析。

以所有数据进行预测的示例,时间模型采用过去120天的历史数据并可以得到更高的准确。

发现以所有历史数据建立的模型的残值自相关在95%的置信水平下检验未通过,但以历史120天建立的模型该检验通过的概率为66%(注残值自相关检验未通过仅代表是否明显具有因素未被模型所包括)这意味着,对于 66% 的使用场景,模型能在 95% 的置信水平下充分捕捉到数据中的模式,使得预测误差在不同时间点之间不再存在显著的相关性。
这表明数据可能存在一些时间上的变化(如季节性、趋势性或者结构性改变),使得过去较远的历史数据对于当前的预测不再那么有用。因此,使用最近的历史数据(如最近120 天的数据)来训练模型可能会得到更好的结果。
注意,这并不一定意味着模型已经考虑了所有可能的影响因素。可能还存在其他的、模型未考虑的因素。而且,即使模型在大部分情况下通过了残差自相关性检验,也不能保证模型在所有情况下都能给出准确的预测。


以客需需求平均值=147.9计算准确率

注:
1.该门店出现部分客需需求数据未回传的问题,实际的均值会更高,实际准确率也会更高
2.测试集采用的是实际出租房数以及各外生变量,在实际预测过程中,虽然对未来出租房数的预测精度同样也会影响该模型的精度,但是影响程度有限:因为ARMIA本身也会捕捉到由出租房数造成的客需需求的趋势或模式
8. 模型优化:
重复上述过程对外生变量进行数值变换以提高模型准确度
9. 未来优化方向:
考虑将历史每日主要客需标签人数占比纳入外生变量,存在的问题是酒店在进行估计时无法准确获得即将入住客人的身份信息,获取未来的标签占比存在难度。
采用入住人数而不是出租房数以达到更高的精确度,需要平台开始记录每日的入住人数并保持历史半年的数据
24小时预测


结论:未来请在21-24店增派前台人员以应对可能出现的高客需请求
(本文作者李军为辉驿科技公司董事长、胡俊杰为盈兴科技总经理、潘哲凯为辉驿科技数据分析师,本文由潘哲凯执笔)
附:对《ARIMAX模型对酒店住客送物需求总量的预测算法》的评估与建议
张兴国
中国饭店协会酒店数字化专业委员会理事长
盈兴科技在建设“##酒店智能总控系统”时采用了数字模型方法对酒店经营中的一些行为进行了抽象、归纳,力图总结出管理行为的规律性,以便用系统进行控制。这是一种非常值鼓得励的方法。
在对结论评估之前,我首先肯定这种方法论的正确以及在研究开发酒店智能系统中的作用。如果我们广泛对酒店经营中的各种现象进行研究并据此找出其内在的规律,我们就可以开发出有实践价值的“数字店长”,我们的数字总控系统也有望统筹其他 的智能系统从酒店智能1.0向 2.0的方向发展。当然,##和其他类同的智能总控系统在挖掘数字资产的同时,应重视其他数字方法比如AGI 等,使我们的系统更加智能化。
(一)
为了叙述方便,下文中对《ARIMAX 模型对酒店住客送物需求总量的预测算法》一律以“本次实践”来指代。
以下是对本次实践中涉及的统计方法进行评估和一些建议:
1. 数据准备和预处理:
• 本次实践提供了酒店送物需求相关的历史数据,这是进行预测的基础。
• 本次实践中提到进行了数据预处理,处理缺失值是非常重要的步骤,可以确保模型建立在完整的数据基础上。
2. ARIMAX模型检验:
• 在进行 ARIMAX 模型之前,对数据进行了时间序列 数据平稳性检验和自相关检验等,这是确保模型的合理性的重要步骤。
• 通过检验,确认了使用ARIMAX模型的可行性,这意味着模型可以在数据中捕捉到一定的模式和趋势。
3. 建立ARIMAX模型和模型训练:
• 本次实践中使用了R中的autoarima函数来自动优化ARIMAX模型的参数,确保了模型的适应性和准确性。
• 采用随机选择训练集和测试集,并使用测试集进行模型预测和评估,这是一个合理的方法来评估模型的性能。
3. 模型评估:
•本次实践中使用了残差检验、RMSE等指标对模型和测试集结果进行准确性分析,这是常用的评估模型预测性能的方法。
•使用预测准确率来衡量模型的成功程度,可以帮助了解模型在实际应用中的表现。概括说,本次实践中的算法流程基本符合常规的数据预处理、建模和评估步骤。然而,对于实际应用中的预测准确性,除了使用测试集评估外,还需要进行实际业务环境的测试,以验证模型在真实场景中的性能。此外,在未来优化方向中,本次实践提到了考虑增加外生变量和使用入住人数等来提高模型的准确性。这些是合理的优化方向,但确实需要收集更多相关数据并进行合适的数据变换和处理。
需要注意的是,统计建模虽然可以提供一定程度的预测能力,但在实际应用中还需结合业务经验和专业知识,进行综合决策和处理。对于预测结果,还需注意对不确定性的评估和风险的考虑,以便更好地应对实际情况。
(二)
本次实践,虽然整体上的算法流程和评估方法是合理的,但仍然存在一些可以继续提升和改善的建议:
1. 外生变量的选择:本次实践中使用了一些外生变量,如出租房数、上证指数涨跌幅、体感温度的平均值和标准差,以及下雨百分比。然而,对于预测住客送物需求总量来说,是否值得使用这些外生变量是值得思考的,似有牵强意味。可能还有其他一些影响住客送物需求的因素,例如节假日、活动、促销等,可以考虑将更多相关因素纳入模型,以提高预测的准确性。
2. 模型优化:虽然本次实践中提到了对外生变量进行数值变 换来提高模型准确度,但并没有详细说明采用了哪些具体的数值变换方法。在模型优化过程中,可以尝试不同的数据变换方式,如对数变换、平方根变换、标准化等,以找到对模型性能最有利的变换方式。
3. 数据窗口的选择:本次实践中提到采用最近的历史数据(如最近120天的数据)来训练模型可能会得到更好的结果。但对于不同的业务场景,调整数据窗口的大小可能会影响模型的预测能力。可以尝试不同的数据窗口大小来找到最适合当前问题的数据窗口。
4. 多模型对比:本次实践中似乎只采用了ARIMAX模型进行 预测,但在实际应用中,可以考虑尝试多种不同的预测模型,并进行比较。例如,可以尝试其他时间序列模型(如 Prophet、SARIMA 等)或者机器学习模型(如回归模型、神经网络等),以找到最适合问题的预测模型。
5. 预测结果解释:本次实践中提到使用预测准确率来衡量模型的成功程度。然而,仅仅使用RMSE等指标来评估模型 可能无法完全解释模型的预测结果。建议结合业务背景和预测结果,对预测结果进行更细致的解释和分析,以便更好地理解预测的含义和意义。
6. 最后我想指出的是,选择研究对象一定要选择酒店业务或研究目标的重要性比较高的也就是有重要经营或业务指导价值的现象。本次实践中讨论的话题就其重要性而言不算太高(我估计是受到研究对象数据搜集困难的限制)。
总体而言,本次实践中的算法流程和方法是一个良好的起点,但在实际应用中可能需要进一步的优化和改进。在实际运用中不断进行实验和验证,逐步完善和提升预测模型的准确性和效果。同时,结合领域专业知识和业务经验,可以更好地解读和利用预测结果,以支持决策和业务优化。
原文作者回复:
非常感谢张总您对我们的工作成果提出了如此详细和有益的建议。我们仔细阅读了您的反馈,深感其中的每一点都对我们项目的改进至关重要。
我们特别赞同您关于使用多模型对比的看法,经过初步的研究,发现Prophet算法同样支持外生变量。针对您提出的每一项建议,我们已经开始着手进行改进,并尽快完成主要的调整工作。
再次感谢您的宝贵时间和精心指导
36
搜索

搜索