当前位置:首页 > 数据挖掘 > 【技术篇】数据挖掘核心技术-时间序列预测算法

【技术篇】数据挖掘核心技术-时间序列预测算法

一、时间序列预测简介


时间序列预测法(Time Series Forecasting Method),一种历史资料延伸预测,也称历史引伸预测法。是以时间数列所能反映的社会经济现象的发展过程和规律性,进行引伸外推,预测其发展趋势的方法。

时间序列,也叫时间数列、历史复数或动态数列。它是将某种统计指标的数值,按时间先后顺序排到所形成的数列。时间序列预测法就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平。其内容包括:收集与整理某种社会现象的历史资料;对这些资料进行检查鉴别,排成数列;分析时间数列,从中寻找该社会现象随时间变化而变化的规律,得出一定的模式;以此模式去预测该社会现象将来的情况。


二、时间序列预测法的步骤


第一步:收集历史资料,加以整理,编成时间序列,并根据时间序列绘成统计图。时间序列分析通常是把各种可能发生作用的因素进行分类,传统的分类方法是按各种因素的特点或影响效果分为四大类:(1)长期趋势;(2)季节变动;(3)循环变动;(4)不规则变动。
第二步:分析时间序列。时间序列中的每一时期的数值都是由许许多多不同的因素同时发生作用后的综合结果。
第三步:求时间序列的长期趋势(T)季节变动(S)和不规则变动(I)的值,并选定近似的数学模式来代表它们。对于数学模式中的诸未知参数,使用合适的技术方法求出其值。
第四步:利用时间序列资料求出长期趋势、季节变动和不规则变动的数学模型后,就可以利用它来预测未来的长期趋势值T和季节变动值s,在可能的情况下预测不规则变动值I。然后用以下模式计算出未来的时间序列的预测值Y:
  加法模式T+S+I=Y
  乘法模式T×S×I=Y

如果不规则变动的预测值难以求得,就只求长期趋势和季节变动的预测值,以两者相乘之积或相加之和为时间序列的预测值。如果经济现象本身没有季节变动或不需预测分季分月的资料,则长期趋势的预测值就是时间序列的预测值,即T=Y。但要注意这个预测值只反映现象未来的发展趋势,即使很准确的趋势线在按时间顺序的观察方面所起的作用,本质上也只是一个平均数的作用,实际值将围绕着它上下波动。


三、时间序列分析基本特征


一、时间序列分析法是根据过去的变化趋势预测未来的发展,它的前提是假定事物的过去延续到未来。


时间序列分析,正是根据客观事物发展的连续规律性,运用过去的历史数据,通过统计分析,进一步推测未来的发展趋势。事物的过去会延续到未来这个假设前提包含两层含义:一是不会发生突然的跳跃变化,是以相对小的步伐前进;二是过去和当前的现象可能表明现在和将来活动的发展变化趋向。这就决定了在一般情况下,时间序列分析法对于短、近期预测比较显著,但如延伸到更远的将来,就会出现很大的局限性,导致预测值偏离实际较大而使决策失误。


二、时间序列数据变动存在着规律性与不规律性


时间序列中的每个观察值大小,是影响变化的各种不同因素在同一时刻发生作用的综合结果。从这些影响因素发生作用的大小和方向变化的时间特性来看,这些因素造成的时间序列数据的变动分为四种类型。


(1)趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不相等。
(2)周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
(3)随机性:个别为随机变动,整体呈统计规律。

(4)综合性:实际变化情况是几种变动的叠加或组合。预测时设法过滤除去不规则变动,突出反映趋势性和周期性变动。


四、时间序列预测法的分类


时间序列预测法可用于短期预测、中期预测和长期预测。根据对资料分析方法的不同,又可分为:简单序时平均数法、加权序时平均数法、移动平均法、加权移动平均法、趋势预测法、指数平滑法、季节性趋势预测法、市场寿命周期预测法等。


简单序时平均数法:也称算术平均法。即把若干历史时期的统计数值作为观察值,求出算术平均数作为下期预测值。这种方法基于下列假设:“过去这样,今后也将这样”,把近期和远期数据等同化和平均化,因此只能适用于事物变化不大的趋势预测。如果事物呈现某种上升或下降的趋势,就不宜采用此法。


加权序时平均数法:就是把各个时期的历史数据按近期和远期影响程度进行加权,求出平均值,作为下期预测值。


简单移动平均法:就是相继移动计算若干时期的算术平均数作为下期预测值。


加权移动平均法:即将简单移动平均数进行加权计算。在确定权数时,近期观察值的权数应该大些,远期观察值的权数应该小些。


上述几种方法虽然简便,能迅速求出预测值,但由于没有考虑整个社会经济发展的新动向和其他因素的影响,所以准确性较差。应根据新的情况,对预测结果作必要的修正。


指数平滑法:即根据历史资料的上期实际数和预测值,用指数加权的办法进行预测。此法实质是由内加权移动平均法演变而来的一种方法,优点是只要有上期实际数和上期预测值,就可计算下期的预测值,这样可以节省很多数据和处理数据的时间,减少数据的存储量,方法简便。是国外广泛使用的一种短期预测方法。


季节趋势预测法:根据经济事物每年重复出现的周期性季节变动指数,预测其季节性变动趋势。推算季节性指数可采用不同的方法,常用的方法有季(月)别平均法和移动平均法两种:a.季(月)别平均法。就是把各年度的数值分季(或月)加以平均,除以各年季(或月)的总平均数,得出各季(月)指数。这种方法可以用来分析生产、销售、原材料储备、预计资金周转需要量等方面的经济事物的季节性变动;b.移动平均法。即应用移动平均数计算比例求典型季节指数。


市场寿命周期预测法:就是对产品市场寿命周期的分析研究。例如对处于成长期的产品预测其销售量,最常用的一种方法就是根据统计资料,按时间序列画成曲线图,再将曲线外延,即得到未来销售发展趋势。最简单的外延方法是直线外延法,适用于对耐用消费品的预测。这种方法简单、直观、易于掌握。


指数平滑模型


重点介绍


指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测,所有预测方法中,指数平滑是用得最多的一种。简单的全期平均法是对时间数列的过去数据一个不漏地全部加以同等利用;移动平均法则不考虑较远期的数据,并在加权移动平均法中给予近期资料更大的权重;而指数平滑法则兼容了全期平均和移动平均所长,不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。


也就是说指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测。其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。


指数平滑模型根据时间序列先前的观察值来预测未来,如根据销售历史记录来预测未来销售情况。SmartMining的指数平滑算法节点提供了自动、简单指数平滑、Holt线性趋势、 简单季节模型、Winter加法和Winter乘法多种模型可以选择。其中自动是指节点会按照其他五个模型分别进行训练,然后输出效果最好的一个,所以自动选项运行耗时会相对长一些。 


指数平滑节点与其他的节点稍有不同,用于分析的时间序列数据都是在均匀间隔的时间点下测量到的数据,时间序列的模型要求每个测量值之间要有一致的区间,所以,在指数平滑节点 之前都要加一个时间区间节点以对时间区间有个规范的定义:指定要使用的时间区间(年、季度、月、日),在模型训练或者预测的过程中将从时间区间生成的标准时间字段中获取相关的时间信息。并且要使用类型节点指定目标字段。  
赞 (