位于美国纽约州的CHG&E天然气和电力公司(以下简称CHG&E)是一家知名的公用事业公司,其服务的30万电力用户和7.4万天然气用户分布在从国际大都市纽约周边地区一直到纽约州首府奥尔巴尼北部的约2600平方英里区域中。在促进区域经济增长、提高系统可靠性、有效成本管理等方面,CHG&E都走在美国、乃至全球同行业界的前列。
在降低运营成本方面,CHG&E积累了很多宝贵的经验,其中的不少成功案例非常值得我们国内的服务型企业学习和借鉴,少走不必要的弯路。例如,CHG&E曾经开展过一个负载研究的项目,要求能够准确地预测出各类用户(居民类、商业类、工业类)的每小时用电需求量,以确定为各类用户服务的成本。
当时,公司急需解决的问题是深入调查过往业务数据,探索用电量每天、每月、每年的变化规律,量化分析气温与用电量之间的关联模式,以及最终制定尽可能低成本、高效能运送能源的新方案。
然而,在项目的执行过程中不可避免地遇到了一些困难。首先,海量数据有40多万行之多,一般的电子表格程序是无法读取的。即使有的电子表格可以读取,也无法执行相应的计算。而且更有挑战性的是,项目组中的成员没有一个是具有深厚统计分析功底的专业统计分析师。
经过多方比较和慎重考虑,CHG&E最终选择了来自全球最顶尖的统计软件公司SAS的交互式可视化桌面分析软件JMP来协助分析工作。CHG&E做出这个决策的原因很多,这里先介绍两点。
首先,JMP可以读取很多不同格式的数据文件,比如文本格式、逗号间隔格式和电子表格格式等等,然后可以根据分析工作的需要堆叠、拆分或重组数据。在整理数据后可以迅速地绘制一组可视化图形(如附图),用来找找感觉,比如看看有没有缺失值,气温是与电力负载的散点图是怎样的,等等。
其次,项目组的核心工作是要对公司的业务数据进行建模,观察每年、每月、每周的变化有没有规律。虽然没有人具有相关的统计建模的经验,但是从JMP自带的帮助手册和案例数据中,项目组成员很快就学会了多元回归、时间序列、数据挖掘等多种不同的建模方法。然后,将这些方法用到实际工作中,成功地将整个系统的电力负载分解成各个用户群的贡献程度。
在首个项目获得成功后,CHG&E的精细化管理思想也得到了推广,使用JMP软件分析当前数据的员工也越来越多。比方说,运营部门需要得到各类用户群中平均每个用户每小时的用电千瓦数,而公司总共有三大类10多个子类的用户群,可想而知相应的数据量也很大。JMP软件提供了众多工具来帮助CHG&E提高工作效率。比如表格汇总、数据子集化、排序等等。
说得具体一些的话,有的人说JMP软件在通过颜色等形式识别异常点、展示数据趋势等方面效果明显。在同一张图形上,如果颜色标识列是"小时",我们就可以看到每小时之间的差异;如果颜色标识列改为"年",我们马上就可以看到每年之间的差异。
有的人则喜欢用JMP软件可以随心所欲地分析、探索和可视化所有的数据。比如增加一个公式列来检查数据的准确性,或者比较连续的两行数据以确保相邻两小时之间的用电差异是否很大。当然,还可以自定义隐藏、排除行数据或者列数据(并非删除)。
CHG&E所用到的统计分析功能几乎涉及了JMP软件所有的分析平台:"分布"Distribution、"以X拟合Y"Fit Y by X、"配对"Matched Pairs、带有刻画器和模拟器功能的"模型拟合"Fit Model和带有谱密度功能的"时间序列"Time Series等等。正如CHG&E的分析师Larry Arvidson所言:"总而言之,JMP软件快速便捷、功能强大,为我们的分析数据工作提供了极大的便利。"
应用JMP软件进行量化分析的队伍在CHG&E还在继续扩大,其中包括大量的业务人员和市场营销人员。他们将用它来确定和改善如何经济有效地服务不同用户群的方案,甚至还打算用它来设计和推广鼓励特定用户节约使用能源的广告宣传。而最初进行负载研究的工作人员也没有因为项目的圆满结束而放弃JMP,而是在继续收集和检验数据,继续用JMP软件更新和优化模型,因为企业所处的市场条件一直在变,持续改善的工作永远不会结束。