1.4.2 大数据分析在商业上的应用
1.体育赛事预测
对体育比赛的结果进行预测几乎已成为赛前的必备活动。现在,互联网公司不断探索体育赛事预测领域,如魔方云科技、摩羯体育等企业。百度北京大数据实验室的负责人介绍说:“在百度对世界杯的预测中,一共考虑了团队实力、主场优势、最近表现、世界杯整体表现和博彩公司的赔率五个因素,这些数据的来源基本上都是互联网,随后再利用一个由搜索专家设计的机器学习模型来对这些数据进行汇总和分析,进而得出预测结果。”
2.股票市场预测
2013年,英国华威商学院和美国波士顿大学物理系的研究发现,用户通过Google(谷歌)搜索的金融关键词或许可以用来预测金融市场的走向,使相应的投资战略收益高达326%。此前,有专家尝试通过Twitter博文情绪来预测股市波动。
和传统量化投资类似,大数据投资也依靠模型,但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上,增加了社交言论、地理信息、卫星监测等非结构化数据,并且对这些非结构化数据进行量化和吸收。
由于大数据模型对成本要求极高,所以业内人士认为,大数据将成为共享平台化的服务,数据和技术相当于食材和锅,基金经理和分析师可以通过平台制作自己的策略。
3.市场物价预测
CPI表征已经发生的物价浮动情况,但统计局数据并不权威。大数据则可能帮助人们了解未来物价的走向,提前预知通货膨胀或经济危机。最典型的案例莫过于马云通过阿里巴巴B2B大数据提前知晓亚洲金融危机,当然这是阿里巴巴数据团队的功劳。
4.用户行为预测
基于用户搜索行为、浏览行为、评论历史和个人资料等数据,互联网业务可以洞察消费者的整体需求,进行针对性的产品生产、改进和营销。《纸牌屋》选择演员和剧情、百度基于用户喜好进行精准广告营销、阿里巴巴根据天猫用户特征包下生产线定制产品、亚马逊预测用户点击行为提前发货,这些均受益于互联网用户行为预测。
5.人体健康预测
中医可以通过望闻问切发现一些人体内隐藏的慢性病,甚至看体质便可知晓一个人将来可能会出现什么症状。人体体征变化有一定规律,而人体在发生慢性病前已有一些持续性异常。理论上来说,如果大数据掌握了这样的异常情况,则可以进行慢性病预测。
6.疾病疫情预测
基于人们的搜索情况、购物行为,预测大面积疫情暴发的可能性,最经典的“流感预测”便属于此类。如果来自某个区域的“流感”“板蓝根”搜索需求越来越多,则可以推测出该处有流感趋势。
7.灾害灾难预测
气象预测是最典型的灾难灾害预测。对于地震、洪涝、高温、暴雨这些自然灾害,如果可以利用大数据能力进行更加提前的预测和告知,则有助于减灾、防灾、救灾、赈灾。过去的数据收集方式存在着死角、成本高等问题,物联网时代可以借助廉价的传感器摄像头和无线通信网络,进行实时的数据监控收集,再利用大数据预测分析,做到更精准的自然灾害预测。
8.环境变迁预测
除可以利用大数据进行短时间微观的天气、灾害预测外,还可以进行更加长期、宏观的环境和生态变迁预测。森林和农田面积缩小、野生动物植物濒危、海岸线上升、温室效应等问题是地球面临的“慢性问题”。人类掌握的地球生态系统、天气形态变化的数据越多,就越容易模型化未来环境的变迁,进而阻止不好的转变发生。大数据可以帮助人类收集、存储和挖掘更多的地球数据,同时还提供了预测的工具。
9.交通行为预测
基于用户和车辆的LBS(Location Based Services,基于位置的服务)定位数据,可分析人车出行的个体和群体特征,进行交通行为的预测。交通部门可预测不同时点、不同道路的车流量进行智能的车辆调度,或应用潮汐车道;用户则可以根据预测结果选择拥堵概率更小的道路。
百度基于地图应用的LBS预测涵盖范围更广。在春运期间预测人们的迁徙趋势可指导人们设置火车线路和航线;在节假日预测景点的人流量可指导人们选择景区;百度热力图可告诉人们城市商圈、动物园等地点的人流情况,可指导人们的出行选择和商家的选点选址。
多尔戈夫的团队利用机器学习算法来创造路上行人的模型。无人驾驶汽车行驶的每一英里(1英里=1.609344公里)路程的情况都会被记录下来,汽车电脑就会保持这些数据,并分析各种不同的对象在不同的环境中如何表现。有些司机的行为可能会被设置为固定变量(如“绿灯亮,汽车行”),但汽车电脑不会生搬硬套这种逻辑,而是从实际的司机行为中进行学习。
这样一来,跟在一辆垃圾运输卡车后面行驶的汽车在垃圾运输卡车停止行进时,可能会选择变道绕过去,而不是跟着停下来。Google已建立了70万英里的行驶数据,这有助于Google汽车根据自己的学习经验来调整自己的行为。
10.能源消耗预测
加利福尼亚州电网系统运营中心管理着加利福尼亚州超过80%的电网,向3500万个用户每年输送2.89亿兆瓦电力,电力线长度超过2.5万英里。该中心采用了Space-Time Insight软件进行智能管理,综合分析来自包括天气、传感器、计量设备等各种数据源的海量数据,预测各地的能源需求变化,进行智能电能调度,平衡全网的电力供应和需求,并对潜在危机做出快速响应。中国智能电网业已在尝试类似大数据预测应用。