1.4 Kaggle竞赛
Kaggle是当前世界上最为流行的,采用众包(Crowdsourcing)策略,为科技公司、研究院所乃至高校课程提供数据分析与预测模型的竞赛平台。该平台成立于2010年4月,由Anthony Goldboom等创立,公司总部设在美国加州旧金山市。
Kaggle平台设立的宗旨在于:汇聚全世界从事数据分析与预测的专家以及兴趣爱好者的集体智慧,利用公开数据竞赛的方式,为科技公司、研究院所和高校课程中的研发课题,提供有效的解决方案。这一初衷使得问题提出者与解决者获得了双赢。
一方面,许多科技公司、研究院和高校拥有大量的数据分析任务和研发课题。如果仅依靠有限的内部研究人员处理和分析,不但耗费大量的时间,而且支付给这些拥有博士学位的研究人员的薪资也是极其高昂的。这也是为什么只有少数实力雄厚的高新科技公司拥有内部的研究院,如Google Research、Microsoft Research、百度研究院等。如果仅拿出一小部分奖金(迄今为止,Kaggle平台上最常见的悬赏是50 000美元,大约是一位在美国IT企业工作的普通职位科研人员一个季度的薪水),便可以向全世界的聪明人征集解决方案,那何乐而不为呢?
另一方面,越来越多有从事数据分析与预测工作意愿的兴趣爱好者,因为难以获得大量可供分析的数据,使得自己的才华难以施展。出现这一问题的主要原因在于,科研机构和大型企业非常看重数据的价值,特别是那些和自己主流业务相关的数据。例如,Google服务器上所存储的全世界互联网用户的搜索日志。对于外部个体的兴趣爱好者,要想获得这些企业和科研机构的数据几乎是不可能的事。但是,如果有一个像Kaggle这样著名的大型平台,随着这上面聚拢的兴趣爱好者甚至行业专家越来越多,大型企业和科研机构也会逐渐信赖这些参赛者,并且放心地提供一些重要数据。
正因为上述种种原因,Kaggle吸引了大量科学家和开发者的关注,并与2017年宣布被Google收购。