大数据初创企业WibiData刚刚在B轮获了1500万美元的融资。
此轮融资由Canaan Partners领投,原有投资者NEA及Google董事会主席施密特也有参与。
WibiData由大数据初创企业Cloudera的联合创始人Christophe Bisciglia及Aaron Kimball创建。创建伊始他们并没有什么大计划,只是希望能成为最早为基于Hadoop的应用之商用套件提供商之一。
大数据的市场已经十分拥挤,Hadoop的三巨头(Cloudera、Hortonworks 及MaPR)牢牢占据了绝大部分的份额。但是大家用Hadoop绝不仅仅是为了将非结构数据转换为结构化数据(即ETL,数据析取),用户开发自行的定制应用仍然是个难题。所以WibiData瞄准了这样一个利基市场—做专业大数据软件包。
能源管理初创企业Opower就是一个用户案例。这家公司已经是Cloudera的招牌客户了,但是当他们想让自己的SaaS工具超越批量分析和ETL处理时,还是得找WibiData。有了新应用的支持,现在这家公司已经从晚间对用户的能源使用进行数据比较分析提升到向用户动态推荐了。
WibiData的核心技术是将后端的Hadoop环境与面向客户的预测性应用连接到一起,包括一组HBase(Hadoop数据库)、数据格式化工具以及机器学习算法(WibiData正在逐步将实现机器学习算法的Kiji开源)。此外,WibiData还在总结其为同一领域内的客户所开发的应用之相似性,以便找出可重用的东西。比方说,零售业要想开发推荐引擎的话,应该从何开始?
WibiData准备重点针对金融和零售业推进应用开发。预期的成型产品将会包括数据格式化的预定义模式、预置预测模型等。此外,软件还将根据用户角色的不同(数据科学家、系统工程师、业务用户)而展现不同的界面,根据用户需要来提供与数据的交互方式。
我们之前曾讨论过,数据科学家无需太多,让大数据好用就行了。WibiData的专业化软件包显然是一种循序渐进的解决方案。此外,像Cloudera这样的Hadoop供应商则采取了另一种大数据应用通用化的路线,即将Hadoop集成到现有环境中。时间会证明WibiData的路线是否正确的。