帮助数据科学家干脏活累活的云数据服务初创企业Paxata刚刚获得由Accel Partners领投的800万美元融资。
Paxata成立于2012年,其联合创始人兼CEO是PRakash Nanduri。在数据服务领域,存储和提供数据来源的数据管理系统(如Hadoop)和利用数据的分析应用之间普遍存在的一道鸿沟,即分析应用在对数据分析之前需要抽取、处理和整合多个来源的数据才能进行分析。这个数据准备的过程以往大都需要人工处理,耗时费力,Paxata的目的就是要填补这道鸿沟。
Paxata的解决方案包括连接、发掘、转换、合并、发布、协作控制等功能。其中连接可将多种来源的数据(Hadoop等,支持Excel、文本文件、关系数据库、xml、JSON等格式)接入然后自动解析数据。发掘功能可支持全文检索、交互式文本及数字过滤器、直方图、热点图等帮助识别错误与重复或缺失数据;转换功能可实时完成数据的分解、连接、去重、空行检测等。合并功能则可自动检测多数据集的共同属性然后合并为单一视图。数据准备的结果可以发布到各种BI工具上。
Paxata提供的服务与ClearStory有点类似,均能从不同的数据源抽取数据,但是Paxata还可以将多个数据源进一步整合为单一的数据集,从而更方便业务分析师和可视化工具的理解。
Paxata目前已经与Tableau、Cloudera及Qlikview等商业智能公司建立了合作关系,其客户包括Dannon、Box、UBS、Pabst Brewing Company等。目前该公司共有28名员工。