通用数据库初创企业Deep Information Sciences 近日宣布在A轮融资中获得1000万美元,投资者包括Stage 1 Ventures、Robert Davoli以及一些天使投资人。
Deep Information Sciences的主打产品是DeepDB。跟一般的专用数据库不同,这种数据库可以处理结构化、半结构化以及非结构化的数据。所以它排斥SQL、NewSQL、NoSQL、内存数据库等标签,自称为“通用数据库”。
传统数据库擅长事务处理,针对写优化(如按行存储)。而大数据要求深度分析、高度灵活、可伸缩、实时性,主要是针对读优化的(如按列存储)。正所谓鱼与熊掌不可得兼,所以,擅长OLTP的SQL数据库往往无法胜任OLAP,因而在大数据时代才有了Hadoop的崛起。
不过,DeepDB通过利用以下几点实现了鱼与熊掌兼得:
1)充分利用多核CPU及新型的并发数据库算法,且这些计算能力可以是来自于本地和云端。
2)利用大容量的廉价内存实现高缓存及对大数据集的内存操作。
3)利用高吞吐的存储子系统,通过算法强制所有IO操作串行进行,从而实现吞吐量的最大化。
从下图可看出,DeepDB对多核CPU的利用率保持在93%以上,且对内存的占用很少。
根据Deep发言人的说法,DeepDB的使用效果明显。该公司现有两家商业客户。其中之一是Global Relief Technologies。在更换了DeepDB数据库后,Global Relief Technologies原来需要一天完成的处理事务现在只需要17分钟。而据Deep在白皮书中的测试结果,DeepDB每秒可处理172万次事务,远远高于MySQL+InnoDB的3.2万次/秒。
当然,提供事务型和分析型混合处理能力的并不仅有Deep一家,SAP的HANA以及JustOneDB也能进行这种通用处理。传统的事务处理需求必然还将长期存在,而大数据应用也会越来越多,因此,这种能兼顾两种应用类型的数据库在竞争中无疑会赢得更多的优势。