由于SIN函数计算比较耗CPU,也比较经典,故分别实现1千万次SIN运算做比较
sql2005代码:
declare @i int;
declare @x float;
set @i=1;
while @i<=10000000
begin
set @x=sin(@i);
set @i=@i+1;
end;
go
耗时:26秒
sas DATA步代码 :
data _null_;
length i x 8.;
i=1;
do i=1 to 10000000;
x=sin(i);
end;
run;
运行结果:
NOTE: “DATA 语句”所用时间(总处理时间):
实际时间 1.72 秒
CPU 时间 1.70 秒
耗时不到2秒
再对字符进行比较,我选择替换字符串做比较,也是分别实现1千万次进行字符串替换运算做比较
SQL代码
declare @i int;
declare @str varchar(50);
declare @tarStr varchar(50);
set @i=1;
set @str='This is my Test!';
while @i<=10000000
begin
set @tarStr=replace(@str,'my','My');
set @i=@i+1;
end;
print @tarStr;
go
运行结果:耗时2分24秒
SAS DATA步代码
data _null_;
length i 8.;
length str tarstr $50.;
str="This is my Test!";
i=1;
do i=1 to 10000000;
tarstr=tranwrd(str,"my","My");
end;
put tarstr;
run;
运行结果:耗时不到9秒
NOTE: DATA statement used (Total process time):
real time 8.09 seconds
cpu time 8.09 seconds
初步总结:
进行一千万次SIN运算时,SQL2005耗时26秒,SAS不到2秒,差不多相差13倍
进行一千万次字符替换运算时,SQL2005耗时144秒,SAS不到9秒,差不多相差16倍
可以看出,SAS的数据处理能力可以说是超强,在这方面可以说任何当前数据库都不能相比
如果不是由于SAS本身产品的限制,说不定早就在中国市场上流行了
:) 如果有人想把SAS做的ETL转为用SQL2005做ETL时,可要考虑客户的感受了,想想如果一下子由原来的十几天的数据加载变成几个月的数据加载,你就头疼把;当然如果只是小数据量加载之间的转换,还是没问题的
比较有意思的是,SAS的MERGE操作一直以来都是要求输入的数据要先按指定字段进行排序才能MERGE,现在SQL2005提供的MERGE组件也有了这样的要求,有点像终于找到党组织的感觉了