valarray::apply()的批判。
本人因恰好需要对数组做整体+=,-=,max等操作,发现valarray是一个挺好的东西,就用这个东西来帮助操作了。
然后发现了一个看上去更好的valarray::apply():它的描述是——把一个函数f的指针传给apply(),apply()就能返回一个被f作用过于每一个元素的valarray
就是说如果我想把一个数组a的每一个值乘以2得到一个新的数组,那么可以写成:
int f(int i)
{
return i * 2;
}
valarray<int>a(10);
valarray<int>b(10);
blahblah.../* 把a赋值为 {1,2,3,4,5,6,7,8,9,10}*/
b = a.apply(f); /*于是b就变成 {2,4,6,8,10,12,14,16,18,20}了*/
但是我对整个过程挺拿不准,写了一个constructor,copy constructor, operator = 都带有输出的类来检测,发现运行一次apply()就会调用很多次各种构造器和operator =()。于是打开<valarray>的源代码,发现这个apply()的定义是:
valarray<_Ty> apply(_Ty _F(_Ty)) const
{_VALOP(_Ty, size(), _F(_Ptr[_I])); }
#define _VALOP(TYPE, LENGTH, RHS) valarray<TYPE> _Ans(LENGTH); for (size_t _I = 0; _I < _Ans.size(); ++_I) _Ans[_I] = RHS; return (_Ans)
这样一看,我就认为apply()是一个效率非常低的东西了。因为为了做一个a的每个元素乘2得到的b,它会:
1.产生一个临时valarray: _Ans,长为10。
2.调用f()给_Ans的每一个元素赋值,循环10次。
3.return的时候产生再产生一个用来保存返回值的临时对象,大小也是10,并运行copy constructor将_Ans复制给它
4.再调用operator=()将刚才的临时返回值对象复制给b,循环10次。
其中又:
2.1 在调用f期间,如果f的传参数方式不是传引用,那么每call一次f调用一次copy constructor,在本例中为10次。
即使是传引用,因为这个引用是const,f中间也必须做一个临时的TYPE对象,还是要产生10次。
2.2 f的返回值必须是传值方式,于是f每返回一次又要生成一个临时返回值对象,调用一次copy constructor.合计10次。
2.3 把f的返回值传给_Ans,要调用TYPE::operator =(),又合计10次。
就是说为了把a全部10个元素每个乘2赋给已经初始化过的b,总计会产生10+10+10+10=40个临时对象,调用operator=()至少20次。再加上销毁对象的操作,额外开销相当大了。显然完全没有用循环来赋值合算。
(我很疑惑为什么apply()不定义成b.apply(f, a)的调用方式,而要写成b = a.apply(f)。如果用前面的方法可以节省中间的_Ans的产生,以及传递_Ans的返回值临时对象的产生。)
另外,apply()的这种形式也限制了不需要传参数与不需要返回值的操作的灵活性。
比如
1.要让a的所有成员赋为一个随机数,虽然可以写一个与传入值无关的f:
int f(int /* not used*/)
{
return rand();
}
但是写a = a.apply(f)的时候还是有很大浪费。
又如
2.我要输出a里所有的元素,那么定义f:
int f(int i)
{
cout << i << endl;
return i;
}
这样可以用a.apply(f)来执行,但是其中多做的返回值处理的操作又浪费了……
综上:我认为valarray::apply()从微观上来看是一个很不好的东东。但是就软件工程的观点来说,它用多余的4倍的损耗节省了开发者写一个循环的精力。所以我写这篇文章纯粹是开发时代的无病呻吟。
gambolgs April 23, 2005