第34章 仿函数和区间(4)
Mathew Wilson /著
刘未鹏(pongba) /译
34.3.6 再进一步,走得太远了!
你可能想知道:我们能否更进一步,把需要指定字符类型的限制也去掉。答案是:可以,这很容易,见Listing 34.6:
Listing 34.6
struct is_large
: public std::unary_function<. . ., bool>
{
template <typename S>
bool operator ()(S const &file) const
{
return is_large_(c_str_ptr(file));
}
private:
static bool is_large_(char const *file);
static bool is_large_(wchar_t const *file);
};
现在,使用它变得更容易了,如下:
n = std::count_if(rs.begin(), rs.end(), is_large());
n = std::count_if(gs.begin(), gs.end(), is_large());
n = std::count_if(gsw.begin(), gsw.end(), is_large());
然而,有很好的理由阻止我们这样做。这个仿函数是一个谓词(predicate)——谓词是这样一个仿函数:其operator()返回一个bool值,该值反映了其(一个或多个)实参的某些方面。谓词的一个重要方面是它们可以和适配器(adapter)结合起来[Muss01],就像下面这行语句——它计算小文件的个数:
n = std::count_if( gs.begin(), gs.end()
, std::not1(is_large<char>()));
为了使适配器可以和谓词协同工作,谓词必须给出成员typedef:argument_type和result_type。通常,通过继承自std::unary_operator可以完成这个任务。现在我们知道为什么Listing 34.6中的最后一步精化(refinement)无法完成了——如果那样做,我们就没有办法指定argument_type。所以,我们不得不将谓词类定义为含有单个模板参数的模板类。并且,每次使用都必须提供模板实参,因为我们无法提供一个有意义的缺省模板实参——那样做既会导致使用上的麻烦又会带来阅读上的混淆。
这就是为什么我们的仿函数类是个(具有两个模板参数的)模板类的缘故,其第一个模板参数C表示字符类型,而第二个模板参数A则缺省为C const*,表示该谓词的argument_type。
template< typename C
, typename A = C const *
>
struct is_large
: public std::unary_function<A, bool>
{
. . .
现在,当我们想要将它和一个适配器(adapter)以及一个“::value_type”不是C const* 的序列一起使用时,我们可以这样做:
n = std::count_if( rs.begin(), rs.end() // rs: readdir_sequence
, std::not1(is_large<char, struct dirent const*>()));
看起来,这并没有“令人窒息的美感”,但是,考虑到这种情况(序列和适配器同时使用)并不常见,以及通用性和复用性的优点,所以这是个可以承受的选择。另外,它还促进了更高程度的通用性,因为我们可以编写一个能和任何序列完美兼容的模板算法,并同时保持类型隧道,像这样:
template< typename C // character type
, typename S // sequence type
>
void do_stuff(. . .)
{
S s = . . .;
size_t n = std::count_if( s.begin(), s.end()
, std::not1(is_large<C, typename S::value_type>()));
. . .
好吧,在你觉得我已经精神失常之前,我得承认这并不能算是一件会欢快的“蹦”入你脑海的事情,却是一件你一定得去思考的事情。然而,有些时候我们必须得面对复杂的代码,如果你不信,可以看一看一些开源C++库的代码。
重要的是,我们有了一个机制可以用于编写高度通用的(或称“可复用的”)组件,它们服从一些被广泛接受的惯用形式,所以使用起来很方便。这种通用性基于一个可接受的(至少我这么认为)代价(即,如果和适配器一起使用,则序列中必须有“::value_type”这个typedef)。
34.3.7 局部仿函数和回调API
局部仿函数不能被用于STL算法并不意味着它们不能被用于枚举。事实上,当面对回调式枚举API时,局部类是个非常不错的选择。考虑FindChildById()函数的实现(见Listing 34.7),它和广为人之的Win32 API——GetDlgItem()——功能相似,不过FindByChildId()可以定位任何级别的(直接派生和间接派生的)子窗口,而并非仅仅是第一级子窗口:
Listing 34.7
HWND FindChildById(HWND hwndParent, int id)
{
if(::GetDlgCtrlID(hwndParent) == id)
{
return hwndParent; // Searching for self
}
else
{
struct ChildFind
{
ChildFind(HWND hwndParent, int id)
: m_hwndChild(NULL), m_id(id)
{
// Enumerate, passing "this" as identity structure
::EnumChildWindows( hwndParent,FindProc,
reinterpret_cast<LPARAM>(this));
}
static BOOL CALLBACK FindProc(HWND hwnd, LPARAM lParam)
{
ChildFind &find = *reinterpret_cast<ChildFind*>(lParam);
return (::GetDlgCtrlID(hwnd) == find.m_id)?
(find.m_hwndChild = hwnd, FALSE):TRUE;
}
HWND m_hwndChild;
int const m_id;
} find(hwndParent, id);
return find.m_hwndChild;
}
}
类ChildFind定义在FindChildById()的函数体中,最大化了封装程度。而窗口句柄和子窗口id被传给对象find的构造函数。构造函数把id保存在m_id成员中,并且把用于保存搜索结果的成员m_hwndChild设为NULL。然后,构造函数调用Win32的回调式枚举函数EnumChildWindows(),它接受父窗口的句柄,以及一个回调函数和一个调用者提供的参数。find对象将FindProc()静态成员函数作为回调函数传入,并将自身的地址也作为参数传入。FindProc()在每次被回调的过程中都会判断id是否匹配,如果是,则将相应的窗口句柄保存起来并结束查找。
当find的构造完成时,它内部的m_hwndChild成员要么保存着用户需要的句柄,要么保存的是NULL(即没有找到),最后,这将被返回给FindChildById()的调用端。整个枚举的过程在ChildFind这个局部类的构造函数中完成,而它的定义对于外界是不可见的,所以说,FindChildById()完美的封装了ChildFind类。
34.4 区间(Ranges)
前面我们已经看到,区间枚举和仿函数的使用存在着两个问题:第一,对于一个序列类型,我们想要避免通常(尽管并非“遍地都是”)的重复指定begin()和end()。第二,我们想要避免编写过多特定的“一次编写,仅用一处”的仿函数。
在我和朋友John Torjo[1]的一次讨论中,我们发现我们对这些问题已经有了清醒的认识,并且,我们需要一个更好的解决方案。于是我们创造了“区间(Range)”这个概念(concept)。很自然的,对于这个问题他和我的看法有些不一样[2],下面给出的区间的定义和组件的实现主要反映的是我的观点。
34.4.1 区间(Range)的概念(concept)
区间的概念相当简单:
定义:区间表示有限的一集元素,这些元素可以通过一种递增的方式来访问。区间封装了一个逻辑上的范围(一个起始点(begin)和一个结束点(end)以及遍历的规则(从头至尾遍历)),并具体表达为一个可被客户代码用来访问其中的元素的单个实体。
这听起来过于简单以至于没有意义,是吗?不然!该定义的最为显著的部分就是——区间是一个单个的实体。使用它的规范形式如下:
for(R r = . . .; r; ++r)
{
f(*r);
}
或者,如果你不主张操作符重载的话,也可以这样写:
for(R r = . . .; r.is_open(); r.advance())
{
f(r.current());
}
这从形式上有了显著的简化——这是区间这个概念的起因之一。区间具有Table 34.2所列出的特性。
让我们来看看区间如何使用:
// A range over a sequence
glob_sequence gs("/usr/include/", "impcpp*");
for(sequence_range<glob_sequence> r(gs); r; ++r)
{
puts(*r); // Print the matched file entry to stdout
}
// A "notional range"
for(integral_range<int> r(10, 20, 2); r; ++r)
{
cout << *r << endl; // Print int value at current point
}