使用 <multimap 库创建重复键关联容器
作者:Danny Kalev
编译:TT 工作室
原文出处:Use multimap to Create Associative Containers with Duplicate Keys
摘要:标准库的 multimap 容器与 map
关联容器非常类似——但是,multimap 允许重复键。这个特性使得 multimap 比想象的要有用得多。本文将对之进行探讨。
在“使用 <map 库创建关联容器”一文中,我们讨论了标准库中的 map 关联容器。但那只是 map 容器的一部分。标准库还定义了一个 multimap
容器,它与 map 类似,所不同的是它允许重复键。这个属性使得 multimap
比预想的要更有用:比如在电话簿中相同的人可以有两个以上电话号码,文件系统中可以将多个符号链接映射到相同的物理文件,或DNS服务器可以将几个URLs映射到相同的IP地址。在这些场合,你可以象下面这样:// 注: 伪码
multimap <string, string phonebook;
phonebook.insert("Harry","8225687"); // 家里电话
phonebook.insert("Harry","555123123"); // 单位电话
phonebook.insert("Harry"," 2532532532"); // 移动电话
在 multimap 中能存储重复键的能力大大地影响它的接口和使用。那么如何创建非唯一键的关联容器呢?答案是使用在 <map 库中定义的
multimap 容器。
提出问题
与 map 不同,multimap 可以包含重复键。这就带来一个问题:重载下标操作符如何返回相同键的多个关联值?以下面的伪码为例:
string phone=phonebook["Harry];
标准库设计者的解决这个问题方法是从
multimap 中去掉下标操作符。因此,需要用不同的方法来插入和获取元素以及和进行错误处理。
插入
假设你需要开发一个 DNS 后台程序(也就是 Windows 系统中的服务程序),该程序将 IP 地址映射匹配的 URL
串。你知道在某些情况下,相同的 IP 地址要被关联到多个 URLs。这些 URLs 全都指向相同的站点。在这种情况下,你应该使用 multimap,而不是
map。例如:
#include <map
#include <string
multimap <string, string DNS_daemon;
用 insert() 成员函数而不是下标操作符来插入元素。insert()有一个
pair 类型的参数。在“使用 <map 库创建关联容器”中我们示范了如何使用 make_pair() 辅助函数来完成此任务。你也可以象下面这样使用它:
DNS_daemon.insert(make_pair("213.108.96.7","cppzone.com"));
在上面的 insert()调用中,串
“213.108.96.7”是键,“cppzone.com”是其关联的值。以后插入的是相同的键,不同的关联值:
DNS_daemon.insert(make_pair("213.108.96.7","cppluspluszone.com"));
因此,DNS_daemon 包含两个用相同键值的元素。注意 multimap::insert() 和 map::insert()
返回的值是不同的。
typedef pair <const Key, T value_type;
iterator
insert(const value_type&); // #1 multimap
pair <iterator, bool
insert(const value_type&); // #2 map
multimap::insert()成员函数返回指向新插入元素的迭代指针,也就是 iterator(multimap::insert()总是能执行成功)。但是 map::insert()
返回 pair<iterator, bool,此处 bool 值表示插入操作是否成功。
查找单个值
与 map 类似,multimap 具备两个版本重载的 find()成员函数:
iterator find(const key_type& k);
const_iterator find(const key_type& k) const;
find(k) 返回指向第一个与键 k 匹配的 pair
的迭代指针,这就是说,当你想要检查是否存在至少一个与该键关联的值时,或者只需第一个匹配时,这个函数最有用。例如:
typedef multimap <string, string mmss;
void func(const mmss & dns)
{
mmss::const_iterator cit=dns.find("213.108.96.7");
if (cit != dns.end())
cout <<"213.108.96.7 found" <<endl;
else
cout <<"not found" <<endl;
}
处理多个关联值
count(k) 成员函数返回与给定键关联的值得数量。下面的例子报告了有多少个与键 “213.108.96.7” 关联的值:
cout<<dns.count("213.108.96.7") //output: 2
<<" elements associated"<<endl;
为了存取 multimap 中的多个值,使用 equal_range()、lower_bound()和 upper_bound()成员函数:
equal_range(k):该函数查找所有与 k 关联的值。返回迭代指针的
pair,它标记开始和结束范围。下面的例子显示所有与键“213.108.96.7”关联的值:
typedef multimap <string, string::const_iterator CIT;
typedef pair<CIT, CIT Range;
Range range=dns.equal_range("213.108.96.7");
for(CIT i=range.first; i!=range.second; ++i)
cout << i-second << endl; //output: cpluspluszone.com
// cppzone.com
lower_bound() 和 upper_bound():lower_bound(k) 查找第一个与键 k 关联的值,而 upper_bound(k)
是查找第一个键值比 k 大的元素。下面的例子示范用 upper_bound()来定位第一个其键值大于“213.108.96.7”的元素。通常,当键是一个字符串时,会有一个词典编纂比较:
dns.insert(make_pair("219.108.96.70", "pythonzone.com"));
CIT cit=dns.upper_bound("213.108.96.7");
if (cit!=dns.end()) //found anything?
cout<<cit-second<<endl; //display: pythonzone.com
如果你想显示其后所有的值,可以用下面这样的循环:
// 插入有相同键的多个值
dns.insert(make_pair("219.108.96.70","pythonzone.com"));
dns.insert(make_pair("219.108.96.70","python-zone.com"));
// 获得第一个值的迭代指针
CIT cit=dns.upper_bound("213.108.96.7");
// 输出: pythonzone.com,python-zone.com
while(cit!=dns.end())
{
cout<<cit-second<<endl;
++cit;
}
结论
虽然 map 和 multimap 具有相同的接口,其重要差别在于重复键,设计和使用要区别对待。此外,还要注意每个容器里
insert()成员函数的细微差别。
作者简介
Danny Kalev 是一名通过认证的系统分析师,专攻 C++ 和形式语言理论的软件工程师。1997 年到 2000
年期间,他是 C++ 标准委员会成员。最近他以优异成绩完成了他在普通语言学研究方面的硕士论文。
业余时间他喜欢听古典音乐,阅读维多利亚时期的文学作品,研究 Hittite、Basque 和 Irish Gaelic
这样的自然语言。其它兴趣包括考古和地理。Danny 时常到一些 C++ 论坛并定期为不同的 C++
网站和杂志撰写文章。他还在教育机构讲授程序设计语言和应用语言课程。