1 调用接口
cp_lexer_get_preprocessor_token: // in cp\ parser.c,C++分析器
=> c_lex_with_flags
=> 标记C++关键字
c_lex_with_flags: // in c-lex.c,C语言词法分析
=> cpp_get_token // in cpplib
=> 过滤掉CPP_PADDING类型的标记
=> 对各类型做进一步精化处理,构造tree结构
2 内存接口
C和C++共用一个cpp_reader *parse_in接口(在c-common.c中定义,cp\decl2.c中有对其的外部声明)。
c_common_init_options(在c-opts.c中实现)函数调用cpp_create_reader(在cpplib中实现)创建cpp_reader对象,并将结果赋给parse_in。
cpp_create_reader是一个重要的接口函数,它用于创建cpp_reader对象和进行一些重要的初始化工作。cpp_create_reader的第二个参数为hash_table *table,它允许用户对hash表进行自定义,如果table非空,则cpplib将使用此hash表存储标识符。hash_table结构存在两个重要的域:
…
hashnode (*alloc_node) (hash_table *);
void * (*alloc_subobject) (size_t);
…
正是这两个域为cpplib和C/++编译器提供了内存接口。所有hash_table的操作函数将使用alloc_node为标识符节点分配空间,cpplib则使用alloc_subobject为所有挂接在标识符节点上的子对象(如cpp_macro)分配空间。
stringpool.c文件中的init_stringpool函数创建了一个hash_table结构ident_hash,并挂接了C编译器中的内存分配函数alloc_node和stringpool_ggc_alloc。
alloc_node的实现如下:
static hashnode
alloc_node (hash_table *table ATTRIBUTE_UNUSED)
{
return GCC_IDENT_TO_HT_IDENT (make_node (IDENTIFIER_NODE));
}
make_node其实是一个在tree.h中定义的宏,它用于创建所有的树对象,上面调用它创建了一个C语言中的标识符节点,它有两部分构成,开头是tree_common结构,紧跟着为ht_identifier(hashnode为指向其的指针类型)结构,GCC_IDENT_TO_HT_IDENT的作用便是把make_node返回的指针加上sizeof(struct tree_common),使其指向后面的hash节点。
在c_lex_with_flags函数中,操作正好相反:
case CPP_NAME:
*value = HT_IDENT_TO_GCC_IDENT (HT_NODE (tok->val.node));
上述代码将cpplib中的hash节点指针转换为C/C++编译器中的标识符节点指针(减去sizeof(struct tree_common)。这一转换结果的正确性是由ident_hash中挂接的节点分配函数alloc_node保证的。