TN002: Persistent Object Data Format(永久对象的数据格式)
摘要:
这是篇笔记主要描述支持永久存储对象的MFC程序和当对象数据保存成文件时的格式。
1、 MFC利用紧凑的二进制格式对数据进行保存,每个对象在文件中只存在一个实体。对象自已的Serialize()函数才是提供真正的数据库存储。
2、 Carchive::WriteObject通过写入数据头来重建对象。数据头包括对象类型和对象状态两个部分。此函数同样也负责写入一标识符,以此来保持一个对象只有一份拷贝。
3、 读取和写入对象需要依依靠几个预定义的常量,如下表:
Tag(标识符)
Description(描述)
wNullTag
用于一个指向NULL的对象.
wNewClassTag
指出其后面是一个新的对象
wOldClassTag
指出将要读取的是一个已读取过的对象
wClassTag
类指示符
wBigObjectTag
0x8000000 指示一个大类标记
nMaxMapCount
0x3FFFFFFE 表示最大的mapCount值
4、 当保存对象时Carchive维持了一个把要存储的对象映射到一个32位标识符PID的CmapPtrToPtr对象(m_pStoreMap)。PID的值是从1始的,PID只在它的作用域范围内有效。
5、 保存对象所用到的函数及相关代码:
void CArchive::WriteObject(const CObject* pOb)
{
// 对象可以为 NULL
DWORD nObIndex;
// 初始化m_pStoreMap
MapObject(NULL);
if (pOb == NULL)
{
// 保存NULL指针标志
*this << wNullTag;
}
else if ((nObIndex = (DWORD)(*m_pStoreMap)[(void*)pOb]) != 0)
// assumes initialized to 0 map
{
//保存已存储过对象的INDEX
if (nObIndex < wBigObjectTag)
*this << (WORD)nObIndex;
else
{
*this << wBigObjectTag;
*this << nObIndex;
}
}
else
{
// 写入示保存过的对象
CRuntimeClass* pClassRef = pOb->GetRuntimeClass();
WriteClass(pClassRef);
// enter in stored object table, checking for overflow
CheckCount();
(*m_pStoreMap)[(void*)pOb] = (void*)m_nMapCount++;
// 使对象自身进行系列化
((CObject*)pOb)->Serialize(*this);
}
}
void CArchive::WriteClass(const CRuntimeClass* pClassRef)
{
// 确认pStoreMap已被初始化
MapObject(NULL);//在这里实际没有做什么事情
// 写入对象的ID和指示符并把指示符放在高位.
// new object follows
//假定map以初始化为0
DWORD nClassIndex;
if ((nClassIndex = (DWORD)(*m_pStoreMap)[(void*)pClassRef]) != 0)
{
// previously seen class, write out the index tagged by high bit
if (nClassIndex < wBigObjectTag)
*this << (WORD)(wClassTag | nClassIndex);
else
{
*this << wBigObjectTag;
*this << (dwBigClassTag | nClassIndex);
}
}
else
{
// 存储新对象
*this << wNewClassTag;
//存储RUNTIME_CLASS对象所需的信息(如:对象名字)
pClassRef->Store(*this);
// 存储新对象的引用(参考)到MAP中
CheckCount();
(*m_pStoreMap)[(void*)pClassRef] = (void*)m_nMapCount++;
}
}
6、 当ReadObject从文件中读取对象时通过判断PID是否大于当前数组的上限,如果大于则是一个新的对象。
7、 实现多版本化所要做的几点和MFC内部实现的部份代码。
l 在IMPLEMENT_SERIAL中要使nSchema为VERSIONABLE_SCHEMA与当前版本号进行或运算所得的值。
l 在Serialize中通过GetObjectSchema来获版本号,并进行相应处理。
具体代码如下:
#define VERSIONABLE_SCHEMA (0x80000000)
IMPLEMENT_SERIAL(CMyObject, CObject, VERSIONABLE_SCHEMA|1)
void CMyObject::Serialize(CArchive& ar)
{
if (ar.IsLoading())
{
int nVersion = ar.GetObjectSchema();
switch(nVersion)
{
case 0:
// read in previous version of
// this object
break;
case 1:
// read in current version of
// this object
break;
default:
// report unknown version of
// this object
break;
}
}
else
{
// Normal storing code goes here
}
}
8、 在一些情况下需要直接调用Serialize,这样带来了一些好处但也带来的不好的地方。主要有四个方面:
l 可以使文件体更小,而且可以支持更多的文件格式。
l ReadObject和WriteObject以及一些与它们有关的东西不会连接到你的程序中去,除非你要支持更多通用对象的存档方案。
l 反系列化时需要自行处理更多的事情。
l 不能调用CArchive::GetObjectSchema或者要使CArchive::GetObjectSchema返回-1来表示未知版本。
由于直接调用Serialize会造成有时在子对象中要存储父文档对象的指针,这需要两步来实现:1、在子对象中必需显式地保存一个指向父文档的back pointer;2、在back pointer存档之前,通过调用CArchive::MapObject把Cdocument映射一个PID。
注:具体内部流程参考《深入浅出MFC》PART4—P60