朋友发过来的信件,全都是
Hi, Sorry for writing back late.
数据丢了就丢了吧,以后小心点就ą
59;了,你应该把那些重要的东东刻下
这个样子,怎么办?让他重写,估计谁也没有这个耐心,只好自己捉摸一下了。
判定问题:看这段文本可以猜出每个&#xxxxx;都是一个字符的某种编码,在google上搜了一把,果然发现这些都是unicode码。
分析问题:unicode无非就是2个字节存储一个字符,所以只要将这些unicode码当作16位数存在一个宽字符缓存中,显示就行了。
还要考虑windows一般显示字符都要转换成mutibyte方式,所以还要用个api函数:WideCharToMultiByte。
实现: code + debug --> ok! 朋友的长信被“解密”了。
现在和大家分享快乐(没有优化,不好意思了):
#define _UNICODE // IMPORTANT!!
// convert from one wide char to mutibyte char[]
char* Convert( wchar_t wc, char* lpDest )
{
// construct wchar string
wchar_t strScr[2];
strScr[0] = wc;
strScr[1] = L'\0';
// lpDest must a char string with 3 byte, and lpDest[2] == '\0'
assert( 0 == lpDest[2] );
int iRet = WideCharToMultiByte(
CP_ACP, // codepage
0, // dwFlags
strScr, // lpWideCharStr
-1, // cchWideChar
lpDest, // lpMutiByteStr
3, // cchMutiByte
NULL, // lpDefaultChar
NULL // lpUsedDefaultChar
);
int iError = GetLastError();
switch(iError)
{
case ERROR_INSUFFICIENT_BUFFER:
break;
case ERROR_INVALID_FLAGS:
break;
case ERROR_INVALID_PARAMETER:
break;
default:
return lpDest;
}
return NULL;
}
// from unicode string to normal string
CString ParseConvert( CString& szSrc )
{
CString szDest = "";
int cLength = szSrc.GetLength();
char cDestChar[] = "??";
for( int i=0 ; i < cLength; i ++ )
{
if( szSrc[i] == '&' && szSrc[i+1] == '#' ) // a unicode char start
{
int iCount = 0;
char szWC[10] ;
memset( szWC, 0, 10 );
i += 2;
while( szSrc[i] != ';' )
{
szWC[iCount] = szSrc[i];
iCount++;
i++;
}
int wc = 0;
sscanf( szWC, "%d", &wc );
szDest += Convert( wc, cDestChar );
}
else
{
szDest += szSrc[i];
}
}
return szDest;
}
void CDecodeDlg::OnButton1()
{
CFileDialog dlg(TRUE);
CString szFileName;
if( dlg.DoModal() == IDOK )
{
szFileName = dlg.GetPathName();
}
else
return;
CStdioFile file;
file.Open( szFileName, CFile::modeRead | CFile::typeText );
CString szBuf, szLine;
while( file.ReadString( szLine ) )
{
szBuf += szLine;
szBuf += "\n";
}
file.Close();
// try it
MessageBox( ParseConvert( szBuf ) );
}
mailto: ma2jun@sina.com