自己动手丰衣足食-搞定网页乱码

王朝vc·作者佚名  2006-01-08
窄屏简体版  字體: |||超大  

朋友发过来的信件,全都是

Hi, Sorry for writing back late.

数据丢了就丢了吧,以后小心点就&#261

59;了,你应该把那些重要的东东刻下

这个样子,怎么办?让他重写,估计谁也没有这个耐心,只好自己捉摸一下了。

判定问题:看这段文本可以猜出每个&#xxxxx;都是一个字符的某种编码,在google上搜了一把,果然发现这些都是unicode码。

分析问题:unicode无非就是2个字节存储一个字符,所以只要将这些unicode码当作16位数存在一个宽字符缓存中,显示就行了。

还要考虑windows一般显示字符都要转换成mutibyte方式,所以还要用个api函数:WideCharToMultiByte。

实现: code + debug --> ok! 朋友的长信被“解密”了。

现在和大家分享快乐(没有优化,不好意思了):

#define _UNICODE // IMPORTANT!!

// convert from one wide char to mutibyte char[]

char* Convert( wchar_t wc, char* lpDest )

{

// construct wchar string

wchar_t strScr[2];

strScr[0] = wc;

strScr[1] = L'\0';

// lpDest must a char string with 3 byte, and lpDest[2] == '\0'

assert( 0 == lpDest[2] );

int iRet = WideCharToMultiByte(

CP_ACP, // codepage

0, // dwFlags

strScr, // lpWideCharStr

-1, // cchWideChar

lpDest, // lpMutiByteStr

3, // cchMutiByte

NULL, // lpDefaultChar

NULL // lpUsedDefaultChar

);

int iError = GetLastError();

switch(iError)

{

case ERROR_INSUFFICIENT_BUFFER:

break;

case ERROR_INVALID_FLAGS:

break;

case ERROR_INVALID_PARAMETER:

break;

default:

return lpDest;

}

return NULL;

}

// from unicode string to normal string

CString ParseConvert( CString& szSrc )

{

CString szDest = "";

int cLength = szSrc.GetLength();

char cDestChar[] = "??";

for( int i=0 ; i < cLength; i ++ )

{

if( szSrc[i] == '&' && szSrc[i+1] == '#' ) // a unicode char start

{

int iCount = 0;

char szWC[10] ;

memset( szWC, 0, 10 );

i += 2;

while( szSrc[i] != ';' )

{

szWC[iCount] = szSrc[i];

iCount++;

i++;

}

int wc = 0;

sscanf( szWC, "%d", &wc );

szDest += Convert( wc, cDestChar );

}

else

{

szDest += szSrc[i];

}

}

return szDest;

}

void CDecodeDlg::OnButton1()

{

CFileDialog dlg(TRUE);

CString szFileName;

if( dlg.DoModal() == IDOK )

{

szFileName = dlg.GetPathName();

}

else

return;

CStdioFile file;

file.Open( szFileName, CFile::modeRead | CFile::typeText );

CString szBuf, szLine;

while( file.ReadString( szLine ) )

{

szBuf += szLine;

szBuf += "\n";

}

file.Close();

// try it

MessageBox( ParseConvert( szBuf ) );

}

mailto: ma2jun@sina.com

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航