内码带来的麻烦

中文有许多编码格式。
一直以为UNICODE同UTF-8是一回事,今天在ACCESS数据库提取一段文本后,在网页中显示时出现了问题。
用ACCESS打开数据库,中文文本显示无误,但是在网页中显示的就是乱码。
检查原始数据,中文的编码是WINDOWS UNICODE,网页输出的编码设为UTF-8。
显然UNICODE和UTF-8不是一回事,在搜索之后发现。
实际上WINDOWS中的UNICODE是UTF-16,而且我的这个原始中文数据是UTF-16 little Endian编码的。

为了转换内码,找到了ConvertZ这个软件,绿色,好用。
我是从PcHome下载的。5.7版。

后来在ALF'S HOME看到了最新的7.40版,

下载后,解压缩,直接运行即可,支持简体,繁体和英文界面,多达10多种内码之间的转换。

上面的中文原始数据,在用ConvertZ转换成UTF-8内码之后,再放入ACCESS数据库之内,网页的显示,就正常了。

相关资料:

unicode官方网站