以下文章不是最优方案,只是为了解答网友提问,写的UTF-8解码过程。
本文最后有示例代码下载中,将本文的编码原理具体应用,封装为了一个类(v1.0),并且用自定义事件的技巧实现向用户显示进度条的功能。在v1.1中再增加了一个事件,让用户可以在后期随意选择符合某个条件的文件是否要进行处理。
图片如下:
'引用 ADO 2.5 以上版本 '引用 DAO 3.6 ' ReadText_TextStream 函数只允许在 access 环境下使用, ' 需要另外建立表2,3个字段。表2:(id(自动编号),xml(备注),path(文本))
'(错误的)用FSO.TextStream读取文本数据
End Function Function ReadText_Stream() '转换编码,将 UTF-8 编码转换为当前 access 系统编码 ' Debug.Print "utf8 3字节汉字首字节最低值", C62ToN10("11100000", 2)
'用于对临时数据进行解释 Debug.Print "utf8 3字节汉字首字节最低值", C62ToN10("11100000", 2)
If bt < 2 Or bt > 62 Then |