Access编程交流网
  • 设为首页|收藏本站|繁体中文|手机版
  •     
  • Access培训-Access开发平台-Access行业开发

  • 首页
  • 资讯
  • 技巧
  • 源码
  • 行业
  • 资源
  • 活动
  • 关于

技巧

ACCESS数据库

启动/设置/选项/背景

修复/压缩

安全/加密/解密

快捷键

版本升级/其它等

数据表

命名方式/设计规范

表设计

查询

Sql语言基础

选择查询

更新查询

删除查询

追加查询

生成表查询

交叉表查询

SQL特定查询

查询参数

查询综合应用

界面/窗体/控件

标签

文本框

命令按钮

组合框/列表框

选项组/复选框/选项按钮

选项卡

子窗体

窗体本身/综合应用

其它

报表打印

报表设计

高级报表

模块/函数/VBA/API/系统

VBA基础

内置函数

调试/跟踪/Debug

模块/类模块

API/COM/系统相关

字符数字日期

网络通信游戏

加密解密安全

文件处理

经典算法

宏/菜单/工具栏/功能区

宏/脚本

菜单/工具栏

功能区/Ribbon

图表/图形/图像/多媒体

图表

图形/图像

音频

视频/动画

DAO/链接表/ADO/ADP

DAO/链接表/ODBC

ADO/RDO

ADP

ActiveX/第三方控件/插件

Treeview树控件

ListView列表控件

Toolbar工具栏控件

微软其它控件

Dbi-Tech

CodeJock

Grid++Report

FastReport

ComponentOne

加载项/插件/Addin

OFFICE集成/导入导出/交互

Excel导入导出/交互

Word导入导出/交互

PPT交互

Outlook控制/邮件

Text文本文件/INI/CSV

PDF/SWF/XML格式

CAD格式

Sharepoint/其它Office

SqlServer/其它数据库

表

视图

存储过程/触发器

函数

用户/权限/安全

调试/维护

SqlServer其它/综合

发布/打包/文档/帮助

开发版/运行时

打包/发布/部署

开发文档/帮助制作

Access完整行业系统

采购管理系统

销售管理系统

仓库管理系统

人力资源管理HRM

CRM管理系统

MRP/ERP管理系统

BRP/流程优化

其它管理系统

心得/经验/绝招
其它/杂项
Excel技巧

Excel应用与操作

Excel开发编程

Word技巧

Word应用与操作

Word开发编程

Outlook技巧

Outlook应用与操作

Outlook开发编程

热门文章

  • vba函数的数据类型强制转..
  • RecordSource ..
  • ACCESS-VBA编程 ..
  • 初识VBA:第五课 小数点..
  • Access报表补空行另类..
  • 如何查看Access某项引..

最新文章

  • Access或VB VBA..
  • 关于VBA的0、""(空字..
  • Access导出函数Out..
  • Access日期与日期区间..
  • RecordSource ..
  • Access子窗体事件控制..

联系方式

Access交流网(免费Access交流)

QQ:18449932 

网  址:www.access-cn.com

当前位置:首页 > 技巧 > 模块/函数/VBA/API/系统 > VBA基础
VBA基础

用VB6 VBA代码解释UTF-8编码原理及转换为ANSI编码

以下文章不是最优方案,只是为了解答网友提问,写的UTF-8解码过程。

本文最后有示例代码下载中,将本文的编码原理具体应用,封装为了一个类(v1.0),并且用自定义事件的技巧实现向用户显示进度条的功能。在v1.1中再增加了一个事件,让用户可以在后期随意选择符合某个条件的文件是否要进行处理。
图片如下:
按此在新窗口浏览图片

'引用 ADO 2.5 以上版本
'引用 DAO 3.6
'   ReadText_TextStream 函数只允许在 access 环境下使用,
'   需要另外建立表2,3个字段。表2:(id(自动编号),xml(备注),path(文本))


'用VBA的Open来读取文本中的二进制流到数组
Function ReadText_Open()
    Dim strXml As String
    Dim strPath As String
    Dim tb() As Byte
    Dim i As Long
    Dim lngFileNumber As Long
    Dim lngFileLen As Long
    
    
    'strPath = "J:\MyTemp\ut\其他的UTF8文本.txt"
    strPath = "J:\MyProgram\DiskClerk\CatalogLibrary\MoveHD-03.xml"
    
    lngFileLen = FileLen(strPath)
    lngFileNumber = FreeFile
    Open strPath For Binary access Read Shared As #lngFileNumber Len = 10000
    '注意,这里并没有为超大文件进行缓冲分割,如果文件太大(超过10kB)可能造成问题
    ReDim tb(lngFileLen - 1) As Byte
    Get #lngFileNumber, , tb
    Debug.Print UBound(tb) + 1
    Close #lngFileNumber
    
    '如果文件体积很大,这段组织文本将耗时非常多,暂时屏蔽了
    'For i = 0 To UBound(tb) Step 2
    '    strXml = strXml & ChrB(tb(i)) & ChrB(tb(i + 1))
    '    DoEvents
    'Next
    'Debug.Print "xml内容", strXml
    
    AnalyseBytes tb

    
End Function

'(错误的)用FSO.TextStream读取文本数据
Function ReadText_TextStream()
    Dim strXml As String
    Dim strPath As String
    Dim tb() As Byte
    Dim i As Long
    
    
    Set fs = CreateObject("Scripting.FileSystemObject")
    '注意替换以下这行,分别取 10个字节的文本和13个字节的文本,你会发现在 #1处Debug出来的长度并不等于文件长度。
    'strPath = "J:\MyTemp\ut\10个字节的UTF8文本.txt"
    strPath = "J:\MyTemp\ut\13个字节的UTF8文本.txt"
    
    
    Set a = fs.OpenTextFile(strPath, 1)
    strXml = a.readall
    a.Close
    Debug.Print "xml内容", strXml
    
    Set a = fs.OpenTextFile(strPath, 1)
    tb = a.readall
    '#1
    Debug.Print "fso textstream 直接读取转换为数组 与 读取字符串长度对比", UBound(tb) + 1, LenB(strXml)
    a.Close
    
    Dim rst As DAO.Recordset
    Set rst = CurrentDb.OpenRecordset("select * from 表2")
    rst.AddNew
    rst("xml") = strXml
    rst("path") = strPath
    rst.Update
    rst.Close
    
    AnalyseBytes tb


    Debug.Print "长度:", UBound(tb) + 1, LenB(strXml)
    
    

End Function

Function ReadText_Stream()
    Dim s As New ADODB.Stream
    Dim strPath As String
    Dim strXml As String
    Dim b() As Byte
    Dim i As Long
    
    'strPath = "J:\MyTemp\ut\其他的UTF8文本.txt"
    strPath = "J:\MyProgram\DiskClerk\CatalogLibrary\MoveHD-03.xml"
    s.Type = adTypeBinary
    s.Open
    s.LoadFromFile strPath
    
    
    b = s.Read()
    Debug.Print "stream 与 数组 长度对比:", s.Size, UBound(b) + 1
    
    AnalyseBytes b
    
End Function

'转换编码,将 UTF-8 编码转换为当前 access 系统编码
Public Function AnalyseBytes(ByRef bts() As Byte)
    Dim i As Long
    Dim strDecode As String
    Dim strChsWord As String
    
    For i = 0 To UBound(bts)
        If i Mod 10000 = 0 Then
            Debug.Print i, Round(i / UBound(bts), 2) * 100 & "%"
            Debug.Print strDecode
            strDecode = ""
        End If
        
        If i <= 2 Then
            '打印前3个字节确定其为 UTF8
            Debug.Print "UTF-8文件的标记是3个字节:&HEF、&HBB 和 &HBF", Hex(bts(i))
        Else
            'Debug.Print N10toC62(bts(i), 2)
            If bts(i) >= 0 And bts(i) <= 127 Then
                'Debug.Print N10toC62(bts(i), 2), ChrW(bts(i))
                strDecode = strDecode & ChrW(bts(i))
            Else
                If bts(i) >= 224 And bts(i) <= 239 Then
                    '表明是3字节汉字的首字节
                    '码长16:如“汉”11100110 10110001 10001001,具体值:0110 110001 001001
                    strChsWord = ChrW(CDbl((bts(i) - 224)) * 4096 + CDbl((bts(i + 1) - 128) * 64) + CDbl(bts(i + 2) - 128))
                    strDecode = strDecode & strChsWord
                    DoEvents
                    
                    'Debug.Print N10toC62(bts(i), 2), strChsWord
                    'Debug.Print N10toC62(bts(i + 1), 2)
                    'Debug.Print N10toC62(bts(i + 2), 2)
                    i = i + 2
                ElseIf bts(i) >= 128 And bts(i) <= 191 Then
                    '表明是各种的后续字节
                    
                ElseIf bts(i) >= 192 And bts(i) <= 223 Then
                    '表明是2字节字符的首字节
                    '码长11: "1111 111111"
                    strChsWord = ChrW(CDbl((bts(i) - 192)) * 2 ^ 6 + CDbl((bts(i + 1) - 128)))
                    strDecode = strDecode & strChsWord
                    DoEvents
                    i = i + 1
                Else
                    Err.Raise 981, "", "bytes(" & i & ") = " & bts(i) & ", " & N10toC62(192, 2)
                End If
                
            End If
        End If
    Next
    Debug.Print strDecode

'    Debug.Print "utf8 3字节汉字首字节最低值", C62ToN10("11100000", 2)
'    Debug.Print "utf8 3字节汉字首字节最高值", C62ToN10("11101111", 2)
'    Debug.Print "utf8 3字节汉字后续节最低值", C62ToN10("10000000", 2)
'    Debug.Print "utf8 3字节汉字后续节最高值", C62ToN10("10111111", 2)
'    Debug.Print "utf8 2字节字符首字节最低值", C62ToN10("11000000", 2)
'    Debug.Print "utf8 2字节字符首字节最高值", C62ToN10("11011111", 2)
'    Debug.Print "utf8 ASCII码最低值", C62ToN10("00000000", 2)
'    Debug.Print "utf8 ASCII码最低值", C62ToN10("01111111", 2)
'    utf8 3字节汉字首字节最低值   224
'    utf8 3字节汉字首字节最高值   239
'    utf8 3字节汉字后续节最低值   128
'    utf8 3字节汉字后续节最高值   191
'    utf8 2字节字符首字节最低值   192
'    utf8 2字节字符首字节最高值   223
'    utf8 ASCII码最低值           0
'    utf8 ASCII码最低值           127


End Function

'用于对临时数据进行解释
Function Explain()
    'Debug.Print Asc("新")
    'Debug.Print Asc("建")
    'Debug.Print Hex(24), Hex(149), Hex(14), Hex(99)
    'Debug.Print &HEF
    'Debug.Print N10toC62(61, 2), N10toC62(119, 2)
    'Debug.Print "UTF-8文件的标记是3个字节:&HEF、&HBB 和 &HBF", Hex(C62ToN10("11101111", 2)), Hex(C62ToN10("10111011", 2)), Hex(C62ToN10("10111111", 2))
    
    'Debug.Print ChrW(C62ToN10(Right("11100110", 4) & Right("10110001", 6) & Right("10001001", 6), 2)), AscW("汉")
    'Debug.Print ChrW(C62ToN10(Right("1100001", 5) & Right("1100001", 6) & Right("10001001", 6), 2)), AscW("汉")
    
    '注意最后一个参数,对16进制进行二进制编码得到 111001110001011,长度为15码位,应该是16个码位,前面补0
    'Debug.Print "王", AscW("王"), Hex(AscW("王")), N10toC62(&H73, 2) & N10toC62(&H8B, 2), "0111 001110 001011"
    

    Debug.Print "utf8 3字节汉字首字节最低值", C62ToN10("11100000", 2)
    Debug.Print "utf8 3字节汉字首字节最高值", C62ToN10("11101111", 2)
    Debug.Print "utf8 3字节汉字后续节最低值", C62ToN10("10000000", 2)
    Debug.Print "utf8 3字节汉字后续节最高值", C62ToN10("10111111", 2)
    Debug.Print "utf8 2字节字符首字节最低值", C62ToN10("11000000", 2)
    Debug.Print "utf8 2字节字符首字节最高值", C62ToN10("11011111", 2)
    Debug.Print "utf8 ASCII码最低值", C62ToN10("00000000", 2)
    Debug.Print "utf8 ASCII码最低值", C62ToN10("01111111", 2)
    
    'Debug.Print "utf8 汉字首字节值", C62ToN10("11100001", 2), C62ToN10("11100001", 2) - C62ToN10("11100000", 2), C62ToN10("1000000000000", 2), C62ToN10("1000000", 2), ChrW(C62ToN10("0111001110001011", 2))
    'Debug.Print ChrW((C62ToN10("11100110", 2) - 224) * 4096 + (C62ToN10("10110001", 2) - 128) * 64 + C62ToN10("10001001", 2) - 128), AscW("汉")
End Function


Function C62ToN10(ByVal strA As String, Optional ByVal bt As Byte) As Double
'本函数用于将 2 8 16 36 62 进制字符串转换为 10 进制数值
'请注意,本函数的输入参数是区分大小写的,36进制以及以下,应该全部转换为大写
    
    '下列进制,如果有必要,可以扩展到整个字符集,
    '也就是你只要输入一个字符,就可以代表上万位
    
    If bt < 2 Or bt > 62 Then
        bt = 16
        '默认为 16 进制
    End If
    '2进制 0-1
    '8进制 0-7          可以用 clng("&O71") 代替
    '16进制 0-9 A-F     可以用 clng("&Hf1") 代替
    '36进制 0-9 A-Z
    '62进制 0-9 A-Z a-z
    '都不对,就用16进制,如果输入数据不符合要求,则出错
    
    If bt <= 36 Then
        strA = UCase(strA)
        '小于等于 36 进值时应该全部转换为大写
    End If
    
    Dim b As Long
    Dim b1 As String
    Dim c As Double
    Dim l As Integer
    Dim i As Integer
    l = Len(strA)
    For i = 1 To l
        b1 = Mid(strA, i, 1)
        Select Case Asc(b1)
        Case 48 To 57
            b = CLng(b1)
        Case 65 To 90
            b = Asc(b1) - 55
        Case 97 To 122
            b = Asc(b1) - 61
        End Select
        c = c + b * bt ^ (l - 1)
        l = l - 1
    Next
    C62ToN10 = c
End Function


Function N10toC62(ByVal b As Long, Optional ByVal bt As Byte) As String
'以下函数将10进制数值根据要求转换为
'2 8 16 36 62 进制字符串
'请注意,本函数的输出结果是区分大小写的

    If bt < 2 Or bt > 62 Then
        bt = 16
        '默认为 16 进制
    End If
    '2进制 0-1
    '8进制 0-7          可以用 OCT 函数代替
    '16进制 0-9 A-F     可以用 HEX 函数代替
    '36进制 0-9 A-Z
    '62进制 0-9 A-Z a-z
    '都不对,就用16进制,如果输入数据不符合要求,则出错
    
    Dim a As Long
    Dim a1 As String
    Dim s As String
    Do
        a = b Mod bt
        Select Case a
        Case 0 To 9
            a1 = CStr(a)
        Case 10 To 35
            a1 = Chr(a + 55)
        Case 36 To 61
            a1 = Chr(a + 61)
        End Select
        s = a1 & s
        b = b \ bt
    Loop Until b = 0
    N10toC62 = s
End Function

发布人:cg1-access911.net  
分享到:
点击次数:  更新时间:2008-11-25 09:35:24  【打印此页】  【关闭】
上一条:如何解决用fso删除文件时不作任何提示直接删除了,也不放入回收  下一条:如何动态创建窗体并设置页脚页眉



相关文章

  • • Access或VB VBA判断数组的值是否为空的几种方法
  • • 关于VBA的0、""(空字符串)、Null、Empty、与 Nothing 的区别
  • • Access导出函数OutPutto解释
  • • Access日期与日期区间的筛选
  • • RecordSource SourceObject ControlSource属性的区别
  • • Access子窗体事件控制父窗体
  • • 事件​change和AfterUpdate的区别
  • • 代码修改完善方法示例(初学者必读)

热门文章

  • [2008-12-06] Access計算工作天數access数据库
  • [2013-08-10] 【Access技巧】Format函数--不同数值对应不同格式access数据库
  • [2013-08-13] Access时间日期函数大全(常用的函数方法)access数据库
  • [2004-08-18] 一个先进先出计算出库成本的例子。access数据库
  • [2013-10-17] Access列表框快速全选的技巧【最快】access数据库
  • [2009-04-22] Access完成累计余额的计算access数据库

热门产品

公司动态|在线留言|在线反馈|友情链接|会员中心|站内搜索|网站地图

中山市天鸣科技发展有限公司 版权所有 1999-2023 粤ICP备10043721号

QQ:18449932

Access应用 Access培训 Access开发 Access平台

access|数据库|access下载|access教程|access视频|access软件

Powered by MetInfo 5.3.12 ©2008-2025  www.metinfo.cn