V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
miniyao
V2EX  ›  问与答

怎么根据 unicode 编码,匹配到中文全角符号?

  •  
  •   miniyao · 2019-12-13 20:01:52 +08:00 · 2168 次点击
    这是一个创建于 1810 天前的主题,其中的信息可能已经有所发展或是发生改变。
    查了下,看到中文文字的 unicode 编码范围在 [\u4e00-\u9fa5],中文全角符号的 unicode 编码,也可以有编码范围可以查到吗?
    4 条回复    2019-12-13 21:07:26 +08:00
    crab
        1
    crab  
       2019-12-13 20:09:47 +08:00   ❤️ 1
    FF00-FFEF
    ynyounuo
        2
    ynyounuo  
       2019-12-13 20:18:53 +08:00
    CJK Symbols and Punctuation
    Range: 3000–303F
    kerr92
        3
    kerr92  
       2019-12-13 20:24:30 +08:00 via iPhone
    去 Unicode 官网可以查到,另外 U+4E00–U+9FFF 只是 CJK 基本字符集,不是所有中文汉字
    imn1
        4
    imn1  
       2019-12-13 21:07:26 +08:00   ❤️ 1
    是时候 share 一下我的笔记了

    ================
    CP65001, UTF-8
    CP936, GBK
    CP54936, GB18030
    CP51936, EUC-CN
    CP950, BIG5
    CP932, SHIFT-JIS
    CP51932, EUC-JP
    CP949, ks_c_5601-1987
    CP51949, EUC-KR
    CP1252, ISO-8859-1


    零宽空格
    ​ -->200B

    汉字
    常用 4E00-9FCF
    extend A 3400-4DBF
    extend B 20000-2A6DF
    extend C 2A700-2B73F
    extend D 2B740-2B81F
    bopomofo(变形符号) 31A0-31BF
    其他(带汉字符号) 3190-319F

    CJK Unified Ideographs (4E00 – 9FFF )
    CJK Unified Ideographs Extension A (3400 – 4DBF)
    CJK Unified Ideographs Extension B (20000 – 2A6DF)
    CJK Unified Ideographs Extension C (2A700 – 2B73F)
    CJK Unified Ideographs Extension D (2B740 – 2B81F)
    CJK Unified Ideographs Extension E (2B820 – 2CEAF)
    CJK Unified Ideographs Extension F (2CEB0 – 2EBE0)

    CJK Compatibility (3300 – 33FF ) 一些中日韩日常符号 /单位
    CJK Compatibility Forms (FE30 – FE4F ) 全角半角符号
    CJK Compatibility Ideographs (F900 – FAFF ) 补充汉字
    CJK Compatibility Ideographs Supplement (2F800 – 2FA1F ) 补充汉字

    CJK Radicals Supplement Range: 2E80–2EFF 偏旁部首
    Kangxi Radicals Range: 2F00–2FDF 康熙部首
    Ideographic Description Characters Range: 2FF0–2FFF 字体结构(形状符号)
    CJK Strokes Range: 31C0–31EF 笔划


    藏文 0F00-0FFF

    蒙文 1800-18AF

    日文
    平假(全角) 3040-309F
    片假(全角) 30A0-30FF
    其他
    31F0-31FF
    FF66-FF9D (半角片假)
    1B000-1B0FF

    朝鲜文
    AC00-D7AF (主体字符)
    3130-318F (朝鲜语字首)
    FFA0-FFDF (半角,范围不详)
    A960-A97F
    D7B0-D7FF

    关于全角符号
    常用标点符号 FF00-FFEF (排除上述重复的半角日韩)

    自定义
    E000-F8FF
    F0000-FFFFF
    100000-10FFFD

    2E80 ~ 33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。
    3400 ~ 4DFFh:中日韩认同表意文字扩充 A 区,总计收容 6,582 个中日韩汉字。
    4E00 ~ 9FFFh:中日韩认同表意文字区,总计收容 20,902 个中日韩汉字。
    A000 ~ A4FFh:彝族文字区,收容中国南方彝族文字和字根。
    AC00 ~ D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。
    F900 ~ FAFFh:中日韩兼容表意文字区,总计收容 302 个中日韩汉字。
    FB00 ~ FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1067 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 22:20 · PVG 06:20 · LAX 14:20 · JFK 17:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.