1
Librazy 2018-07-13 13:23:25 +08:00
其实这是一个 Unicode 的问题,U+0b53 并不是一个有效的字符。
https://en.wikipedia.org/wiki/Oriya_(Unicode_block) |
2
showecho OP @Librazy 对 确实是 unicode 的问题,如果我只知道 unicode 一个范围 比如 U+0B00 到 U+0B7F,怎么知道里面哪些 unicode 代码点是没有被分配的?
然后,既然没有被分配,为什么又有对应的 html 代码? |
3
imn1 2018-07-13 13:34:34 +08:00
首先,显示在于客户端的字体
例如,V 站的 Node 中苹果标识我这里就显示不出来(没有相关字体),但 V 站各位 iV2er 应该没问题,都是苹果设备 所以,不能自己不显示就定义为无效字符 如果确实有需要按自己的需求过滤,可以用正则\uxxxx-\uxxxx 过滤,必要时用 unicode escape 函数转换 |
4
Librazy 2018-07-13 14:20:49 +08:00
@showecho 根据 https://www.w3.org/TR/2017/REC-html52-20171214/single-page.html#character-references HTML Character references 可以引用除 U+0000, U+000D, noncharacters, surrogates 之外的 code points,但这个 code points 不一定是一个有效的 character,能不能显示出来看的是这个字符是否有效。至于判断一个字符的有效性……我就不了解了。
|