我简单的想法是,统一保存简体内容,使用繁简切换的JS库。
搜索时候转换成简体,返回结果再用JS处理一遍。
我觉得肯定有更好的解决方式,希望大家能给点想法。
1
Agromania 2015-02-12 15:56:03 +08:00 1
如果内容不多,对准确要求高,建议维护简繁两个版本的内容,程序转换是不靠谱的。
比如简体“后”,解释是古代君主或帝王的妻子的时候,繁体是“后”,解释是空间或时间上与“前”相对的时候,繁体是“後” 这种情况非常之多。维护一个大词典,做分词和猜测意思,能够从某种程度上解决这个问题,但是古文中很多单字为句的,要联系上下文还要具备专业知识才能判断,不是程序能搞定的。 |
3
lichao 2015-02-12 16:03:09 +08:00 1
举个简单的例子
我们说 软件,他们说 軟體(软体) 我们说 缓存,他们说 快取 除非你的转换程序足够智能,否则还是维护两套内容吧 |
4
Agromania 2015-02-12 16:15:50 +08:00
如果内容是你自己维护的,又要追求准确,最好是简体繁体分别维护。
字典转换的库很不准确,转换出来的繁体在真正使用繁体的人眼里可能是笑话百出的 词典准确性要好的多,比如楼上说的,你对简体内容做分词,根据词典做单元匹配,把“软件”转换成“軟體”。这个词典会非常大,我记得看过一个,词数是千万条的量级。应该要放在后端处理,JS搞不定。但是还是会遇到一些无法分词匹配不上的情况, 比如“过年了,我家门上贴了一个 ‘发’ 字” 这里应该转成發,如果转成髪就要闹笑话了。 这个诗词网 http://sou-yun.com 有一个简繁转换的功能http://sou-yun.com/STConvert.aspx 也许不适用你的场景但是希望能对你有所启发,他们在转换的时候碰到1对多的情况 会分别告诉用户什么意思,让用户自己选择。 |
5
seki 2015-02-12 16:18:52 +08:00 1
opencc
wikipedia 也维护有一个较大的简繁转换库 这些也都不重,但是要 js 完成的话总得把一个数据库传输到用户浏览器里,我国的窄带网玩不动啊 |
6
Kilerd 2015-02-12 17:40:15 +08:00 via Android
直接做好i18n就好啦,
|
7
shiny 2015-02-12 17:41:49 +08:00
简体转繁体会有比较多的错误,繁体转简体问题会少很多。
|
8
tmqhliu 2015-02-12 17:49:07 +08:00
曾经用过繁体中文版的 Windows XP,用了一周时间,觉得界面有点乱,然后就果段重装……
|
9
abelyao 2015-02-12 19:12:05 +08:00
曾见过一个简繁切换做得非常好的网站,它是这样的:
cn.domain.com 为简体中文页面,面向大陆用户; hk.domain.com 为香港繁体页面,面向香港用户; tw.domain.com 为台湾繁体页面,面向台湾用户; 如果当前你在访问 cn.domain.com/abc/xyz.html 页面,然后点击切换到香港繁体,会直接进入 hk.domain.com/abc/xyz.html 去,页面的外观样式完全一样,但是接下来你就是在 hk 这个子域继续浏览了,体验很赞。 另外如果访问 domain.com 或者 www 的话,会根据 IP 地址所在地区自动跳入 cn / hk / tw。 |
10
blacktulip 2015-02-12 19:32:06 +08:00
楼主应该分开维护,非要维护一个的话,维护繁体比较靠谱
|