第一步:
设计一个中立语言,实现中立语言到中文、英语等语言的转换。
中立语言要求设计成为易于计算机理解,易于转换到其它语言。
书写的时候就明确指定语句的意思,后期计算机就能自动翻译到其他语言了。
不过感觉这个会比重建一个维基百科的难度还大 9999999 倍。
第二步
中文、英文等语言到中立语言转化。
将互联网上的资料转换到中立语言。
歧义、歧义、歧义!
第三步
将第二步获得的中立语言资料的内容抽取出来,建立一个已经建好索引的资料库。
不过这个资料库会出现好多逻辑错误...
不要求全部实现,第一步实现就能节省很多翻译的工作了。
1
XianZaiZhuCe 2015-12-05 21:12:41 +08:00 via Android
这跟人工智能有啥关系?
|
2
watzds 2015-12-05 21:13:48 +08:00 via Android
中立语言,英语?
|
3
dikcen 2015-12-05 21:14:05 +08:00
|
4
nbndco 2015-12-05 21:23:24 +08:00 via iPhone
我觉得在对 NLP 展开各种宏大想象之前至少先理解一下 NLP 吧
|
5
RqPS6rhmP3Nyn3Tm 2015-12-05 22:12:53 +08:00 via Android
有很多人造语言,你说的应该是理语,也叫逻辑语。
然而并没有什么卵用,连世界语使用者都比它多 |
6
Yvette 2015-12-05 22:23:21 +08:00 via iPhone
手语
|
7
msg7086 2015-12-06 07:35:28 +08:00
没有歧义?来我们先学法语吧。
|
8
haogefeifei 2015-12-06 11:58:42 +08:00
逗。
|
9
gamexg OP @XianZaiZhuCe 原因当时刚刚在 V2EX 看到了要抛弃身体变成人工智能的帖子...
@watzds @dikcen @BXIA @Yvette @msg7086 知道世界语之类的语言,但是不是这种类型的。设想中立语言并不是可读、可书写的语言,而是附带很多属性的,恐怕只能通过计算机使用的语言,例如: 录入“我很悲伤”这句话时计算机会猜测一些属性(歧义)要用户确认,例如"我"会标识性别属性,悲伤会标识程度、类型之类的属性。 语言本身就附带这些属性,感觉向其它语言转换就容易些了。当然建立这些资料的难度也是很难实现的。猜测只有单词量少、语义简单的环境才有可能实现,计算机 API 之类的文档环境可能有点希望... @nbndco NLP 只知道目前主流是通过神经网络、统计学做的, 语义规则的难度太大,已经不是主流了。主要的难度就是歧义、模糊性,但是第一步试图将这个麻烦在书写时由人类解决掉,或者说第一步实现的目标是一次书写,自动输出多种语言。不过前面也说了感觉这个的难度也是近乎不可能实现的... |
10
watzds 2015-12-06 18:29:01 +08:00 via Android
然而大家说的都是中文,却很难交流
|
11
yangzh 2015-12-06 18:59:52 +08:00 via iPhone
llvm
|
12
nbndco 2015-12-06 20:57:01 +08:00
@gamexg 你要做的事情没有意义,只不过你把当前的计算机保存语义信息的任何方法起了个名字,把那些二进制信息起名叫做“ XX 中立语言”罢了。然后难点又在第二步,那你的中立语言究竟有何意义?
如果你说要显式定义中间变量的表现形式,这样的优越性何在?不就是你说的几十年来的规则。 |
13
miao1007 2015-12-07 22:58:01 +08:00
你需要垠语言
|
14
evilic 2015-12-08 09:15:55 +08:00
"中立语言要求设计成为易于计算机理解",看看中立语言搞成 0 和 1 可以么?易于机器理解,而且还像阿拉伯数字那样中立……
|