今天看到了一篇文章 Generating naming languages,介绍了根据语音组合法,将元音、辅音组成音节,再根据拼写特征,组成词语的思路。 还有具体实现的例子。 不过可能是构造规则比较简单的缘故,构造出来的词语还是不太合理,比如可能构造出像 pulkerkervrelkerkelg、Apipalipipow、Selpulreln 这样的词,正常人是不会这么发音和组词的。
对这一块了解不深,不知道现在有没有更好的这类单词生成器,如果指定符合英语规律,生成的词看上去能够确实像英语,也可以自定义人造语言的规律。
1
takato 2018-06-11 23:03:53 +08:00
个人认为可以考虑“炼丹学习”一下。
当然首先要解决 Sampling 的问题,以什么作为采样数据。 个人觉得可以以单个音素来进行 onehot 编码。然后尝试导入模型寻找音素之间的 Pattern 联系. 简单扫描了一下那一段代码,目测作者是人工提取了一些特征,不过在随机拼入的时候可能并没有考虑到上下文音节和音素的影响。 |
2
dallaslu 2018-06-12 00:31:13 +08:00 via iPhone
听上去好像很适合用来取名字啊。比如宜家的产品命名…
|
3
param 2018-06-12 02:31:37 +08:00 via Android
我今天刚好也想到这个。有更新的话 @我一下谢谢
|
4
WildCat 2018-06-12 02:58:11 +08:00
炼丹学习+1
LSTM RNN 的一个比较基础的示例就是生成单词。 |