1
levon 2013-08-23 12:10:59 +08:00
|
2
qdvictory 2013-08-23 12:19:58 +08:00
|
3
qdvictory 2013-08-23 12:21:23 +08:00
汗,我理解错了,sorry- -
|
4
qdcanyun 2013-08-23 12:37:06 +08:00
|
5
leiz 2013-08-23 12:45:29 +08:00
python有中文文字转拼音的库,不过效率不清楚
|
6
200 2013-08-23 12:56:06 +08:00
要做准确的话 就要分词 不然多音字会有问题
|
7
felix021 2013-08-23 13:32:53 +08:00
顶@200 。汉字转拼音的数据和代码很多,但是搞不定多音字,前面的那些回答都没啥用。要解决多音字,必须从语义层面入手。分词是一个比较好的方法,但是最终的实现还是需要一个"词语->拼音"的数据库,这个貌似不太好找。
|
9
kittenll 2013-08-23 14:56:30 +08:00 1
利用自然语言统计模型处理,可以很好的处理多音字的问题。比如HMM(隐马尔土科夫模型)。如果计算资源足够的话,可以使用n>2,不然使用n=2就可以了。
|