Quantcast
Channel: 数据科学中的R和Python
Viewing all articles
Browse latest Browse all 85

基于深度LSTM的中文分词

$
0
0
本例尝试的用多层LSTM来玩中文分词,大部分代码和之前的文章是一样的。不一样的就是使用了更复杂的模型,用了多个LSTM叠加在一起。这对于句子这种有时序特征的数据更有帮助。在前面部分的代码是计算了字向量,但是发现是没有太大必要。除了用多层LSTM,后面还尝试了双向LSTM,效果也还可以。


Viewing all articles
Browse latest Browse all 85

Trending Articles