利用搜索引擎的原理实现的聊天机器人效果差强人意,为了对庞大的语料库进一步运用,打算利用 LSTM-RNN 来做训练,第一步需要把中文语料转成算法可以识别的向量形式,最强大的 word embedding 工具莫过于 word2vec 了,本节跟大家分享我是怎么用三千万影视剧字幕语料库生成词向量的
评论