LDA主题模型¶

调用¶

训练

./lda.py --train training_docs.txt --model model.txt --result training_result.txt

预测

./lda.py --predict test_docs.txt --model model.txt --result test_result.txt

其它主要参数：

训练、预测文件：每行为一个文本，文本中的词用空格隔开。

模型文件：第一行为模型的 alpha 和 beta ，余下的行每行三个值 topic word freq 为主题 topic 下词 word 的权重。

结果文件：每行一个文本，每一项用空格隔开。前`K`项为文本主题分布，后面的项为每个词及其对应的主题。