训练
./lda.py --train training_docs.txt --model model.txt --result training_result.txt
预测
./lda.py --predict test_docs.txt --model model.txt --result test_result.txt
其它主要参数:
训练、预测文件:每行为一个文本,文本中的词用空格隔开。
模型文件:第一行为模型的 alpha 和 beta ,余下的行每行三个值 topic word freq 为主题 topic 下词 word 的权重。
结果文件:每行一个文本,每一项用空格隔开。前`K`项为文本主题分布,后面的项为每个词及其对应的主题。