主成分分析(PCA)
LDA主题模型
Enter search terms or a module, class or function name.
简单但实用的k-means聚类算法。
为提高代数运算速度,使用了numpy包,在ubuntu下使用 sudo apt-get install python3-numpy 安装。
./k-means.py –train data.txt –result result.txt
其它主要参数:
训练文件:每行一个样本,项用空格隔开。第一项的字符串是样本id。后面m项为样本坐标。
结果文件:每行一个文本,每一项用空格隔开。第一项的字符串是样本id。后面的项依次为与样本最近的n个聚类中心的编号。