参考 Andraw Ng的介绍 写的主成分分析工具。
为进行矩阵运算,使用了scipy包,在ubuntu下使用 sudo apt-get install python3-scipy 安装。
命令行:
./pca.py --train data.txt --result result.txt
其它主要参数:
训练文件:每行一个样本,项用空格隔开。第一项的字符串是样本id(可选,参见 --with_id 参数)。后面是特定格式向量(参见 --vector 参数)。
结果文件:每行一个文本,每一项用空格隔开。第一项的字符串是样本id(可选,参见 --with_id 参数)。后面是向量各维分量。