测试用的文本聚类程序,使用的是kmeans算法进行聚类。
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 487 2011-04-10 16:37 TextClustering.classpath
文件 784 2011-04-10 18:00 TextClustering.myeclipseprofilerProgram (1).xml
文件 390 2011-04-10 15:50 TextClustering.project
文件 629 2011-04-10 15:50 TextClustering.settingsorg.eclipse.jdt.core.prefs
文件 446 2011-04-11 09:56 TextClusteringincneduhitinput.txt
文件 250 2011-04-10 18:50 TextClusteringincneduhitITokeniser.class
文件 4491 2011-04-11 09:59 TextClusteringincneduhitProgram.class
文件 3251 2011-04-10 18:50 TextClusteringincneduhitReadFiles.class
文件 1873 2011-04-10 18:50 TextClusteringincneduhitStopWordsHandler.class
文件 1201 2011-04-10 18:50 TextClusteringincneduhitTermVector.class
文件 7351 2011-04-10 18:50 TextClusteringincneduhitTFIDFMeasure.class
文件 1584 2011-04-10 18:50 TextClusteringincneduhitTokeniser.class
文件 1118 2011-04-10 18:50 TextClusteringincneduhitWawaCluster.class
文件 2952 2011-04-10 20:40 TextClusteringincneduhitWawaKMeans.class
文件 40 2011-04-10 17:36 TextClusteringdirfile1.txt
文件 27 2011-04-11 09:58 TextClusteringdirfile10.txt
文件 46 2011-04-11 09:58 TextClusteringdirfile11.txt
文件 38 2011-04-11 09:58 TextClusteringdirfile12.txt
文件 39 2011-04-11 09:59 TextClusteringdirfile13.txt
文件 28 2011-04-11 09:57 TextClusteringdirfile2.txt
文件 22 2011-04-11 09:57 TextClusteringdirfile3.txt
文件 16 2011-04-11 09:57 TextClusteringdirfile4.txt
文件 28 2011-04-11 09:57 TextClusteringdirfile5.txt
文件 47 2011-04-11 09:57 TextClusteringdirfile6.txt
文件 22 2011-04-11 09:58 TextClusteringdirfile7.txt
文件 23 2011-04-11 09:58 TextClusteringdirfile8.txt
文件 46 2011-04-11 09:58 TextClusteringdirfile9.txt
文件 893163 2011-04-10 09:46 TextClusteringlibje-analysis-1.5.3.jar
文件 818961 2011-04-10 16:36 TextClusteringliblucene-core-2.4.0.jar
文件 446 2011-04-11 09:56 TextClusteringsrccneduhitinput.txt
............此处省略26个文件信息
package cn.edu.hit;
import java.util.List;
///
/// 分词器接口
///
public interface ITokeniser {
List partition(String input);
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 487 2011-04-10 16:37 TextClustering.classpath
文件 784 2011-04-10 18:00 TextClustering.myeclipseprofilerProgram (1).xm
文件 390 2011-04-10 15:50 TextClustering.project
文件 629 2011-04-10 15:50 TextClustering.settingsorg.eclipse.jdt.core.prefs
文件 446 2011-04-11 09:56 TextClusteringincneduhitinput.txt
文件 250 2011-04-10 18:50 TextClusteringincneduhitITokeniser.class
文件 4491 2011-04-11 09:59 TextClusteringincneduhitProgram.class
文件 3251 2011-04-10 18:50 TextClusteringincneduhitReadFiles.class
文件 1873 2011-04-10 18:50 TextClusteringincneduhitStopWordsHandler.class
文件 1201 2011-04-10 18:50 TextClusteringincneduhitTermVector.class
文件 7351 2011-04-10 18:50 TextClusteringincneduhitTFIDFMeasure.class
文件 1584 2011-04-10 18:50 TextClusteringincneduhitTokeniser.class
文件 1118 2011-04-10 18:50 TextClusteringincneduhitWawaCluster.class
文件 2952 2011-04-10 20:40 TextClusteringincneduhitWawaKMeans.class
文件 40 2011-04-10 17:36 TextClusteringdirfile1.txt
文件 27 2011-04-11 09:58 TextClusteringdirfile10.txt
文件 46 2011-04-11 09:58 TextClusteringdirfile11.txt
文件 38 2011-04-11 09:58 TextClusteringdirfile12.txt
文件 39 2011-04-11 09:59 TextClusteringdirfile13.txt
文件 28 2011-04-11 09:57 TextClusteringdirfile2.txt
文件 22 2011-04-11 09:57 TextClusteringdirfile3.txt
文件 16 2011-04-11 09:57 TextClusteringdirfile4.txt
文件 28 2011-04-11 09:57 TextClusteringdirfile5.txt
文件 47 2011-04-11 09:57 TextClusteringdirfile6.txt
文件 22 2011-04-11 09:58 TextClusteringdirfile7.txt
文件 23 2011-04-11 09:58 TextClusteringdirfile8.txt
文件 46 2011-04-11 09:58 TextClusteringdirfile9.txt
文件 893163 2011-04-10 09:46 TextClusteringlibje-analysis-1.5.3.jar
文件 818961 2011-04-10 16:36 TextClusteringliblucene-core-2.4.0.jar
文件 446 2011-04-11 09:56 TextClusteringsrccneduhitinput.txt
............此处省略26个文件信息
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。
评论列表(条)