向量空间模型 JAVA改进版
向量空间模型(VSM)的JAVA实现,从文档表示到相似度计算,使用两种相似度计算方式:cos和tf-idf算法,对错误进行修改
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2014-06-19 11:17 src
文件 3680 2014-06-19 09:35 srcChineseStopWords.txt
文件 344 2014-06-19 09:37 srcDoc.java
文件 164 2014-06-19 09:38 srcDocSimilarity.java
文件 8221775 2014-06-19 09:50 srcedited1988.txt
文件 11950 2014-06-19 13:53 srcedited2014.txt
文件 11648 2014-06-19 13:51 srcSimilarity.java
文件 536 2014-06-19 09:38 srcTerm.java
import java.util.*;
public class Doc {
int length; //该文章term个数
Vector termVec; //该文章term集合
public Doc() {
length = 0;
termVec = new Vector();
}
public String toString()
{
String s=“
The length is :“+this.length;
for(String t:termVec)
{
s+=t+“
“;
}
return s;
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2014-06-19 11:17 src
文件 3680 2014-06-19 09:35 srcChineseStopWords.txt
文件 344 2014-06-19 09:37 srcDoc.java
文件 164 2014-06-19 09:38 srcDocSimilarity.java
文件 8221775 2014-06-19 09:50 srcedited1988.txt
文件 11950 2014-06-19 13:53 srcedited2014.txt
文件 11648 2014-06-19 13:51 srcSimilarity.java
文件 536 2014-06-19 09:38 srcTerm.java
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。
评论列表(条)