向量空间模型 JAVA改进版


向量空间模型(VSM)的JAVA实现,从文档表示到相似度计算,使用两种相似度计算方式:cos和tf-idf算法,对错误进行修改
资源截图
代码片段和文件信息
import java.util.*;

public class Doc {
int length;  //该文章term个数
Vector termVec; //该文章term集合
public Doc() { 
length = 0;
termVec = new Vector();
}
public String toString()
{
String s=“
The length is :“+this.length;
for(String t:termVec)
{
s+=t+“
“;
}
return s;
}
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2014-06-19 11:17  src
     文件        3680  2014-06-19 09:35  srcChineseStopWords.txt
     文件         344  2014-06-19 09:37  srcDoc.java
     文件         164  2014-06-19 09:38  srcDocSimilarity.java
     文件     8221775  2014-06-19 09:50  srcedited1988.txt
     文件       11950  2014-06-19 13:53  srcedited2014.txt
     文件       11648  2014-06-19 13:51  srcSimilarity.java
     文件         536  2014-06-19 09:38  srcTerm.java

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。

发表评论

评论列表(条)