vsm向量空间模型java实现源码


vsm向量空间模型java实现(源码) 已经测试了,可以直接导入eclipse使用。
资源截图
代码片段和文件信息
/**
 * @author Orisun
 * 打印输出微量空间模型中每个特征项出现的顺序
 */
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.HashMap;

public class OutFeatureHash {
    final int vec_len = 1000;
    public static HashMap features = new HashMap();// 存放最终选择的特征词

    // 从文件中读入特征项。参数文件存储经过特征选择后剩下的特征项。
    public void initFeatures(File file) {
        features.clear();
        try {
            FileReader fr = new FileReader(file);
            BufferedReader br = new BufferedReader(fr);
            String line = null;
            int i = 0;
            while ((line = br.readLine()) != null && i++ < vec_len) {
                String[] words = line.split(“\s+“);
                features.put(words[0] Double.valueOf(words[1]));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    public static void main(String[] args){
        OutFeatureHash inst=new OutFeatureHash();
        inst.initFeatures(new File(“/home/orisun/master/fudan_corpus/4000_features“));
        object[] feature_array = features.keySet().toArray();
        File seqfile=new File(“/home/orisun/master/fudan_corpus/vsm_termsequence_1000“);
        try {
            if(!seqfile.exists())
                seqfile.createNewFile();
            FileWriter fw=new FileWriter(seqfile);
            BufferedWriter bw=new BufferedWriter(fw);
            for (int i = 0; i < feature_array.length; i++) {
                String feat = feature_array[i].toString();
                bw.write(feat+“ “);        //用一个空格隔开
            }    
            bw.flush();
            bw.close();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2015-12-24 10:41  vsm向量空间模型java实现
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidf
     文件         301  2015-12-23 13:53  vsm向量空间模型java实现ifidf.classpath
     文件         381  2015-12-23 13:53  vsm向量空间模型java实现ifidf.project
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidf.settings
     文件         598  2015-12-23 13:53  vsm向量空间模型java实现ifidf.settingsorg.eclipse.jdt.core.prefs
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfin
     目录           0  2015-12-24 10:31  vsm向量空间模型java实现ifidfinalgorithm
     文件       28966  2015-12-15 15:30  vsm向量空间模型java实现ifidfinarticle.txt
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfincom
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfincomaseframework
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfincomaseframeworksort
     文件        4742  2015-12-24 10:28  vsm向量空间模型java实现ifidfincomaseframeworksortVsmMain.class
     文件     1212694  2012-09-06 16:56  vsm向量空间模型java实现ifidfinIKAnalyzer-2012.jar
     文件     1398580  2012-09-06 16:57  vsm向量空间模型java实现ifidfinlucene-core-3.4.0.jar
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfinorg
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfinorgwltea
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfinorgwlteaanalyzer
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfinorgwlteaanalyzercore
     文件     1212694  2015-12-23 13:57  vsm向量空间模型java实现ifidfinorgwlteaanalyzercoreIKAnalyzer-2012.jar
     文件     1398580  2015-12-23 13:57  vsm向量空间模型java实现ifidfinorgwlteaanalyzercorelucene-core-3.4.0.jar
     文件        2860  2015-12-24 10:18  vsm向量空间模型java实现ifidfinOutFeatureHash.class
     文件       17768  2015-12-15 15:26  vsm向量空间模型java实现ifidfinsort.txt
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfsrc
     目录           0  2015-12-24 10:31  vsm向量空间模型java实现ifidfsrcalgorithm
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfsrccom
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfsrccomaseframework
     目录           0  2015-12-24 10:40  vsm向量空间模型java实现ifidfsrccomaseframeworksort
     文件        3469  2015-12-24 10:28  vsm向量空间模型java实现ifidfsrccomaseframeworksortVsmMain.java
     文件     1212694  2012-09-06 16:56  vsm向量空间模型java实现ifidfsrcIKAnalyzer-2012.jar
     文件     1398580  2012-09-06 16:57  vsm向量空间模型java实现ifidfsrclucene-core-3.4.0.jar
............此处省略11个文件信息

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。

发表评论

评论列表(条)