机器学习-文档建模


1、掌握选择term的方法; 2、权重计算(TermWeighting):即计算每篇文 权重计算(Term Weighting):即计算每篇文 档中每个term的权重,计算TF、IDF; 3、查询和文档的相似度计算(Siili • 查询和文档的相似度计算(Similarity Computation)。
资源截图
代码片段和文件信息
// stdafx.cpp : 只包括标准包含文件的源文件
// VSM.pch 将作为预编译头
// stdafx.obj 将包含预编译类型信息

#include “stdafx.h“

// TODO: 在 STDAFX.H 中引用任何所需的附加头文件,
//而不是在此文件中引用

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件    2883584  2017-05-22 19:44  VSM-YYCipchvsm-ecba59c9vsm-6b86ff20.ipch

     文件       2777  2016-05-14 21:56  VSM-YYCVSMChinese-StopWords.txt

     文件     144527  2017-05-09 15:22  VSM-YYCVSMinput.txt

     文件       1414  2017-05-16 15:07  VSM-YYCVSMkmeans.txt

     文件       1482  2017-05-09 14:43  VSM-YYCVSMReadMe.txt

     文件        207  2017-05-09 14:43  VSM-YYCVSMstdafx.cpp

     文件        234  2017-05-09 14:43  VSM-YYCVSMstdafx.h

     文件        240  2017-05-09 14:43  VSM-YYCVSM argetver.h

     文件       5092  2017-05-16 15:06  VSM-YYCVSMVSM.cpp

     文件       8053  2017-05-16 11:20  VSM-YYCVSMVSM.vcxproj

     文件       1310  2017-05-09 14:43  VSM-YYCVSMVSM.vcxproj.filters

     文件     343024  2017-05-16 15:07  VSM-YYCVSM所有文本之间的相似度.txt

     文件        504  2017-05-16 15:07  VSM-YYCVSM相似度大于定值的文本.txt

     文件    8519680  2017-05-22 19:44  VSM-YYCVSM.sdf

     文件       1291  2017-05-09 14:43  VSM-YYCVSM.sln

    ..A..H.     13824  2017-05-22 19:44  VSM-YYCVSM.v12.suo

     目录          0  2017-05-22 19:44  VSM-YYCipchvsm-ecba59c9

     目录          0  2017-05-22 19:44  VSM-YYCipch

     目录          0  2017-05-18 21:15  VSM-YYCVSM

     目录          0  2017-05-22 19:44  VSM-YYC

----------- ---------  ---------- -----  ----

             11927243                    20


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。

发表评论

评论列表(条)