中文文本分类语料复旦-训练集
标签:
•
文件类型: .rar
•
文件大小: 50.38MB
•
下载次数: 1
•
这个链接是训练集,测试集请见我的资源
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 52827271 2013-05-15 21:07 617249.rar
文件 531 2011-09-01 09:08 README-datatang.txt
文件 132 2013-05-23 17:27 url.txt
----------- --------- ---------- ----- ----
52827934 3
----------- --------- ---------- ----- ----
文件 52827271 2013-05-15 21:07 617249.rar
文件 531 2011-09-01 09:08 README-datatang.txt
文件 132 2013-05-23 17:27 url.txt
----------- --------- ---------- ----- ----
52827934 3
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。
评论列表(条)