基于weka的文本分类器


这一我自己写的weka文本分类器,里面有代码的注视,也有样本数据,可以方便大家入门使用
资源截图
代码片段和文件信息
package ICTCLAS.I3S.AC;
import java.io.*;
public class ICTCLAS50
{
//public enum eCodeType
//{
//    CODE_TYPE_UNKNOWN//type unknown 
//    CODE_TYPE_ASCII//ASCII
//    CODE_TYPE_GB//GB2312GBKGB10380
//    CODE_TYPE_UTF8//UTF-8
//    CODE_TYPE_BIG5//BIG5
//}

public native boolean ICTCLAS_Init(byte[] sPath);
public native boolean ICTCLAS_Exit();
public native int ICTCLAS_ImportUserDictFile(byte[] sPathint eCodeType);
public native int ICTCLAS_SaveTheUsrDic();
public native int ICTCLAS_SetPOSmap(int nPOSmap);
public native boolean ICTCLAS_FileProcess(byte[] sSrcFilename int eCodeType int bPOSTaggedbyte[] sDestFilename);
public native byte[] ICTCLAS_ParagraphProcess(byte[] sSrc int eCodeType int bPOSTagged);
public native byte[] nativeProcAPara(byte[] sSrc int eCodeType int bPOStagged);
/* Use static intializer */
static
{
System.loadLibrary(“ICTCLAS50“);
}
}



 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        374  2015-03-03 09:22  Classifier.classpath

     文件        386  2015-02-07 09:10  Classifier.project

     文件        598  2015-02-07 09:10  Classifier.settingsorg.eclipse.jdt.core.prefs

     文件        727  2015-03-03 09:22  ClassifierinICTCLASI3SACICTCLAS50.class

     文件       7423  2015-03-03 09:22  ClassifierinluoyangMessageClassifier.class

     文件       4396  2015-03-03 09:22  ClassifierinutilDirectoryUtil.class

     文件        903  2015-03-03 09:22  ClassifierinutilDirFilter.class

     文件       1198  2015-03-03 09:22  ClassifierinutilICTCLASUtils.class

     文件    8067154  2015-02-09 21:52  ClassifierClassifier.model

     文件       1042  2015-02-07 09:15  ClassifierConfigure.xml

     文件    3520144  2015-01-20 12:59  ClassifierDataBiWord.big

     文件     524280  2015-01-20 12:59  ClassifierDatacharacter.idx

     文件      65540  2015-01-20 12:59  ClassifierDatacharacter.type

     文件    1696620  2015-01-20 12:59  ClassifierDataCoreDict.pdat

     文件    1786424  2015-01-20 12:59  ClassifierDataCoreDict.pos

     文件     478168  2015-01-20 12:59  ClassifierDataCoreDict.unig

     文件     262236  2015-01-20 12:59  ClassifierDataFieldDict.pdat

     文件         72  2015-01-20 12:59  ClassifierDataFieldDict.pos

     文件    1978128  2015-01-20 12:59  ClassifierDataGranDict.pdat

     文件    1778776  2015-01-20 12:59  ClassifierDataGranDict.pos

     文件      37253  2015-01-20 12:59  ClassifierDataICTCLAS30.ctx

     文件        288  2015-01-20 12:59  ClassifierDataICTCLAS_First.map

     文件        406  2015-01-20 12:59  ClassifierDataICTPOS.map

     文件       2213  2015-01-20 12:59  ClassifierData
r.ctx

     文件       3008  2015-01-20 12:59  ClassifierData
r.fsa

     文件    1757200  2015-01-20 12:59  ClassifierData
r.role

     文件        307  2015-01-20 12:59  ClassifierDataPKU.map

     文件        288  2015-01-20 12:59  ClassifierDataPKU_First.map

     文件        217  2015-02-09 21:52  ClassifierICTCLAS.log

     文件     240640  2015-02-07 09:15  ClassifierICTCLAS50.dll

............此处省略1638个文件信息

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。

发表评论

评论列表(条)