Java机器学习实例源码,一共有10个源码示例,机器学习入门。
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 126894 2016-04-26 13:55 MachineLearninginJava_CodeB03686_Software list.pdf
目录 0 2016-04-26 14:00 MachineLearninginJava_CodeCode
文件 417 2016-04-03 07:21 MachineLearninginJava_CodeCode.gitignore
目录 0 2016-04-26 13:44 MachineLearninginJava_CodeCodeMLJ-Chapter10
文件 402 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10.classpath
文件 372 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10.project
目录 0 2016-04-26 13:44 MachineLearninginJava_CodeCodeMLJ-Chapter10data
目录 0 2016-04-26 13:44 MachineLearninginJava_CodeCodeMLJ-Chapter10databc
目录 0 2016-04-26 13:43 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness
文件 2560 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 01.txt
文件 2252 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 02.txt
文件 1552 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 03.txt
文件 2412 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 04.txt
文件 1570 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 05.txt
文件 1187 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 06.txt
文件 1669 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 07.txt
文件 1922 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 08.txt
文件 1494 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 09.txt
文件 1449 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 10.txt
文件 1144 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 11.txt
文件 1847 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 12.txt
文件 1830 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 13.txt
文件 2981 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 14.txt
文件 3808 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 15.txt
文件 1393 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 16.txt
文件 1299 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 17.txt
文件 1002 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 18.txt
文件 1733 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 19.txt
文件 3854 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 20.txt
文件 2046 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 21.txt
文件 1933 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 22.txt
............此处省略3343个文件信息
import java.util.ArrayList;
import cc.mallet.types.*;
import cc.mallet.classify.Classifier;
import cc.mallet.classify.ClassifierTrainer;
import cc.mallet.classify.NaiveBayesTrainer;
import cc.mallet.classify.Trial;
import cc.mallet.pipe.*;
import cc.mallet.pipe.iterator.*;
import java.util.regex.*;
import java.io.*;
public class SpamDetector {
public static void main(String[] args){
String stopListFilePath = “data/stoplists/en.txt“;
String dataFolderPath = “data/ex6DataEmails/train“;
String testFolderPath = “data/ex6DataEmails/test“;
ArrayList pipeList = new ArrayList();
pipeList.add(new Input2CharSequence(“UTF-8“));
Pattern tokenPattern = Pattern.compile(“[\p{L}\p{N}_]+“);
pipeList.add(new CharSequence2TokenSequence(tokenPattern));
pipeList.add(new TokenSequenceLowercase());
pipeList.add(new TokenSequenceRemoveStopwords(new File(stopListFilePath) “utf-8“ false false false));
pipeList.add(new TokenSequence2FeatureSequence());
pipeList.add(new FeatureSequence2FeatureVector());
pipeList.add(new Target2Label());
SerialPipes pipeline = new SerialPipes(pipeList);
FileIterator folderIterator = new FileIterator(
new File[] {new File(dataFolderPath)}
new TxtFilter()
FileIterator.LAST_DIRECTORY);
InstanceList instances = new InstanceList(pipeline);
instances.addThruPipe(folderIterator);
ClassifierTrainer classifierTrainer = new NaiveBayesTrainer();
Classifier classifier = classifierTrainer.train(instances);
InstanceList testInstances = new InstanceList(classifier.getInstancePipe());
folderIterator = new FileIterator(
new File[] {new File(testFolderPath)}
new TxtFilter()
FileIterator.LAST_DIRECTORY);
testInstances.addThruPipe(folderIterator);
Trial trial = new Trial(classifier testInstances);
System.out.println(“Accuracy: “ + trial.getAccuracy());
System.out.println(“F1 for class ‘spam‘: “ + trial.getF1(“spam“));
System.out.println(“Precision for class ‘“ +
classifier.getLabelAlphabet().lookupLabel(1) + “‘: “ +
trial.getPrecision(1));
System.out.println(“Recall for class ‘“ +
classifier.getLabelAlphabet().lookupLabel(1) + “‘: “ +
trial.getRecall(1));
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 126894 2016-04-26 13:55 MachineLearninginJava_CodeB03686_Software list.pdf
目录 0 2016-04-26 14:00 MachineLearninginJava_CodeCode
文件 417 2016-04-03 07:21 MachineLearninginJava_CodeCode.gitignore
目录 0 2016-04-26 13:44 MachineLearninginJava_CodeCodeMLJ-Chapter10
文件 402 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10.classpath
文件 372 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10.project
目录 0 2016-04-26 13:44 MachineLearninginJava_CodeCodeMLJ-Chapter10data
目录 0 2016-04-26 13:44 MachineLearninginJava_CodeCodeMLJ-Chapter10databc
目录 0 2016-04-26 13:43 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness
文件 2560 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 01.txt
文件 2252 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 02.txt
文件 1552 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 03.txt
文件 2412 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 04.txt
文件 1570 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 05.txt
文件 1187 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 06.txt
文件 1669 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 07.txt
文件 1922 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 08.txt
文件 1494 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 09.txt
文件 1449 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 10.txt
文件 1144 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 11.txt
文件 1847 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 12.txt
文件 1830 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 13.txt
文件 2981 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 14.txt
文件 3808 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 15.txt
文件 1393 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 16.txt
文件 1299 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 17.txt
文件 1002 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 18.txt
文件 1733 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 19.txt
文件 3854 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 20.txt
文件 2046 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 21.txt
文件 1933 2016-04-03 07:21 MachineLearninginJava_CodeCodeMLJ-Chapter10databcusiness 22.txt
............此处省略3343个文件信息
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。
评论列表(条)