郑捷《机器学习算法原理与编程实践》第2-9章各章节的算法源码及数据集


郑捷《机器学习算法原理与编程实践》第2-9章各章节的算法源码及数据集
资源截图
代码片段和文件信息
from numpy import *
import matplotlib.pyplot as plt
import sys

def LongToInt(value):
    assert isinstance(value (int long))
    return int(value & sys.maxint)

def loadDataSet(fileName) :
recordlist = []
fp = open(fileName“rb“)
content = fp.read()
fp.close()
rowlist = content.splitlines()
#print rowlist
recordlist = [map(evalrow.split(“ “)) for row in rowlist if row.strip()]
#recordlist = [row.split(‘ ‘) for row in rowlist if row.strip()]
mn = shape(recordlist)
dataSet = mat(recordlist)[::-1]
for i in xrange(m) :
if recordlist[i][-1] == 0.0 :
recordlist[i][-1] = -1.0
labels = mat(recordlist)[:-1].T
return dataSetlabels

def plotROC(predStrengthsclassLabels) :
# mn = shape(classLabels)
# print mn
# print type(classLabels)
# print classLabels
cur = (1.01.0)
ySum = 0.0
numPosClas = sum(array(classLabels) == 1.0)
yStep = 1/float(numPosClas)
xStep =1/float(len(classLabels) - numPosClas)
sortedIndicies = predStrengths.argsort()
# print sortedIndicies
fig = plt.figure()
fig.clf()
ax = plt.subplot(111)
for index in sortedIndicies.tolist()[0] :
if classLabels[0index] == 1.0 :
delX = 0
delY = yStep
else :
delX = xStep
delY = 0
ySum += cur[1]
ax.plot([cur[0]cur[0] - delX][cur[1]cur[1]-delY]c=‘b‘)
cur = (cur[0] - delXcur[1]-delY)
ax.plot([01][01]‘b--‘)
plt.xlabel(‘False positive rate‘)
plt.ylabel(‘True positive rate‘)
plt.title(‘ROC curve for AdaBoost horse colic datection system‘)
ax.axis([0101])
plt.show()
print “the Area Under the Cure is:“ySum*xStep

def decisionTree(dataSetlabellistD) :
dataMat = mat(dataSet)
labelMat = mat(labellist).T
mn = shape(dataMat)
numSteps = 10.0
bestFeat = {}
bestClass = mat(zeros((m1)))
minError = inf
for i in xrange(n) :
#rangeMin = dataMat[:i].min()
# print dataMat[:i]
rangeMin = dataMat[:i].min()
rangeMax = dataMat[:i].max()
stepSize = (rangeMax - rangeMin)/numSteps
for j in xrange(-1int(numSteps) + 1) :
for operator in [‘lt‘‘gt‘] :
threshVal = (rangeMin + float(j) * stepSize)
predictedVals = splitDataSet(dataMatithreshValoperator)
# print predictedVals
# ddd
errSet = mat(ones((m1)))
errSet[predictedVals == labelMat] = 0
weightedError = D.T*errSet
if weightedError < minError :
minError = weightedError
bestClass = predictedVals.copy()
bestFeat[‘dim‘] = i
bestFeat[‘thresh‘] = threshVal
bestFeat[‘oper‘] = operator
return bestFeatminErrorbestClass

def adaBoostTrain(dataSetlabellistnumIt=40) :
weakClassSet = []
m = shape(dataSet)[0]
D = mat(ones((m1))/m)
# print “D = “D
aggClassSet = mat(zeros((m1)))
for i in xrange(numIt) :
bestFeaterrorEstClass = decisionTree(dataSetlabellistD)
alpha = float(0.5 * log((1-error)/max(error1e-16)))
bestFeat[‘alpha‘] = alpha
weakClassSet.append(bestFeat)
wtx = multiply(-1*alpha*mat(labellist)

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2017-11-11 10:04  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集
     目录           0  2017-10-01 22:38  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集KNN
     文件        2746  2017-10-01 22:38  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集KNNKNN.py
     目录           0  2017-09-24 16:34  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集KNN\__pycache__
     文件        3503  2017-09-24 16:34  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集KNN\__pycache__Nbayes_lib.cpython-34.pyc
     目录           0  2017-11-11 10:04  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCA
     文件        2882  2017-11-06 17:26  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAMyPCA.py
     文件        4399  2017-11-06 17:26  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAMyPCA.pyc
     目录           0  2017-11-11 10:04  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatt
     目录           0  2017-11-11 10:04  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts1
     文件       10318  1994-04-18 14:17  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts11.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts110.pgm
     文件       10318  1994-04-18 14:17  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts12.pgm
     文件       10318  1994-04-18 14:17  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts13.pgm
     文件       10318  1994-04-18 14:17  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts14.pgm
     文件       10318  1994-04-18 14:17  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts15.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts16.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts17.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts18.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts19.pgm
     目录           0  2017-11-11 10:04  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts10
     文件       10318  1994-04-18 14:18  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts101.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts1010.pgm
     文件       10318  1994-04-18 14:18  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts102.pgm
     文件       10318  1994-04-18 14:18  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts103.pgm
     文件       10318  1994-04-18 14:18  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts104.pgm
     文件       10318  1994-04-18 14:18  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts105.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts106.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts107.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts108.pgm
     文件       10318  1994-04-18 14:07  郑捷《机器学习算法原理与编程实践》第2-9章节的源代码及数据集PCAatts109.pgm
............此处省略5190个文件信息

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。

发表评论

评论列表(条)