Python数据挖掘入门与实践.zip code


Python数据挖掘入门与实践.zip (code)
资源截图
代码片段和文件信息
import os
import re
from mrjob.job import MRJob
from mrjob.step import MRStep

word_search_re = re.compile(r“[w‘]+“)


class ExtractPosts(MRJob):

    post_start = False
    post = []

    def mapper(self key line):
        filename = os.environ[“map_input_file“]
        gender = filename.split(“.“)[1]
        try:
            docnum = int(filename[0])
        except:
            docnum = 8
        if filename.startswith(“51“):
            # remove leading and trailing whitespace
            line = line.strip()
            if line == ““:
                self.post_start = True
            elif line == “
“:
                self.post_start = False
                yield gender repr(“
“.join(self.post))
                self.post = []
            elif self.post_start:
                self.post.append(line)



if __name__ == ‘__main__‘:
    ExtractPosts.run()

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2018-03-06 19:04  #Python数据挖掘入门与实践
     目录           0  2018-03-09 17:16  #Python数据挖掘入门与实践Code_REWRITE
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 1
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 10
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 10.ipynb_checkpoints
     文件      434745  2015-06-28 15:31  #Python数据挖掘入门与实践Code_REWRITEChapter 10.ipynb_checkpointsChapter 10 (Cluster Types)-checkpoint.ipynb
     文件       64766  2015-06-28 15:36  #Python数据挖掘入门与实践Code_REWRITEChapter 10.ipynb_checkpointsChapter 10 Clusterer-checkpoint.ipynb
     文件     1100672  2015-06-28 15:34  #Python数据挖掘入门与实践Code_REWRITEChapter 10.ipynb_checkpointsChapter 10 Image creation 10_02.png-checkpoint.ipynb
     文件          72  2015-06-28 15:29  #Python数据挖掘入门与实践Code_REWRITEChapter 10.ipynb_checkpointsChapter 10-checkpoint.ipynb
     文件       78925  2015-06-28 15:40  #Python数据挖掘入门与实践Code_REWRITEChapter 10Chapter 10 Clusterer.ipynb
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 11
     文件       58837  2015-06-28 15:17  #Python数据挖掘入门与实践Code_REWRITEChapter 11Chapter 11 (CIFAR).ipynb
     文件       62409  2015-06-28 15:02  #Python数据挖掘入门与实践Code_REWRITEChapter 11Chapter 11 (Theano and Lasagne).ipynb
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 12
     文件       38759  2015-06-28 15:22  #Python数据挖掘入门与实践Code_REWRITEChapter 12CH12 MapReduce Basics.ipynb
     文件       10578  2015-05-08 19:56  #Python数据挖掘入门与实践Code_REWRITEChapter 12Chapter 12 (NB Predict).ipynb
     文件        1730  2015-05-08 06:35  #Python数据挖掘入门与实践Code_REWRITEChapter 12Chapter 12 (Test load).ipynb
     文件         882  2015-05-08 16:49  #Python数据挖掘入门与实践Code_REWRITEChapter 12extract_posts.py
     文件        1986  2015-05-08 09:37  #Python数据挖掘入门与实践Code_REWRITEChapter 12
b_predict.py
     文件        2021  2015-05-08 08:44  #Python数据挖掘入门与实践Code_REWRITEChapter 12
b_train.py
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 1.ipynb_checkpoints
     文件       14242  2015-05-28 09:33  #Python数据挖掘入门与实践Code_REWRITEChapter 1.ipynb_checkpointsch1_affinity-checkpoint.ipynb
     文件       13797  2015-05-28 09:33  #Python数据挖掘入门与实践Code_REWRITEChapter 1.ipynb_checkpointsch1_oner_application-checkpoint.ipynb
     文件        1000  2014-10-10 03:13  #Python数据挖掘入门与实践Code_REWRITEChapter 1affinity_dataset.txt
     文件       14242  2015-05-28 09:33  #Python数据挖掘入门与实践Code_REWRITEChapter 1ch1_affinity.ipynb
     文件        3544  2014-10-10 03:13  #Python数据挖掘入门与实践Code_REWRITEChapter 1ch1_affinity_create.ipynb
     文件       14210  2017-10-11 06:29  #Python数据挖掘入门与实践Code_REWRITEChapter 1ch1_oner_application.ipynb
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 2
     目录           0  2017-10-11 14:15  #Python数据挖掘入门与实践Code_REWRITEChapter 2.ipynb_checkpoints
     文件      128669  2015-05-28 10:08  #Python数据挖掘入门与实践Code_REWRITEChapter 2.ipynb_checkpointsIonosphere Nearest Neighbour-checkpoint.ipynb
     文件      129473  2017-10-11 13:23  #Python数据挖掘入门与实践Code_REWRITEChapter 2Ionosphere Nearest Neighbour.ipynb
............此处省略40个文件信息

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。

发表评论

评论列表(条)