N-gram语言模型

标签： language mod N-gram KN平滑 python • 文件类型: .rar • 文件大小: 11.36MB • 下载次数: 1 • 2023-12-02

本项目利用python实现N-gram语言模型，采用的平滑算法是Kneser-Ney平滑。

资源截图

小图大图

代码片段和文件信息

#!/usr/bin/python
#coding = utf-8

‘‘‘
    This file achieves to deal the dictionary.
‘‘‘ 
f_out = open（‘dict.txt‘ ‘w‘ encoding = ‘utf-8‘）
with open（‘dict_old.txt‘ ‘r‘ encoding = ‘utf-8‘） as f_in:
    lines = f_in.readlines（）
    for line in lines:
        result = line.split（‘ /‘）[0]
        f_out.write（result）
        f_out.write（‘
‘）
f_out.close（）

属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        372  2018-06-07 10:03  languageModel_kneser-neydealDict.py

     文件     519392  2018-05-05 08:55  languageModel_kneser-neydict.txt

     文件     722950  2018-05-05 08:50  languageModel_kneser-neydict_old.txt

     文件       9972  2018-06-07 10:03  languageModel_kneser-neyLM_train_backoff.py

     文件      11528  2018-06-07 10:03  languageModel_kneser-neyLM_train_interpolation.py

     文件       3029  2018-06-07 10:04  languageModel_kneser-neyNgram.py

     文件     184397  2018-05-04 08:48  languageModel_kneser-ney est.trans

     文件   50499426  2018-05-05 12:34  languageModel_kneser-neyTrain.trans

     目录          0  2018-06-07 10:04  languageModel_kneser-ney

----------- ---------  ---------- -----  ----

             51951066                    9

立即下载

Python数据处理 Data Wrangling with Python 中译版完整全本文字pdf Jacqueline Katharine 张亮吕家明 python编程从入门到实践高清pdf +廖雪峰python3带标签教程高清pdf

0 0

N-gram语言模型

发表评论

评论列表（条）