python从文本文件中选出使用频率最多的单词

2018-07-20    来源:open-open

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
Python语言: python.从一个文本文件中选出使用频率最多的若干个单词
#coding:utf-8
# ------------------------------------------------------------
# 简介 : 从一个文件中选出使用频率最多的10个单词
#       请自行准备一个 test.txt 文档放在与本脚本相同目录
# ------------------------------------------------------------

from time import time
from operator import itemgetter

def test():
    # 取 10 个,有需要可以修改, 及定义读取的文件 test.txt 
    iList = 10
    strFileName = 'test.txt'

    count = {}
    for word in open(strFileName).read().split():
        if count.has_key(word):
            count[word] = count[word] + 1
        else:
            count[word] = 1
    print sorted(count.iteritems( ), key=itemgetter(1), reverse=True)[0:iList]

# 调用
if __name__ == '__main__':
    t1 = time()
    test()
    print time()-t1

标签: 脚本

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:python连接mysql查询数据示例

下一篇:python操作oracle数据库