如何用python统计一个txt文件中某个单词出现的次数 python3.3.2 如何统计文本文件中出现的每个单词出现...

\u7528python\u5199\u4e00\u4e2a\u811a\u672c\u67e5\u8be2txt\u6587\u4ef6\u4e2d\u67d0\u51e0\u4e2a\u5355\u8bcd\u51fa\u73b0\u7684\u6b21\u6570\uff0c\u5e76\u628a\u7ed3\u679c\u8f93\u51fa\u751f\u6210\u4e00\u4e2a\u65b0\u6587\u4ef6

#!bin/python#-*- encoding: utf-8 -*-def counter(path, find, punctuation): infile = open(path, "r") lenth = len(find) count = [] for i in range(lenth): count.append(0) dat = infile.readline().strip("\n") while dat != '': dat = dat.split() for elemt in dat: elemt = elemt.strip(punctuation) #\u53bb\u9664\u6807\u70b9\u7b26\u53f7 if elemt in find: i = find.index(elemt) count[i] += 1 dat = infile.readline().strip("\n") infile.close() for i in range(lenth): print "%s:%d\u6b21" % (find[i],count[i]) if __name__ == "__main__": path = "PATH" find = ["hello", "hi", "world"] punctuation = ''',.;'":!?''' counter(path, find, punctuation)

\u5f88\u7b80\u7b54\u7684\u4e1c\u4e1c

import re
import collections

print( collections.Counter( re.findall( '\w+' ,open( 'test.txt' ).read( ) ) ) )

\u8fd8\u662f\u591a\u770b\u770b\u8d44\u6599\u5427,\u8fd9\u4e2a\u662f\u5b98\u65b9\u7684\u6807\u51c6\u7b54\u6848

1、首先,定义一个变量,保存要统计的英文文章。

2、接着,定义两个数组,保存文章中的单词,以及各单词的词频。

3、从文章中分割出所有的单词,保存在数组中。

4、然后,计算文章中单词的总数,保存在变量中。

5、用for循环,统计文章中各单词的词频。

6、最后,输出文章中各单词的词频。

7、运行程序,电脑会自动统计输入文章中各单词的词频。



"fatway" 的方法简单-美。

还有另一中方法:引入collections的Counter实现更强大的功能

import collections
import re

patt = re.compile("\w+")
counter = collections.Counter(patt.findall(
    open('reparser.py','rt').read()
    ))

# top 10
for word, times in counter.most_common(10):
    print word, times

# find word
counter_dict = dict(counter.most_common(0))
tobefind = 'hello'
print tobefind, counter_dict.get(tobefind, 0)


import re
txt = open("123.txt", "r").read()
print len(re.findall("hello", txt))

content = {}
wth open("文件") as fr:
for line in fr:
lines = line.strip().split(" ") #假设单词与单词之间,空格做为分隔符
for word in lines:
if word not in content:
content[word] = 0
content[word] += 1
for word,val in content.items():
print '%s:%d\n"%(word,val)

还有个问题123.txt文件放在哪个文件夹里?

  • 鐢╬ython濡備綍鎵惧埌鏃ュ織鏁版嵁涓闂鏁版渶澶氱殑鍓10涓〉闈
    绛旓細1)鎶婄浉鍏虫枃浠秙cp鍒拌繙绔殑node29鐩稿叧鐩綍涓嬶細scp -r /usr/local/hive-0.8.1/lib/py/* 172.16.41.29:/usr/local/hive_py/.2) 鍦╪ode1鏈嶅姟鍣ㄤ笂寮鍙慼ive锛歔hadoop@node1 py]$ hive --service hiveserver Starting Hive Thrift Server 3锛夊湪node29涓婄紪鍐欐煡璇㈣剼鏈細!/usr/bin/env python ...
  • Python濡備綍杩涜澶氫覆鍙i氫俊?涓涓涓插彛鎺у埗鐢垫満 涓涓覆鍙i噰闆嗘暟鎹?_鐧惧害...
    绛旓細' except Exception as ex: self.lblInfo['text'] = '鎵撳紑澶辫触锛'浣跨敤com鍙e彂閫乵odbus鍗忚缁欑粓绔澶囥俤ef btnEmId_Click(self):barray = bytearray([0x05, 0x03, 0xA#, 0x54, 0x00, 0x08])vOldEmId = self.txbOldEmId.get()vNewEmId = self.txbNewEmId.get()barray[0] = ...
  • pytestxdist鎻掍欢鎬庝箞璁惧畾闂撮殧鏃堕棿
    绛旓細瑕佽缃畃ytest-xdist鎻掍欢鐨勯棿闅旀椂闂达紝浣犲彲浠ヤ娇鐢╜--dist`閫夐」鏉ユ寚瀹氬垎鍙戝櫒鎻掍欢鐨勯厤缃弬鏁般傚叾涓紝`--dist`閫夐」鍚庨潰鍙互璺涓涓鍙傛暟锛岀敤浜庤缃垎鍙戝櫒鐨勯厤缃弬鏁般備緥濡傦紝瑕佽缃棿闅旀椂闂翠负2绉掞紝鍙互浣跨敤浠ヤ笅鍛戒护锛歚``pytest --dist=loadfile --tx=2*popen//python=python3 ```鍦ㄨ繖涓緥瀛愪腑锛屾垜浠娇鐢╜--...
  • linux甯﹀鏌ョ湅linux甯﹀鏌ョ湅
    绛旓細鎴戜滑鏈鍚庝粙缁嶇殑ranwhen.py鏄涓涓猵ython宸ュ叿锛屽畠鍙互浠ュ浘褰㈡柟寮忔樉绀虹郴缁熸椿鍔ㄣ傝浣跨敤璇ュ伐鍏烽渶瑕佸厛瀹夎python璇█鏀寔锛歴udo
  • python 瀛楃涓插鐞嗛棶棰
    绛旓細鏌ユ壘瀛楃涓诧細find锛氭壘涓嶅埌杩斿洖-1 锛岄兘鏄粠宸﹁竟鎵撅紝鍙宠竟鏌ユ壘r index锛氭壘涓嶅埌鎶ラ敊
  • mac python鎬庝箞鎵撳紑txt缁撳熬鐨勬枃鏈枃妗,鎴戞妸test.txt寤虹珛骞跺瓨鍦╟ode涓簡...
    绛旓細鎴戣寰楀鏋渢est.tx鏀惧湪"/code"鐩綍涓嬮潰闇瑕乺oot鏉冮檺鎵嶈兘璁块棶锛屼綘鍙互鎶妕est.txt鏀惧湪鈥/Users/tuyu/鈥濈洰褰曚笅璇曡瘯锛屾敞鎰忔枃浠剁洰褰曞悕鐨勫ぇ灏忓啓锛屽彲浠ュ厛cd 鍒扮洰褰曚腑杈撳叆 pwd鏌ョ湅鐩綍锛涘鏋滃疄鍦ㄨ鏀惧湪鈥/code鈥濈洰褰曚笅锛屽彲浠ュ皾璇曠敤root鏉冮檺杩愯浠g爜 sudo python dd.py ...
  • python澶氱嚎绋嬪疄鐜颁负闃诲璇彞璁℃椂
    绛旓細os.system榛樿闃诲褰撳墠绋嬪簭鎵ц锛屽湪cmd鍛戒护鍓嶅姞鍏tart鍙笉闃诲褰撳墠绋嬪簭鎵ц銆備緥濡傦細import os os.system(r"start E:\TX\qq.exe")鎴栬 os.system('start python test.py ')
  • python浣犱拱浜嗕竴绠眓涓嫻鏋,寰堜笉骞哥殑鏄拱瀹屾椂绠卞瓙閲屾贩杩涗簡涓鏉¤櫕瀛.铏...
    绛旓細#渚濇杈撳叆n x y锛堜互绌烘牸鍒嗛殧瀹冧滑锛塻=input().strip().split()n,x,y=(float(e) for e in s)t=y//x n-=t n=int(n-1 if y!=x*t else n)print(n)浠g爜 杈撳叆 杈撳嚭
  • 濡備綍鍦pcDuino涓婇潰浣跨敤python-serial
    绛旓細serial_test.py鈥濇枃浠讹紝鐒跺悗杩愯锛歴udo python ./serial_test.py 锛堥渶瑕佸鎺涓涓USB杞覆鍙g殑妯″潡鍜宲cduino涓插彛閫氳锛屽鏋滄病鏈夛紝涔熷彲浠ョ洿鎺ョ敤璺崇嚎灏哛XD鍜孴XD鐭帴璧锋潵锛岀粓绔細鎵撳嵃鍑哄彂閫佺殑鏁版嵁鈥減ython serial test on pcduino鈥濓級锛1 浣跨敤pc绔殑涓插彛璋冭瘯宸ュ叿鍙戦佹暟鎹埌pcduino涓婏細2 ...
  • 鎯鐢╬ython缂栧啓涓娣诲姞鏍囧織浣嶅皬绋嬪簭 寰堢畝鍗曚絾鏄垜涓嶄細,鏈涢珮鎵嬫寚鐐圭紪鍐欏嚭...
    绛旓細鈼忎笉鐢ㄩ噸瑁呫佽繕鍘熴佷紭鍖栵紝璁╀綘鐨勭郴缁熸瘮閲嶈杩樼埥鈼忔垜鐨勬枃妗d竴浜涗笉涓轰汉鐭ョ殑搴旂敤鈼忕數鑴戝悇绉嶉敊璇俊鎭殑涓枃鎰忔 鈼忕粷瀵规湁鐢ㄧ殑20鏉$數鑴戜娇鐢ㄨ秴绾ф妧宸р棌楂樻墜鏂版墜閮介傜敤鐨137涓妧宸р棌閿洏涓婃瘡涓敭鐨勪綔鐢ㄢ棌鏁欎綘鎬庢牱鎶撳浘 鈼忛噴鏀綜鐩樼┖闂寸殑鎶宸р棌涓閿仮澶嶅強閲嶈绯荤粺姝ラ鈼忓府浣犳妸鐢佃剳璋冨埌鏈浣崇姸鎬佲棌鐢佃剳闂瑙g瓟 鈼忕數鑴...
  • 扩展阅读:python初学编程必背 ... python代码生成器 ... c++和python先学哪个 ... python符号含义大全 ... python编程入门自学 ... 小学生学python还是c++ ... python编程必背单词 ... python基础代码大全 ... 学python最佳年龄 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网