5.1统计英文文件中的单词数python

 本关任务:编写一个能统计文件中单词数量的小程序,用replace替换文本内的标点

代码如下:

# 补充你的代码
a = input()
import string
with open(f'/data/bigfiles/{a}', 'r', encoding='utf-8') as text:  # 打开文件a.txt,创建文件对象
    txt = text.read()  # 读文件为字符串
    for i in ",.!\'":
        txt = txt.replace(i, " ")
    x1 = txt.split()
    print('共有'+str(len(x1))+"个单词")




( 整体思路,先将文本中的标点符号用空格替换,然后用空格分隔单词,最后用len()

统计文本中单词的数量 )

相关知识

为了完成本关任务,你需要掌握:

1.获取文件内容 2.字符串方法的使用

1.读取文件

open(filename)函数可以打开诸如txtcsv等格式的文件。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬

例如:

with open('a.txt', 'r', encoding='utf-8') as text: # 打开文件a.txt,创建文件对象
txt = text.read() # 读文件为字符串
print(txt) # 输出字符串

2.字符串方法

为了方便编程,Python 为我们提供了许多方法这里我们将学习其中的两个字符串方法。

2.1替换

str.replace(oldvalue, newvalue, count)

方法是在字符串str中,用另一个newvalue字符串替换oldvalue字符串count次。

参数值:

序号参数描述
1oldvalue必需。要检索的字符串。
2newvalue必需。替换旧值的字符串。
3count可选。数字,指定要替换的旧值出现次数。默认为替换所有出现的检索字符串。

示例如下:

txt = "I like bananas. She likes bananas too. "

x1 = txt.replace("bananas", "apples") # 替换所有
print(x1) # I like apples. She likes apples too.

x2 = txt.replace("bananas", "apples", 1) # 只替换一次
print(x2) # I like apples. She likes bananas too.

2.2切分

str.split(sep=None, maxsplit=- 1)

将字符串拆分成一个列表,其中每个单词都是一个列表项。可以指定分隔符,默认分隔符是空白字符(包括空格、制表\t、换行\n、回车\r、进纸\f和纵向制表符\v)。

参数值:

序号参数描述
1sep可选。规定分割字符串时要使用的分隔符。默认值为空白字符。
2maxsplit可选。规定要执行的拆分数。默认值为 -1,即“所有出现次数”。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年6月13日
下一篇 2023年6月13日

相关推荐