批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

请问批处理可以统计词频吗?
4字一行,只统计4字词组出现的频率。
如:

一丘之貉
一丝不挂
一丝不苟
一事无成
一亲对老
一分身又
一叶知秋
一叶知秋
一叶障目
一叶障目
一往无前
一往无前
一往无前

实现如下:

一丘之貉 1
一丝不挂 1
一丝不苟 1
一事无成 1
一亲对老 1
一分身又 1
一叶知秋 2
一叶障目 2
一往无前 3

解决代码


@echo off & setlocal enabledelayedexpansion
for /f "delims=" %%a in ('type "测试.txt"') do set /a "#%%a#+=1"
for /f "tokens=1* delims=#=" %%a in ('set #') do echo %%a %%b
pause

win7以上系统


powershell -c "gc '测试.txt'|group $_|%%{$_.name+' '+$_.count}"
pause

到此这篇关于批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)的文章就介绍到这了,更多相关bat统计词频内容请搜索aitechtogether.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持aitechtogether.com!

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
心中带点小风骚的头像心中带点小风骚普通用户
上一篇 2024年2月19日
下一篇 2024年2月19日

相关推荐