python 将txt文件转换成csv文件

前言

今天今天又来了一个冷门脚本!读取txt文件中的数据转换成csv文件。
比如下面文件开始有规律分布着需要提取的数据,从第三行开始提取,并且对数据进行处理,最后进行输出。

代码

说明:

  1. 以下代码不仅仅是提取数据,还包含处理的步骤,处理的方式不进行公开,from utils.feature_process import FeatureProcess是我自定义的库;
  2. plot_flag可以将一个文件夹中的处理后的数据进行显示,设为False就不进行绘图啦。
  3. 在main中先设置源文件,再设置存储位置。
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from utils.feature_process import FeatureProcess  # 自定义的特征处理函数

plot_flag = True


class txt2csv:
    def __init__(self, source_dir, save_dir):

        self.source_dir = source_dir
        self.save_dir = save_dir

    def process(self):
        txt_data = os.listdir(self.source_dir)
        for one_data in txt_data:

            self.csv_date = pd.DataFrame(columns=['frames', 'wratio', 'cvalue', 'kangle'])
            self.arr_data = np.zeros((1, 4))

            self.feature_process = FeatureProcess()

            with open(os.path.join(self.source_dir, one_data), 'r') as f:
                # 读取每个文件夹的数据
                lines = f.readlines()
                for line in lines:
                    num = line.split(',')
                    if len(num) <= 1:
                        continue

                    # 处理数据
                    frame = num[0]
                    bounding_box = num[2:]
                    feature_list = self.feature_process.feature_extraction([240, 320], bounding_box)

                    # 存储数据
                    self.arr_data[0][0] = frame
                    self.arr_data[0][1] = feature_list[0]
                    self.arr_data[0][2] = feature_list[1]
                    self.arr_data[0][3] = feature_list[2]

                    # 追加方式填充上数据
                    one_row_data = pd.DataFrame(self.arr_data, columns=['frames', 'wratio', 'cvalue', 'kangle'])
                    self.csv_date = self.csv_date.append(one_row_data, ignore_index=True)

            self.csv_date.to_csv(os.path.join(self.save_dir, one_date.split('.')[0] + '.csv'), index=False)
            if plot_flag:
                # 拿起画板
                fig = plt.figure()

                # 在画板上贴上画纸
                ax1 = fig.add_subplot(111)
                # 画图显示 True显示,False不显示
                ax1.scatter(self.csv_date['frames'], self.csv_date['cvalue'])

                plt.show()


if __name__ == '__main__':
    # 读取源文件
    tc = txt2csv(r'./annotation_files', '.')  
    # 进行转化和存储
    tc.process()

文件目录结构

简单展示一下csv中的结果

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年11月13日
下一篇 2023年11月13日

相关推荐