python-按序号切割txt文件

发布时间 2023-04-26 14:05:58作者: 许个未来—

1.切割任何文件的时候,都需要查找到文件的分割的规律,从而按照一个规则来进行切割。

  我的需求就是将一个txt文档按照序号切割成每一行,从来进行DataFrame转化成其它文件。

2.代码:

"""
coding:utf-8
@Software:PyCharm
@Time:2023/3/28 9:37
@author:Panda
"""


import pandas as pd


# 定义文本文件路径和 csv 文件夹路径
text_file = "abstract-migraineAN-set_new.txt"
excel_folder = "abstract-migraineAN-set_new1.csv"

ls = []  # 定义一个大的列表将所有分割好的内容装起来,为后面生成DataFrame做好工作
with open(text_file, "r", encoding='utf-8') as f:

    lines = f.readlines()  # 读取整个文件所有行,保存在 list 列表中
    # print(lines)
    text = ""
    i = 0
    for line in lines:
        # print(line)
        line = line.strip("\n")
        # print(text)
        str_number = str(i+2) + ". "
        if str_number == line[:len(str_number)]:  # 找到分割点,每行的序号
            ls.append(text)
            text = '' + line
            i += 1
        else:
            text += str(line)

    arr_ls = pd.DataFrame(ls)
    arr_ls.to_csv(excel_folder, encoding='utf-8')