今天同事说手上有1000多个表,要求批量把表头改了,比如人事干部任免表改为人员信息表这样的小事,一个个的改估计要花费不少时间,看能否写个小程序什么的。
首先考虑的是这件事不是那么容易,主要是.xls是老格式,只是改表,不动格式其实挺不容易,然后开始尝试,gpt总是喜欢改.xlsx格式的,老格式的反倒没有太多支持的。
最后找到了xlwings组件,总算是可以只改一下表头,不会丢格式了,考虑到是1000多个文件,最好放在一个目录中遍历寻找,找到一个改一个然后存另一个目录中,整体代码如下:
程序中为了操作简单,直接在D盘创建文件夹D:/data/ori作为源目录
D:/data/mod作为目标目录
import os
import xlwings as xw
def modify_excel_file(file_path, save_path, app):
"""
使用传入的 Excel 应用实例 app 打开 file_path 文件,
修改第一个工作表 A1 单元格内容为“人员信息表”,
然后另存为 save_path 文件。
"""
wb = app.books.open(file_path)
# 假设标题在第一个工作表的 A1 单元格(如果有合并单元格,则修改左上角即可)
wb.sheets[0].range('A1').value = "人员信息表"
wb.save(save_path)
wb.close()
def process_excel_files(input_dir, output_dir):
"""
搜索 input_dir 目录下所有 .xls 文件,
使用 Excel 修改后另存到 output_dir 目录中。
"""
# 如果输出目录不存在,则创建
if not os.path.exists(output_dir):
os.makedirs(output_dir)
# 启动 Excel 应用,后台运行
app = xw.App(visible=False)
try:
# 遍历目录下所有文件
for filename in os.listdir(input_dir):
if filename.lower().endswith('.xls'):
file_path = os.path.join(input_dir, filename)
save_path = os.path.join(output_dir, filename)
print(f"正在处理:{file_path}")
modify_excel_file(file_path, save_path, app)
finally:
# 退出 Excel 应用
app.quit()
if __name__ == '__main__':
input_directory = r'D:\data\ori'
output_directory = r'D:\data\mod'
process_excel_files(input_directory, output_directory)
print("处理完成!")
input("按任意键退出...")
然后得发给同事用,他们可能没有python环境,使用pyinstaller --onefile cc.py
生成cc.exe即可
知识扩展
下面小编为大家整理了Python处理xls表格的相关方法,感兴趣的可以了解下
01_X3_xsl_sort.py
1.删除当前路径下3个文件,test.xls,output_X3_left_align.xls,output_X4_left_align.xls
2.将当前路径下的xls,修改为test.xls
3.获取每行数据第一个是 X3
4.数据按照第三列,排序
5.数据拼接+新增一行
6.数据删除多余的列
7.数据左对齐,导入output_X3_left_align.xls中
import xlrd
import os
# 要删除的文python件列表
files_to_delete = [
"./test.xls",
"./output_X3_left_align.xls",
"./output_X4_left_align.xls"
]
# 遍历文件列表,删除文件
for file_path in files_to_delete:
if os.path.exists(file_path):
os.remove(file_path)
print(f"{file_path} 已删除。")
else:
print(f"{file_path} 不存在。")
folder_path = r'./'
# 获取目录下所有文件
file_list = os.listdir(folder_path)
# 遍历文件列表
for file_name in file_list:
# 检查文件是否以 .xls 结尾
if file_name.endswith('.xls'):
# 构造新文件名
new_file_name = os.path.join(folder_path, 'test.xls')
# 重命名文件
os.rename(os.path.join(folder_path, file_name), new_file_name)
data = xlrd.open_workbook('test.xls') # 打开xls文件
table = data.sheets()[0] # 打开第一张表
nrows = table.nrows # 获取表的行数
# 用于存储符合条件的数据
filtered_data = []
# 循环逐行提取数据并筛选
for i in range(nrows):
if i == 0: # 跳过第一行
continue
row_data = table.row_values(i)
if row_data[0] == 'X3': # 如果第一个元素等于'X3'
filtered_data.append(row_data)
# 对 filtered_data 中的数据按照第三个元素排序
filtered_data_sorted = sorted(filtered_data, key=lambda x: x[2], reverse=True)
# 假设要插入的新数据是 new_row
new_row = ['区域','应用名称','已监控机器数量','数据库服务器数量','应用服务器数量','cpu平均使用率(%)','cpu最大使用率(%)','内存平均使用率(%)','内存最大使用率(%)','系统盘平均使用率(%)','系统盘最大使用率(%)','数据盘平均使用率(%)','数据盘最大使用率(%)']
# 在 filtered_data_sorted 的第一个位置之前插入新数据
filtered_data_sorted = [new_row] + filtered_data_sorted
# # 输出排序前的数据
# print(filtered_data_sorted)
for inner_list in filtered_data_sorted:
del inner_list[0]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[2]
for inner_list in filtered_data_sorted:
del inner_list[3]
for inner_list in filtered_data_sorted:
del inner_list[4]
# 关闭文件
data.release_resources()
import xlwt
# 创建一个新的 Excel 文件
output_workbook = xlwt.Workbook()
# 添加一个工作表
output_sheet = output_workbook.add_sheet('Sheet1')
# 设置单元格左对齐
style = xlwt.XFStyle()
alignment = xlwt.Alignment()
alignment.horz = xlwt.Alignment.HORZ_LEFT
style.alignment = alignment
# 将筛选出的数据写入到新文件中,左对齐
for i, row in enumerate(filtered_data_sorted):
for j, value in enumerate(row):
output_sheet.write(i, j, value, style)
# 保存文件
output_workbook.save('output_X3_left_align.xls')
02_X4_xsl_sort.py
import xlrd
data = xlrd.open_workbook('test.xls') # 打开xls文件
table = data.sheets()[0] # 打开第一张表
nrows = table.nrows # 获取表的行数
# 用于存储符合条件的数据
filtered_data = []
# 循环逐行提取数据并筛选
for i in range(nrows):
if i == 0: # 跳过第一行
continue
row_data = table.row_values(i)
if row_data[0] == 'X4': # 如果第一个元素等于'X4'
filtered_data.append(row_data)
# 对 filtered_data 中的数据按照第三个元素排序
filtered_data_sorted = sorted(filtered_data, key=lambda x: x[2], reverse=True)
# 假设要插入的新数据是 new_row
new_row = ['区域','应用名称','已监控机器数量','数据库服务器数量','应用服务器数量','cpu平均使用率(%)','cpu最大使用率(%)','内存平均使用率(%)','内存最大使用率(%)','系统盘平均使用率(%)','系统盘最大使用率(%)','数据盘平均使用率(%)','数据盘最大www.devze.com使用率(%)']
# 在 filtered_data_sorted 的第一个位置之前插入新数据
filtered_data_sorted = [new_row] + filterQWQkFYohed_data_sorted
# # 输出排序前的数据
# print(filtered_data_sorted)
for inner_list in filtered_data_sorted:
del inner_list[0]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[1]
for inner_list in filtered_data_sorted:
del inner_list[2]
for inner_list in filtered_data_sorted:
del inner_list[3]
for inner_list in filtered_data_sorted:
del inner_list[4]
# 关闭文件
data.release_resources()
import xlwt
# 创建一个新的 Excel 文件
output_workbook = xlwt.Workbook()
# 添加一个工作表
output_sheet = output_workbook.add_sheet('Sheet1')
# 设置单元格左对齐
style = xlwt.XFStyle()
alignment = xlwt.Alignment()
alignment.horz = xlwt.Alignment.HORZ_LEFT
style.alignment = alignment
# 将筛选出的数据写入到新文件中,左对齐
for i, row in enumerate(filtered_data_sorted):
for j, value in enumerate(row):
output_sheet.write(i, j, value, style)
# 保存文件
output_workbook.save('output_X4_left_align.xls')
03_X3_ma编程x.py
import xlrd
data = xlrd.open_workbook('test.xls') # 打开xls文件
table = data.sheets()[0] # 打开第一张表
nrows = table.nrows # 获取表的行数
# 用于存储符合条件的数据
filtered_data = []
# 循环逐行提取数据并筛选
for i in range(nrows):
row_data = table.row_values(i)
if row_data[0] == 'X3': # 如果第一个元素等于'x3'
filtered_data.append(row_data)
# 对 filtered_data 中的数据按照第三个元素排序
filtered_data_sorted = sorted(filtered_data, key=lambda x: x[2], reverse=True)
# 将null替换为0
data_with_zeros = [[0 if cell == 'null' else cell for cell in row] for row in filtered_data_sorted]
# 对 filtered_data 中的数据按照第7个元素排序 cpu最大使用率(%) 最大
data_with_zeros_sorted = sorted(data_with_zeros, key=lambda x: x[6], reverse=True)
first_sublist = data_with_zeros_sorted[0]
sixth_element_of_first_sublist = first_sublist[6]
print("X3区域cpu最大使用率(%):",sixth_element_of_first_sublist)
data_with_zeros_sorted8 = sorted(data_with_zeros, key=lambda x: x[8], reverse=True)
first_sublist2 = data_with_zeros_sorted8[0]
sixth_element_of_first_sublist2 = first_sublist2[8]
print("X3区域cpu最大使用率(%):",sixth_element_of_first_sublist2)
# 关闭文件
data.release_resources()
04_X4_max.py
import xlrd
data = xlrd.open_workbook('test.xls') # 打开xls文件
table = data.sheets()[0] # 打开第一张表
nrows = table.nrows # 获取表的行数
# 用于存储符合条件的数据
filtered_data = []
# 循环逐行提取数据并筛选
for i in range(nrows):
row_data = table.row_values(i)
if row_javascriptdata[0] == 'X4': # 如果第一个元素等于'X4'
filtered_data.append(row_data)
# 对 filtered_data 中的数据按照第三个元素排序
filtered_data_sorted = sorted(filtered_data, key=lambda x: x[2], reverse=True)
# 将null替换为0
data_with_zeros = [[0 if cell == 'null' else cell for cell in row] for row in filtered_data_sorted]
data_with_zeros_sorted = sorted(data_with_zeros, key=lambda x: x[6], reverse=True)
first_sublist = data_with_zeros_sorted[0]
sixth_element_of_first_sublist = first_sublist[6]
print("X4区域cpu最大使用率(%):",sixth_element_of_first_sublist)
data_with_zeros_sorted8 = sorted(data_with_zeros, key=lambda x: x[8], reverse=True)
first_sublist2 = data_with_zeros_sorted8[0]
sixth_element_of_first_sublist2 = first_sublist2[8]
print("X4区域cpu最大使用率(%):",sixth_element_of_first_sublist2)
# 关闭文件
data.release_resources()
main.py
import subprocess subprocess.run(["python", "01_X3_xsl_sort.py"]) subprocess.run(["python", "02_X4_xsl_sort.py"]) subprocess.run(["python", "03_X3_max.py"]) subprocess.run(["python", "04_X4_max.py"])
到此这篇关于Python如何实现对.xls文件表头的修改的文章就介绍到这了,更多相关Python修改xls文件内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)!
加载中,请稍侯......
精彩评论