本文介绍在使用 `pandas.excelfile` 逐个读取并遍历 excel 工作表时,如何正确释放文件句柄以避免“文件被占用”导致的 `winerror 32` 权限错误,确保后续 `os.rename()` 操作成功执行。
在批量处理 Excel 文件时,许多开发者会习惯性地使用 pd.ExcelFile 来获取工作表名并按需读取(例如 file.parse(sheet)),这比直接用 pd.read_excel() 更灵活。但关键区别在于:pd.ExcelFile 是一个持久化的文件句柄对象,它底层持有一个打开的 xlrd、openpyxl 或 pyxlsb 文件流(取决于引擎),而该流不会自动关闭——即使循环结束或变量超出作用域,Python 的垃圾回收也不保证立即释放系统级文件锁,尤其在 Windows 上极易触发 [WinError 32] The process cannot access the file because it is being used by another process。
正确的做法是在完成所有 sheet 处理后,显式调用 .close() 方法释放资源。注意:不是 del file,也不是依赖 with 语句(ExcelFile 当前不支持上下文管理协议),而是必须主动关闭:
import os import pandas as pd directory = r"C:\path\to\source" destination = r"C:\path\to\dest" os.chdir(directory) for filename in os.listdir(directory): if not filename.endswith(('.xlsx', '.xls', '.xlsm')): continue # 跳过非 Excel 文件 filepath = os.path.join(directory, filename) try: excel_file = pd.ExcelFile(filepath) # 遍历所有工作表(示例:仅打印名称,实际中可 concat 或处理) for sheet_name in excel_file.sheet_names: df = excel_file.parse(sheet_name) # ✅ 在此处对 df 进行数据清洗、合并等操作 # ⚠️ 关键步骤:显式关闭 ExcelFile 对象,释放文件锁 excel_file.close() # 此时 rename 才能安全执行 dest_path = os.path.join(destination, filename) os.rename(filepath, dest_path) print(f"✓ 移动成功: {filename}") except Exception as e: print(f"✗ 处理失败 {filename}: {e}")
⚠️ 注意事项:
总结:pd.ExcelFile 提供了灵活的多 Sheet 访问能力,但代价是需手动资源管理。牢记「打开即负责关闭」原则——每次 pd.ExcelFile(...) 后,必跟 .close(),这是规避 Windows 文件锁定问题最直接、最可靠的实践。