17370845950

新闻动态

requests 如何优雅处理流式响应而不一次性读完全部内容

使用requests处理流式响应需设stream=True，用iter_content()逐块读取bytes并手动解码；raw流需自行处理编码和连接释放；务必用with管理连接或显式close()。

用 requests 处理流式响应时，关键在于禁用自动解码、启用流模式，并逐块读取，避免把整个响应体加载进内存。

必须显式设置 stream=True，否则 requests 会默认把响应体全部读入内存再返回：

response = requests.get(url, stream=True)
此时 response.content 不可用（会触发完整读取），应改用 response.iter_content() 或直接遍历 response.raw

推荐使用 iter_content(chunk_size)，它自动处理压缩、分块传输等细节：

若需精细控制底层 socket 行为（如超时、非阻塞读），可绕过 requests 的封装，直接操作 response.raw：

确保 response.raw.readable() 为 True
调用 response.raw.read(n) 或 response.raw.readline()
注意：需手动处理 gzip 等编码，requests 默认已解压 Content-Encoding: gzip，但 raw 可能未解压，建议优先用 iter_content

流式响应容易因处理慢或中断导致连接堆积，务必规范收尾：