python将大型XML文件拆分为多个文件

微信扫一扫,分享到朋友圈

python将大型XML文件拆分为多个文件
收藏 00

用到的包

lmxl

代码

from lxml import etree
import re

html = etree.parse('sitemap.xml')
rs = html.xpath('.')
index = 0
count = 0
full_text = b""
for elem in rs[0]:
    count += 1
    full_text += etree.tostring(elem)
    if count >= 9999:
        count = 0
        index += 1
        filename = format(str(index) + ".xml")
        with open(filename, 'wb') as f:
            f.write(full_text)
            full_text = b""
with open(format(str(index+1)+".xml"), 'wb') as f:
    f.write(full_text)

参考资料:https://www.thinbug.com/q/56043298

一个热爱互联网的咸鱼
上一篇

利用正则表达式过滤特殊字符

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
返回顶部