mht网页转html的问题

[复制链接]
作者: 我爱python | 时间: 2021-7-27 23:38:07 | 已解决|
2 430
结帖率:0% (0/1)
发表于 2021-7-27 23:38:07| 显示全部楼层 |阅读模式
5金币
网上有 一段python代码 ,通过email  mimetypes的引用来把mht网页转换成html,以前是可以用的 ,最近不知是浏览器升级了还是怎么回事,手机保存的mht网页不能转换了,希望大佬们答疑,给个能用的例程参考下

点评

由于长时间没有人回答,本问答已关闭。  发表于 2021-9-12 15:35
结帖率:0% (0/1)
 楼主| 发表于 2021-7-28 07:33:17高大上手机用户 | 显示全部楼层
代码就是这段,以前可以解析的,最近不能用了
import email
import mimetypes
# 把mht文件转为html文件
def parse(file_name):
    print(file_name)
    # mht = open(file_name,'r',encoding='utf-8')
    mht = open(file_name, 'r', encoding='gbk')
    msg = email.message_from_file(mht)
    mht.close()
    # file_path =r'/home/ai/resume/resume/1rename/0rename/10rename/'
    file_path = file_name.replace('.mht', '')
    for part in msg.walk():
        if part.get_content_maintype() == 'multipart':
            continue
        filename = part.get_filename()
        if not filename:
            ext = mimetypes.guess_extension(part.get_content_type())
            # print(ext)
        if ext == '.html':
            try:

                fp = open(file_path + ext, 'wb')
                fp.write(part.get_payload(decode=True))
                fp.close()
            except Exception as e:
                print(e)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

!jz_fbzt! 快速回复 !jz_sctz! !jz_fhlb! 按钮
快速回复 返回列表 返回顶部