V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
vtoexsir
V2EX  ›  Python

word 文件另存为“筛选过的网页”文件时,得到的网页文件中 charset=x-cp20936,怎么设置让 charset=gbk 或者 utf-8?

  •  
  •   vtoexsir · 2016-10-26 09:08:14 +08:00 · 3704 次点击
    这是一个创建于 2980 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如,在 Windows7 中文版, 64 为, office 套件 2010 。
    将 f.doc 文件另存为"删选过的网页"类型,起名为 f.html
    但打开 f.html ,发现文件中有如下:
    <head>
    <meta http-equiv=Content-Type content="text/html; charset=x-cp20936">
    我的问题是:
    怎么样让生成的 f.html 文件中, charset=gbk 或者 utf-8 ?
    使用 python 或者 c#代码操作都可以。
    多谢!
    1 条回复    2016-10-26 12:52:19 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   6126 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 02:30 · PVG 10:30 · LAX 18:30 · JFK 21:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.