首页 > 文档格式转换

文档格式转换

互联网 2021-04-18 14:08:05

 不经常写博客,俗话说好记性不如烂笔头,今天闲下来就把这几天的东西给总结一下供大家参考,也是在这里记录一下免得以后我自己给忘了。

    首先我的目的是word转换成html,当然有一些工具是可以直接将word直接将word转换成html的,但是效果都不好,而且css都是内嵌到html中去的,所以就没有采用直接转换的方法。下面我介绍一下我的方法,当然你也可以截取其中的一个步骤来完成你的需求。

一、word的拆分

    word文档已将到达了一定的量级,所以手动ctrl+c,ctrl+v会很累的,很庆幸word提供了文档拆分的功能,但是隐藏的比较深。首先规定好标题(就是显示级别),按照级别来分文档 --> 切换到大纲视图 --> 在“显示级别”一栏选择你要分割的级别 --> 然后用鼠标选中你要分割的文档 --> 点击“显示文档” --> 接着点击创建 --> ctrl+s保存就OK。切换到文档所在目录,就可以看到已经分割好的文档了。

二、word批量转rst

     批量的工作是我写了一py脚本实现的,最重要的还是word转rst,在这里有一个工具“pandoc”,这个是一个非常强大的文档格式转换工具,几乎无所不能,所以word转rst也是小意思。在文末我会将转换脚本放到下边。

三、rst转html

    在这里也是使用工具,sphinx和rst当然是绝配,将rst和css融合,一条命令就可以将rst转换成非常漂亮的html,详细的sphinx教程我在这里就不详细说了,因为输入关键字网上一大堆。

四、word批量转rst脚本

# coding=utf-8import ospath = "../word"for root, dir, files in os.walk(path):print rootfor filename in files:print filenameprefix = os.path.splitext(filename)[0]print "将" + filename + "转换成rst格式"srcfile = root + "/" + filenamedesfile = root + "/" + prefix+".rst"command = "pandoc -t rst " + srcfile + " -o " + desfileprint srcfile, desfileos.system(command)print "转换成功"print "============================="

免责声明:非本网注明原创的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明(版权证明、身份证正反面、侵权链接),站长将在收到邮件12小时内删除。