word转html工具

<!-- word转html --><dependency>    <groupId>org.apache.poi</groupId>    <artifactId>poi-scratchpad</artifactId>    <version>3.10.1</version></dependency><dependency>    <groupId>org.apache.xmlbeans</groupId>    <artifactId>xmlbeans</artifactId>    <version>2.6.0</version></dependency><dependency>    <groupId>fr.opensagres.xdocreport</groupId>    <artifactId>org.apache.poi.xwpf.converter.core</artifactId>    <version>1.0.6</version></dependency><dependency>    <groupId>fr.opensagres.xdocreport</groupId>    <artifactId>org.apache.poi.xwpf.converter.xhtml</artifactId>    <version>1.0.6</version></dependency>
package com.vivo.magazineunlock.common.dal.common.util;

import org.apache.commons.io.FileUtils;import org.apache.poi.hwpf.HWPFDocument;import org.apache.poi.hwpf.converter.PicturesManager;import org.apache.poi.hwpf.converter.WordToHtmlConverter;import org.apache.poi.hwpf.usermodel.Picture;import org.apache.poi.hwpf.usermodel.PictureType;

import org.w3c.dom.Document;

import javax.xml.parsers.DocumentBuilderFactory;import javax.xml.transform.OutputKeys;import javax.xml.transform.Transformer;import javax.xml.transform.TransformerFactory;import javax.xml.transform.dom.DOMSource;import javax.xml.transform.stream.StreamResult;import java.io.ByteArrayOutputStream;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.InputStream;import java.util.List;

/** * author:ruisheng Date:2018/12/6 Time:19:23 */public class WordToHtml {

public static void main(String[] args) throws Throwable {        final String path = "F:\\";        final String file = "test.doc";        InputStream input = new FileInputStream(path + file);        HWPFDocument wordDocument = new HWPFDocument(input);        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(            DocumentBuilderFactory.newInstance().newDocumentBuilder()                .newDocument());        wordToHtmlConverter.setPicturesManager(new PicturesManager() {            @Override public String savePicture(byte[] content, PictureType pictureType,                String suggestedName, float widthInches, float heightInches) {                return suggestedName;            }        });        wordToHtmlConverter.processDocument(wordDocument);        List pics = wordDocument.getPicturesTable().getAllPictures();        if (pics != null) {            for (int i = 0; i < pics.size(); i++) {                Picture pic = (Picture) pics.get(i);                try {                    pic.writeImageContent(new FileOutputStream(path                        + pic.suggestFullFileName()));                } catch (FileNotFoundException e) {                    e.printStackTrace();                }            }        }        Document htmlDocument = wordToHtmlConverter.getDocument();        ByteArrayOutputStream outStream = new ByteArrayOutputStream();        DOMSource domSource = new DOMSource(htmlDocument);        StreamResult streamResult = new StreamResult(outStream);        TransformerFactory tf = TransformerFactory.newInstance();        Transformer serializer = tf.newTransformer();        serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");        serializer.setOutputProperty(OutputKeys.INDENT, "yes");        serializer.setOutputProperty(OutputKeys.METHOD, "html");        serializer.transform(domSource, streamResult);        outStream.close();        String content = new String(outStream.toByteArray());        FileUtils.write(new File(path, "test.html"), content, "utf-8");    }

}

原文地址:https://www.cnblogs.com/shenggege5240/p/10081006.html

时间: 12-06

word转html工具的相关文章

好用的支持PDF转Word文本的工具

我们都知道,借助PDF转换成Word转换器的帮助,可以非常轻松地实现PDF转换成为Word的需求.但是网 上那么多的转换器,你知道哪个好用么?现在的时代讲得就是方便和快捷!快速易操作才是王道. 现在网上那么多的PDF转Word转换器,那么到底哪个PDF转换成Word转换器好呢?国内知名的迅捷PDF转换 成Word转换器近期给了答案:全面升级提升转换效率.支持高质量精准解析和转换.多功能PDF转换功能 涵括八大转换模式,目前迅捷PDF转换成Word转换器已经不再仅仅局限于普通的PDF转换Word的

图文详解PDF与word、excel、ppt互转工具Solid PDF Tools v9的下载、安装与注册激活

很多同学经常询问小编有没有关于PDF转word.excel.ppt或者它们之间互转的软件,之前亦是美网络小编曾经给大家介绍过一款工具AnyBizSoft_PDF_Convert的下载.安装与注册激活使用教程,但是有部分小伙伴反映说安装时出现了问题,可能是系统不兼容导致的无法使用,为了解决小伙伴的难题,今天再给大家分享一款PDF与word.excel.ppt互转工具,那就是Solid PDF Tools v9中文版,下面亦是美网络给大家介绍一下它的下载.安装与注册激活教程吧. Solid PDF

使用Spire.Office自制一个进行批量格式转换(Pdf转换为Word)的工具

使用Spire.Office自制一个进行批量格式转换(Pdf转换为Word)的工具 本文文末提供一个可将PDF转换为Word的小工具供下载. +BIT祝威+悄悄在此留下版了个权的信说: Spire.Office 我一直想找一个工具能够把我收集的一些PDF资料转换为Word版.最近偶然发现一个超级强大的工具Spire.Office for .NET可以做到这一点. 而且Spire.Office提供C#.VB的DLL供调用,还提供了丰富简洁的示例项目可供学习. 如下图所示,Spire.Office

简单快速有效地将PDF文件转换成Word

写论文的时候需要大段地引用知网下载下来的前人论文内容,但是数据库的论文下载下来大部分几乎都是pdf格式的,所以这成了让人很头疼的事情,后来经过方法的寻找,我发现了一款很有用的转换器软件,解决了我的一大烦恼. 这款软件名字叫做迅捷pdf转换器,是一款最快捷的PDF文件转换到Word文档工具,它可以帮助用户生成一个与原PDF文件一模一样的Word格式文档,而这个文档完好地保留了原有排版及所有元素.如文字.图片.链接.图表.表格.样式等都可以很好的保留在Word文档中,接下来用户就可以很方便的修改或重

pdf转换器手机版如何将pdf转换成word

pdf转换器如何将pdf转换成word,难吗?--不难! pdf转换器手机版如何将pdf转换成word,难吗?--难! 下面就让大家看一下,小编是如何在手机上将pdf转换成word的! 工具/原料 手机(建议连接wifi) pdf文件 方法/步骤 1.打开手机上的浏览器,找到"百度",点击进入百度搜索页面: 2.在搜索框中输入"pdf转word在线",再点击"百度一下": 3.展现出比较多的页面,点击其中任意一个进入转换界面: 4.默认就是&qu

[转载]word尾注插入参考文献——前人经验+自己总结

1. 以尾注的方式插入第一个参考文献. 将光标定位于word文档中将要插入参考文献的位置,按“插入/引用/脚注和尾注”.出现一菜单,选择“尾注”,“文档结尾”,编号格式为“1,2,3”.按“插入”按钮,就在该处就插入了一个上标“1”,而光标自动跳到文档最后,一个上标“1”的地方,这就是输入第一个参考文献的地方.然后按照排版格式要求输入参考文献. 注意:给文档中间的尾注编号添加方括号,选择   编辑——替换,输入查找内容为   ^e ,替换内容为   [^&].就OK了. 2. 文档结尾的参考文献

编程实现绘制表格

之前只知道word等文本工具可以绘图,但只是知其然不知其所以然.下面就粗略的讲一下它的原理.首先我们要了解的是表格的绘制都是有一些制表符构成的,那么下面就简单了,我们只要知道光标是如何判断怎么来显示这些制表符的.下面是一张光标向左时要执行的逻辑判断表,以及各种制表符的ascii码值就好了,我们就可以通过编程逻辑判断,来让活动窗体按照自己的意愿绘制表格了. 光标向左时要执行的逻辑判断表 下面是主要的逻辑代码 #include<stdio.h> #include<conio.h>] #

Lucene:基于Java的全文检索引擎简介 (zhuan)

http://www.chedong.com/tech/lucene.html ********************************************** Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比较 具体的安装和使用简介:系统结构介绍和演示 Hacking Lucene:简化的查询分析器,删除的

UI--Android中的状态切换按钮自定义

<代码里的世界> -UI篇 用文字札记描绘自己 android学习之路 转载请保留出处 by Qiao http://blog.csdn.net/qiaoidea/article/details/46715453 1.概述 Android中关于控制开关和页面/状态切换的使用场景还是比较多的.源生做的支持也有比如RadioGroup 和Tabhost等.这里准备通过自定义View来模仿学习下IOS两种常见UI样式: SwitchButton 和 SegmentControl. 首先先通过简易的组

最火的.NET开源项目

综合类 微软企业库 微软官方出品,是为了协助开发商解决企业级应用开发过程中所面临的一系列共性的问题, 如安全(Security).日志(Logging).数据访问(Data Access).配置管理(Configuration Manage)等,并将这些广泛使用的应用程序块集成封装至一个叫企业库的程序包中 CommonLibrary.net 一个帮助类库,包含了ActiveRecord, Csv, Command Line Parsing, Configuration, Validation,