Java 将Word转为HTML的方法

本文介绍如何在JAVA程序中将Word文档通过 Document.saveToFile() 方法转换为HTML文档。编辑代码前,参考如下环境配置,导入jar包。

【程序环境】

1. IntelliJ IDEA 2018( jdk 1.8.0)

2. 测试文档:Word 2013(.docx)

3. Jar包:Free Spire.Doc for Java 3.9.0

导入jar的两种方法:

方法1下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:

 

 

 

导入结果:

 

方法2maven程序中需要配置pom.xml文件,指定maven仓库路径和spire.doc.free的依赖,配置内容如下:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>

<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>3.9.0</version>
    </dependency>
</dependencies>

【Java】

import com.spire.doc.*;

public class WordtoHtml {
    public static void main(String[] args) {
        Document  doc = new Document();
        doc.loadFromFile("test.docx");
        doc.saveToFile("wordtohtml.html",FileFormat.Html);
        doc.dispose();
    }
}

转换效果

Word测试文档:

 

转换后的HTML文件:

 

注:代码中的文件路径为IDEA程序项目文件夹路径,如 F:\IDEAProject\Conversion_Doc\test.docx ,文件路径可以另行自定义为其他路径。

 

—End—