PDF文件转成图片保存_itxt7 pdf 转图片-程序员宅基地

技术标签: java  

最新版访问:https://blog.csdn.net/wmf_helloWorld/article/details/107105353
1、根据文件路径获取文件,并将PDF文件的每一页转换为一个图片。其中要将图片转为base64格式的。

/**
     * <p>Description PDF文件转成图片</p>
     * @author wumf
     * @date 2020年1月20日 上午11:00:47
     * @param PdfFilePath PDF文件路径
     * @param fileImageList 存放图片文件
     * @param dpi 越大越清晰,转换也越慢
     * @return 文件页数
     * @throws CodeException 
     */
    public int pdfTurnImage(String pdfFilePath, List<String> fileImageList, int dpi) throws CodeException {
        
        File file = new File(pdfFilePath);
        PDDocument pdDocument;
        int pages = 0;
        try {
            
            pdDocument = PDDocument.load(file);
            PDFRenderer renderer = new PDFRenderer(pdDocument);
            PdfReader reader = new PdfReader(pdfFilePath);
            pages = reader.getNumberOfPages();
            LOGGER.info(LogType.INFO, "PDF文件一共有"+pages+"页");
            for (int i = 0; i < pages; i++) {
                BufferedImage image = renderer.renderImageWithDPI(i, dpi);                           
                fileImageList.add(base64Image(image));
            }
            
        } catch (Exception e) {
            LOGGER.error(LogType.ERROR, e);
            throw new CodeException(XYRFileServerConstants.ERROR_CODE_2017, XYRFileServerConstants.ERROR_MESSAGE_2017, e);
        }
        
        return pages;
    }

2、base64Image,其中的Base64.encode(bytes)方法为自定义的方法,可以去网上百度其他方式

/**
     * <p>Description image转成base64</p>
     * @author wumf
     * @date 2020年1月20日 上午11:26:24
     * @param image
     * @return
     * @throws CodeException
     */
    private String base64Image(BufferedImage image) throws CodeException {
        try(ByteArrayOutputStream baos = new ByteArrayOutputStream()) {            
            ImageIO.write(image, "png", baos);//写入流中
            byte[] bytes = baos.toByteArray();//转换成字节
            return new String(Base64.encode(bytes),"UTF-8");
        } catch (Exception e) {
            LOGGER.error(LogType.ERROR, e);
            throw new CodeException(XYRFileServerConstants.ERROR_CODE_2017, XYRFileServerConstants.ERROR_MESSAGE_2017, e);
        }        

    }

3、此时文件图片已经在集合中,可以解析查看

List<String> list = response.getFileImageList();
        for (int i = 0; i < list.size(); i++) {
            File file = new File("/20200120\\image"+i+".jpg");
            String image = list.get(i);
            try (FileOutputStream fos = new FileOutputStream(file)){
                fos.write(Base64.decode(image));                
            } catch (Exception e) {
                throw new CodeException(XYRFileServerConstants.ERROR_CODE_2018, XYRFileServerConstants.ERROR_MESSAGE_2018);
            }
        }

4、需要引用的包

import javax.imageio.ImageIO;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;
import org.springframework.stereotype.Component;

import com.itextpdf.text.pdf.PdfReader;

import cfca.sadk.util.Base64;

5、maven依赖

<!-- PDF -->  
        <dependency> 
            <groupId>com.itextpdf</groupId>  
            <artifactId>itext-asian</artifactId> 
        </dependency>  
        <dependency> 
            <groupId>cpcn.common.3rd</groupId>  
            <artifactId>itext-xtra</artifactId> 
        </dependency>  
        <dependency> 
            <groupId>com.itextpdf</groupId>  
            <artifactId>itextpdf</artifactId> 
        </dependency>
        <dependency>
    		<groupId>org.apache.pdfbox</groupId>
    		<artifactId>pdfbox</artifactId>
    		<version>2.0.9</version>
		</dependency>

5、测试demo

import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import java.util.UUID;
import javax.imageio.ImageIO;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;
import com.itextpdf.text.pdf.PdfReader;

public class LocalTest {

    // 获取到 pdf 文件路径

    // 获取到图片存放路径

    // study-1.jpg

    public static void main(String[] args) {
        pdf2Image("D:\\xyrFileRepository\\PolicyDeclare\\20200120\\202001200944427972857793199.pdf", "D:/temp/picture", 150);

    }

    /***
     * 
     * PDF文件转PNG图片,全部页数
     * @param PdfFilePath  pdf完整路径
     * @param imgFilePath 图片存放的文件夹
     * @param dpi dpi越大转换后越清晰,相对转换速度越慢
     * @return list 获取到pdf 的文件路径 /dsd/d.pdf 然后拼上绝对路径
     * 
     */

    public static Integer pdf2Image(String PdfFilePath, String dstImgFolder, int dpi) {

        UUID uuid = UUID.randomUUID();
        String uuId = uuid.toString();
        System.out.println(uuId);
        File file = new File(PdfFilePath);
        @SuppressWarnings("resource")
        PDDocument pdDocument = new PDDocument();
        try {
            // String imagePDFName = file.getName().substring(0, dot); //
            // 获取图片文件名
            String imgFolderPath = null;
            if (dstImgFolder.equals("")) {
                imgFolderPath = dstImgFolder + File.separator + uuId;// 获取图片存放的文件夹路径
            } else {
                imgFolderPath = dstImgFolder + File.separator + uuId;
            }
            if (createDirectory(imgFolderPath)) {
                pdDocument = PDDocument.load(file);
                PDFRenderer renderer = new PDFRenderer(pdDocument);
                /* dpi越大转换后越清晰,相对转换速度越慢 */
                PdfReader reader = new PdfReader(PdfFilePath);
                int pages = reader.getNumberOfPages();
                System.out.println("pdf总共多少页-----" + pages);
                StringBuffer imgFilePath = null;
                for (int i = 0; i < pages; i++) {
                    String imgFilePathPrefix = imgFolderPath + File.separator + "study";
                    System.out.println("imgFilePathPrefix=====" + imgFilePathPrefix);
                    imgFilePath = new StringBuffer();
                    imgFilePath.append(imgFilePathPrefix);
                    imgFilePath.append("-");
                    imgFilePath.append(String.valueOf(i));
                    imgFilePath.append(".jpg");
                    File dstFile = new File(imgFilePath.toString());
                    BufferedImage image = renderer.renderImageWithDPI(i, dpi);
                    System.out.println(dstFile);
                    ImageIO.write(image, "png", dstFile);
                }
                System.out.println("PDF文档转PNG图片成功!");
                System.out.println("做保存操作保存数据库-----");
                return 1;
            } else {
                System.out.println("PDF文档转PNG图片失败:" + "创建" + imgFolderPath + "失败");
                return -1;
            }
        } catch (IOException e) {
            e.printStackTrace();
            return -1;
        }
    }

    private static boolean createDirectory(String folder) {
        File dir = new File(folder);
        if (dir.exists()) {
            return true;
        } else {
            return dir.mkdirs();
        }
    }

    // 删除文件夹
    // param folderPath 文件夹完整绝对路径
    public static void delFolder(String folderPath) {
        try {
            delAllFile(folderPath); // 删除完里面所有内容
            String filePath = folderPath;
            filePath = filePath.toString();
            java.io.File myFilePath = new java.io.File(filePath);
            myFilePath.delete(); // 删除空文件夹
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // 删除指定文件夹下所有文件
    // param path 文件夹完整绝对路径
    public static boolean delAllFile(String path) {
        boolean flag = false;
        File file = new File(path);
        if (!file.exists()) {
            return flag;
        }
        if (!file.isDirectory()) {
            return flag;
        }
        String[] tempList = file.list();
        File temp = null;
        for (int i = 0; i < tempList.length; i++) {
            if (path.endsWith(File.separator)) {
                temp = new File(path + tempList[i]);
            } else {
                temp = new File(path + File.separator + tempList[i]);
            }
            if (temp.isFile()) {
                temp.delete();
            }
            if (temp.isDirectory()) {
                delAllFile(path + "/" + tempList[i]);// 先删除文件夹里面的文件
                delFolder(path + "/" + tempList[i]);// 再删除空文件夹
                flag = true;
            }
        }
        return flag;
    }
}

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/wmf_helloWorld/article/details/104051137

智能推荐

ABAP创建销售订单BAPI示例_bapi 创建退货销售订单-程序员宅基地

文章浏览阅读3.8k次。ABAP中创建销售订单BAPI1.BAPI种类2.BAPI区别3.创建抬头行项目输入结构4.创建接口函数,并配置传入传出参数5.代码1.BAPI种类BAPI_SALESORDER_CREATEFROMDAT2BAPI_CUSTOMERRETURN_CREATESD_SALESDOCUMENT_CREATE2.BAPI区别BAPI_SALESORDER_CREATEFROMDAT2 业务对象限制为BUS2032BAPI_CUSTOMERRETURN_CREATE 业务对象限制为BUS210_bapi 创建退货销售订单

FIRST集与FOLLOW 集合终极讲解_first follow-程序员宅基地

文章浏览阅读9.2k次,点赞5次,收藏22次。最近一直在学first集合和follow集合,一直没怎么搞明白,今天花了一点时间搞得差不多了。记录下来~~一下图文法为例: S->AB S->bC A->∑ A->b B->∑ B->aD C->AD C->b D->aS D->c FIRST集合相对FOLLOW集合更好求也更简明,故不在此贴重复first集合方法,下面是follow集合方法:规则如下: 1:若S是文法的开始_first follow

python交互式怎么保存_如何保存Python交互式会话?-程序员宅基地

文章浏览阅读1k次。我发现自己经常使用Python的解释器来处理数据库,文件等 - 基本上是大量的半结构化数据的手动格式化。 我没有像我希望的那样经常保存和清理有用的位。 有没有办法将我的输入保存到shell(数据库连接,变量赋值,少量循环和逻辑位) - 交互式会话的一些历史记录? 如果我使用类似script东西,我会得到太多的噪音。 我真的不需要腌制所有对象 - 但如果有一个解决方案可以做到这一点,那就没关系。 理..._python交互式怎么保存

python语言表达式5%2_python 计算2**3**4**5%10**8 的说明-程序员宅基地

文章浏览阅读1w次。在群里看到了有一个群使用这个2**3**4**5%10**8作为验证的问题,直接在python输入计算,很显然等了半天都没有反应,因为指数的运算太大了3**4**5运算如下373391848741020043532959754184866588225409776783734007750636931722079040617265251229993688938803977220468765065431..._. 在 python 语 言 中 , 表 达 式 5 2 * 5 % 3 * * 2 运 行 的 结 果 是 ( ) 。 省 牛 。 释义

如何将csdn上的文章保存为PDF?_怎么把csdn的文章导出为pdf-程序员宅基地

文章浏览阅读1.2k次,点赞3次,收藏19次。【代码】如何将csdn上的文章保存为PDF?_怎么把csdn的文章导出为pdf

C语言编程会遇到的问题-程序员宅基地

文章浏览阅读46次。关于C语言编程会遇到的一些问题

随便推点

[RabbitMQ] AMQP close-reason, initiated by Library, code=541-程序员宅基地

文章浏览阅读1.7k次。RabbitMQ.Client.Exceptions.BrokerUnreachableException: None of the specified endpoints were reachable ---> RabbitMQ.Client.Exceptions.OperationInterruptedException: The AMQP operation was interrupt..._the amqp operation was interrupted: amqp close-reason, initiated by library,

Redash -- Redash部署安装docker版_redash 部署 docker-程序员宅基地

文章浏览阅读3.1k次。向导官网1.环境准备1.1 安装docker和docker-compose1.2 安装nodejs和npm2.安装Redash官网主页Developer Guidegithub讨论issues1.环境准备官网Docker Based Developer Installation Guide1.1 安装docker和docker-composeDocker – yum安装docker和docker-compose1.2 安装nodejs和npmnodejs/githubNode_redash 部署 docker

secureCRT连接服务器报错 Unable to authenticate_the client has disconnected from the server. reaso-程序员宅基地

文章浏览阅读3.1w次,点赞2次,收藏5次。问题描述:用secureCRT连接远程云服务器时, 报出了以下错误:The client has disconnected from the server.Reason:Unable to authenticate using any of the configured authentication methods. 谷歌一番后, 解决方案如下:1. 修改/etc/ssh/ssh_the client has disconnected from the server. reason: unable to authenticate

linux下不同服务器间数据传输(rcp,scp,rsync,ftp,sftp,lftp,wget,curl)-程序员宅基地

文章浏览阅读107次。rcprcp不是一种安全的的传输文件的方式,rcp通过rsh(rsh见下面)来执行远程命令,要使用rcp必须经过一些配置,现在rcp已经被scp取代了,常用scp来进行文件传输。要使用rcp,需要具备以下条件:(1)如果系统中有/etc/hosts 文件,应确保该文件包含要与之进行通信的远程主机信息:internet_address official_name alias。例如:1.186..._curl sftp使用sshd

CVTE硬件、电源工程师技术一面+技术二面_电源硬件开发面经-程序员宅基地

文章浏览阅读5.9k次,点赞11次,收藏119次。技术一面:1. 3904是什么三极管?解答:(我的手机号码最后后四位是3904,当然是N型啦,还有3906。3904是NPN型的高频小功率管,用在正电源供电的放大电路里前级小信号放大。3906是PNP型的高频小功率管,用在负电源供电的小信号前级放大。2你什么课程学的比较好?(说了电力电子) 画出buck电路,并分析工作原理。解答:最基本的拓扑结构你要会把,升压降压拓扑,电压关系表达式,......_电源硬件开发面经

opencv批量灰度转换_图片处理-opencv-9.图像的灰度变换-程序员宅基地

文章浏览阅读513次。图像灰度线性变换图像的灰度线性变换是通过建立灰度映射来调整原始图像的灰度,从而改善图像的质量,凸显图像的细节,提高图像的对比度。灰度线性变换的计算公式如下所示:该公式中表示灰度线性变换后的灰度值,表示变换前输入图像的灰度值,和为线性变换方程的参数,分别表示斜率和截距。当α=1,b=0时,保持原始图像当α=1,b!=0时,图像所有的灰度值上移或下移当α=-1,b=255时,原始图像的灰度值反转当α&..._def log(c, img): output = c * np.log(1.0 + img) output = np.uint8(output + 0

推荐文章

热门文章

相关标签