没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:何跃|2022-01-24 14:36:15.267|阅读 190 次
概述:PDF文件可以被用来存储文件、图像和其他数据。在过去,人们问是否有一个简单的方法从PDF文件中提取图形,如图表或照片。如果你想从一个PDF文件中获取所有的图像,或者有数百个或更多的PDF文件需要处理,那么答案就是使用LEADTOOLS。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
使用LEADTOOLS提取嵌入在PDF文件中的图像很容易。下面是使用LEADTOOLS从PDF文件中提取图像的C#、Java和PowerShell代码样本。
/// <summary> /// 提取PDF文档为TIFF /// </summary> /// <param name="pdfPath"></param> private static void ExtractImagesFromPdf(string pdfPath) { var destinationPath = Path.Combine(Path.GetDirectoryName(pdfPath), @"images\"); var documentName = Path.GetFileNameWithoutExtension(pdfPath); using var pdfDocument = new PDFDocument(pdfPath); pdfDocument.ParsePages(PDFParsePagesOptions.Objects, 1, -1); foreach (var page in pdfDocument.Pages) { var embeddedImages = page.Objects.Where(o => o.ObjectType == PDFObjectType.Image).ToArray(); using var codecs = new RasterCodecs(); foreach (var imgObj in embeddedImages) { var destinationFilePath = destinationPath + documentName + "~page-" + page.PageNumber + "~" + imgObj.ImageObjectNumber + ".tif"; using var image = pdfDocument.DecodeImage(imgObj.ImageObjectNumber); codecs.Save(image, destinationFilePath, RasterImageFormat.TifLzw, image.BitsPerPixel, 1, 1, -1, CodecsSavePageMode.Append); } } }
/** * 提取PDF文件并另存为到子目录 * e.g. getFileName("c:\\temp\\") will return "c:\\temp\\images\\" * * * @param pdfPath */ private static void extractImagesFromPdf(String pdfPath) { final String destinationFolder = getOutputFolder(pdfPath); final String documentName = getBaseName(getFileName(pdfPath)); final PDFDocument pdfDocument = new PDFDocument(pdfPath); pdfDocument.parsePages(PDFParsePagesOptions.OBJECTS.getValue(), 1, -1); final RasterCodecs codecs = new RasterCodecs(); try { final List<PDFDocumentPage> pages = pdfDocument.getPages(); for (PDFDocumentPage page : pages) { final int pageNumber = page.getPageNumber(); for (final PDFObject object : page.getObjects()) { if (object.getObjectType() == PDFObjectType.IMAGE) { final String imageObjectNumber = object.getImageObjectNumber(); final String destinationFilePath = destinationFolder + documentName + "~page-" + pageNumber + "~" + imageObjectNumber + ".tif"; final RasterImage image = pdfDocument.decodeImage(imageObjectNumber); try { codecs.save(image, destinationFilePath, RasterImageFormat.TIFLZW, image.getBitsPerPixel(), 1, 1, -1, CodecsSavePageMode.OVERWRITE); } finally { image.dispose(); } } } } } finally { codecs.dispose(); } }
function Export-LtImagesFromPdf { <# .SYNOPSIS Exports images embedded in a PDF file .DESCRIPTION Exports images embedded in a PDF file .PARAMETER PdfPath File path to the PDF file that has embedded images to be exported .PARAMETER Path Folder path to export the embedded images .EXAMPLE Export-LtImagesFromPdf -PdfPath "c:\temp\a.pdf" -Path "c:\temp\images\" .INPUTS String .OUTPUTS void .NOTES Author: LEAD Technologies, Inc. Website: //www.leadtools.com Twitter: @leadtools #> [CmdletBinding()] param( [Parameter(Mandatory)] [string]$PdfPath, [Parameter(Mandatory)] [string]$Path ) if( -not(Test-Path -Path $PdfPath -PathType Leaf) ) { Write-Error "File does not exist." return $false } if( -not(Test-Path -Path $Path -PathType Container) ) { New-Item -Path $Path -ItemType Directory } $baseFileName = (Get-Item $PdfPath).Basename $pdfDocument = New-Object -TypeName Leadtools.Pdf.PDFDocument -ArgumentList $PdfPath $pdfDocument.ParsePages(1, 1, -1) ForEach ($page in $pdfDocument.Pages){ ForEach($object in $page.Objects){ if( $object.ObjectType -eq [Leadtools.Pdf.PDFObjectType]::Image ){ $imageObjectNumber = $object.ImageObjectNumber $pageNumber = $page.PageNumber $image = $pdfDocument.DecodeImage($imageObjectNumber) $outputFilePath = (Join-Path -Path $Path -ChildPath ($baseFileName + "~page#-" + $pageNumber + "~" + $imageObjectNumber + ".tif")) Export-LTImage -RasterImage $image -Path $outputFilePath -Format ([Leadtools.RasterImageFormat]::Tif) } } } }
有了LEADTOOLS的工具包,就没有什么是你不能做的PDF文件了。点击这里可以下载Leadtools全套SDK。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@wqylolg.cn
对于 Essential Studio WPF 产品,Syncfusion 提供了一个 Web 安装程序。这个安装程序减轻了下载较大安装包的负担。你只需下载并运行在线安装程序,它的体积较小,并且会下载和安装你所选择的 Essential Studio 产品。
在本文中,我们将分享一个典型的系统集成实践,讲解如何将第三方后端 API 提供的数据格式转换为 DHTMLX Scheduler 所需的格式,实现与预订数据源的无缝对接。
通过编程方式从 Word 文档中提取图片,可以用于自动化文档处理任务。本文将演示如何使用 C# 和 Spire.Doc for .NET 库从 Word 文件中提取图片。
在数据整理完成、导出、共享或打印之前,往往需要 删除 Excel 工作表中的筛选器,本文将介绍如何使用 Spire.XLS for .NET 在 C# 程序中删除 Excel 中的筛选器。
LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@wqylolg.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢