![](http://img.qy6.com.cn/images/noimg.gif)
图书制作,单、双层pdf
发布时间:07月07日
详细说明
什么是双层PDF文件?
PDF文件是一种具有多层结构的格式文件,其特点是:文件既可以是文本型的(比如由word生成的文件),也可以是图像型的(比如由扫描生成的文件);双层PDF文件是指文件内容既包含文本层,也包含图像层,且其位置上下一一相对应。双层PDF是指将标准资料通过扫描仪快速录入后,经过去污、纠偏和OCR识别,然后可以直接生成可以检索的PDF文件,这个PDF文件是双层的,上层是原始图像,下层是识别结果,这样可以100%保留原始版面效果,并且支持选择/复制/检索等功能,这样的PDF文件*后可以存储在光盘、硬盘或磁盘阵列中,并通过建立索引数据库进行科学的管理。
双层PDF生成解决方案
一、系统简介
• 强劲的识别核心
《双层PDF文件加工系统》全能图文软件系统集成汉王*新技术,内嵌汉王科技尖端ocr核心,目前《双层PDF文件加工系统》字符库涵盖GB2312-80一级字库3775个字符,二级字库3008个字符以及标点、数字、英文字集等常用符号。同时收录了使用频率高的台湾繁体字集和香港繁体字集。常用字符采集率达到99.99%。
《双层PDF文件加工系统》能够自动识别宋体、黑体、楷体、隶书、新宋体、仿宋等一百多种字体格式。
支持中英混排、简繁混排以及字体混排。
• 领先的文档存储
《双层PDF文件加工系统》能够将图片的识别结果保存为Word、RTF、Excel、Txt、Html及普通PDF、双层PDF等文件格式。让您轻轻松松摘抄、编辑扫描图像中的文字、图片、表格等。
• 简单的操作界面
高度封装处理核心,无需专门学习,轻轻松松,点击完成。
• 全面的兼容性: 全面支持市场上的扫描仪类型,《双层PDF文件加工系统》与扫描仪无缝连接,扫描处理同步进行,一步到位轻轻松松点击按钮就完成。
• 强劲的PDF处理:
• 支持通用的ZIP、LZW、CCITT、JPEG、JPEG2000等11种PDF编码格式。该系统支持打开多种编码方式的PDF文件,涵盖企事业单位所有PDF应用格式。
• 多页PDF智能拆分、处理识别,同时支持导出多页双层PDF、单层PDF。
• 复杂版面,精确还原:智能分析中、英、繁字体,文、表、图混排文本,无需人工干预。同时采用全新分栏技术,版面还原更加精确,识别后的文档无需排版编辑更轻松。
• 批量处理,高速录入:可以达到每分钟至少6000字的速度,超强、高速批量处理功能,可连续识别1000页文件。建立工程文件,工作进度自动保存,打开工程自动保存,打开工程自动指向工作断点,方便管理。
• 公文处理,简单易用:强大的公文处理能力,对于其中的红章可以单独识别与提取,再现公文原貌。
• 文、表、图,高效录入:优异的表格识别能力,帮您将原有表格快捷转化成为可任意编辑的电子表格。获取图像支持黑白二值、256级灰度和24位真彩色。支持bmp、tif、jpg的图像格式。
• 图文对照,校对方便:识别结果可与原图一一对应显示,校对也轻松。使得错误点一目了然。
二、系统特点
1、批量、快速的前端扫描:
支持通用平板扫描仪、企业级中高速扫描仪;充分满足高速集中录入的要求。
2、强大的识别:
双层PDF生成系统内置功能强大的OCR识别软件,识别核心采用国际领先的OCR技术,能快速的实现图文转换,识别率达到98%以上。
3、完美的PDF重现:
识别结果PDF是采用灵文公司特有的双层PDF,完美的实现了原文重现。
4、加密功能:
系统支持PDF文件加密功能,可以控制用户编辑/打印/修改该PDF文件,在标准化管理中非常有必要。
5、用户不需要安装Adobe Acrobat软件。
6、支持数十种图像格式到双层PDF文件的直接转换,包括TIFF, JPG, BMP, DCX, PCX, EMF, GIF, PCD, PIC, PICT, PNG, PNM, PSD, TGA, WMF等图像格式,系统会自动识别这些文件,然后生成文本层,合并到双层PDF中,不需要人工干涉。