你需要了解的 3 种 PDF 类型

更深入地了解不同类型的 PDF

PDF 已经成为数字世界中的常用格式,从存储和共享文档到填写表单或制作电子书,都会用到它。不过,并不是所有 PDF 都一样。你知道其实存在 3 种主要的 PDF 类型吗?从简单的 PDF 到交互式和动态 PDF 表单,了解不同类型的 PDF 对任何处理电子文档的人来说都非常重要。

PDF 的类型

在过去 30 年中,PDF 不断发展,并在其集合中新增了更多文件格式。为了支持更多类型的企业和使用场景, 又增加了 6 种额外的 PDF 标准, 它们基于 ISO (国际标准化组织)。PDF 标准由 ISO 32000-1 进行规范。该标准规定了 PDF 的技术要求及其使用方式。适合你的文档的 PDF 标准取决于你打算如何存储、共享和使用它。

了解更多 PDF 子集相关内容 请点击这里

根据来源不同,PDF 可以分为三种类型。创建方式也会决定 PDF 中文本、图片、表格等内容的可访问性。

3 种 PDF 类型:

  • “真正的”或标准 PDF
  • 扫描版 PDF
  • 可搜索 PDF

1. “真正的”或数字创建的 PDF

真正的 PDF (也称为数字创建的 PDF)是通过 Microsoft Word、Excel 等软件,或使用这些程序中的“打印为 PDF”功能创建的。它们由文本和图像组成。

可以将这类 PDF 看作包含两层: 图像层文本层。图像层显示文档打印后的样子,而文本层则是从原始 Word 文件继承过来的可搜索文本。

数字创建的 PDF 的主要优势之一在于它们可以被 轻松编辑 和排版。你可以修改文档中的文本、图片、布局或外观。但是否允许编辑 PDF 文件,取决于你用来打开该 PDF 的软件。

真正的 PDF 可以通过多种程序进行编辑,包括易于获取的在线 PDF 编辑器。借助功能丰富的在线工具(如 PDF2Go ),你可以轻松管理 PDF。你还可以 将 PDF 转换为其他文件格式 ,反之亦然。

“真正的”或数字创建的 PDF 是一种用途广泛且可靠的格式,可用于文档共享与协作、出版物、表单与申请、使用手册、存档与保存、报告和演示文稿。它们支持完全编辑和搜索,并包含交互功能,适用于多种使用场景。

2. “仅图像”或扫描版 PDF

仅图像扫描版 PDF 是纸质文档通过扫描仪或其他数字成像设备扫描得到的电子版本。这类 PDF 本质上是原始文档的图像,因此 无法像标准 PDF 或交互式 PDF 那样进行编辑或排版, 但可以在 PDF 阅读器或编辑器中添加批注和高亮。

由于仅图像 PDF 文档只包含页面的扫描图像而没有底层文本层,因此这类 PDF 文件不可搜索,文本通常无法修改或标注。 “仅图像”PDF 可以通过以下方式变为可搜索: 应用 OCR ,为文档添加一个文本层,通常位于页面图像的下方。

注意:如果想编辑“扫描版 PDF”文件,你可以使用 PDF转Word转换器 集成 OCR(光学字符识别)的软件。

3. 可搜索 PDF

可搜索 PDF 是一种允许用户在文档中搜索特定文本的 PDF 文件。可搜索 PDF 通常通过 OCR (光学字符识别)创建。OCR 会将图像或扫描文档中的文字转换为机器可读文本,以文本层的形式叠加在图像层之上。可搜索 PDF 文档中的文本可以被选择、复制和标注。

该过程通常通过专业的桌面 OCR 软件、移动应用或 基于网页的服务

来完成。可搜索 PDF 深受企业和机构欢迎,对于需要在大型文档中快速查找信息的用户而言非常实用。