Cách chuyển PDF sang PDF/A trực tuyến

5 bước đơn giản để chuẩn bị PDF cho môi trường lưu trữ lâu dài

Bạn có một tài liệu PDF và cần chuyển nó sang PDF/A, nhưng không chắc phải làm thế nào và nên chọn phiên bản nào? Nếu đúng như vậy, chúng tôi sẵn sàng hướng dẫn bạn chuyển PDF sang tệp PDF/A.

Trong bài viết này, hãy tìm hiểu về các phiên bản PDF/A khác nhau, các mức độ tuân thủcách chuyển đổi tài liệu của bạn sang định dạng PDF/A phù hợp.

Nên chọn phiên bản PDF/A và mức độ tuân thủ nào

Trước khi chuyển tệp sang PDF/A, công cụ chuyển đổi sẽ yêu cầu bạn chọn một tiêu chuẩn PDF/A (PDF/A-1, PDF/A-2, PDF/A-3) và một mức độ tuân thủ (a, b & u). Nhìn qua có thể chúng khá giống nhau, nhưng lựa chọn của bạn có thể ảnh hưởng đến toàn bộ quá trình chuyển đổi, khiến nó rất đơn giản hoặc cần nhiều điều chỉnh.

Nắm rõ các phiên bản PDF/A và mức độ tuân thủ sẽ giúp bạn tăng giá trị tài liệu, tùy theo nhu cầu sử dụng.

Khi bạn chuyển một tệp PDF thông thường sang tiêu chuẩn PDF/A-1 gốc, thường sẽ cần thay đổi nhiều nhất. Ví dụ, kích thước tệp có thể tăng do không dùng được các công nghệ nén ảnh mới hơn.

PDF/A-1 quy định hai mức độ tuân thủ:

  • PDF/A-1b - Mức B (cơ bản). Yêu cầu bắt buộc: nhúng phông chữ, hướng dẫn quản lý màu, siêu dữ liệu. PDF/A-1b chủ yếu được dùng để lưu trữ tài liệu được quét hoặc các tài liệu từ tệp PDF hiện có.
  • PDF/A-1a - Mức A (khả năng truy cập).

Các yêu cầu bổ sung cho mức A:

  • Khai báo ngôn ngữ,
  • Cấu trúc tài liệu phân cấp,
  • Vùng văn bản được gắn thẻ và văn bản mô tả cho hình ảnh và biểu tượng,
  • Ánh xạ ký tự sang Unicode.

Tệp PDF/A-1a dễ điều hướng hơn, nội dung trong tài liệu dễ tái sử dụng hơn và tài liệu cũng dễ đọc hơn cho người khiếm thị. Văn bản thường có khả năng tái tạo tốt hơn. Khác với mức cơ bản, mức có khả năng truy cập cho phép người dùng tìm kiếm từ khóa trong tài liệu.

PDF/A-2, ngược lại, cần ít điều chỉnh hơn, vì hỗ trợ nén JPEG2000, phần tử trong suốt và các lớp PDF. Nhờ vậy, kích thước tệp sẽ nhỏ hơn. Có 3 loại PDF/A-2 khác nhau: PDF/A-2a, PDF/A-2u và PDF/A-2b.

Như đã đề cập, phần 2 của tiêu chuẩn cung cấp thêm một số tính năng:

  • Nén ảnh JPEG 2000
  • Hỗ trợ hiệu ứng trong suốt và các lớp
  • Nhúng phông chữ OpenType
  • Hỗ trợ chữ ký số theo PDF Advanced Electronic Signatures
  • Tùy chọn nhúng tệp PDF/A để giúp lưu trữ cả bộ tài liệu trong một tệp duy nhất

PDF/A-2a và PDF/A-2b tương ứng với mức tuân thủ a và b trong PDF/A-1. Tuy nhiên, PDF/A-2u là mức B (PDF/A-2b) cùng yêu cầu bổ sung rằng toàn bộ văn bản trong tài liệu phải được ánh xạ Unicode.

PDF/A-3 gần như giống hệt PDF/A-2, nhưng còn cho phép nhúng các tệp không phải PDF/A. Nếu bạn dự định dùng hoặc xử lý nhiều tệp có đính kèm không phải PDF/A, PDF/A-3 có thể là lựa chọn phù hợp. Định dạng này có thể coi là "đầy đủ", vì bản thân PDF/A giúp tài liệu quét có thể đọc được lâu dài, nén MRC giúp tệp rất nhỏ, OCR giúp có thể tìm kiếm và tệp đính kèm hỗ trợ nhu cầu trao đổi tài liệu. Hãy chọn định dạng phù hợp nhất với nhu cầu lưu trữ của bạn.

Tóm tắt về các mức độ tuân thủ:

  • Mức B (Cơ bản) là mức dễ đạt nhất. Chỉ yêu cầu tài liệu tuân thủ các hướng dẫn để hiển thị ổn định. Về lâu dài, tài liệu sẽ hiển thị giống nhau khi xem hoặc in.
  • Mức A (Khả năng truy cập) bao gồm mọi yêu cầu của mức B, đồng thời bổ sung các tính năng giúp cải thiện khả năng truy cập của tài liệu. Văn bản có thể được tìm kiếm và sao chép một cách đáng tin cậy, nội dung cũng dễ truy cập hơn với các công nghệ như trình đọc màn hình cho người khiếm thị.
  • Mức U (Unicode) được giới thiệu cùng với PDF/A-2. Nó đảm bảo văn bản trong tài liệu có thể được ánh xạ sang mã ký tự Unicode chuẩn.

Cách chuyển PDF sang PDF/A?

Công cụ chuyển đổi PDF sang PDF/A giúp bạn chuyển tài liệu PDF sang phiên bản chuẩn ISO một cách hiệu quả. Bạn không cần tải về và cài đặt chương trình mới trên máy tính. Trình chuyển đổi PDF/A của chúng tôi cho phép bạn chuyển PDF sang PDF/A thuận tiện, ngay trên web. Thực hiện các bước sau:

Chỉnh sửa PDF
  1. Nhấp “Chọn tệp” để chọn tệp PDF cần tải lên. Bạn cũng có thể kéo và thả tệp PDF. Có thể tải tệp từ Internet (Nhập URL) hoặc từ dịch vụ lưu trữ đám mây (Google Drive, Dropbox).
  2. Chọn định dạng PDF/A bạn muốn chuyển sang: PDF/A-1b, PDF/A-2b hoặc PDF/A-3b.
  3. Tùy chọn - Bật chế độ nghiêm ngặt để truy cập tất cả các mức độ tuân thủ (a, b & u).
  4. Nhấp Bắt đầu để tiến hành chuyển đổi.
  5. Tải xuống tệp PDF/A mới của bạn.

Cần lưu ý: Mặc dù mức tuân thủ cao hơn (a hoặc u) có thể tăng giá trị tài liệu, chúng cũng có thể tốn khá nhiều thời gian. Bằng cách chọn mức B, ví dụ PDF/A-2b, tài liệu của bạn vẫn tuân thủ các hướng dẫn hiển thị ổn định mà không phát sinh yêu cầu bổ sung. Nhờ đó, tiết kiệm thời gian cho bạn.

PDF/A có thể tìm kiếm được không?

Có. PDF/A cho phép các quy trình nhận dạng văn bản và đó cũng là một trong những lợi ích chính của PDF/A. Văn bản của nội dung được tạo số hóa được giữ nguyên trong tài liệu, bao gồm cả văn bản trích xuất bằng nhận dạng ký tự quang học (OCR), nghĩa là ngay cả tài liệu PDF/A được quét cũng có thể tìm kiếm được.

“Tuân thủ PDF/A” nghĩa là gì?

Tuân thủ PDF/A đơn giản nghĩa là tệp của bạn đáp ứng các yêu cầu của định dạng PDF/A. Một số yêu cầu tuân thủ PDF/A gồm:

  • Toàn bộ nội dung được nhúng (phông chữ, màu sắc, văn bản, hình ảnh, v.v.)
  • Không được chứa nội dung âm thanh và video.
  • Tệp không được mã hóa.
  • Tệp không chứa tham chiếu đến nội dung bên ngoài.
  • Tệp tuân theo siêu dữ liệu dựa trên tiêu chuẩn.
  • Trường biểu mẫu PDF tương tác phải có từ điển hiển thị.
  • Tệp không được chứa JavaScript.

Còn việc xác thực thì sao - Có cần không?

Vì không phải lúc nào cũng dễ nhận biết một tệp PDF hiện có có thực sự đáp ứng tiêu chuẩn PDF/A của ISO hay không, nên tốt hơn là bạn nên thực hiện kiểm tra xác thực để xem xét tất cả các phần liên quan của tài liệu.

Cách xác thực tệp PDF/A?

Trình xác thực PDF/A có thể được dùng để xác nhận rằng một tệp thực sự là tệp PDF/A. Đây là các công cụ trực tuyến kiểm tra xem mọi yếu tố của tiêu chuẩn đã được đáp ứng hay chưa. Các tệp PDF/A được tạo bằng trình chuyển đổi trực tuyến của chúng tôituân thủ ISOvà vượt quakiểm tra Vera PDF.Vera PDF là trình xác thực định dạng tệp mã nguồn mở hỗ trợ mọi phần và mọi mức độ tuân thủ của PDF/A.