Show Menu
主题×

确定文档是否符合PDF/A规范

您可以使用Assembler服务确定PDF文档是否符合PDF/A规范。 PDF/A文档以存档格式存在,用于长期保留文档的内容。 字体嵌入到文档中,且文件未压缩。 因此,PDF/A文档通常大于标准PDF文档。 此外,PDF/A文档不包含音频和视频内容。
PDF/A-1规范由A和B两个符合性级别组成。两个级别之间的主要区别是逻辑结构(辅助功能)支持,符合性级别B不需要这些支持。无论符合性级别如何,PDF/A-1都规定所有字体都嵌入到生成的PDF/A文档中。 目前,验证(和转换)只支持PDF/A-1b。
在本讨论中,请假定使用以下DDX文档。
 <?xml version="1.0" encoding="UTF-8"?>
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/">
         <DocumentInformation source="Loan.pdf" result="Loan_result.xml">
         <PDFAValidation compliance="PDF/A-1b" resultLevel="Detailed"                       ignoreUnusedResources="true" allowCertificationSignatures="true" />
     </DocumentInformation>
 </DDX>

在此DDX文档中,元素 DocumentInformation 指示Assembler服务返回有关输入PDF文档的信息。 在元 DocumentInformation 素中,元 PDFAValidation 素指示Assembler服务指示输入的PDF文档是否符合PDF/A规范。
Assembler服务返回信息,该信息指定输入的PDF文档在包含元素的XML文档中是否符合PDF/A规 PDFAConformance 范。 如果输入的PDF文档符合PDF/A规范,则元素 PDFAConformance 属性的 isCompliant 值为 true 。 如果PDF文档不符合PDF/A规范,则元素 PDFAConformance 属性的 isCompliant 值为 false
由于本节中指定的DDX文档包含元 DocumentInformation 素,因此Assembler服务返回XML数据而不是PDF文档。 即,汇编服务不会汇编或反汇编PDF文档;它返回有关XML文档中输入的PDF文档的信息。
有关Assembler服务的详细信息,请参阅 AEM Forms的服务参考
有关DDX文档的详细信息,请参 阅Assembler service和DDX Reference

步骤摘要

要确定PDF文档是否符合PDF/A规范,请执行以下任务:
  1. 包括项目文件。
  2. 创建PDF Assembler客户端。
  3. 引用现有DDX文档。
  4. 引用用于确定PDF/A规范的PDF文档。
  5. 设置运行时选项。
  6. 检索有关PDF文档的信息。
  7. 保存返回的XML文档。
包括项目文件
在开发项目中包含必要的文件。 如果您使用Java创建客户端应用程序,请包含必要的JAR文件。 如果您使用Web服务,请确保包含代理文件。
以下JAR文件必须添加到项目的类路径中:
  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar(在JBoss上部署AEM表单时为必需)
  • jbossall-client.jar(在JBoss上部署AEM表单时需要)
如果AEM Forms部署在JBoss以外的受支持J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar文件替换为特定于AEM Forms部署在上的J2EE应用程序服务器的JAR文件。 有关所有AEM Forms JAR文件的位置的信息,请参 阅包括AEM Forms Java库文件
创建PDF Assembler客户端
在以编程方式执行Assembler操作之前,必须创建Assembler服务客户端。
引用现有DDX文档
必须引用DDX文档才能执行Assembler服务操作。 要确定输入的PDF文档是否符合PDF/A规范,请确保DDX文档包含元素 PDFAValidation 中的元 DocumentInformation 素。 元 PDFAValidation 素指示Assembler服务返回一个XML文档,该文档指定输入的PDF文档是否符合PDF/A规范。
引用用于确定PDF/A规范的PDF文档
必须引用PDF文档并将其传递给Assembler服务,以确定PDF文档是否符合PDF/A规范。
设置运行时选项
您可以设置运行时选项,这些选项控制Assembler服务在执行作业时的行为。 例如,您可以设置一个选项,指示Assembler服务在遇到错误时继续处理作业。 有关可设置的运行时选项的信息,请参阅 AssemblerOptionSpec AEM Forms API参考 中的类引用
检索有关PDF文档的信息
在创建Assembler服务客户端、引用DDX文档、引用交互式PDF文档和设置运行时选项后,可以调用该操 invokeDDX 作。 由于DDX文档包含该元 DocumentInformation 素,因此Assembler服务返回XML数据而不是PDF文档。
保存返回的XML文档
Assembler服务返回的XML文档指定输入的PDF文档是否符合PDF/A规范。 例如,如果输入的PDF文档不符合PDF/A规范,Assembler服务将返回一个包含以下元素的XML文档:
 <PDFAConformance isCompliant="false" compliance="PDF/A-1b" resultLevel="Detailed" ignoreUnusedResources="true" allowCertificationSignatures="true">

将XML文档另存为XML文件,以便打开文件并查看结果。
另请参阅

使用Java API确定文档是否符合PDF/A规范

使用Assembler Service API(Java)确定PDF文档是否符合PDF/A规范:
  1. 包括项目文件。
    在Java项目的类路径中包含客户端JAR文件,如adobe-assembler-client.jar。
  2. 创建PDF Assembler客户端。
    • 创建包 ServiceClientFactory 含连接属性的对象。
    • 使用对 AssemblerServiceClient 象的构造函数并传递该对 ServiceClientFactory 象。
  3. 引用现有DDX文档。
    • 使用 java.io.FileInputStream DDX文档的构造函数并传递一个指定DDX文件位置的字符串值,创建一个表示该文档的对象。 要确定PDF文档是否符合PDF/A规范,请确保DDX文档包含元 PDFAValidation 素中包含的元 DocumentInformation 素。
    • 使用对 com.adobe.idp.Document 象的构造函数并传递该对象来创建 java.io.FileInputStream 对象。
  4. 引用用于确定PDF/A规范的PDF文档。
    • 通过 java.io.FileInputStream 使用其构造函数并传递用于确定PDF/A符合性的PDF文档的位置,创建对象。
    • 使用对 com.adobe.idp.Document 象的构造函数并传递包含PDF文 java.io.FileInputStream 档的对象,从而创建对象。
    • 使用构 java.util.Map 造函数创建用于存储输入PDF文档的对 HashMap 象。
    • 通过调用对象的方 java.util.Map 法并传递以下参数, put 向对象添加一个条目:
      • 表示键名的字符串值。 此值必须与DDX文档中指定的源元素的值匹配。 例如,本节介绍的DDX文档中的源元素的值为Loan.pdf。
      • com.adobe.idp.Document 含输入PDF文档的对象。
  5. 设置运行时选项。
    • 使用 AssemblerOptionSpec 其构造函数创建存储运行时选项的对象。
    • 通过调用属于对象的方法,设置运行时选项以满足您的业务 AssemblerOptionSpec 要求。 例如,要指示Assembler服务在发生错误时继续处理作业,请调用对 AssemblerOptionSpec 象的方 setFailOnError 法并传递 false
  6. 检索有关PDF文档的信息。
    调用对 AssemblerServiceClient 象的方 invokeDDX 法并传递以下所需值:
    • 表示 com.adobe.idp.Document 要使用的DDX文档的对象
    • java.util.Map 含用于确定PDF/A兼容性的输入PDF文件的对象
    • 指定 com.adobe.livecycle.assembler.client.AssemblerOptionSpec 运行时选项的对象
    该方 invokeDDX 法返回一个包 com.adobe.livecycle.assembler.client.AssemblerResult 含XML数据的对象,该对象指定输入的PDF文档是否符合PDF/A规范。
  7. 保存返回的XML文档。
    要获取指定输入的PDF文档是否为PDF/A文档的XML数据,请执行以下操作:
    • 调用 AssemblerResult 对象的方 getDocuments 法。 这将返回一个 java.util.Map 对象。
    • 遍历对象, java.util.Map 直到找到生成的对 com.adobe.idp.Document 象。
    • 调用对 com.adobe.idp.Document 象的方 copyToFile 法以提取XML文档。 确保将XML数据另存为XML文件。
另请参阅
快速入门(SOAP模式):使用Java API (SOAP模式)确定文档是否符合PDF/A规范

使用Web服务API确定文档是否符合PDF/A规范

使用Assembler Service API(Web服务)确定PDF文档是否符合PDF/A规范:
  1. 包括项目文件。
    创建使用MTOM的Microsoft .NET项目。 确保使用以下WSDL定义: http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1 .
    替换 localhost 为承载AEM Forms的服务器的IP地址。
  2. 创建PDF Assembler客户端。
    • 使用对 AssemblerServiceClient 象的默认构造函数创建对象。
    • 使用构 AssemblerServiceClient.Endpoint.Address 造函数创建对 System.ServiceModel.EndpointAddress 象。 将指定WSDL的字符串值传递给AEM Forms服务(例如, http://localhost:8080/soap/services/AssemblerService?blob=mtom )。 您无需使用该属 lc_version 性。 在创建服务引用时,会使用此属性。)
    • 通过 System.ServiceModel.BasicHttpBinding 获取字段的值创建对 AssemblerServiceClient.Endpoint.Binding 象。 将返回值转换为 BasicHttpBinding
    • 将对 System.ServiceModel.BasicHttpBinding 象的字段 MessageEncoding 设置为 WSMessageEncoding.Mtom 。 此值确保使用MTOM。
    • 通过执行以下任务启用基本HTTP身份验证:
      • 将AEM表单用户名分配给字段 AssemblerServiceClient.ClientCredentials.UserName.UserName
      • 为字段分配相应的口令值 AssemblerServiceClient.ClientCredentials.UserName.Password
      • 为字段指 HttpClientCredentialType.Basic 定常数值 BasicHttpBindingSecurity.Transport.ClientCredentialType
      • 为字段指 BasicHttpSecurityMode.TransportCredentialOnly 定常数值 BasicHttpBindingSecurity.Security.Mode
  3. 引用现有DDX文档。
    • 使用对 BLOB 象的构造函数创建对象。 对 BLOB 象用于存储DDX文档。
    • 通过调 System.IO.FileStream 用对象的构造函数并传递一个字符串值来创建对象,该字符串值表示DDX文档的文件位置以及打开文件的模式。
    • 创建存储对象内容的字节数 System.IO.FileStream 组。 您可以通过获取对象的属性来确定字 System.IO.FileStream 节数组的大 Length 小。
    • 通过调用对象的方法并传递要读取的字 System.IO.FileStream 节数组、开始 Read 位置和流长度,用流数据填充字节数组。
    • 通过 BLOB 为对象的字段指定 MTOM 字节数组的内容来填充该对象。
  4. 引用用于确定PDF/A规范的PDF文档。
    • 使用对 BLOB 象的构造函数创建对象。 对 BLOB 象用于存储输入的PDF文档。
    • 通过调 System.IO.FileStream 用对象的构造函数并传递一个字符串值来创建对象,该字符串值表示输入PDF文档的文件位置以及打开文件的模式。
    • 创建存储对象内容的字节数 System.IO.FileStream 组。 您可以通过获取对象的属性来确定字 System.IO.FileStream 节数组的大 Length 小。
    • 通过调用对象的方法并传递要读取的字 System.IO.FileStream 节数组、开始 Read 位置和流长度,用流数据填充字节数组。
    • 通过 BLOB 将对象的属性指定 MTOM 为字节数组的内容来填充对象。
    • 创建对 MyMapOf_xsd_string_To_xsd_anyType 象。 此集合对象用于存储PDF文档。
    • 创建对 MyMapOf_xsd_string_To_xsd_anyType_Item 象。
    • 为对象的字段指定表示键名 MyMapOf_xsd_string_To_xsd_anyType_Item 的字符串 key 值。 此值必须与DDX文档中指定的PDF源元素的值匹配。
    • 将存 BLOB 储PDF文档的对象指定到该对 MyMapOf_xsd_string_To_xsd_anyType_Item 象的字 value 段。
    • 将对 MyMapOf_xsd_string_To_xsd_anyType_Item 象添加到对 MyMapOf_xsd_string_To_xsd_anyType 象。 调用对 MyMapOf_xsd_string_To_xsd_anyType 象的方 Add 法并传递对 MyMapOf_xsd_string_To_xsd_anyType 象。
  5. 设置运行时选项。
    • 使用 AssemblerOptionSpec 其构造函数创建存储运行时选项的对象。
    • 通过为属于该对象的数据成员分配一个值,设置运行时选项以满足您的业务 AssemblerOptionSpec 要求。 例如,要指示Assembler服务在发生错误时继续处理作业,请为对 false 象的数 AssemblerOptionSpec 据成员分 failOnError 配。
  6. 检索有关PDF文档的信息。
    调用对 AssemblerServiceService 象的方 invoke 法并传递以下值:
    • 表示 BLOB DDX文档的对象。
    • MyMapOf_xsd_string_To_xsd_anyType 含输入PDF文档的对象。 其键必须与PDF源文件的名称匹配,并且其值必须是与输 BLOB 入的PDF文件对应的对象。
    • 指定 AssemblerOptionSpec 运行时选项的对象。
    该方 invoke 法返回一个包 AssemblerResult 含XML数据的对象,该对象指定输入的PDF文档是否为PDF/A文档。
  7. 保存返回的XML文档。
    要获取指定输入的PDF文档是否为PDF/A文档的XML数据,请执行以下操作:
    • 访问对 AssemblerResult 象的字段,该 documents``Map 字段是一个包含XML数据的对象,该XML数据指定输入的PDF文档是否为PDF/A文档。
    • 遍历对象 Map 以获得每个生成的文档。 然后,将该数组成员的值转换为 BLOB
    • 通过访问XML对象的字段提取表示XML数据 BLOB 的二进制数 MTOM 据。 此字段存储可以作为XML文件写入的字节数组。
另请参阅