Show Menu
화제×

프로그래밍 방식으로 PDF 문서 분리

PDF 문서를 어셈블러 서비스로 전달하여 분해할 수 있습니다. 일반적으로 이 작업은 PDF 문서가 여러 개별 문서(예: 문 모음)에서 처음 작성된 경우에 유용합니다. 다음 그림에서 DocA는 여러 결과 문서로 나누어져 페이지에서 첫 번째 수준 1 책갈피가 새 결과 문서의 시작을 식별합니다.
PDF 문서를 분해하려면 해당 PDFsFromBookmarks 요소가 DCX 문서에 있는지 확인합니다. 요소는 결과 PDFsFromBookmarks 요소이며 DDX 요소의 하위 요소일 수 있습니다. 여러 문서를 생성할 수 있으므로 result 속성이 없습니다.
PDFsFromBookmarks 요소로 소스 문서의 각 수준 1 책갈피에 대해 단일 문서가 생성됩니다.
이 토론을 위해 다음 DCX 문서가 사용되었다고 가정합니다.
 <?xml version="1.0" encoding="UTF-8"?>
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/">
      <PDFsFromBookmarks prefix="stmt">
     <PDF source="AssemblerResultPDF.pdf"/>
 </PDFsFromBookmarks>
 </DDX>

이 섹션을 읽기 전에 Assembler 서비스를 사용하여 PDF 문서를 조합하는 것에 익숙해지는 것이 좋습니다. 자세한 내용은 프로그래밍 방식으로 PDF 문서 작성을 참조하십시오 .
단일 PDF 문서를 어셈블러 서비스로 전달하고 단일 문서를 다시 가져올 때 invokeOneDocument 작업을 호출할 수 있습니다. 그러나 한 개의 입력 PDF 문서가 어셈블러 서비스로 전달되더라도 어셈블러 서비스는 하나 이상의 문서가 들어 있는 컬렉션 개체를 반환하므로 PDF 문서를 분해하려면 invokeDDX 작업을 사용하십시오.
어셈블러 서비스에 대한 자세한 내용은 AEM Forms 에 대한 서비스 참조를 참조하십시오 .
DDX 문서에 대한 자세한 내용은 어셈블러 서비스 및 DCX 참조를 참조하십시오 .

단계 요약

PDF 문서를 분해하려면 다음 작업을 수행하십시오.
  1. 프로젝트 파일 포함
  2. PDF Assembler 클라이언트 만들기
  3. 기존 DCX 문서를 참조합니다.
  4. PDF 문서를 참조하여 분해합니다.
  5. 런타임 옵션을 설정합니다.
  6. PDF 문서를 분해합니다.
  7. 분해된 PDF 문서를 저장합니다.
프로젝트 파일 포함
개발 프로젝트에 필요한 파일을 포함합니다. Java를 사용하여 클라이언트 응용 프로그램을 만드는 경우 필요한 JAR 파일을 포함합니다. 웹 서비스를 사용하는 경우 프록시 파일을 포함해야 합니다.
다음 JAR 파일을 프로젝트의 클래스 경로에 추가해야 합니다.
  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar (AEM Forms가 JBoss에 배포된 경우 필요)
  • jbossall-client.jar(JBoss에 AEM Forms가 배포된 경우 필요)
aem Forms가 JBoss가 아닌 지원되는 J2EE 응용 프로그램 서버에 배포된 경우, adobe-utilities.jar 및 jbossall-client.jar를 AEM Forms가 배포된 J2EE 응용 프로그램 서버에 고유한 JAR 파일로 교체해야 합니다.
PDF 어셈블러 클라이언트 만들기
어셈블리 작업을 프로그래밍 방식으로 수행하려면 먼저 어셈블러 서비스 클라이언트를 만들어야 합니다.
기존 DCX 문서 참조
PDF 문서를 분해하려면 DCX 문서를 참조해야 합니다. 이 DDX 문서에는 PDFsFromBookmarks 요소가 포함되어야 합니다.
분해할 PDF 문서 참조
PDF 문서를 분해하려면 분해할 PDF 문서를 나타내는 PDF 파일을 참조하십시오. 어셈블러 서비스에 전달되면 문서의 각 수준 1 책갈피에 대해 별도의 PDF 문서가 반환됩니다.
런타임 옵션 설정
작업을 수행하는 동안 어셈블러 서비스의 동작을 제어하는 런타임 옵션을 설정할 수 있습니다. 예를 들어 오류가 발생하면 어셈블리 서비스에서 작업을 계속 처리하도록 하는 옵션을 설정할 수 있습니다.
PDF 문서 분해
Assembler 서비스 클라이언트를 만든 후 DCX 문서를 참조하고, 분해할 PDF 문서를 참조하고, 런타임 옵션을 설정한 후 invokeDDX 메서드를 호출하여 PDF 문서를 분해할 수 있습니다. DDX 문서에 PDF 문서를 분해하는 지침이 포함되어 있는 경우 어셈블러 서비스는 컬렉션 개체 내에서 분해된 PDF 문서를 반환합니다.
분해된 PDF 문서 저장
분해된 모든 PDF 문서는 컬렉션 개체 내에서 반환됩니다. 컬렉션 개체를 반복하고 각 PDF 문서를 PDF 파일로 저장할 수 있습니다.
참고 항목

Java API를 사용하여 PDF 문서 분해

Assembler Service API(Java)를 사용하여 PDF 문서를 분해합니다.
  1. 프로젝트 파일 포함
    Java 프로젝트의 클래스 경로에 adobe-assembler-client.jar와 같은 클라이언트 JAR 파일을 포함합니다.
  2. PDF Assembler 클라이언트 만들기
    • 연결 속성을 포함하는 ServiceClientFactory 개체를 만듭니다.
    • 생성자를 사용하여 객체를 전달하여 AssemblerServiceClient 객체를 만듭니다 ServiceClientFactory .
  3. 기존 DCX 문서를 참조합니다.
    • 생성자를 사용하고 DCX 파일의 위치를 지정하는 문자열 값을 전달하여 DCX 문서를 나타내는 java.io.FileInputStream 객체를 만듭니다.
    • 생성자를 사용하여 객체를 전달하여 com.adobe.idp.Document 객체를 만듭니다 java.io.FileInputStream .
  4. PDF 문서를 참조하여 분해합니다.
    • 생성자를 사용하여 입력 PDF 문서를 저장하는 데 사용되는 java.util.Map 개체를 HashMap 만듭니다.
    • 생성자를 사용하여 java.io.FileInputStream 개체를 만들고 분해할 PDF 문서의 위치를 전달하여 개체를 만듭니다.
    • 개체를 com.adobe.idp.Document 만들고 분해할 PDF 문서가 포함된 java.io.FileInputStream 개체를 전달합니다.
    • 해당 java.util.Map put 메서드를 호출하고 다음 인수를 전달하여 개체에 항목을 추가합니다.
      • 키 이름을 나타내는 문자열 값입니다. 이 값은 DCX 문서에 지정된 PDF 소스 요소의 값과 일치해야 합니다.
      • 분해할 PDF 문서를 포함하는 com.adobe.idp.Document 오브젝트입니다.
  5. 런타임 옵션을 설정합니다.
    • 생성자를 사용하여 런타임 옵션을 저장하는 AssemblerOptionSpec 객체를 만듭니다.
    • 객체에 속하는 메서드를 호출하여 비즈니스 요구 사항을 충족하도록 런타임 옵션을 AssemblerOptionSpec 설정합니다. 예를 들어 오류가 발생할 때 어셈블리 서비스에서 작업을 계속 처리하도록 하려면 AssemblerOptionSpec 개체의 setFailOnError 메서드를 호출하고 전달합니다 false .
  6. PDF 문서를 분해합니다.
    객체의 AssemblerServiceClient invokeDDX 메서드를 호출하고 다음 필수 값을 전달합니다.
    • 사용할 DCX 문서를 나타내는 com.adobe.idp.Document 개체
    • 분해할 PDF 문서를 포함하는 java.util.Map 개체
    • 기본 글꼴 및 작업 로그 수준을 포함하여 런타임 옵션을 지정하는 com.adobe.livecycle.assembler.client.AssemblerOptionSpec 개체
    invokeDDX 메서드는 분해된 PDF 문서와 발생한 모든 예외가 포함된 com.adobe.livecycle.assembler.client.AssemblerResult 개체를 반환합니다.
  7. 분해된 PDF 문서를 저장합니다.
    분해된 PDF 문서를 얻으려면 다음 작업을 수행하십시오.
    • 객체의 메서드를 AssemblerResult 호출합니다 getDocuments . 이렇게 하면 java.util.Map 개체가 반환됩니다.
    • 결과 개체를 찾을 때까지 java.util.Map com.adobe.idp.Document 개체를 반복합니다.
    • PDF 문서를 추출하려면 com.adobe.idp.Document 개체의 copyToFile 방법을 불러옵니다.
참고 항목

웹 서비스 API 파섹

Assembler Service API(웹 서비스)를 사용하여 PDF 문서를 분해합니다.
  1. 프로젝트 파일 포함
    MTOM을 사용하는 Microsoft .NET 프로젝트를 만듭니다. 서비스 참조를 설정할 때 다음 WSDL 정의를 사용해야 합니다. http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1 Adobe
    AEM localhost Forms를 호스팅하는 서버의 IP 주소로 대체합니다.
  2. PDF Assembler 클라이언트 만들기
    • 기본 생성자를 사용하여 AssemblerServiceClient 객체를 만듭니다.
    • 생성자를 사용하여 AssemblerServiceClient.Endpoint.Address 객체를 만듭니다 System.ServiceModel.EndpointAddress . WSDL을 지정하는 문자열 값을 AEM Forms 서비스에 전달합니다(예: http://localhost:8080/soap/services/AssemblerService?blob=mtom ). 속성을 사용할 필요는 lc_version 없습니다. 이 속성은 서비스 참조를 만들 때 사용됩니다.
    • 필드의 값을 가져와 System.ServiceModel.BasicHttpBinding 개체를 만듭니다 AssemblerServiceClient.Endpoint.Binding . 반환 값을 로 BasicHttpBinding 캐스팅합니다.
    • 개체 System.ServiceModel.BasicHttpBinding 필드를 로 설정합니다 MessageEncoding . WSMessageEncoding.Mtom 이 값을 사용하면 MTOM이 사용됩니다.
    • 다음 작업을 수행하여 기본 HTTP 인증을 활성화합니다.
      • AEM 양식 사용자 이름을 필드에 AssemblerServiceClient.ClientCredentials.UserName.UserName 지정합니다.
      • 필드에 해당 암호 값을 지정합니다 AssemblerServiceClient.ClientCredentials.UserName.Password .
      • 필드에 상수 값을 HttpClientCredentialType.Basic 지정합니다 BasicHttpBindingSecurity.Transport.ClientCredentialType .
      • 필드에 상수 값을 BasicHttpSecurityMode.TransportCredentialOnly 지정합니다 BasicHttpBindingSecurity.Security.Mode .
  3. 기존 DCX 문서를 참조합니다.
    • 생성자를 사용하여 BLOB 객체를 만듭니다. 이 BLOB 개체는 DCX 문서를 저장하는 데 사용됩니다.
    • 생성자를 호출하여 System.IO.FileStream 객체를 만듭니다. DCX 문서의 파일 위치와 파일을 열 모드를 나타내는 문자열 값을 전달합니다.
    • 개체의 내용을 저장하는 바이트 배열을 System.IO.FileStream 만듭니다. 개체의 System.IO.FileStream Length 속성을 가져와 바이트 배열의 크기를 결정할 수 있습니다.
    • 객체의 메서드를 호출하고 바이트 배열, 시작 위치 및 읽을 스트림 길이를 전달하여 바이트 배열을 스트림 데이터로 채웁니다. System.IO.FileStream Read
    • 바이트 배열의 컨텐츠로 해당 BLOB MTOM 속성을 할당하여 객체를 채웁니다.
  4. PDF 문서를 참조하여 분해합니다.
    • 생성자를 사용하여 BLOB 객체를 만듭니다. 이 BLOB 개체는 입력 PDF 문서를 저장하는 데 사용됩니다. 이 BLOB 개체는 invokeOneDocument 인수로 전달됩니다.
    • 생성자를 호출하고 입력 PDF 문서의 파일 위치와 파일을 열 모드를 나타내는 문자열 값을 전달하여 System.IO.FileStream 개체를 만듭니다.
    • 개체의 내용을 저장하는 바이트 배열을 System.IO.FileStream 만듭니다. 개체의 System.IO.FileStream Length 속성을 가져와 바이트 배열의 크기를 결정할 수 있습니다.
    • 객체의 메서드를 호출하고 바이트 배열, 시작 위치 및 읽을 스트림 길이를 전달하여 바이트 배열을 스트림 데이터로 채웁니다. System.IO.FileStream Read
    • 해당 BLOB MTOM 필드에 바이트 배열의 내용을 할당하여 개체를 채웁니다.
    • 객체를 MyMapOf_xsd_string_To_xsd_anyType 만듭니다. 이 컬렉션 개체는 분해할 PDF를 저장하는 데 사용됩니다.
    • 객체를 MyMapOf_xsd_string_To_xsd_anyType_Item 만듭니다.
    • 키 이름을 나타내는 문자열 값을 MyMapOf_xsd_string_To_xsd_anyType_Item 개체의 key 필드에 지정합니다. 이 값은 DCX 문서에 지정된 PDF 소스 요소의 값과 일치해야 합니다.
    • PDF 문서를 저장하는 BLOB 개체를 MyMapOf_xsd_string_To_xsd_anyType_Item 개체의 value 필드에 할당합니다.
    • 개체에 MyMapOf_xsd_string_To_xsd_anyType_Item 개체를 추가합니다 MyMapOf_xsd_string_To_xsd_anyType . 객체의 MyMapOf_xsd_string_To_xsd_anyType 메서드를 호출하고 Add MyMapOf_xsd_string_To_xsd_anyType 객체를 전달합니다.
  5. 런타임 옵션을 설정합니다.
    • 생성자를 사용하여 런타임 옵션을 저장하는 AssemblerOptionSpec 객체를 만듭니다.
    • 객체에 속하는 데이터 멤버에 값을 할당하여 비즈니스 요구 사항에 맞게 런타임 옵션을 설정할 수 AssemblerOptionSpec 있습니다. 예를 들어 오류가 발생할 때 어셈블리 서비스에서 작업을 계속 처리하도록 하려면 false 개체의 AssemblerOptionSpec failOnError 필드에 할당합니다.
  6. PDF 문서를 분해합니다.
    객체의 AssemblerServiceClient invokeDDX 메서드를 호출하고 다음 값을 전달합니다.
    • PDF 문서를 분해하는 DCX 문서를 나타내는 BLOB 개체
    • 분해할 PDF 문서가 포함된 MyMapOf_xsd_string_To_xsd_anyType 개체
    • 런타임 옵션을 지정하는 AssemblerOptionSpec 개체
    invokeDDX 메서드는 작업 결과 및 발생한 예외가 포함된 AssemblerResult 객체를 반환합니다.
  7. 분해된 PDF 문서를 저장합니다.
    새로 만든 PDF 문서를 가져오려면 다음 작업을 수행하십시오.
    • 분해된 PDF 문서를 포함하는 AssemblerResult 개체인 개체의 documents Map 필드에 액세스합니다.
    • 객체를 반복하여 각 결과 문서를 가져옵니다. Map 그런 다음 해당 어레이 멤버를 value a로 캐스팅합니다 BLOB .
    • PDF 문서의 BLOB 개체 MTOM 속성에 액세스하여 이진 데이터를 추출합니다. PDF 파일에 쓸 수 있는 바이트 배열을 반환합니다.
참고 항목