以程式分解的PDF檔案 programmatically-disassembling-pdf-documents
本檔案中的範例和範例僅適用於JEE環境上的AEM Forms 。
您可以將PDF檔案傳遞至組合器服務來分解它。 通常,當PDF檔案最初是由許多個別檔案(例如陳述式集合)建立時,這項工作會很有用。 在下圖中,DocA會分成多個結果檔案,其中頁面上的第一個第1層書籤會識別新結果檔案的開頭。
若要拆解PDF檔案,請確定 PDFsFromBookmarks
元素位於DDX檔案中。 此 PDFsFromBookmarks
元素是結果元素,而且只能是 DDX
元素。 它沒有 result
屬性,因為它可能會導致產生多個檔案。
此 PDFsFromBookmarks
元素會針對來原始檔中的每個第1層書籤產生單一檔案。
為了進行此討論,假設使用下列DDX檔案。
<?xml version="1.0" encoding="UTF-8"?>
<DDX xmlns="https://ns.adobe.com/DDX/1.0/">
<PDFsFromBookmarks prefix="stmt">
<PDF source="AssemblerResultPDF.pdf"/>
</PDFsFromBookmarks>
</DDX>
invokeOneDocument
作業。 然而,若要拆解PDF檔案,請使用 invokeDDX
作業的原因是,雖然有一個輸入PDF檔案傳遞到Assembler服務,但Assembler服務會傳回包含一或多個檔案的集合物件。步驟摘要 summary-of-steps
若要拆解PDF檔案,請執行下列工作:
- 包含專案檔案。
- 建立PDF組合器使用者端。
- 參考現有的DDX檔案。
- 參照要拆解的PDF檔案。
- 設定執行階段選項。
- 拆解PDF檔案。
- 儲存已拆解的PDF檔案。
包含專案檔案
在您的開發專案中包含必要的檔案。 如果您使用Java建立使用者端應用程式,請包含必要的JAR檔案。 如果您使用Web服務,請確定您包含Proxy檔案。
必須將下列JAR檔案新增至專案的類別路徑:
- adobe-livecycle-client.jar
- adobe-usermanager-client.jar
- adobe-assembler-client.jar
- adobe-utilities.jar (如果AEM Forms部署在JBoss上,則為必要)
- jbossall-client.jar (如果AEM Forms部署在JBoss上,則為必要)
如果將AEM Forms部署在受支援的J2EE應用程式伺服器(不是JBoss)上,則必須將adobe-utilities.jar和jbossall-client.jar取代為特定於已部署AEM Forms之J2EE應用程式伺服器的JAR檔案。
建立PDF組合器使用者端
您必須先建立組合器服務使用者端,才能以程式設計方式執行組合器作業。
參考現有的DDX檔案
必須參考DDX檔案才能分解PDF檔案。 此DDX檔案必須包含 PDFsFromBookmarks
元素。
參照PDF檔案以分解
若要拆解PDF檔案,請參照代表要拆解PDF檔案的PDF檔案。 當傳遞至Assembler服務時,會針對檔案中的每個1級書籤傳回個別的PDF檔案。
設定執行階段選項
您可以設定執行階段選項,控制Assembler服務執行工作時的行為。 例如,您可以設定一個選項,在遇到錯誤時指示Assembler服務繼續處理工作。
拆解PDF檔案
建立Assembler服務使用者端、參照DDX檔案、參照PDFPDF檔案以拆解並設定執行階段選項之後,您可以透過叫用 invokeDDX
方法。 只要DDX檔案包含解組PDF檔案的指示,組裝程式服務就會傳回集合物件中已解組的PDF檔案。
儲存已拆解的PDF檔案
所有已拆解的PDF檔案都會在集合物件中傳回。 逐一檢視集合物件,並將每個PDF檔案儲存為PDF檔案。
另請參閱
使用Java API分解PDF檔案 disassemble-a-pdf-document-using-the-java-api
使用組合器服務API (Java)分解PDF檔案:
-
包含專案檔案。
在您的Java專案的類別路徑中包含使用者端JAR檔案,例如adobe-assembler-client.jar。
-
建立PDF組合器使用者端。
- 建立
ServiceClientFactory
包含連線屬性的物件。 - 建立
AssemblerServiceClient
物件,使用它的建構函式並傳遞ServiceClientFactory
物件。
- 建立
-
參考現有的DDX檔案。
- 建立
java.io.FileInputStream
物件,使用它的建構函式並傳遞字串值(指定DDX檔案的位置)來代表DDX檔案。 - 建立
com.adobe.idp.Document
物件,使用它的建構函式並傳遞java.io.FileInputStream
物件。
- 建立
-
參照要拆解的PDF檔案。
-
建立
java.util.Map
使用儲存輸入PDF檔案的物件HashMap
建構函式。 -
建立
java.io.FileInputStream
物件,使用它的建構函式並傳遞PDF檔案的位置以進行拆解。 -
建立
com.adobe.idp.Document
物件並傳遞java.io.FileInputStream
包含要拆解之PDF檔案的物件。 -
將專案新增至
java.util.Map
物件(透過叫用其put
方法並傳遞下列引數:- 代表索引鍵名稱的字串值。 此值必須符合DDX檔案中指定的PDF來源元素的值。
- A
com.adobe.idp.Document
包含要拆解之PDF檔案的物件。
-
-
設定執行階段選項。
- 建立
AssemblerOptionSpec
使用建構函式來儲存執行階段選項的物件。 - 透過叫用屬於下列專案的方法,設定執行階段選項以符合您的業務需求
AssemblerOptionSpec
物件。 例如,若要指示Assembler服務在發生錯誤時繼續處理工作,請叫用AssemblerOptionSpec
物件的setFailOnError
方法與傳遞false
.
- 建立
-
拆解PDF檔案。
叫用
AssemblerServiceClient
物件的invokeDDX
方法並傳遞下列必要值:- A
com.adobe.idp.Document
代表要使用的DDX檔案的物件 - A
java.util.Map
包含PDF檔案的物件進行拆解 - A
com.adobe.livecycle.assembler.client.AssemblerOptionSpec
指定執行階段選項的物件,包括預設字型和作業記錄層級
此
invokeDDX
方法傳回com.adobe.livecycle.assembler.client.AssemblerResult
物件,其中包含已解譯的PDF檔案以及發生的任何例外狀況。 - A
-
儲存已拆解的PDF檔案。
若要取得已拆解的PDF檔案,請執行下列動作:
- 叫用
AssemblerResult
物件的getDocuments
方法。 這會傳回java.util.Map
物件。 - 逐一檢視
java.util.Map
物件,直到您找到結果為止com.adobe.idp.Document
物件。 - 叫用
com.adobe.idp.Document
物件的copyToFile
用於擷取PDF檔案的方法。
- 叫用
另請參閱
快速入門(SOAP模式):使用Java API分解PDF檔案
使用Web服務API分解PDF檔案 disassemble-a-pdf-document-using-the-web-service-api
使用組合器服務API (Web服務)拆分PDF檔案:
-
包含專案檔案。
建立使用MTOM的Microsoft .NET專案。 設定服務參考時,請務必使用下列WSDL定義:
http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1
.note note NOTE 取代 localhost
搭配託管AEM Forms之伺服器的IP位址。 -
建立PDF組合器使用者端。
-
建立
AssemblerServiceClient
物件,使用它的預設建構函式。 -
建立
AssemblerServiceClient.Endpoint.Address
物件,使用System.ServiceModel.EndpointAddress
建構函式。 將指定WSDL的字串值傳遞至AEM Forms服務(例如,http://localhost:8080/soap/services/AssemblerService?blob=mtom
)。 您不需要使用lc_version
屬性。 當您建立服務參考時,會使用此屬性。 -
建立
System.ServiceModel.BasicHttpBinding
物件,方法是取得AssemblerServiceClient.Endpoint.Binding
欄位。 將傳回值轉換為BasicHttpBinding
. -
設定
System.ServiceModel.BasicHttpBinding
物件的MessageEncoding
欄位至WSMessageEncoding.Mtom
. 此值可確保使用MTOM。 -
執行下列工作來啟用基本的HTTP驗證:
- 將AEM表單使用者名稱指派給欄位
AssemblerServiceClient.ClientCredentials.UserName.UserName
. - 將對應的密碼值指派給欄位
AssemblerServiceClient.ClientCredentials.UserName.Password
. - 指派常數值
HttpClientCredentialType.Basic
至欄位BasicHttpBindingSecurity.Transport.ClientCredentialType
. - 指派常數值
BasicHttpSecurityMode.TransportCredentialOnly
至欄位BasicHttpBindingSecurity.Security.Mode
.
- 將AEM表單使用者名稱指派給欄位
-
-
參考現有的DDX檔案。
- 建立
BLOB
物件(使用其建構函式)。 此BLOB
物件可用來儲存DDX檔案。 - 建立
System.IO.FileStream
物件,透過叫用它的建構函式。 傳遞代表DDX檔案檔案位置以及開啟檔案的模式的字串值。 - 建立位元組陣列,儲存
System.IO.FileStream
物件。 您可以取得System.IO.FileStream
物件的Length
屬性。 - 透過叫用
System.IO.FileStream
物件的Read
方法,並傳遞位元組陣列、起始位置以及要讀取的資料流長度。 - 填入
BLOB
物件,透過指派其MTOM
包含位元組陣列內容的屬性。
- 建立
-
參照要拆解的PDF檔案。
- 建立
BLOB
物件(使用其建構函式)。 此BLOB
物件是用來儲存輸入PDF檔案。 這個BLOB
物件傳遞至invokeOneDocument
作為引數。 - 建立
System.IO.FileStream
物件,方法是叫用其建構函式,並傳遞代表輸入PDF檔案的檔案位置以及開啟檔案的模式的字串值。 - 建立位元組陣列,儲存
System.IO.FileStream
物件。 您可以取得System.IO.FileStream
物件的Length
屬性。 - 透過叫用
System.IO.FileStream
物件的Read
方法,並傳遞位元組陣列、起始位置以及要讀取的資料流長度。 - 填入
BLOB
物件,透過指派其MTOM
欄位位位位元組陣列的內容。 - 建立
MyMapOf_xsd_string_To_xsd_anyType
物件。 此集合物件是用來儲存要拆解的PDF。 - 建立
MyMapOf_xsd_string_To_xsd_anyType_Item
物件。 - 將代表索引鍵名稱的字串值指派給
MyMapOf_xsd_string_To_xsd_anyType_Item
物件的key
欄位。 此值必須符合DDX檔案中指定的PDF來源元素的值。 - 指派
BLOB
將PDF檔案儲存到的物件MyMapOf_xsd_string_To_xsd_anyType_Item
物件的value
欄位。 - 新增
MyMapOf_xsd_string_To_xsd_anyType_Item
物件至MyMapOf_xsd_string_To_xsd_anyType
物件。 叫用MyMapOf_xsd_string_To_xsd_anyType
物件'Add
方法並傳遞MyMapOf_xsd_string_To_xsd_anyType
物件。
- 建立
-
設定執行階段選項。
- 建立
AssemblerOptionSpec
使用建構函式來儲存執行階段選項的物件。 - 將值指派給屬於下列專案的資料成員,以設定執行階段選項以符合您的業務需求
AssemblerOptionSpec
物件。 例如,若要指示Assembler服務在發生錯誤時繼續處理工作,請指派false
至AssemblerOptionSpec
物件的failOnError
欄位。
- 建立
-
拆解PDF檔案。
叫用
AssemblerServiceClient
物件的invokeDDX
方法並傳遞下列值:- A
BLOB
物件,代表拆解PDF檔案的DDX檔案 - 此
MyMapOf_xsd_string_To_xsd_anyType
包含PDF檔案的物件進行拆解 - 一個
AssemblerOptionSpec
指定執行階段選項的物件
此
invokeDDX
方法傳回AssemblerResult
包含工作結果和發生之任何例外狀況的物件。 - A
-
儲存已拆解的PDF檔案。
若要取得新建立的PDF檔案,請執行下列動作:
- 存取
AssemblerResult
物件的documents
欄位,即Map
包含已拆解PDF檔案的物件。 - 逐一檢視
Map
物件以取得每個產生的檔案。 然後,轉換該陣列成員的value
至BLOB
. - 存取代表PDF檔案的二進位資料
BLOB
物件的MTOM
屬性。 這會傳回您可以寫出至PDF檔案的位元組陣列。
- 存取
另請參閱