已监视文件夹的备份策略 backup-strategies-for-watched-folders

CAUTION
AEM 6.4已结束扩展支持,本文档将不再更新。 有关更多详细信息,请参阅 技术支助期. 查找支持的版本 此处.

本内容介绍了已监视的文件夹如何受到不同备份和恢复方案的影响,这些方案的限制和结果,以及如何最大限度地减少数据丢失。

监视文件夹 是基于文件系统的应用程序,它调用已配置的服务操作,这些操作将在监视文件夹层次结构中的以下文件夹之一内处理文件:

  • 输入
  • 暂存
  • 输出
  • 失败
  • 保留

用户或客户端应用程序首先将文件或文件夹放在输入文件夹中。 然后,服务操作将文件移入暂存文件夹进行处理。 服务执行指定操作后,会将修改后的文件保存到输出文件夹中。 已成功处理的源文件将移到保留文件夹,失败的处理文件将移到失败文件夹。 当 Preserve On Failure 已启用监视文件夹的属性,处理失败的源文件将移至保留文件夹。 (请参阅 配置监视文件夹端点.)

您可以通过备份文件系统来备份已监视的文件夹。

NOTE
此备份与数据库或文档存储备份和恢复过程无关。

监视文件夹的工作方式 how-watched-folders-work

此内容描述已监视的文件夹文件处理过程。 在制定恢复计划之前,务必要了解此过程。 在本例中, Preserve On Failure 已启用监视文件夹的属性。 文件会按文件到达的顺序进行处理。

下表描述了整个过程中对五个样例文件(file1、file2、file3、file4、file5)的文件操作。 在表中,x轴表示时间(如时间1或T1),y轴表示监视文件夹层次结构(如输入)中的文件夹。

文件夹
T1
T2
T3
T4
T5
T6
T7
输入
file1, file2, file3, file4
file2, file3, file4
文件3,文件4
file4
file5
暂存
file1
file2
file3
file4
file5
输出
file1_out
file1_out, file2_out
file1_out, file2_out
file1_out, file2_out, file4_out
file1_out, file2_out, file4_out
失败
file3_fail,file3
file3_fail,file3
file3_fail,file3
保留
file1
file1,file2
file1,file2
file1, file2, file4
file1, file2, file4

以下文本描述了每次的文件操作:

T1: 四个样例文件放置在输入文件夹中。

T2: 服务操作将文件1移入暂存文件夹进行操作。

T3: 服务操作将文件2移入暂存文件夹进行操作。 它将file1的结果放在输出文件夹中,并将file1移到保留文件夹。

T4: 服务操作将文件3放置在暂存文件夹中进行操作。 它将file2的结果放在输出文件夹中,并将file2放在保留文件夹中。

T5: 服务操作将文件4放置在暂存文件夹中进行操作。 文件3的操作失败,服务操作将其放在失败文件夹中。

T6: 服务操作将文件5放置在输入文件夹中。 它将file4的结果放在输出文件夹中,将file4放在保留文件夹中。

T7: 服务操作将文件5放置在暂存文件夹中进行操作。

备份监视的文件夹 backing-up-watched-folders

建议您将整个监视文件夹文件系统备份到另一个文件系统。

恢复监视文件夹 restoring-watched-folders

本节介绍如何恢复已监视的文件夹。 已监视的文件夹通常会调用在一分钟内完成的短暂进程。 在这种情况下,使用每小时完成一次的备份来恢复已监视的文件夹不会阻止数据丢失。

例如,如果在T1备份时,服务器在T7失败,则文件1、文件2、文件3和文件4都已被处理。 使用在T1执行的备份还原已监视的文件夹,不会阻止数据丢失。

如果执行了更新的备份,则可以恢复文件。 恢复文件时,请考虑当前文件所在的监视文件夹层次结构文件夹:

阶段: 在恢复监视的文件夹后,将再次处理此文件夹中的文件。

输入: 在恢复监视的文件夹后,将再次处理此文件夹中的文件。

结果: 不会处理此文件夹中的文件。

输出: 不会处理此文件夹中的文件。

保留: 不会处理此文件夹中的文件。

最大限度地减少数据丢失的策略 strategies-to-minimize-data-loss

以下策略可在还原已监视的文件夹时最大限度地减少输出和输入文件夹数据丢失:

  • 经常备份输出和失败文件夹(如每小时),以避免丢失结果和失败文件。

  • 将输入文件备份到监视文件夹以外的文件夹中。 这可确保在恢复后文件的可用性,以防在输出或失败文件夹中找不到文件。 确保文件命名方案一致。

    例如,如果您使用 %F.扩展,则输出文件将与输入文件具有相同的名称。 这有助于您确定要处理哪些输入文件以及必须重新提交哪些输入文件。 如果在结果文件夹中只看到file1_out文件,而没有看到file2_out、file3_out和file4_out文件,则必须重新提交file2、file3和file4。

  • 如果可用的监视文件夹备份的时间早于处理作业所花费的时间,则应允许系统创建新的监视文件夹,并自动将文件放入输入文件夹中。

  • 如果最新的可用备份时间不够,则备份时间少于处理文件所花费的时间,并且已恢复监视的文件夹,则文件会在以下不同阶段之一进行处理:

    • 阶段1: 在输入文件夹中
    • 阶段2: 已复制到暂存文件夹,但尚未调用该进程
    • 阶段3: 复制到暂存文件夹并调用该进程
    • 阶段4: 正在进行的操作
    • 阶段5: 返回的结果

    如果文件在阶段1中,则将处理它们。 如果文件位于阶段2或3中,请将它们置于输入文件夹中以便再次进行操作。

    note note
    NOTE
    如果对文件进行多次操作,将阻止数据丢失,但结果可能会重复。

结论 conclusion

由于监视文件夹的性质是动态的,而且不断变化,因此应使用一天内备份的文件来恢复监视文件夹。 最佳做法是备份结果、将输入文件夹存储在服务器上并跟踪输入文件,以便在失败时可以重新提交作业。

recommendation-more-help
a6ebf046-2b8b-4543-bd46-42a0d77792da