Ce contenu décrit la façon dont les dossiers de contrôle sont affectés par les différents scénarios de sauvegarde et de récupération. Il présente également les limites et les résultats de ces scénarios, ainsi que les possibilités de réduire les pertes de données.
Watched Folder
est une application basée sur système de fichiers. Elle appelle des opérations de service configurées qui manipulent le fichier au sein de l’un des dossiers suivants de la hiérarchie du dossier de contrôle :
-
Input (Entrée)
-
Stage (Traités)
-
Output (Sortie)
-
Failure (Echecs)
-
Preserve (Conservés)
Un utilisateur ou une application client dépose tout d’abord le fichier ou le dossier dans le dossier input (Entrée) du dossier de contrôle. L’opération de service déplace ensuite ce fichier dans le dossier stage en vue de son traitement. Après l’exécution par le service de l’opération indiquée, l’enregistrement du fichier modifié intervient dans le dossier output du dossier de contrôle. Les fichiers source correctement traités sont déplacés vers le dossier preserve (Conservés). Les fichiers dont le traitement a échoué sont quant à eux déplacés dans le dossier failure (Echecs) du dossier de contrôle. Si l’attribut
Conserver en cas d'échec
est activé au niveau du dossier de contrôle, les fichiers source dont le traitement a échoué sont déplacés dans le dossier preserve (Conservés) (voir
Configuration des points de fin Watched Folder
).
Vous pouvez sauvegarder les dossiers de contrôle en sauvegardant le système de fichiers.
Remarque :
cette sauvegarde est indépendante de la sauvegarde de stockage de la base de données ou des documents, de même que du processus de récupération.
Fonctionnement des dossiers de contrôle
Cette section décrit le processus de manipulation des fichiers du dossier de contrôle. Il est important de bien comprendre ce processus avant de mettre en place un plan de récupération. Dans l’exemple fourni, l’attribut
Conserver en cas d'échec
est activé pour le dossier de contrôle. Les fichiers sont traités selon leur ordre d’arrivée.
Le tableau suivant décrit la manipulation de cinq exemples de fichier (fichier1, fichier2, fichier3, fichier4 et fichier5) tout au long du processus. Dans ce tableau, l’axe x représente le temps, par exemple Temps 1 ou T1, et l’axe y représente les dossiers au sein de la hiérarchie du dossier de contrôle, par exemple output.
Dossier
|
T1
|
T2
|
T3
|
T4
|
T5
|
T6
|
T7
|
Input (Entrée)
|
fichier1, fichier2, fichier3, fichier4
|
fichier2, fichier3, fichier4
|
fichier3, fichier4
|
fichier4
|
vide
|
fichier5
|
vide
|
Stage (Traités)
|
vide
|
fichier1
|
fichier2
|
fichier3
|
fichier4
|
vide
|
fichier5
|
Output (Sortie)
|
vide
|
vide
|
fichier1_out
|
fichier1_out, fichier2_out
|
fichier1_out, fichier2_out
|
fichier1_out, fichier2_out, fichier4_out
|
fichier1_out, fichier2_out, fichier4_out
|
Failure (Echecs)
|
vide
|
vide
|
vide
|
vide
|
fichier3_fail, fichier3
|
fichier3_fail, fichier3
|
fichier3_fail, fichier3
|
Preserve (Conservés)
|
vide
|
vide
|
fichier1
|
fichier1, fichier2
|
fichier1, fichier2
|
fichier1, fichier2, fichier4
|
fichier1, fichier2, fichier4
|
Le texte suivant décrit la manipulation des fichiers à chacun des temps définis :
T1 :
les quatre fichiers sont placés dans le dossier input.
T2 :
l’opération de service déplace le fichier1 dans la scène dossier stage pour la manipulation.
T3 :
l’opération de service déplace le fichier2 dans le dossier stage pour la manipulation. Elle place les résultats du fichier1 dans le dossier output et déplace le fichier1 dans le dossier preserve.
T4 :
l’opération de service déplace le fichier3 dans le dossier stage pour la manipulation. Elle place les résultats du fichier2 dans le dossier output, et déplace le fichier2 dans le dossier preserve.
T5 :
l’opération de service déplace le fichier4 dans le dossier stage pour la manipulation. La manipulation du fichier3 échoue et l’opération de service le place dans le dossier failure.
T6 :
l’opération de service place fichier5 dans le dossier input. Elle place les résultats du fichier4 dans le dossier output et le fichier4 dans le dossier preserve.
T7 :
l’opération de service déplace le fichier5 dans le dossier stage pour la manipulation.
Sauvegarde des dossiers de contrôle
Il est recommandé de sauvegarder l’intégralité du système de fichiers du dossier de contrôle dans un autre système de fichiers.
Restauration des dossiers de contrôle
Cette section décrit la façon de restaurer les dossiers de contrôle. Les dossiers de contrôle appellent souvent des processus de courte durée (une minute ou moins). Dans de tels cas, la restauration du dossier de contrôle au moyen d’une sauvegarde effectuée toutes les heures n’empêche pas les pertes de données.
Par exemple, si une sauvegarde est entreprise à T1 et que le serveur échoue à T7, alors fichier1, fichier2, fichier3 et fichier4 font déjà l’objet d’une manipulation. La restauration d’un dossier de contrôle au moyen d’une sauvegarde entreprise à T1 n’empêche pas les pertes de données.
Si une sauvegarde plus récente a eu lieu, vous pouvez restaurer les fichiers. Lors de cette restauration, vous devez prendre en compte le dossier de la hiérarchie du dossier de contrôle dans lequel se trouve le fichier actuel :
Stage :
les fichiers de ce dossier sont traités à nouveau une fois le dossier de contrôle restauré.
Input :
les fichiers de ce dossier sont traités à nouveau une fois le dossier de contrôle restauré.
Result :
les fichiers de ce dossier ne sont pas traités.
Output :
les fichiers de ce dossier ne sont pas traités.
Preserve :
les fichiers de ce dossier ne sont pas traités.
Stratégies visant à limiter les pertes de données
Les stratégies suivantes permettent de limiter les pertes de données des dossiers output et input au moment de restaurer un dossier de contrôle :
-
Sauvegardez fréquemment les dossiers output et failure (toutes les heures par exemple) pour éviter les pertes de données au niveau des fichiers des dossiers result et failure.
-
Sauvegardez les fichiers du dossier input dans un dossier autre que le dossier de contrôle. Vous assurez ainsi la disponibilité du fichier après la récupération au cas où les fichiers seraient introuvables dans le dossier output ou le dossier failure. Veillez à la cohérence de votre dispositif d’appellation.
Par exemple, si vous enregistrez la sortie au format
%F.
extension
, le fichier de sortie aura alors le même nom que le fichier d’entrée. Cela vous aidera à déterminer les fichiers d’entrée manipulés et ceux qui doivent être soumis à nouveau. Si vous ne voyez qu’un seul fichier fichier1_out dans le dossier result, et non fichier2_out, fichier3_out et fichier4_out, cela signifie que vous devez soumettre fichier2, fichier3 et fichier4 de nouveau.
-
Si la sauvegarde du dossier de contrôle disponible est plus ancienne que le temps nécessaire au traitement de la tâche, vous devez autoriser le système à créer un nouveau dossier de contrôle et à placer automatiquement les fichiers dans le dossier input.
-
Si la dernière sauvegarde disponible n’est pas suffisamment récente, que l’heure de la sauvegarde est plus récente que l’heure à laquelle vous parvenez en lançant un nouveau traitement des fichiers et que le dossier de contrôle est restauré, cela signifie que le fichier a été manipulé au cours de l’une des phases suivantes :
-
Phase 1 :
dans le dossier input
-
Phase 2 :
copie effectuée dans le dossier stage mais traitement non encore appelé
-
Phase 3 :
copie effectuée dans le dossier stage et traitement appelé
-
Phase 4 :
manipulation en cours
-
Phase 5 :
résultats renvoyés
Si les fichiers se trouvent en Phase 1, ils seront manipulés. Si les fichiers se trouvent en Phase 2 ou 3, placez-les dans le dossier input afin qu’ils soient manipulés à nouveau.
Remarque :
en manipulant un fichier plusieurs fois, vous évitez les pertes de données mais vos résultats peuvent être dupliqués.
Conclusion
Du fait de la nature dynamique et en perpétuel changement des dossiers de contrôle, vous devez effectuer la restauration de tels dossiers avec des fichiers dont la sauvegarde date de moins de 24 heures. La meilleure pratique reste la sauvegarde des résultats, le stockage du dossier input sur un serveur plus sécurisé et le suivi des fichiers d’entrée, afin de pouvoir soumettre la tâche en cas d’échec.
|
|
|