Comme prévu, la nouvelle version de Spark Archives a été livrée en interne le 3 janvier 2022 et propose un ensemble de nouveautés tant d’un point de vue technique que fonctionnel.
1. Évolutions techniques
Comme d’habitude, les releases de début d’année sont l’occasion de remettre à jour l’ensemble de la « stack technique » et ses composants afin d’être en phase avec l’état de l’art dans le domaine.
Mises à jour des composants techniques
En ce sens, on notera les versions mises à jour sur les principaux composants que sont :
- Java : version 8 (pas de changement)
- Serveur d’application Apache Tomcat : version 9.52
- Moteur de recherche ElasticSearch : version 7.15
- Moteur de files RabbitMQ : version 3.9.4
- Base de données PostgrSQL : version 13.4
- Base de données Oracle : version 19c (pas de changement)
- Conversion Aspose : version 21.8
- Antivirus Clamav : version 0.104.0
- Côté navigateur, on supporte toujours Chrome, Edge Chromium et Firefox
- Evolution de l’API Storage
Dans Delphes, l’API Storage associée à la conservation des documents électroniques dans les magasins électroniques a été améliorée et simplifiée à fonctionnalités constantes.
Améliorations des performances
Dans la suite des travaux effectués dans la version Cuzco, des analyses complémentaires ont été menées afin de continuer à améliorer les performances applicatives, en particulier dans le cas d’une application « chargée ». S’appuyant sur des outils comme JMeter et des scénarios automatiques de tests, l’ensemble de ces travaux a permis de corriger certains axes et d’identifier les améliorations à mettre en place.
Ces travaux au long cours se poursuivront sur la prochaine release.
Isolation technique des composants tiers
Les montées de version sont devenues une priorité pour nous autant que pour nos clients. En effet, l’obsolescence de plus en plus rapide des composants techniques et la nécessité associée aux « patch » de sécurité est de plus en plus prégnante. On a évidemment à l’esprit la récente faille découverte sur log4j même si celle-ci ne concerne pas directement Spark Archives.
Aussi, des travaux ont été menés afin de permettre d’isoler les montées de version des « thirds parties » telles que Elastic Search et RabbitMQ pour que celles-ci soient indépendante d’une montée de version applicative.
Pour faire simple, un client sous Spark Delphes pourra plus facilement faire évoluer ces deux composants techniques tout en restant dans la version Spark Delphes si celui-ci considère que les améliorations fonctionnelles ne sont pas nécessaires à ses besoins immédiats.
Diagnostic et état de santé des principaux composants
L’écran de diagnostic qui permet de suivre l’état de santé des principales briques techniques (Elastic Search, RabbitMQ, magasin électroniques, convertisseur, serveur mail, caches, base de données…) a été enrichi de manière à permettre une meilleure visibilité sur le nombre de documents électroniques conservés.
Amélioration du connecteur SAML
On peut maintenant activer l’authentification forcée dans le cadre du connecteur SAML ce qui a pour objectif de mettre en place des mécanismes de réauthentification selon les cas d’usages métiers identifiés.
De même, lors de l’authentification on peut dorénavant créer les utilisateurs directement dans l’application avec des valeurs par défaut après que ceux-ci ont été dûment authentifiés.
Amélioration de l’export SEDA 2.1
Des améliorations techniques permettent de prendre en charge en export les versements électroniques au format SEDA 2.1.
L’export SEDA 2.1 des versements peut être personnalisé par client en fonction des profils et contrats d’archivage qui sont définis avec le client.
Une première implémentation client a été mise en place avec un export vers une plateforme VITAM.
2. Evolutions fonctionnelles
Les évolutions fonctionnelles de la version Delphes se sont concentrées autour de trois axes principaux que sont les mises à jour attendues dans la cadre de la norme NF Z 42-013 :2020, la mise en place de la brique « archives historiques » définies comme un des axes stratégiques et l’extension du connecteur GED/ECM à SharePoint online (SharePoint 365).
La mise en conformité NF Z 42-013 :2020
La prise en compte des exigences de la norme NF Z 42-013 :2020 porte sur l’intégration des date au format ISO 8601 de manière à s’assurer d’une date fiable. Cette date fiable est intégrée aux éléments de journalisation que sont le journal du cycle de vie des archives et le journal des événements ainsi que l’ensemble des attestations d’archivage qui sont signées électroniquement.
On notera que, le cas échéant, l’horodatage externe via un Tiers horodateur est une fonction déjà disponible dans Spark Archives et qu’il suffit de l’activer.
Des améliorations sont intervenues sur le journal du cycle de vie des archives de manière à intégrer une granularité plus importante sur certaines opérations telles que les conversions, les mises à jour de la date de destruction, etc.
Le journal des évènements trace maintenant toutes les modifications opérées au niveau des utilisateurs à savoir, la création, mise à jour, suppression, désactivation et ce notamment au niveau de gestion des droits. Cette traçabilité s’étend à toutes les opérations liées à l’authentification proprement dite, les changements de mot de passe et les verrouillages de compte.
Une nouvelle fonctionnalité appelé « Transchiffrement » permet de répondre à l’exigence FCT-E-6.4.4.1-3 qui indique « Lorsque l’algorithme utilisé pour le calcul d’empreinte présente le risque de ne plus être suffisamment robuste, le SAE doit calculer une nouvelle empreinte plus robuste, unitairement et pour chaque objet numérique concerné (journaux archivés compris) ».
Comme son nom l’indique le transchiffrement permet de modifier en masse les empreintes des documents électroniques lorsqu’un algorithme n’est plus jugé suffisamment robuste et d’assurer l’intégrité des données conservées dans le SAE.
Enfin une nouvelle attestation intègre le SAE avec la preuve de restitution qui a l’instar des autres attestations est générée sous la forme d’un fichier PDF signé électroniquement.
Les finalisation des sujets normatifs liés à la norme NF Z 42-013 :2020 est prévue pour juin 2022. Les sujets à traiter correspondent à l’intégration de l’exigence FCT-E-5.6.4-2 « En cas d’exigence du PA, le SA doit pouvoir démontrer l’intégrité des métadonnées non modifiables », une mise à jour du contrôle de cohérence / d’exhaustivité pour affiner la granularité du contrôle existant et une extension des possibilités associées aux demandes d’audit en masse.
Les archives historiques
Les archives historiques sont à l’honneur dans cette version de Spark Archives afin de permettre à nos clients d’aller plus loin en terme de gestion des archives historiques dans la continuité de la gestion des archives courantes et intermédiaires.
La mise en place d’un cadre de classement conforme à la norme ISAD(G) permet d’ores et déjà de poser le cadre associé à la gestion et/ou au des retraitement des fonds d’archives tout en attendant et en suivant les avancées liées à Record in Contexts (RiC).
De cette manière les utilisateurs pourront dorénavant créer les différents niveaux du cadre de classement souhaités qui sont traditionnellement : groupes de fonds, fonds, sous-fonds, série organique, sous-série organique, dossier et pièce. Chaque niveau du cadre de classement intègre de manière hiérarchique les différentes zones d’informations (identification, contexte, contenu et structure, conditions d’accès e d’utilisation, sources complémentaires, notes et contrôle de la description) et leurs métadonnées associées.
Le cadre posé en termes de référentiels est complètement paramétrable et ajustable et permet également d’effectuer une recherche dans le cadre de classement dont l’ensemble des champs est indexé dans Elastic search.
Les travaux seront finalisés dans le cadre de la release de juin 2022 afin de permettre de lier ces niveaux de description avec les archives papier et/ou électroniques, naviguer dans le cadre de classement et les archives associées et publier l’Instrument de Recherche.
Le connecteur SharePoint Online (SharePoint 365)
Le connecteur GED de Spark Archives permet depuis de nombreuses années de s’authentifier à une GED, de définir fonctionnellement des règles qui permettent de rechercher des documents électroniques dans la GED source et de les absorber afin de créer des opérations de versements en transposant les métadonnées de la GED dans les métadonnées définies dans Spark Archives.
Ce connecteur conforme au standard Content Management Interoperability Services (CMIS) a été étendu afin de prendre en charge SharePoint Online dans une logique similaire à ce qui préexistait afin de ne pas perturber les clients déjà utilisateur du connecteur GED.
Le connecteur SharePoint 365 s’appuie sur les API Microsoft Graph.
Quelques améliorations fonctionnelles au long cours
On notera par exemple :
- Une amélioration de l’affichage de l’écran d’accueil
- Un rendu graphique sur le taux d’occupation des emplacements physiques
- La génération des étiquettes d’emplacements
- L’amélioration du prétirage de documents et de contenants en lien avec l’import de versement
- L’identification des pièces jointes dans les articles, les documents physiques et les documents électroniques (à différencier des document électroniques)
- Des métriques associées au nombre des demandes effectuées sur les documents dans le cadre de la recherche en complément des statistiques
Côté « Lab Innovation » les travaux autour des vracs numériques continuent.
Comme vous pouvez le voir, l’équipe Spark Archives fait évoluer au cours des releases le produit et nous pourrons échanger de vive voix avec vous sur l’ensemble de ces évolutions fonctionnelles lors du club utilisateur en mars prochain.
Dans l’attente, n’hésitez pas à revenir vers nous pour des compléments d’informations.
Herwann PERRIN
Responsable Produit Spark Archives