Introduction
Il existe, aujourd'hui,
un nombre conséquent de logiciels permettant d'automatiser la gestion des données
généalogiques. Contrairement au monde de la bureautique, aucun d'entre eux ne s'est
« imposé » comme standard incontournable (en effet, les enjeux du marché ne
sont pas du tout les mêmes). Ils ont donc, tous, leurs « partisans » et leurs
« adversaires », leurs avantages et leurs inconvénients, leurs petites
astuces sympathiques et leurs petits côtés désagréables (lorsqu'il faut, par exemple,
changer de version...).
| Mais voilà, leur
inconvénient majeur est leur totale incompatibilité. Point de standard du marché,
point d'échanges dit « transparents » ! Il est impossible d'ouvrir le fichier
de données de l'un par l'autre... |
  |
Heureusement, tous
permettent, à l'heure actuelle, d'exporter les données gérées sous une forme
pratiquement normalisée. Ce remarquable « standard » est le résultat du
travail de certains membres de l'Eglise de Jésus-Christ des Saints des Derniers Jours,
communauté plus connue sous le nom de « Mormons ».
Cette exportation
normalisée est un fichier de type « texte » (donc parfaitement
lisible avec un simple outil comme « Notepad » sous « Microsoft
Windows ») contenant, stockées de façon séquentielle, toutes ou
pratiquement toutes les informations contenues dans le fichier d'origine, propre au
logiciel de gestion. En voici un exemple :
 |
Avec un peu d'entraînement,
vous serez parfaitement capable, après avoir édité un fichier de ce type avec un outil
tel que « Microsoft Wordpad » ou « Word », de lire et de
comprendre le contenu un peu « bizarre" de ce dernier. |
Il devient alors
possible de communiquer ces données via une disquette ou un réseau de
télécommunication tel que l'Internet et permettre ainsi à d'autres généalogistes
utilisant, sans doute, des logiciels de gestion différents de ré-utiliser ces
dernières.
Ce
fichier porte le doux nom de « GEDCOM », acronyme signifiant « GEnealogical
Data COMmunication » (autrement dit "communication de données
généalogiques"). Il répond à un standard dont la dernière version est la
« 5.5 ». L'extension de type de fichier est, en général, « .ged ». |

|
Ceci dit, tous les
logiciels ne respectent pas strictement cette « norme de fait », libertés qui
peuvent compromettre de futurs échanges...
Développé par le
département « Family History » de l'Eglise précédemment citée, ce standard
est la description détaillée d'un format flexible mais uniforme d'échange
de données généalogiques informatisées.
Approfondissons !
Un standard d'échange
peut être appréhendé comme un langage.
Ce document décrivant le
standard « GEDCOM 5.5 » comprend donc deux parties,
une première partie
(«GEDCOM data format») qui décrit la grammaire du langage «GEDCOM» en
spécifiant les séquences de caractères valides pour créer un enregistrement,
et une seconde
(«GEDCOM form») qui décrit la structure du fichier et la sémantique de ce
langage en listant le sens de chaque type de données utilisé.
Une exportation de données au format « GEDCOM » consiste donc à
représenter le contenu d'une base généalogique sous la forme d'un flot séquentiel
d'enregistrements tels que : |
0 @I1@
INDI
1 NAME Pierre /DANGLE/
1 SEX M
1 BIRT
2 DATE 24 JUN 1833
2 PLAC VILLENEUVE (03)
1 DEAT
2 DATE ABT 1901
|
La
grammaire décrite dans le premier chapitre précise :
la structure des
enregistrements : une séquence de mots («tag») de longueur variable (255
caractères maximum) arrangée hiérarchiquement,
le contenu de ces
enregistrements :
une indication de
niveau hiérarchique (comprise entre entre 1 et 99)
suivie d'un numéro de
"fiche" optionnel, entouré s'il existe de deux « @ »,
puis d'une étiquette
ou « tag » suivie d'un contenu (de 31 caractères maximum, la séquence
formée des 15 premiers étant unique dans le fichier)
et d'une valeur
optionnelle ou un identificateur vers une autre référence (il contient alors un
caractère «@») voire un pointeur,
.
0 @I1@ INDI
niveau hiérarchique : 0,
numéro de fiche : I1, étiquette : IND1
1 NAME Pierre /DANGLE/
niveau hiérarchique : 1,
étiquette : NAME, contenu : Pierre/DANGLE/ |
Le second
chapitre précise (entre autres) :
le contenu des enregistrements
de structure concernant les informations d'entête (source, version, nom du
produit
), les individus, les familles, les notes, les bibliographies
le contenu des enregistrements
de sous-structure, contenus dans ces enregistrements, concernant les dates
d'événement pour les individus, les dates d'événement pour les familles, les attributs
des individus, les adresses
et les éléments de
base, constituants de ces derniers enregistrements, tels que les rôles joués par les
individus dans les événements (« CHIL », « HUSB »,
« WIFE »
), les types d'événements concernant les individus
(« BIRT », « DEAT »
)
Concrètement,
l'analyse d'un fichier
« GEDCOM » nous fait découvrir :
tout d'abord quelques
lignes d'informations générales précisant le logiciel d'origine, le propriétaire des
données, le langue utilisée, le type de caractères, la date de création...
puis une suite de
blocs, chaque bloc décrivant un individu et commençant par le mot-clé («TAG»)
«INDI» :
0 @I1@ INDI
1 NAME Pierre /DANGLE/
1 SEX M
1 BIRT
2 DATE 24 JUN 1833
2 PLAC VILLENEUVE (03)
1 DEAT
2 DATE ABT 1901
1 FAMS @F8@
1 FAMS @F12@
1 FAMC @F5@ |
Dans chaque bloc, nous découvrons donc des informations concernant l'individu,
son nom, son sexe, ses lieu et date de naissance, ses lieu et date de décès mais
également deux types d' informations de famille, la première associée au mot-clé
« FAMS », précisant à quel(s) couple(s) appartient l'individu, la
seconde associée au mot-clé « FAMC », précisant à quelle famille
l'individu appartenait en temps qu'enfant. |
Dans
chaque bloc "FAM", nous pouvons décoder la description d'une famille,
donc qui est l'époux, « HUSBand », l'épouse, « WIFE »,
le ou les enfants, « CHILd », la date et le lieu du mariage. Un individu
sera associé avec une famille soit parce qu'il sera parent, père ou mère
(« HUSB » ou « WIFE ») soit parce qu'il sera enfant
(« CHIL »). Aux deux mots-clés « FAMS » et « FAMC »
dans le bloc « Individu », ne correspondra donc qu'un seul mot-clé : « FAM ». |
0 @F8@ FAM
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I5@
1 MARR
2 DATE 4 APR 1860
2 PLAC VILLENEUVE (03)
|
Quelques
précisions encore !
a) Un fichier
"GEDCOM" doit se finir par l'enregistrement "0 TRLR". La
présence de ce dernier permet de s'assurer que le fichier est bien complet, qu'il n'a pas
été tronqué. Certains logiciels, à l'exportation, l'omettent... Or d'autres
n'acceptent pas d'importer des données s'il manque. Il est donc parfois bien utile de
savoir la rajouter manuellement, après avoir ouvert le fichier avec un outil simple comme
"Notpad".
b) Les noms des mois
apparaissant dans les formats de date sont normalisés à l'anglo-saxonne : JAN, FEB,
MAR, APR, MAY, JUN, JUL, AUG, SEP, OCT,
NOV, DEC. Certains logiciels francisés exportent en utilisant les
abréviations françaises : FEV, MAI, AOU. Cet excès de zèle francophone peut
compromettre une future importation !
c) Vous découvrirez
parfois dans les zones de dates des abréviations telles que "ABT",
"AFT", "BEF". Ce sont simplement les abréviations
anglaises de "ABout", "aux environs de", de "AFTer",
"après" et de "BEFore", "avant". |