Amicale-Généalogie

 

Page d'accueil                          Page précédente

Blason5.jpg (5908 octets)

Une Equipe
au service
du Généalogiste Amateur

LA NORME GEDCOM

 

Introduction

Il existe, aujourd'hui, un nombre conséquent de logiciels permettant d'automatiser la gestion des données généalogiques. Contrairement au monde de la bureautique, aucun d'entre eux ne s'est « imposé » comme standard incontournable (en effet, les enjeux du marché ne sont pas du tout les mêmes). Ils ont donc, tous, leurs « partisans » et leurs « adversaires », leurs avantages et leurs inconvénients, leurs petites astuces sympathiques et leurs petits côtés désagréables (lorsqu'il faut, par exemple, changer de version...). 

Mais voilà, leur inconvénient majeur est leur totale incompatibilité. Point de standard du marché, point d'échanges dit « transparents » ! Il est impossible d'ouvrir le fichier de données de l'un par l'autre...  berger2.gif (1235 octets)berger3.gif (1275 octets)

Heureusement, tous permettent, à l'heure actuelle, d'exporter les données gérées sous une forme pratiquement normalisée. Ce remarquable « standard » est le résultat du travail de certains membres de l'Eglise de Jésus-Christ des Saints des Derniers Jours, communauté plus connue sous le nom de « Mormons ».

Cette exportation normalisée est un fichier de type « texte » (donc parfaitement lisible avec un simple outil comme « Notepad » sous « Microsoft Windows ») contenant, stockées de façon séquentielle, toutes ou pratiquement toutes les informations contenues dans le fichier d'origine, propre au logiciel de gestion. En voici un exemple : 

berger4.gif (2914 octets) Avec un peu d'entraînement, vous serez parfaitement capable, après avoir édité un fichier de ce type avec un outil tel que « Microsoft Wordpad » ou « Word », de lire et de comprendre le contenu un peu « bizarre" de ce dernier.

Il devient alors possible de communiquer ces données via une disquette ou un réseau de télécommunication tel que l'Internet et permettre ainsi à d'autres généalogistes utilisant, sans doute, des logiciels de gestion différents de ré-utiliser ces dernières. 

Ce fichier porte le doux nom de « GEDCOM », acronyme signifiant « GEnealogical Data COMmunication » (autrement dit "communication de données généalogiques"). Il répond à un standard dont la dernière version est la « 5.5 ». L'extension de type de fichier est, en général, « .ged ». 

berger.gif (1238 octets)

Ceci dit, tous les logiciels ne respectent pas strictement cette « norme de fait », libertés qui peuvent compromettre de futurs échanges...

Développé par le département « Family History » de l'Eglise précédemment citée, ce standard est la description détaillée d'un format flexible mais uniforme d'échange de données généalogiques informatisées.

Approfondissons !

Un standard d'échange peut être appréhendé comme un langage.

Ce document décrivant le standard « GEDCOM 5.5 » comprend donc deux parties,

  • une première partie («GEDCOM data format») qui décrit la grammaire du langage «GEDCOM» en spécifiant les séquences de caractères valides pour créer un enregistrement,

  • et une seconde («GEDCOM form») qui décrit la structure du fichier et la sémantique de ce langage en listant le sens de chaque type de données utilisé.

Une exportation de données au format « GEDCOM » consiste donc à représenter le contenu d'une base généalogique sous la forme d'un flot séquentiel d'enregistrements tels que :

   0 @I1@ INDI
   1 NAME Pierre /DANGLE/
   1 SEX M
   1 BIRT
   2 DATE 24 JUN 1833
   2 PLAC VILLENEUVE (03) 
   1 DEAT
   2 DATE ABT 1901
   …

La grammaire décrite dans le premier chapitre précise :

  • la structure des enregistrements : une séquence de mots («tag») de longueur variable (255 caractères maximum) arrangée hiérarchiquement,

  • le contenu de ces enregistrements : 

    • une indication de niveau hiérarchique (comprise entre entre 1 et 99) 

    • suivie d'un numéro de "fiche" optionnel, entouré s'il existe de deux « @ », 

    • puis d'une étiquette ou « tag » suivie d'un contenu (de 31 caractères maximum, la séquence formée des 15 premiers étant unique dans le fichier) 

    • et d'une valeur optionnelle ou un identificateur vers une autre référence (il contient alors un caractère «@») voire un pointeur,

  • ….

0 @I1@ INDI
niveau hiérarchique : 0, numéro de fiche : I1, étiquette : IND1

1 NAME Pierre /DANGLE/
niveau hiérarchique : 1,  étiquette : NAME, contenu : Pierre/DANGLE/

Le second chapitre précise (entre autres) :

  • le contenu des enregistrements de structure concernant les informations d'entête (source, version, nom du produit…), les individus, les familles, les notes, les bibliographies…

  • le contenu des enregistrements de sous-structure, contenus dans ces enregistrements, concernant les dates d'événement pour les individus, les dates d'événement pour les familles, les attributs des individus, les adresses …

  • et les éléments de base, constituants de ces derniers enregistrements, tels que les rôles joués par les individus dans les événements (« CHIL », « HUSB », « WIFE »…), les types d'événements concernant les individus (« BIRT », « DEAT »…)

Concrètement,

l'analyse d'un fichier « GEDCOM » nous fait découvrir :

  • tout d'abord quelques lignes d'informations générales précisant le logiciel d'origine, le propriétaire des données, le langue utilisée, le type de caractères, la date de création...

  • puis une suite de blocs, chaque bloc décrivant un individu et commençant par le mot-clé («TAG») «INDI» :

0 @I1@ INDI
1 NAME Pierre /DANGLE/
1 SEX M
1 BIRT
2 DATE 24 JUN 1833
2 PLAC VILLENEUVE (03)
1 DEAT
2 DATE ABT 1901
1 FAMS @F8@
1 FAMS @F12@
1 FAMC @F5@

Dans chaque bloc, nous découvrons donc des informations concernant l'individu, son nom, son sexe, ses lieu et date de naissance, ses lieu et date de décès mais également deux types d' informations de famille, la première associée au mot-clé « FAMS », précisant à quel(s) couple(s) appartient l'individu, la seconde associée au mot-clé « FAMC », précisant à quelle famille l'individu appartenait en temps qu'enfant.

  • enfin une suite de blocs décrivant chacun une famille et commençant par le mot-clé « FAM » :

Dans chaque bloc "FAM", nous pouvons décoder la description d'une famille, donc qui est l'époux, « HUSBand », l'épouse, « WIFE », le ou les enfants, « CHILd », la date et le lieu du mariage. Un individu sera associé avec une famille soit parce qu'il sera parent, père ou mère (« HUSB » ou « WIFE ») soit parce qu'il sera enfant (« CHIL »). Aux deux mots-clés « FAMS » et « FAMC » dans le bloc « Individu », ne correspondra donc qu'un seul mot-clé : « FAM ».

0 @F8@ FAM
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I5@
1 MARR
2 DATE 4 APR 1860
2 PLAC VILLENEUVE (03)

Quelques précisions encore !

a) Un fichier "GEDCOM" doit se finir par l'enregistrement "0 TRLR". La présence de ce dernier permet de s'assurer que le fichier est bien complet, qu'il n'a pas été tronqué. Certains logiciels, à l'exportation, l'omettent... Or d'autres n'acceptent pas d'importer des données s'il manque. Il est donc parfois bien utile de savoir la rajouter manuellement, après avoir ouvert le fichier avec un outil simple comme "Notpad".

b) Les noms des mois apparaissant dans les formats de date sont normalisés à l'anglo-saxonne : JAN, FEB, MAR, APR, MAY, JUN, JUL, AUG, SEP, OCT, NOV, DEC. Certains logiciels francisés exportent en utilisant les abréviations françaises : FEV, MAI, AOU. Cet excès de zèle francophone peut compromettre une future importation !

c) Vous découvrirez parfois dans les zones de dates des abréviations telles que "ABT", "AFT", "BEF". Ce sont simplement les abréviations anglaises de "ABout", "aux environs de", de "AFTer", "après" et de "BEFore", "avant".

Auteur © 2001 - Amicale-Généalogie