Archéolocalis : répertoire des communes d’Europe
Référencement de l’ensemble des structures administratives territoriales

, par Katherine Gruel

ArcheoLocalis, une base conçue pour des atlas archéologiques à une échelle multinationale - Aide à la cartographie mise à la disposition de tous par AOROC


L’application Archeolocalis est en ligne sur le site « chronocarto.eu » chez Huma-Num afin de permettre notamment le téléchargement des données sur les communes par divisions administratives (pays / super-région / région / département) dans 17 pays européens actuellement.
Les changements dans le découpage français issus de la loi Notre de 2015 ont aussi été intégrés (nouvelles régions - en « super-régions » - et regroupements de communes
Autant que possible, la description d’une commune intègre aussi des références à des nomenclatures internationales (ISO, Geonames, OpenStreetMap, Wikidata), fournissant des métadonnées complémentaires permettant par exemple d’accéder au contour géographique de la commune ou à une description détaillée si besoin.

Corpus de sites référencés mis à disposition de la communauté par AOROC

Thématique : contenus, cartographie et collecte, archéologie
Logiciel concerné:SIG
Mots-clefs : atlas, archéologie, échelle multinationale, découpage administratif, NUTS
 
Communication aux Journées ESRI 2016
par Michel Cartereau,Olivier Buchsenschutz, Katherine Gruel, Élisabeth Goussard

INTRODUCTION

L’origine de la base ArcheoLocalis se trouve au sein du laboratoire
Archéologie et philologie d’Orient et d’Occident (AOROC). Dans le cadre de recherches sur l’Âge du fer (période s’étendant de - 1 000 à - 27),
les archéologues construisent des cartes de répartition et effectuent des analyses spatiales à partir de bases de données spécifiques [1, 2].
La BaseFer constitue l’une des principales bases exploitées [3]. C’est une base générale d’environ 17 000 fiches descriptives de sites à ce jour, et en constante évolution. Un site contient un gisement archéologique de l’Âge du fer défini par une fonction donnée pendant une période plus ou moins longue, mais continue.
Les données proviennent essentiellement du dépouillement de publications scientifiques, de travaux universitaires, de différents rapports et de la Carte archéologique de la Gaule [4].
Chaque site est géolocalisé simplement par le centroïde de la commune. Ce repérage fournit une précision suffisante car la base vise à donner une idée générale sur l’état des connaissances.
L’exploitation des données repose sur le découpage administratif traditionnel français : région et département.
Les coordonnées du centroïde sont toujours disponibles en WGS84. Elles peuvent aussi, selon les pays, être exprimées dans un référentiel géographique national utileaux archéologues, comme par exemple Lambert zone II carto étendu (n° EPSG 27572) en France. La géolocalisation des sites intégrée initialement à BaseFer, s’appuie désormais sur la base ArcheoLocalis issue d’une refonte effectuée en 2011 lors d’un passage de Filemaker à MySQL.
 
Initialement, la géolocalisation couvrait le territoire de la France métropolitaine. Depuis quelques années, le périmètre s’étend progressivement aux pays voisins. Parallèlement son audience s’internationalise. Des archéologues étrangers collaborent désormais à son enrichissement. De plus, ses modalités d’utilisation se développent dans le cadre de programmes de recherche européens. Cette évolution atteint les limites de l’Union européenne. ArcheoLocalis constitue donc un outil de géolocalisation au service des archéologues, conçu en vue de faciliter sa réutilisation dans des SIG gérés notamment avec ArcGIS. Les particularités de cette base et les difficultés rencontrées dans sa constitution sont présentées ci-après.

STRUCTURATION DE LA BASE

Le modèle de découpage administratif repose sur la réutilisation de la nomenclature européenne des unités territoriales statistiques (NUTS) et unités administratives locales (UAL) [5] . Cet important outil créé par la direction générale Eurostat de la Commission européenne, fournit une généralisation du découpage français aux pays de l’Union européenne. Il vise notamment à « la collecte, le développement et l’harmonisation des statistiques régionales ».
La nomenclature se déploie selon six niveaux hiérarchiques :
1. NUTS 0 : un pays, identifié par un code à deux lettres, exemple : UK pour Royaume-Uni.
2. NUTS 1 : une grande région (appelée ici « super-région ») correspondant par exemple à un Land en Allemagne, identifiée par le code de son pays suivi d’un chiffre, exemple : DE2 pour la Bavière ; certains pays ne disposent que d’une seule super-région globale comme par exemple le Luxembourg.
3. NUTS 2 : l’équivalent d’une région française identifiée par le code de sa super-région suivi d’un chiffre, exemple : ES51 pour la Catalogne en Espagne ; certains pays ne disposent que d’une seule région globale comme par exemple le Luxembourg.
4. NUTS 3 : l’équivalent d’un département français, identifié par le code de sa région suivi d’un chiffre, exemple : ITC20 pour la Vallée d’Aoste en Italie ; certains pays ne disposent que d’un seul département global comme par exemple le Luxembourg.
5. UAL1 : l’équivalent d’un canton français, identifié par le code de son département suivi d’un chiffre, exemple : FR522 pour le canton de Crozon en France.
6. UAL 2 : l’équivalent d’une commune française, identifié par un code national si existant. Il est à noter la grande variabilité quantitative du découpage selon les pays due à l’hétérogénéité de leurs organisations administratives respectives. Ainsi le maillage du territoire en UAL 2 s’avère très fin en France avec 36 621 communes de surface moyenne de 15 km², par rapport aux 2 478 communes (gminy) polonaises d’une surface moyenne s’élevant à 126 km². En outre, le découpage administratif d’un pays comme le Royaume-Uni n’est pas sans poser de problèmes du fait de l’absence d’équivalent à la commune (voir ci-après).
 
La modélisatio d’ArcheoLocalis reprend cinq niveaux hiérarchiques : pays, super-région, région, département et commune. La super-région n’est en fait prise en compte que quand elle apporte une plus-value au niveau du découpage d’un pays. Autrement dit, les super-régions uniques ne sont pas considérées (cas des Danemark, Irlande, Luxembourg, République tchèque). En conséquence, une commune est toujours rattachée à un département, lui-même rattaché à une région, elle-même à un pays et optionnellement à un super-région (rattachée à un pays). Les communes sont identifiées par un numéro d’ordre dans ArcheoLocalis.
 

Les référentiels de coordonnées figurent aussi dans la modélisation.

 
Ils sont identifiés selon la classification de l’EPSG[6] . En complément du système de référence WGS84 pour les coordonnées des centroïdes des communes, des référentiels nationaux sont représentés pour le cas échéant compléter la géolocalisation des communes. Ainsi une commune dispose toujours des coordonnées de son centroïde en WGS84, et éventuellement de coordonnées exprimées dans un référentiel local. Un pays peut donc se voir associer un référentiel national unique ou multiple (cas de l’Italie 1 couvert par Roma 1940 Gauss Boaga Ouest -n° EPSG 3003, et Est- n° EPSG 3004).
 
Afin de permettre un usage international, les noms de pays et de référentiels de coordonnées sont disponibles en plusieurs langues. Une entité complémentaire énumère et traduit chaque langue, identifiée par son code ISO639-1 à deux lettres (fr - français, de - allemand, en - anglais, es - espagnol, it italien). Dans la perspective d’interopérabilité avec des jeux de données complémentaires, la description d’unités administratives inclut de manière optionnelle un code national(région, département, commune) ainsi que la nomenclature ISO 3166 (pays, super-région, région et département).
 

SOURCES D’INFORMATION

 
Eurostat constitue bien évidemment la principale source d’information disponible en ligne, non seulement pour la nomenclature NUTS mais aussi pour les informations spatiales sur les communes [7]. Cela fournit une information de première qualité. Il faut saluer le travail accompli au niveau d’Eurostat, qui au-delà des mises à jour périodiques de données, assure aussi un service d’assistance.
Cependant, la constitution d’une base comme ArcheoLocalis nécessite de sources complémentaires pour plusieurs raisons. Les évolutions nationales des découpages administratifs ne sont pas répercutées en temps réel au niveau d’Eurostat (cas par exemple des séparations ou fusions de communes régulières en France) ; il peut aussi s’avérer pratique de connaître leur historique afin de géolocaliser un site décrit avec un ancien nom de commune. Il s’avère aussi nécessaire de compléter la géolocalisation des centroïdes de
commune
La nomenclature NUTS ne couvre réellement que les pays de l’Union européenne. Des pays européens comme la Suisse ou le Liechtenstein nécessitent donc des compléments d’information. Le même problème concerne l’extension de la base à des pays en dehors de l’Europe.
L’objectif d’interopérabilité des données impose aussi de déterminer les codes nationaux et ISO absents de la nomenclature NUTS, voire les référentiels de coordonnées nationaux pertinents pour l’usage considéré.
 
Voici les principales sources d’information complémentaires utilisées :
• Découpages administratifs : instituts nationaux statistiques [8], Wikipedia [notamment l’édition en anglais], GDAM [9], Statoids [10].
• Géolocalisation : OpenStreetMap, GeoNames, Wikipedia, instituts nationaux géographiques.
• Référentiels de coordonnées : EPSG [6], GeoRepository [11].

POINTS PARTICULIERS

Quelques points particuliers caractérisent les difficultés rencontrées dans l’élaboration d’une base multinationale comme ArcheoLocalis, qui proviennent pour l’essentiel des origines administratives et du caractère dynamique des informations considérées.

  • PARTICULARITÉS LINGUISTIQUES
    De par sa portée internationale, les informations telles que les noms géographiques s’expriment dans plusieurs langues voire plusieurs alphabets. L’Unicode s’impose donc pour le codage informatique des données dans la base et dans toutes les manipulations. Cela implique une vigilance permanente au niveau des formats de fichiers utilisés pour l’importation ou l’exportation de données.
    Le plus grand soin est apporté au codage des noms de communes afin de faciliter leur identification par l’usager.
    Comme une même commune peut être désignée par plusieurs appellations selon des langues régionales (cas notamment au pays basque espagnol), les noms alternatifs de commune figurent dans un champ spécifique (infoCommune).
    Il en est de même pour les variantes diacritiques où un caractère est remplacé par deux autres ; exemple : « Århus » et « Aarhus ». Dans le cas d’existence d’un préfixe au nom de commune, celui est enregistré dans un champ à part (prefCommune) ; exemple : « Le Mans » devient « Mans » avec le préfixe « Le »
  • ÉVOLUTION DES DÉCOUPAGES ADMINISTRATIFS
    Les découpages administratifs ne sont pas immuables. Cela concerne principalement les communes, avec une fusion, une séparation ou le changement d’appellation. Ces informations sont généralement répertoriées par les instituts statistiques nationaux (Insee en France).
    Afin là-aussi de faciliter le travail de l’usager, ces modifications sont notées dans un champ spécifique de la description d’une commune (infoCommune).
  • CAS DU ROYAUME-UNI
    Le Royaume-Uni constitue un cas très délicat. En effet, le découpage administratif s’avère particulièrement complexe du fait du poids de l’histoire et des différences politiques entre ses composantes (Angleterre, Pays de Galles, Écosse, Irlande du Nord).
    Dans ce système administratif à géométrie variable, cela se manifeste essentiellement au niveau de la commune qui n’y existe pas de manière universelle sous une forme unique.
    Eurostat s’appuie sur la notion de district électoral (ward) au niveau UAL 2 pour l’établissement de ses statistiques. Malheureusement cette entité est non seulement très évolutive (actualisation chaque année) et donc trop instable, mais de plus elle repose sur des critères électoraux et ne correspond pas à la réalité géographique de l’archéologue.
    Une étude est en cours afin de trouver une solution.

PERSPECTIVES D’ÉVOLUTION

Actuellement, un site dédié à la base est en cours de mise en place [Figure 2]. Il permettra non seulement sa consultation mais aussi un téléchargement libre sous différents formats : export en SQL, base Microsoft Access, ontologie.
Les couches spatiales correspondant aux unités administratives seront également mises à disposition à terme.
Dans le cadre de projets internationaux, il est prévu une extension géographique de la base au-delà des limites de l’Union européenne.
Cela concerne non seulement des pays européens comme la Norvège, mais aussi d’autres contrées comme le Kazakhstan en Asie centrale.
Pour remplacer la nomenclature NUTS inopérante au-delà de la zone européenne, un important travail d’identification deviendra nécessaire en s’appuyant sur l’existant. A ce niveau, le code ISO 639 constituera une première base de travail à compléter par des recherches pays par pays.
Il est aussi envisagé d’ajouter au découpage administratif un repérage
géographique par bassin versant.
Cette tâche se présente comme particulièrement complexe. En effet, un premier examen révèle l’inexistence d’un répertoire international des bassins versants, voire la difficulté de définir formellement ce concept.

CONCLUSION

La base ArcheoLocalis est issue d’activités de production d’atlas par des archéologues.
Elle fournit un système simple de géolocalisation basé sur la commune (centroïdes) accompagné d’un découpage administratif à plusieurs niveaux. Son modèle est aligné sur le système NUTS d’Eurostat (département, région, grande région, pays).
La conception vise aussi à remplir un objectif d’interopérabilité des données en intégrant plusieurs codifications (ISO, nationales). Le périmètre, initialement limité à la France métropolitaine, est progressivement étendu à l’Europe et au-delà.

L’élaboration de cette base rencontre plusieurs difficultés du fait son internationalisation, tant au niveau des différences linguistiques que de la grande variabilité des découpages administratifs nationaux.
Comme son existence correspond à un intérêt grandissant tant au niveau national qu’international, la base est destinée à une diffusion sous licence libre dans différents formats, avec des couches spatiales, afin de faciliter son intégration aux différentsSIG utilisés. Il est envisagé de lui adjoindre un repérage par bassin versant.

BIBLIOGRAPHIE

[1] Olivier Buchsenschutz, Christophe Batardy, Michel Cartereau, Katherine Gruel, Marc Lévery,
« Une base pour l’élaboration de modèles de peuplement de l’Âge du Fer en France », ArcheoSciences, revue d’archéométrie, n° 39, 2015, p. 157-175. Voir en ligne ; DOI 10.4000/archeosciences.4457
[2] Christophe Batardy, Olivier Buchsenschutz, Katherine Gruel
et Marc Lévery, « Analyse spatiale et statistique de l’âge du Fer en France. L’exemple de la « BaseFer » », Revue archéologique du Centre de la France, tome 47, 2008. Voir en ligne
[3] Michel Cartereau, Olivier Buchsenschutz, Coralie Broussard, Katherine Gruel, « Les gaulois à portée de tous, un SIG thématique sur l’âge du Fer », conférence Esri SIG 2013.
[4] La Carte archéologique de la Gaule (collection), Académie des inscriptions et belles lettres.
[5] Vue d’ensemble de la nomenclature des unités territoriales statistiques (NUTS), Eurostat. Voir en ligne
[6] Nomenclature de l’European petroleum survey group (EPSG). Voir en ligne
[7] Données géographiques sur les communes [base Access, couches au format SHP], Eurostat. http://www.epsg.org/Voir en ligne
[8] Information on national statistical systems, Division des statistiques de l’ONU. voir en ligne
[9] Base Global administrative areas (GADM). Voir en ligne
[10] Administrative divisions of countries (Statoids). Voir en ligne
[11] Geodetic parameter repository (GeoRepository). Voir en ligne

Merci à Julien Cavero cartographe du labexTransferS pour son assistance.