Chargement
Veuillez patienter...

EITAB- DIGITme TAL Gruppe

Bilan de la journée du 12 décembre 2014


Dernière modification : 21 novembre 2016

 Introduction (O. Buchsenschutz)

En guise d’introduction, O. Buchsenschutz propose un tour d’horizon sur le traitement graphique de l’information archéologique. L’intervention distingue quatre principaux volets : les graphiques et les statistiques ; les outils cartographiques et la sémiologie ; les images satellite, l’environnement et l’analyse spatiale ; les problématiques adaptées à différentes échelles. En premier lieu, l’intervenant rappelle qu’une carte est un cas particulier de mise en relation de données. La carte constitue l’aboutissement d’un travail d’inventaire, d’analyse et de traitement des données ; elle résulte également du croisement d’informations diverses (repérage, géographie, conservation, structure, mobilier, datation…). Préalablement à la représentation cartographique, il s’avère essentiel de traiter les données à partir d’outils graphiques ou statistiques. D’autre part, on rappelle l’importance du choix d’une sémiologie adaptée à ce que l’on souhaite représenter : l’interprétation de la carte doit s’imposer à l’œil instantanément. La cartographie possède donc des règles spécifiques. Il faut correctement appréhender la nature et les propriétés des variables visuelles utilisées. Celles-ci doivent exprimer la différence, l’ordre ou la quantité, sur une implantation ponctuelle, surfacique ou linéaire (on renvoie à l’ouvrage de J. Bertin (1967) : Sémiologie graphique). O. Buchsenschutz rappelle que l’image satellite, même géo-référencée, n’est pas une carte. Une carte est une construction, une sélection, un outil de démonstration. Pour cette raison, le choix du fond de carte est très important et fait partie de la démonstration. Il doit fournir des informations complémentaires et mettre en perspective les données représentées. En ce sens, il ne faut pas altérer les cartes avec des éléments superflus. Enfin, l’intervenant souligne la distinction fondamentale qu’il existe entre deux types de carte : la carte inventaire (qu’y a-t-il à tel endroit ?) et la carte de traitement (où se trouvent tous les sites de tel type ?). La première s’adapte davantage aux cartes à grande échelle, la seconde aux cartes à petite échelle. Les problématiques et la représentation doivent être adaptées aux différentes échelles. Le passage de l’une à l’autre suppose une « généralisation » de l’information, dans ses concepts comme dans la graphique, qui a été un peu oubliée depuis que les images satellites et les supports informatiques en général nous ont habitués à « zoomer » les documents.
Jean Steinberg, « L’apport de la sémiologie graphique de Jacques Bertin a la cartographie pour l’aménagement et l’urbanisme », Cybergeo : European Journal of Geography [En ligne], Dossiers, document 146, mis en ligne le 17 novembre 2000, consulté le 21 novembre 2016. URL : http://cybergeo.revues.org/497 ; DOI : 10.4000/cybergeo.497
« Colloque : 30 ans de sémiologie graphique », Cybergeo : European Journal of Geography [En ligne], Dossiers, mis en ligne le 12 décembre 1997, consulté le 21 novembre 2016. URL : http://cybergeo.revues.org/553 ; DOI : 10.4000/cybergeo.553

 L’atlas diachronique de l’innovation (TOPOI et DAI) : Objectifs, grandes lignes du contenu (D. Lukas)

Après une introduction historique des représentations cartographiques, D. Lukas rappelle l’intérêt heuristique des cartes et l’importance qu’elles revêtent dans la représentation des comportements sociaux différents. Le Digital Atlas der Innovationen (DAI), développé en collaboration avec le Max-Planck-Institut für Wissenschaftsgeschichte dans le cadre de Topoi, permet d’étudier le rythme de développement et la périodisation des innovations, à différentes échelles et sur le long terme. Cet Atlas en ligne dynamise les cartes de répartition archéologique traditionnelles et rend compte des changements à la fois dans le temps et dans l’espace (l’Atlas repose sur l’application PLATIN : places and time navigator). Dans le cadre de l’invention de la roue, par exemple, l’Atlas fait apparaître différents foyers : l’innovation ne semble pas résulter d’une diffusion progressive et linéaire ; l’innovation obéit vraisemblablement à des dynamiques plus complexes. Relié à une base de données, cet instrument donne accès à un jeu d’information très conséquent. L’intervenant présente également le projet ORBIS (Stanford Geospatial Network), destiné à modéliser les voyages et à calculer le temps de déplacement dans l’Empire romain. Ces outils vont à l’encontre des modes de représentation statiques en introduisant une dimension temporelle. L’objectif est de favoriser la réflexion, de visualiser les phénomènes de continuité, de rupture et de complexité.
Voir sur le site de topoi.

 L’Atlas de l’âge du Fer européen (PSL, AOROC- CNRS, ENS) – (O. Buchsenschutz, K. Gruel, M. Cartereau, E. Hiriart)

Le projet BaseFer, développé par le laboratoire AOROC, se présente sous la forme d’une base de données MySQL, le projet couvre actuellement l’ensemble du territoire français avec 15000 gisements de l’âge du Fer répertoriés. Plusieurs expériences menées en Allemagne et en Italie (500 sites enregistrés) soulignent l’intérêt d’étendre cette démarche à d’autres pays européens, pour l’âge du Fer et/ou pour d’autres périodes. Les entités archéologiques sont référencées au niveau du centroïde communal ; ce degré de précision est suffisant pour une représentation à petite échelle. L’objectif n’est pas de rechercher ce qu’il y a à tel endroit, mais d’indiquer comment se répartissent tous les gisements de telle ou telle nature. La Base demeure volontairement généraliste. Par exemple, on n’indique ni les quantités, ni les liaisons stratigraphiques, ni l’étendue d’un oppidum. On commence par des données larges pour cibler, dans un second temps, des données plus précises. Les données de la BaseFer sont intégrées à l’Atlas de l’âge du Fer en ligne, qui met à la disposition du public tout une sélection des sites de l’âge du Fer. Les internautes peuvent consulter la base de données automatiquement comme un atlas/dictionnaire de référence (où sont tous les xx en Europe ? Que connaît-on à telle époque sur telle région ?). L’atlas propose, en complément de ces réponses ponctuelles à « Où ? Quoi ? Quand ? », des cartes thématiques enrichies et commentées par les chercheurs.

Voir en ligne.

 De Patriarche à l’atlas du patrimoine, l’exemple de la Bretagne, retour d’expérience (SRA Bretagne) – (Th. Lohro, M. -O. Pinel)

M. -O. Pinel présente l’évolution et la structure de l’outil de gestion du patrimoine archéologique PATRIARCHE, SIG (Arcview) couplé à un système de gestion de base de données (ORACLE), installé dans les services du Ministère de la Culture depuis 2002 : un tronc commun fait de 3 ensembles géoréférencés (avec une composante cartographique) : les entités archéologiques, les opérations archéologiques et les protections et de trois tables régionales : les données géo-administratives, les sources documentaires et le répertoire (annuaire des acteurs de l’archéologie). L’outil présente deux limites majeures : système fermé sans interopérabilité et sans « web compatibilité ». Sa consultation est uniquement possible au sein du réseau Ministère de la Culture. Le SRA- Bretagne (Service de régional de l’archéologie) a donc choisi de diffuser sa documentation en utilisant comme outils : l’Atlas des Patrimoines ; la plateforme Géobretagne et une bibliothèque numérique pour la mise en ligne des rapports d’opérations archéologiques.
Développé par le ministère de la Culture, l’Atlas des Patrimoines permet un accès cartographique (par la localisation) à des informations culturelles et patrimoniales (ethnographiques, archéologiques, architecturales, urbaines, paysagères). Il permet de connaître, visualiser, éditer, et télécharger des données géographiques sur un territoire. Le SRA Bretagne propose via l’Atlas l’accès à une partie des données de la carte archéologique : les entités archéologiques, les réseaux viaires, les opérations archéologiques avec un lien vers la version numérique du rapport de fouilles remis à l’issue de l’opération, stockée dans la bibliothèque numérique.
Le SRA a également versé ces mêmes données, sur Géobretagne, plate-forme d’information spatialisée, développée conjointement par la région Bretagne et la préfecture de région. Cette plate-forme offre les mêmes possibilités que l’atlas mais permet aussi de réaliser des légendes thématiques de l’information mise en ligne (sites archéologiques par nature de vestige ou chronologie). Tous les sites archéologiques régionaux s’affichent, du Paléolithique à l’époque moderne. Il est possible d’effectuer des requêtes précises et de visualiser les gisements suivant la nature des vestiges, la chronologie ou la localisation. Il permet également de réaliser des recherches à partir de la cartographie et/ou des éléments qui caractérisent cette information. Le résultat de cette recherche peut être exporté sous la forme d’un tableur.

 Atlas du patrimoine marocain développé pour la division de l’inventaire et de la documentation du patrimoine (Yebni, DIDP, Geocarta) – (Y. Riahi, M. Dabas, S. Kafas, N. Boutros)

Le projet d’Atlas marocain du patrimoine s’inscrit dans le Programme Conjoint de Coopération « Le patrimoine culturel et les industries créatives comme vecteur de développement au Maroc 2008-2011) », lancé pas des agences des Nations Unies (dont l’UNESCO) en coopération avec des partenaires nationaux. La mise en place d’un SIG pour le patrimoine marocain vise à renforcer les capacités professionnelles du Ministère de la Culture, en créant un outil de gestion (et de prise de décision) incluant la dimension spatiale de l’information patrimoniale. La région Tata sert de région pilote. L’approche documentaire consiste à élaborer une fiche « minimale » d’identification du patrimoine. Cette fiche est associée à une collection de relations liées à d’autres types de documents spécifiques (fiches informatives, illustration, organisme…). Dans la base de données, les fiches du patrimoine culturel se déclinent en plusieurs volets : patrimoine immobilier, patrimoine mobilier, patrimoine immatériel, médiathèque du patrimoine, fiches transversales (thème, personne, service). Le système est doté d’une interface d’administration (permettant la saisie et l’archivage des fiches) et un portail public. Le SIGPCM (Système d’Information Géographique du Patrimoine Culturel du Maroc) permet un aperçu des données issues de la base documentaire. Ici aussi, l’interface admet un accès « Grand Public » (visualiser les cartes publiées, afficher les fiches de site, effectuer des recherches) et un accès « Administrateur » (déposer de nouvelles couches, mettre à jour des données, créer des cartes, gérer des requêtes…).

Voir le site du SIGPCM.

 ArkéoGIS, agrégateur bilingue de bases de données requêtables autour de la vallée du Rhin. Présentation de l’outil et retour sur expériences (Univ. De Strasbourg) – (L. Bernard)

ArkéoGIS est un projet de SIG bilingue (français – allemand) et transfrontalier, dont la finalité est de mettre en commun les données archéologiques disponibles de part et d’autre de la vallée du Rhin, depuis les Vosges jusque dans la Forêt-Noire. Actuellement, 31 bases de données sont intégrées au projet et 38546 sites recensés (certains sites sont redondants). A l’instar de la BaseFer, les gisements archéologiques peuvent être renseignés sur quatre niveaux de profondeurs, tout en croisant chronologie, structures, mobiliers, productions et paysage. Le projet se fonde sur la mise en commun des données et sur le partage des informations archéologiques de la vallée du Rhin. La base intègre les données des sociétés privées, de Patriarche et de plusieurs chercheurs. En mode administrateur, un onglet « Import » permet aux utilisateurs de rajouter une base. Ce Système d’Information archéologique en ligne permet aux différents partenaires de disposer d’un outil afin de visualiser des données cartographiées, entre la fin de la Préhistoire et le Moyen Age. En facilitant une approche diachronique du territoire, ArkéoGIS rend possible le développement de nouvelles problématiques. L’intervenant précise qu’il est possible d’effectuer des requêtes ciblées et d’exporter le résultat en format csv. En outre, ArkéoGIS est relié à un agrégateur de cartes (Cigal) qui donne accès à plusieurs jeux de photographies aériennes et de cartes.

Voir le site d’ArkéoGIS.

 Chronocarto, Visualiseur de données intra –sites en ligne, grandes et moyennes échelles - (AOROC, CNRS-ENS, Géocarta) – (K. Gruel, M. Dabas)

Tout d’abord, les intervenants présentent l’architecture du serveur de données géographiques. Les utilisateurs de Chronocarto peuvent facilement créer et publier des cartes, en suivant ces cinq étapes : définition du projet, entrée des données, attribution d’un style aux données, création de la carte, publication de la carte. Un copyright peut être attribué aux cartes, on dispose d’outils pour s’assurer la traçabilité et la sécurisation des données. Chronocarto offre un large choix de possibilités, en permettant de créer sa propre sémiologie graphique (en s’appuyant, par exemple, sur les symboles Bertin) et d’ajouter un document non géographique géoréférencé (images, photos, rasters…). Les intervenants présentent la publication en ligne du PCR Sarthe, qui permet de visualiser l’évolution des relations Hommes-milieux sur la Cité des Aulerques Cénomans (Sarthe). Le projet se subdivise en dossiers, signés par les différents auteurs et comprenant plusieurs cartes. Ici aussi, différents outils existent, qui permettent, par exemple, de calculer la distance entre deux points. Chronocarto peut servir de support à un travail collaboratif : à distance, les chercheurs peuvent simultanément dessiner online et confronter des points de vue sur des résultats de fouilles ou des interprétations de prospections. Par ailleurs, les données de base peuvent être enrichies avec des fonds IGN, Google, OpenStreetMap… En somme, les outils développés pour Chronocarto permettent de réaliser, dans des projets différents, des cartes thématiques à différentes échelles : des cartes d’analyse à l’échelle du site archéologique, des cartes d’analyses du territoire entre sites voisins et des cartes thématiques à petite échelle (Gaule, Europe…). Chronocarto se révèle aussi comme un outil pédagogique innovant, en particulier pour les stages de terrain. Le document graphique est l’entrée naturelle à la place du texte, avec un classement simple par dossier et par calque.

Voir le site de Chronocarto.

 Géolat (géographie pour la littérature latine) – (M. Lana)

Géolat constitue un projet d’agrégation opensource des textes des auteurs latins de l’antiquité tardive. L’objectif est de permettre au public ainsi qu’aux chercheurs de découvrir les informations géographiques contenues dans les sources littéraires. L’idée est de pouvoir lire les textes à partir et en fonction des informations géographiques qu’ils contiennent. Il s’agit d’effectuer un marquage ou un balisage de tous les textes classiques latins, des origines à 476 AD. Tous les noms de lieux contenus dans les textes seront automatiquement indexés, grâce aux ressources existantes comme par exemple le projet en ligne PLEIADES, et le Barrington Atlas. Parallèlement, une interface géographique permettra, par exemple, de dessiner une zone sur une carte et d’obtenir une liste d’auteurs et d’œuvres qui évoquent la zone en question. Des cartes anciennes seront également inclues dans l’Atlas, afin d’aboutir à une approche diachronique des noms de lieux. La gestion de la bibliothèque numérique et des annotations seront effectuées soit à partir d’un système logiciel développé ad hoc, soit à partir de la réutilisation d’un système de logiciel existant. Plusieurs options sont également étudiées afin de développer une interface géographique adéquate.
On ne peut échapper à un travail de vérification a posteriori, pour éviter les doublons. En effet, comment distinguer, les nombreux Mediolanum, Alexandrie, Neapolis… ?
Geolat, that is geography for Latin literature (www.geolat.it), is an ongoing research project in its startup phase, funded by “Compagnia di San Paolo” (a bank foundation in Turin, Italy) in 2013 after a blind peer evaluation carried out by European Science Foundation.
The core idea is that of annotating a corpus of Latin texts (in perspective, the whole Latin literature as it being collected in the diglibLT digital library, www.digiliblt.uniupo.it) and then of using the annotation to study the texts thanks to new ways to get in touch with the texts, to read them and to use them.
The annotation is made mainly through the use of an ontology (in the information science sense, an ontology is a formalized way of describing a given domain of knowledge so that it can be understood both by humans and machines) which describes the geographical knowledge contained the classical texts contains. This ontology is being built from scratch as of January 2015 with both a bottom-up approach (many classical texts were read in order to recognize the geographical knowledge they contain with their specificities) and a top-bottom approach (many main concepts are known a priori : for example the fact that natural places are sacred to, or the abode of, divinities of various types).
This annotation will be formally expressed (will be ‘written’) partly as inline mark-up (=annotation written in the texts) conforming to TEI-XML, partly as standoff mark-up (=annotation written outside the texts) and it will consist in populating the ontology .
The services will offer and foster the possibility of investigating the geographical knowledge contained in the texts with two approaches : cartographical and textual.
At cartographical level maps layers showing roman places could be integrated with Open Street Map or Google maps, or could be put into a specific web site where you draw an area on the map and you get the list of works/authors containing names of places, etc. This means developing a geographical resource bridging the gap between cartography and texts by bringing into focus the places. An important extension of our model (we start from literature) we are already thinking of, is the one towards archaeological places : they are not always mentioned in texts nevertheless they belong to that same culture to which the texts too belong.
At textual level the re-use of the annotation can start from a map interface mixed with a faceted textual search allowing to ask new questions, e.g. : which is the geography of Horace Odes and what does it mean ? has it any relation with the geography of other Augustan age authors ? has it any functional or ideological meaning ? are there any places of a given area mentioned in a given type of texts or authors ?
This basic concept can be expanded - call it “ontolit - ontologies for literary texts“ in two orthogonal directions :

  • adding more ontologies for person names/roles and events/times ;
  • adding more European literatures.
    Searches involving the triplet made by place-person-event/time would allows for a deeper insight into the content of the texts, while the extension to more literatures of the European area would allow for a diachronic in depth study of places, roles, events across times1.
    This expanded approach would more closely interconnect Classical studies with the European cultures, showing that the route from Latin and Greek to modern languages is an aspect of the creation and evolution of a unique yet faceted and composited culture.
    The complex task of annotating every occurrence of every placename will be made someway easier by an activity of Named Entities Recognition (NER) which will allow to automatically parse the texts, find the placenames, identify them and associate them with data coming form the Pleiades gazetteer which in turn is based on the Barrington Atlas of Classical World. The output of this preliminary NER phase will be checked by scholars to disambiguate betweem omographs, to correct errors, and so on.
    A specifici care wil be devoted to archeological sites, particularly those who show evidence on the terrain but have no known identity.
    Those interested can follow the development of the project and particularly can know when the prototype of the system will be online, going to the website of the project www.geolat.ite

 EITAB, Passage de documents papier vers un format numérique : l’exemple de l’archéologie (Lattice- AOROC) – (Fr. Mélanie, J. Ferguth, Th. Poibeau, K. Gruel)

Tout d’abord, les orateurs rappellent que les Humanités numériques vise à : mettre en ligne des données, améliorer l’accès aux données, et à concevoir de nouvelles techniques d’analyses. Le projet Lattice a pour but de restructurer les textes dans des formats standards (XML), à développer le traitement automatique des langues, à analyser des grandes masses de données et à offrir différents moyens de visualisation de l’information. Le TAL (Traitement Automatique des Langues) consiste à identifier les entités nommées et à saisir les liens entre ces différentes entités. Il existe des outils (Yatea, Tydi) pour analyser le contenu, extraire automatiquement les termes les plus importants (noms d’objets, codes INSEE, etc.), les entités (noms de personnes, de lieux, dates, etc.) ainsi que d’autres informations pertinentes. Les intervenants montrent un exemple, à partir du travail effectué sur les Cartes Archéologiques de la Gaule (CAG), dans le cadre du projet EITAB. Ces éléments peuvent ensuite être structurés (par exemple sous-forme d’index) directement exploitables pour une consultation en ligne. Il s’agit de construire une ontologie (un lexique spécifique) enrichie grâce à la collaboration des archéologues et qui puisse servir de référent. Les informations extraites ont pour vocation d’enrichir différentes bases de données comme la BaseFer. L’indexation servira à la future collection de publications numériques d’AOROC.
Les questions concernent les délais nécessaires à la mise en œuvre du projet (un an : analyse et traitement des données, maîtrise des outils, production d’une liste automatique de termes) et les compétences requises (deux stagiaires linguistes, expertise d’archéologues).

 Articulation de l’Atlas de l’âge du Fer et de la Base Fer avec la Carte Archéologique de la Gaule, avec les bases spécialisées (animaux, semi-produits en fer, meules, établissements agricoles…) avec des bases régionales (ENS, PSL, AOROC- CNRS) – (O. Buchsenschutz, K. Gruel, M. Cartereau)

La BaseFer est une base généraliste destinée à fournir une vue générale de l’occupation du territoire à l’âge du Fer. Elle vise à répertorier les gisements géolocalisés par commune. C’est une base qualitative (présence/absence) qui a pour objectif de produire des cartes et des analyses à l’échelle de la France et, à terme, de l’Europe. Les données s’appuient sur le dépouillement de la CAG et de divers catalogues et inventaires. Des liens sont d’ores et déjà établis avec d’autres bases régionales plus détaillées (AquiFer), des bases thématiques spécialisées (base Monnaie), des fichiers de thèse. Le programme Archeolocalis permet de géoréférencer automatiquement les informations. Le gisement est l’unité de référence de la base ; les informations sont regroupées en structures ; un second onglet correspond au mobilier et aux écofacts. Sous MySQL, la base peut-être interrogée en ligne, afin de répondre à certaines questions : Où, quand, quoi ? L’élargissement à l’Europe pose un certain nombre de questions : taille inégale des entités administrative (communes) ; référentiels typo-chronologiques différents ; terminologie différente en fonction des pays… Les orateurs précisent qu’une extension de la BaseFer est en cours en Italie, dans le cadre de l’ANR CAECINA. Les questions portent notamment sur les soucis liés au choix d’un système chronologique adapté (Datation absolue ou par phase) et à la précision des termes employés.
_ Question sur la fiabilité des bases : cette fiabilité en rapport avec le texte de départ (souvent CAG), il faut donc se référer à la source de base.

 État actuel dans l’agrégation des donnés entre Topoi et Ianus (DAI, TOPOI) – (D. Lukas)

D. Lukas présente le laboratoire d’excellence Topoi, qui rassemble plus de 200 chercheurs issus de toutes les disciplines. Ils se trouvent actuellement dans la deuxième phase du projet (2013-2017). Le but de IANUS est de répondre aux opportunités et aux défis posés par l’utilisation des méthodes numériques, de plus en plus utilisées dans les études anciennes. Ce projet est novateur car pour l’instant, aucune autre structure allemande ne met en commun, au-delà des provinces, l’ensemble des informations archéologiques. Ainsi, on pourra plus aisément vérifier les résultats issus de la recherche. IANUS a monté, entre autre, une base destinée à rassembler et à sauvegarder toutes les données archéologiques de l’Allemagne. Les champs particuliers de la base destinées à rendre possible l’amalgame des différentes bases de données sont limités à un petit nombre et restent à un niveau de précision très général, comme dans la BaseFer. À long terme, cette base numérique vise à favoriser les échanges et à pallier le risque d’une perte des informations. Les données pourront ensuite servir de base à des travaux divers, à différentes échelles (grande : site, opération ; moyenne : région ; petite : pays, Europe). L’objectif est de coordonner différents projets reliés aux humanités numériques (il s’agit d’agréger différentes bases et trouver des points communs entre celles-ci). En vue d’un projet commun, européen, on s’interroge sur l’unification de la structure des bases de données. Il faut correctement définir les problématiques communes pour aboutir à une homogénéisation.

 La numérisation et les archives ouvertes à l’EHESS - A. Berra

Philologue et helléniste, l’intervenant enseigne les humanités numériques dans le master « Humanités classiques et humanités numériques » de Paris-Ouest et anime le séminaire « Digital Humanities. Les transformations numériques du rapport aux savoirs » à l’EHESS. Pour plus d’informations, voir le carnet Philologie à venir (http://philologia.hypotheses.org).

Il présente d’abord différents projets nationaux (archives ouvertes HAL) et européens (DARIAH) de diffusion et de valorisation des données issues de la recherche. Ensuite, Aurélien Berra évoque le traitement des archives et de la documentation en vue de l’extraction et de l’exploitation numérique. Plusieurs projets sont présentés : la plateforme Perseus, le gazetteer des noms de lieux anciens Pleiades, les projets HESTIA (vision de l’espace et de la géographie dans Hérodote), SAWS (traditions des énoncés de sagesse) et Tesserae (détection des références et des allusions), l’édition d’Athénée, notamment. Parmi leurs principaux objectifs se trouvent l’interopérabilité, l’élaboration d’ontologies et l’exploitation de données multilingues.

Autre exemple, le projet HESTIA traite de la vision de l’espace dans Hérodote et, à partir de ses textes, vise à définir un réseau de cité. D’autres projets comme Pleiades, ont le même objectif.
EHESS, archives ouvertes, institutions

 Philologie numérique et exploitation des textes

_ A. Bases de textes

B. Ontologies

  • CIDOC (International Committee for Documentation) Conceptual Reference Model, CIDOC-CRM (musées)
  • Functional Requirements for Bibliographic Records,FRBR
  • FRBRoo
  • Projet SAWS, Sharing Ancient Wisdoms

C. Géographie antique et SIG

D. Companion to Digital Humanities :

  • • Harrison Eiteljorg, « Computing for Archaeologists », dans Susan Schreibman, Raymond G. Siemens et John M. Unsworth (éd.), A Companion to Digital Humanities, Oxford, Blackwell, 2004 ;

 Liens internet

 Conclusions et perspectives

Nous cherchons à créer un espace numérique de travail en ligne permettant de travailler en groupe, au sein des laboratoires ou en réseau, dans des conditions optimales. Il s’agit de rendre effectif l’accès aux ressources et aux données géo-référencées partagées indépendamment du lieu d’interrogation, et d’exploiter les bases de données disponibles sur internet…L’objectif est de collecter, capitaliser, gérer, diffuser et valoriser nos travaux en favorisant les échanges entre les chercheurs.
Ces journées ont été l’occasion de présenter des outils de recherche orientés vers les mêmes objectifs dans les différents projets.
On peut résumer dans un tableau les principales caractéristiques des bases qui ont été présentées. (cf.infra)

 Etat des lieux


Le tableau que nous avons dressé, essaie de résumer les caractéristiques des opérations en cours.
On peut déjà remarquer que deux grandes familles de bases se distinguent : les bases à grande ou moyenne échelle (en bleu clair) qui visent à répondre à la question « qu’y a-t-il à tel endroit ? », sont liées à la gestion (en orange), permettent aussi des opérations de recherche. Elles ont un objectif prioritaire, la gestion du patrimoine, la diffusion des données auprès du public, éventuellement grâce au Web (en orange).
A petite échelle (en bleu soutenu), on arrive vraiment dans le domaine de la cartographie géographique et historique (en jaune) « répartition de tel ou tel phénomène ».
Nous avons seulement évoqué, à travers les bases sur la Sarthe ou le Berry, des bases à moyenne échelle, qui intègrent les données environnementales, et calculent les biais des répartitions archéologiques et leurs liens avec l’environnement avant de construire des cartes de répartition.
Le problème des sources est abordé à différents niveaux, selon qu’on utilise uniquement des sources archéologiques (inventaires, rapports, publications) ou des sources littéraires.
Les travaux du Peps etiab Lattice- AOROC (CNRS-PSL) permettent d’envisager une saisie automatisée des inventaires archéologiques, qui nous soulageraient d’un travail fastidieux et permettraient un enrichissement des bases par exploitation de documents en format texte de type catalogue et de bases de spécialistes. Les méthodes d’agrégation des bases mises au point à Strasbourg présentent aussi une solution très intéressante, notamment pour dépouiller les fichiers de thèse.
Il apparait clairement que les expériences présentées sont plutôt complémentaires que concurrentielles. On peut imaginer un travail en commun avec un fichier aux normes générales semblables, relié à des « outils » capables de traiter les sources ou de faire des calculs sur les données.
La seule division qui demeure, à notre avis, est dans les objectifs : la gestion du patrimoine a ses contraintes propres, difficilement compatibles avec les besoins de la recherche. Il faut certainement des ponts entre les deux, mais l’expérience française, au cours des quarante dernières années, montre qu’il est vain de chercher à coordonner des objectifs aussi divergents.

Les modules que nous pourrions mettre au point pour fusionner ou relier nos données et nos méthodes

1. Tableau de données de type Excel avec des colonnes réservées à la position géographique.

  • Données administratives européennes (nuts) (système Archeolocalis étendu à l’Europe : calcul automatique des centroïdes des communes). Possibilité d’entrer des données topographiques plus précises. Projection en wgs 84_ mercator (EPSG 4326). Possibilités de projections locales à un deuxième niveau.
  • Double chronologie : chronologie absolue date sup / inf et référentiel typochronologique.
  • Index hiérarchisé (tree) : Hiérarchie des data permettant des questions à différents niveaux de généralité, et réponses multiples autorisées. Exemple : habitat/ habitat fortifié/ murus gallicus/ bâtiments sur poteaux, fosses/ parure, arme/ bracelet, épée, lance
  • Pour les fonctions de gestion, les bases qui dépendent des ministères de la Culture enregistrent des renseignements sur la conservation, la propriété, l’exploration des sites.

2. Outils généraux  :

  • Outils de calcul statistique : pourcentages, tableaux croisés dynamiques, boîtes à moustaches, graphiques, analyses multivariées.
  • Visualisation de données ponctuelles
  • Visualisation de données traitées sur d’autres supports : statistiques, analyses spatiales
  • Intégration de rasters provenant de diverses sources en ligne : open street map, google, ign, Corine landcover, images satellites…

3. Développement d’outils spécifiques
Frises chronologiques (cf. Atlas de l’Innovation)
TAL, extraction de données dans un niveau plus général.
Alimentation semi- automatique de base de données, identification des doublets

4. Communication entre les projets :

  • Portail de projets, coordination des bases par agrégations (cf. Arkéosig)
  • Utilisation des « gazetteer » : geonames, pleiades, iDAI.gazetteer ;
  • utilisation des vocabulaires standardisées (cf. Archaeology Data Service au Royaume Unit) ; utilisation des technologies de Open Linked Data (RDF, etc.) pour l’échange des données
  • Clés de référence communes.
  • Fonds de carte commun.

 Les objectifs

1. Objectifs patrimoniaux  :
Qu’est- ce qui a à tel endroit ? (coordonnées géographiques, cadastre).
Accès à l’information textuelle et graphique : rapports, documentation de fouille et de prospections, corrélation des documents graphiques aux grandes échelles (1/10 à 1/5000e environ).
Inventaire, gestion des opérations de recherche, prédictivité.

2. Objectifs de recherche :
Où sont tous les gisements /le mobilier de tel type ? Quels sont les éléments innovants ? Extension et chronologie des groupes culturels.
Construire une chronologie absolue, à partir des données actuelles : date inférieure, date supérieure, typo-chronologie.
Mettre en évidence la corrélation des données dans l’espace et le temps : cartes de répartition.
Analyses statistiques et spatiales des phénomènes observés : median center, ellipse de déviation, cartes de densité, courbes de niveau, Analyse ascendante hiérarchique, anamorphoses, etc.
Modélisation, prédictivité.

3. Diffusion  :
Mettre à disposition des chercheurs l’information de base :
Accès à distance aux données, intervention en temps réel des opérateurs (pour les petites échelles).
Accès sur le web aux données générales. Possibilité de construire à distance sa carte (atlas de l’Innovation, Chronocarto, Atlas du Maroc).

Compte-rendu des travaux , K Gruel, E. Hiriart, O. Buchsenschutz, Paris le 12 décembre 2014