Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Stocker dans la base de données certaines métadonnées #22

Closed
Seb35 opened this issue Feb 5, 2017 · 2 comments
Closed

Stocker dans la base de données certaines métadonnées #22

Seb35 opened this issue Feb 5, 2017 · 2 comments

Comments

@Seb35
Copy link
Member

Seb35 commented Feb 5, 2017

Il y a dans la base LEGI-XML certaines métadonnées intéressantes comme les liens, mais peut-être également d’autres. Ces métadonnées ne serviraient probablement pas dans une version “texte brut” mais seraient intéressantes à exploiter dans des versions “texte enrichi” ou “machine-readable”.

Les premières étapes seraient :

  • étudier les métadonnées intéressantes à stocker dans la base de données (travail sans qu’il y ait besoin de compétence en programmation, mais surtout de la curiosité pour parcourir quelques textes et juger de l’intérêt des différentes métadonnées + lecture de doc)
  • définir un schéma de base de données pour cette fonctionnalité : quelles sont les champs à stocker ?
  • stocker dans la base de données les métadonnées à ajouter

Dans un second temp, on pourra envisager de réutiliser ces métadonnées pour améliorer #2 et #18.

Dans un troisième temps, dans le cadre d’Archéo Lex ou pas (plutôt “pas” en fait), on pourrait comparer les résultats obtenus selon les deux méthodes (source officielle et reconstruction heuristique), et en fonction des cas améliorer les heuristiques ou rapporter l’erreur de liens à la DILA – selon que c’est un faux positif ou un faux négatif en fait – et dans ce cadre ça rentrerait dans le cadre de legi.py (@Changaco).

Je mentionne cette feature ici parce qu’il faut bien le mettre quelque part et que c’est d’intérêt pour Archéo Lex, mais ça rentrerait dans un projet plus global à Légilibre d’avoir une structure de base de données commune entre les différents projets.

@Changaco
Copy link
Member

Changaco commented Feb 6, 2017

Pour info legi.py a déjà une table liens, qui est une des plus grosses d'ailleurs (5564793 lignes aujourd'hui), et normalement toutes les autres métadonnées sont aussi dans la base (si je n'en ai pas oublié). Cependant legi.py n'utilise pas encore la table liens (Legilibre/legi.py#4).

@Seb35
Copy link
Member Author

Seb35 commented Aug 14, 2018

Je ferme cette issue vu qu’Archéo Lex n’a plus de base de données en propre, et legi.py a effectivement certaines données comme les liens.

@Seb35 Seb35 closed this as completed Aug 14, 2018
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants