Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

wrong publication date considered publication date (reported by Alain Monteil) #39

Open
Aazhar opened this issue Jul 28, 2016 · 1 comment
Assignees

Comments

@Aazhar
Copy link
Member

Aazhar commented Jul 28, 2016

Mauvaise interprétation de la date par grobid : inria-00331305 il y a en haut de la première page 12345 et qui visiblement a été pris comme date à l'affichage http://traces1.saclay.inria.fr/anHALyticsInria/
=> il faudrait donner les règle de date à grobid pour qu'il exclu les aberrations par exemple yyyy ne peut pas etre supérieur à X

@kermitt2
Copy link
Member

Les règles "applicatives" sur la bilbiographie (contraintes sur les dates, volumes, numéro, auteurs, nom de journaux, etc.) sont pour le moment laissées à l'application qui intégre GROBID, ce qui permet de mieux adapter les contraintes de contexte d'utilisation.

Mais on pourrait sans problème je pense ajouter dans GROBID une règle qui exclut les années de publication dans le futur en capturant l'année courante de l'environnment et en excluant les dates supérieures à 2-3 ans (il y a des publications dans le futur avec les pre-prints!).

kermitt2 added a commit that referenced this issue Nov 26, 2016
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants