Systématique Animale

Documents ISTEX liés aux espèces animales

v1

Nombre de documentsistex:quantityOfItems
/api/run/count-all
Description du corpus

Type de corpusdcterms:type

Corpus thématique constitué de 11 sous-corpus :

  • Arthropodes : 3 147 documents
  • Batraciens : 771 documents
  • Échinodermes : 736 documents
  • Éponges : 790 documents
  • Insectes : 3 394 documents
  • Mammifères : 5 525 documents
  • Mollusques : 1 971 documents
  • Oiseaux : 6 228 documents
  • Poissons : 10 245 documents
  • Reptiles : 1 934 documents
  • Vers : 1 198 documents
Domaine(s)dbpedia:domain

Sciences biologiques

Anglais
Destinataire(s)istex:addressee
Inist-CNRS, Équipe ISTEX-RD

Tester l'outil entity-fishing de la société Science-Miner.

Cet outil est destiné à détecter et étiqueter dans le texte intégral un type d’entités scientifiques : les noms d’espèces animales et végétales, en les désambiguïsant en contexte et en faisant un lien avec la fiche correspondante dans Wikipédia.

Détection dans le texte intégral d'entités nommées constituées par les noms d'espèces animales ou végétales avec, en sortie, un standoff au format TEI regroupant les entités nommées trouvées pour chaque document.
Méthode de constitution du corpus

Critères
  • Chaque document doit contenir au moins un nom d'espèce animale
  • Pas de micro-organismes ou de champignons
  • Présence d'une grande variété d'espèces animales
  • Le nom de l'espèce doit être en latin
  • Documents en anglais
  • Types de documents : documents simples type articles de recherche
  • Dates de publication : à partir des années 1960-1970
  • Type de fichier : Full text de qualité moyenne (pdf à partir de 1.2 + score qualité à partir de 3.0) avec présence obligatoire d’un abstract
Requête
NB : Cette requête peut être réutilisée telle quelle sur le démonstrateur ISTEX ou directement sur l'API ISTEX en ajoutant le préfixe "https://api.istex.fr/document/?q=".
Quel que soit le mode d'interrogation, cette requête est susceptible de ramener des résultats différents en fonction de la date d'interrogation car de nouveaux documents ont été chargés sur la plateforme depuis la création initiale de ce corpus.
Liste des identifiants

NB : Si vous souhaitez utiliser ce corpus pour vos besoins de recherche, téléchargez le fichier.corpus (en cliquant sur l'icône de la liste des identifiants) qui vous permettra d'extraire le corpus via le moissonneur HarvestCorpus. Voir la documentation : https://doc.istex.fr/tdm/extraction/harvest-corpus.pl.html

Comment citer ce corpus

Institut de l'information scientifique et technique - UPS 76 (Inist-CNRS) (2018) : Corpus Systématique Animale. ISTEX - data.istex.fr, https://systematique-collection.corpus.istex.fr/ark:/67375/1G0-27BP7BPS-6

Inist-CNRS
Contributeur(s)dcterms:contributor
Besagni, Dominique (collecteur de données)
Date de créationdcterms:created
2017-07-20
Date de publicationdcterms:issued
2018-12-19
Naviguer dans le contenu du corpus
Les graphiques ci-dessous permettent de visualiser la répartition des documents du corpus selon différents angles de vue bibliométriques, ainsi que leur répartition dans les 11 sous-corpus.
Editeurs
Types de documents
Types de publication
Langue des documents
Catégories Science Metrix
Catégories Inist
Catégories Scopus
Catégorie Scopus - Niveau 1
Catégorie Scopus - Niveau 2
Catégorie Scopus - Niveau 3
Catégories WOS
Années de publication
Présence de XML structuré
Versions PDF
Revues
Répartition des documents dans les sous-corpus
Powered by Lodex 9.3.8