Domaine D4. Organiser la recherche d'informations à l'ère du numérique

Please download to get full document.

View again

of 20
334 views
PDF
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Document Description
Domaine D4 Organiser la recherche d'informations à l'ère du numérique Nathalie DENOS Maître de conférences en informatique UPMF - Grenoble Karine SILINI Maître de conférences en informatique ULCO
Document Share
Documents Related
Document Transcript
Domaine D4 Organiser la recherche d'informations à l'ère du numérique Nathalie DENOS Maître de conférences en informatique UPMF - Grenoble Karine SILINI Maître de conférences en informatique ULCO Licence Creative Commons : Paternité - Pas d'utilisation Commerciale Partage des Conditions Initiales à l'identique 20 octobre 2011 Table des matières D4.1 : Rechercher de l information avec une démarche adaptée...3 La recherche d'information...4 Les sources d'information...5 Les catalogues de bibliothèque...6 Les portails documentaires...7 Les annuaires de recherche...8 Les moteurs de recherche...9 Les requêtes...10 La compétence en questions...11 La compétence en situations...12 D4.2 : Évaluer les résultats d'une recherche...13 Les critères d'évaluation...14 L'évaluation de la fiabilité...15 Les règles de publication...16 La compétence en questions...17 La compétence en situations...18 D4.3 : Référencer une ressource numérique en ligne...19 La disponibilité d'une ressource...20 La récupération...21 La référence à une ressource en ligne...22 La compétence en questions...23 La compétence en situations...24 D4.4 : Organiser une veille informationnelle...25 La veille informationnelle...26 L'agrégateur de flux...27 La lettre d'information...28 Le microblogage...29 Le nomadisme...30 La compétence en questions...31 La compétence en situations...32 Les réponses aux questions...33 D4.1 : Rechercher de l information avec une démarche adaptée D4.1 : Rechercher de l information avec une démarche adaptée D4.1 : Rechercher de l information avec une démarche adaptée La recherche d'information La recherche d'information nécessite la mise en place d'une stratégie qui consiste à : cerner le besoin d'information ; formuler le besoin d'information ; repérer les sources pertinentes ; identifier les outils à exploiter en fonction de ces sources ; interroger les outils ; évaluer la qualité des résultats. Exemple : On désire étudier l'évolution des supports de stockage numérique en vue de rédiger un article de vulgarisation de 5 à 10 pages. Pour formuler ce besoin sur un domaine que l'on connaît mal, on commence la recherche par des sources de type lexiques, dictionnaires, encyclopédies : Wikipédia, Encyclopedia Universalis en ligne, FranceTerme (terminologie officielle en France). On utilise les moteurs de recherche dédiés à chacune de ces sources, et on obtient des résultats de bonne qualité (articles de fond, définitions) que l'on filtre selon leur capacité à répondre aux questions posées et à couvrir l'évolution des supports de stockage numérique au fil du temps. Cette première phase permet de cerner ce sujet qu'on connaît mal, en repérant de nouveaux mots-clé (loi de Moore, technique holographique, mémoire flash, etc.) et des aspects de la question à traiter auxquels on n'aurait pas pensé (ordres de grandeur, fonctionnalités, caractéristiques de durée de vie ou de coût, solutions de stockage interne, externe, partagée, distribuée, par un prestataire, etc.). On se tourne alors vers de nouveaux types de sources compte tenu du public visé (vulgarisation) et du domaine (numérique) : les manuels fondamentaux et les ressources pédagogiques (commentçamarche, dépôts de ressources pédagogiques pour le C2i niveau 1). On y trouve des fiches pratiques pédagogiques, des échanges dans des forums, et on mobilise sa capacité à évaluer les résultats trouvés : sont-ils utiles? sont-ils fiables? En rédigeant l'article, on sera certainement amené à prolonger la recherche pour documenter des points précis ; on pourra aussi se tourner vers des sources d'actualités pour donner du relief à l'introduction ou à la conclusion, ou repérer les dernières évolutions des supports de stockage (technique holographique). Le web et les sources d'information Il ne faut pas croire qu'un moteur de recherche généraliste interroge une unique source et donne accès à toutes les informations du web : les sources d'information sont multiples et variées : elles n'ont pas toutes la même valeur ; Pour la requête «compétences numériques», un moteur de recherche sur le web peut retourner côte à côte un article du Monde, une définition de Wikipédia, un billet du blog d'un internaute influent sur ce sujet, un rapport de l'unesco ou une question d'un étudiant dans un forum. certaines informations ne sont pas accessibles par un moteur généraliste : la majeure partie des ressources en ligne font partie du web invisible. En savoir plus... Le «web invisible» ou «web profond» désigne la partie du web que les moteurs de recherche classiques ne peuvent pas indexer. Il recouvre notamment les banques de données et les ressources dont l'accès requiert une authentification. Cerise Conseils aux Étudiants pour une Recherche d'information Spécialisée Efficace (URFIST) D4.1 : Rechercher de l information avec une démarche adaptée Les sources d'information Parmi les sources d'information sur le web, on distingue : les sources d'information traditionnelles (agences de presse, grandes organisations d'intérêt privé ou public, associations d'experts, publications scientifiques, etc.) qui diffusent des informations validées selon un processus reconnu ; L'agence de presse AFP, l'organisation internationale OCDE, la Bibliothèque Nationale de France, les éditeurs de publications scientifiques sont des sources d'information traditionnelles. les sources émergeant de structures collectives plus ou moins formelles, dont les règles de publication et de validation de l'information sont plus ou moins strictes. L'encyclopédie en ligne Wikipédia est une source qui émerge d'une communauté d'auteurs ; la qualité de l'information qu'elle diffuse est liée aux règles et processus d'édition qui lui sont propres. les sources informelles (pages web personnelles, blogs d'internautes, etc.) publiées sans aucun contrôle. Les différents types de source Le blog d'un prix Nobel d'économie relève des sources informelles. Les informations qui y sont publiées peuvent être d'une grande valeur, sans toutefois bénéficier d'une validation par d'autres spécialistes du domaine. Les sources d'information peuvent être généralistes ou spécialisées. On peut les organiser ainsi : manuels fondamentaux (écrits par les auteurs fondateurs d'un domaine) et ressources pédagogiques ; encyclopédies, dictionnaires et lexiques (édités par les éditeurs importants d'un domaine) ; revues scientifiques (souvent éditées par des sociétés savantes, et dont les articles sont validés par des experts) et littérature grise (rapports d'études ou de recherches, actes de congrès, thèses, brevets, etc.) ; vulgarisation scientifique (souvent sous la forme de revues ou d'ouvrages destinés au grand public) ; actualité (presse quotidienne tournée vers le grand public ou un lectorat plus spécialisé selon le cas) ; rapports et bilans (produits par des organisations et institutions reconnues au niveau national ou international) ; sources officielles (produites par les gouvernements ou organismes gouvernementaux) ; banque de données et de statistiques (produites par des groupements de chercheurs ou des organismes officiels) ; blogs et podcasts (édités par des internautes relevant ou non d'institutions bien identifiées). La qualité des sources Lorsqu'on se documente sur un domaine que l'on connaît mal, il faut commencer par repérer les sources pertinentes qui permettront de cerner les concepts et la terminologie associés : dictionnaires, lexiques, encyclopédies, manuels, etc. Pour évaluer la qualité d'une source, on pourra s'intéresser à sa fiabilité (propension à diffuser des informations exactes, liée au processus de validation de l'information) et à son autorité (réputation dont elle jouit dans son domaine auprès des experts). D4.1 : Rechercher de l information avec une démarche adaptée Les catalogues de bibliothèque Les bibliothèques conservent des documents. Pour les répertorier et les localiser, ils sont décrits par leur notice bibliographique. Une notice bibliographique est la description d'un document. Elle est organisée selon des champs : auteur, titre, éditeur, collection, ISBN, année de publication, type de publication, résumé, mots-sujet, etc. Un catalogue de bibliothèque donne accès aux notices bibliographiques des documents qu'elle contient. L'indexation du contenu Il peut arriver que le document lui-même soit accessible sous une forme numérisée à partir du catalogue. Pour permettre une recherche par le sujet, les documents doivent être indexés, c'est-à-dire associés à des mots-clé. Traditionnellement, l'indexation des documents d'une bibliothèque est manuelle et s'appuie sur un thésaurus ; c'est un ensemble de mots-clé ou mots-sujet prédéfinis que le bibliothécaire choisit d'associer au document pour décrire son contenu. Le vocabulaire d'un thésaurus est fermé : tous les mots du dictionnaire ne s'y trouvent pas! Lorsqu'un usager formule une requête avec des mots-clé dans le champ correspondant à l'indexation manuelle du catalogue, il peut ne rien trouver simplement parce qu'il n'a pas utilisé les mots du thésaurus. Les catalogues intègrent désormais une indexation automatique des divers champs des notices, notamment du champ «Titre» et du champ «Résumé». Il est ainsi possible d'entrer une requête composée de mots-clés qui seront cherchés dans tous ces champs à la fois, ce qui lève partiellement la contrainte du vocabulaire fermé du thésaurus, et rapproche cette pratique de celle de l'interrogation des moteurs de recherche. Le thésaurus reste un outil intéressant pour le repérage des termes importants pour une recherche. Le catalogue du SUDOC (Système Universitaire de Documentation) est le catalogue collectif français réalisé par les bibliothèques et centres de documentation de l'enseignement supérieur et de la recherche. En savoir plus... SUDOC catalogue du Système Universitaire de Documentation D4.1 : Rechercher de l information avec une démarche adaptée Les portails documentaires Un portail documentaire de bibliothèque centralise l'accès à un ensemble de services liés à la recherche d'information. On trouve notamment : l'accès au catalogue de cette bibliothèque et d'autres bibliothèques ; la recherche fédérée, qui consiste à interroger simultanément plusieurs outils (catalogues de bibliothèque, sites web, moteurs de recherche, etc.) ; l'accès à des documents en texte intégral ; l'accès à des encyclopédies, des dictionnaires, la presse en ligne, etc. ; des services personnalisés comme l'accès à son dossier de lecteur, à des informations ciblées, à des outils de veille. D4.1 : Rechercher de l information avec une démarche adaptée Les annuaires de recherche Un annuaire de recherche est un outil de recherche qui répertorie des sites web sélectionnés pour leur qualité par des spécialistes du domaine. Les sites sont organisés dans une hiérarchie de catégories. Le processus d'alimentation d'un annuaire reposant sur une sélection humaine, les ressources qu'on y trouve sont théoriquement de bonne qualité. Cependant, elles sont relativement peu nombreuses, et n'intègrent pas toujours les dernières nouveautés apparues sur le web. On distingue : les annuaires généralistes : ils sont difficiles à tenir à jour ; Exemples d'annuaires généralistes mondiaux : Open Directory Project DMOZ (mise à jour par les internautes) ipl2 - information you can trust (sélection du web par des professionnels de l'information) Ces annuaires généralistes sont peu utilisés car peu connus. les annuaires spécialisés : très utilisés, ils font l'objet d'une activité de mise à jour régulière. Exemples d'annuaires spécialisés : Signets de la BNF (sélection des bibliothécaires de la Bibliothèque Nationale de France) Signets de CERIMES (sélection des bibliothèques universitaires) WWW Virtual Library (le premier de l'histoire du web) Infomine (ressources académiques) On peut utiliser un annuaire selon deux modalités : en naviguant de catégorie en catégorie ; en faisant une recherche par mots-clé. L'indexation est limitée aux champs que l'annuaire renseigne pour chaque site web : elle ne s'applique pas au contenu intégral des sites web. D4.1 : Rechercher de l information avec une démarche adaptée Les moteurs de recherche Un moteur de recherche est un outil permettant de retrouver des pages web à partir d'une requête. C'est un logiciel qui réalise les tâches suivantes : moissonnage : les pages du web sont parcourues automatiquement par un robot ; indexation automatique : les pages sont analysées pour en extraire les mots significatifs ; interrogation en fonction d'une requête : les mots clés de la requête sont comparés aux mots extraits par l'indexation et une liste de pages web sélectionnées est affichée par ordre de pertinence. Google, Yahoo Search ou Bing sont des moteurs de recherche généralistes. Il existe des moteurs de recherche spécialisés dans certains types de ressources (images, vidéos, publications académiques, blogs, flux RSS, personnes, etc.) ou dans certains domaines (technologie, musique, mathématiques, santé, chimie, etc.). Les limites du moissonnage Sur certains sites web, on trouve un moteur dédié aux pages du site lui-même. Certaines pages du web ne peuvent pas être moissonnées par les moteurs de recherche : c'est le web invisible ou web profond. Notamment certaines pages ne sont accessibles qu'après authentification ; d'autres sont des pages dynamiques qui sont composées à partir de données stockées dans des bases de données. Les limites de l'indexation automatique Il existe des forums de discussion privés (soumis à authentification) dont les posts ne sont pas répertoriés par le moteur de recherche. Si vous consultez le site web de la SNCF pour faire une réservation en ligne, la page web est dynamique : ses informations changent en fonction du remplissage du train. L'administrateur d'un site web peut interdire aux robots des moteurs d'indexer certaines pages. Certains documents en ligne ne sont pas indexés car le moteur ne sait pas traiter leur format. Les documents au format PDF sont désormais indexés par la plupart des moteurs. Pour indexer les images, les moteurs utilisent les métadonnées associées, le texte entourant l'image ou les tags laissés par les internautes. Les textes très courts ou «mal écrits» (langage SMS) représentent un défi pour l'indexation automatique. Un méta-moteur est un outil permettant de soumettre une même requête à plusieurs moteurs de recherche simultanément. Exemples de méta-moteurs : Dogpile, Yippy D4.1 : Rechercher de l information avec une démarche adaptée Les requêtes Lorsqu'on interroge un catalogue de bibliothèque ou un moteur de recherche, on utilise une requête pour préciser les critères de la recherche. Catalogue de bibliothèque Lorsqu'on fait une recherche dans un catalogue de bibliothèque, la requête exprime des critères qui sont structurés selon les champs des notices bibliographiques. On peut choisir les opérateurs pour combiner ces critères : l'opérateur ET (celui proposé par défaut) rend tous les critères obligatoires ; avec l'opérateur OU il suffit que l'un des critères soit vérifié ; Si on utilise à mauvais escient cet opérateur, cela peut éliminer des réponses pertinentes des résultats : c'est le phénomène de «silence» Si on change un ET en un OU dans une requête, cela augmente le nombre de résultats, au risque de voir apparaître des documents non pertinents : c'est le phénomène de «bruit». l'opérateur SAUF permet de signaler un mot-clé non souhaité. Dans certains cas, on utilise la version anglaise des opérateurs : AND, OR et NOT. Au-delà de ces opérateurs booléens, il existe l'opérateur de troncature * qui permet de ne donner que le début d'un motclé pour inclure virtuellement toutes les terminaisons possibles. Moteur de recherche Le critère certificat* est vérifié si on a certificat, certificats, certification, etc. Les moteurs de recherche tendent à limiter l'effort de formulation de l'usager en décidant automatiquement de la façon de combiner et ajuster les mots-clés saisis. Cependant, il est possible de réaliser une recherche plus fine en utilisant les opérateurs booléens pour combiner les critères. Les moteurs proposent généralement des notations plus légères : le signe + devant un mot-clé signifie qu'il est obligatoire (proche du ET) ; le signe signifie qu'il ne doit pas apparaître (proche du SAUF) ; Au-delà de ces opérateurs booléens, on utilise souvent les guillemets pour rechercher une expression exacte (l'expression entière doit être présente, et sous cette forme exactement). Les moteurs offrent souvent un mode de recherche avancée où on peut préciser par exemple la langue des réponses, les sites auxquels doivent se limiter les réponses, etc. L'ordre des réponses d'un moteur à une requête tient compte de la pertinence thématique, c'est-à-dire de l'importance des mots-clé de la requête dans la page web. Il tient aussi compte de la popularité de la page web, que les moteurs déduisent : de l'abondance et de la qualité des liens qui mènent à la page ; de la tendance des internautes à cliquer sur la page en réponse à la même requête. Certains moteurs sont explicitement collaboratifs : l'ordre des réponses est déterminé par les notes laissées par les internautes et l'indexation peut s'appuyer sur leurs tags. D4.1 : Rechercher de l information avec une démarche adaptée La compétence en questions Q 1 : Que contiennent les catalogues de bibliothèque? 1 - Des adresses de bibliothèques. 2 - Des notices bibliographiques. 3 - Des livres à acheter. 4 - Des articles de journaux. Q 2 : Qui parcourt et indexe les ressources du web dans un moteur de recherche généraliste? 1 - Des internautes. 2 - Des experts. 3 - Des logiciels robots. 4 - Des bibliothécaires. Q 3 : Quelle est la requête la plus précise pour rechercher les ressources contenant l'expression poisson rouge au singulier ou au pluriel? 1 - poisson rouge 2 - poisson OR rouge 3 - poisson rouge OR poissons rouges 4 - poisson* rouge* D4.1 : Rechercher de l information avec une démarche adaptée La compétence en situations Trouver les bonnes sources... Repérez les sources utiles pour élaborer votre projet professionnel. Dressez-en une liste en commentant leur utilité et leur qualité. Comment vole un avion? Dans le catalogue du SUDOC, formulez une requête qui permet de trouver des documents pour préparer un exposé sur les avions. Annuaire ou moteur? Reprenez cette recherche en utilisant d'abord un annuaire de recherche puis un moteur de recherche. Quelle approche a été la plus rapide pour repérer des informations intéressantes? Avez-vous trouvé les mêmes réponses avec l'annuaire et sur la première page de réponses du moteur? D4.2 : Évaluer les résultats d'une recherche D4.2 : Évaluer les résultats d'une recherche D4.2 : Évaluer les résultats d'une recherche Les critères d'évaluation Une ressource est l'entité concrète qui véhicule de l'information. Dans le cadre d'une recherche d'information sur le web, les ressources contribuant à répondre au besoin d'information peuvent prendre des formes diverses : page web, notice bibliographique, document au format PDF, ouvrage, image, etc. Évaluer une ressource consiste à étudier : sa pertinence : l'information qu'elle véhicule correspond-t-elle au besoin d'information? sa qualité : l'information qu'elle contient est-elle fiable et est-elle bien présentée? La pertinence d'une ressource est l'adéquation de son contenu informationnel avec le besoin d'information. Pour cela on peut répondre aux questions sui
Similar documents
View more...
Search Related
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks
SAVE OUR EARTH

We need your sign to support Project to invent "SMART AND CONTROLLABLE REFLECTIVE BALLOONS" to cover the Sun and Save Our Earth.

More details...

Sign Now!

We are very appreciated for your Prompt Action!

x