Quelles ressources ?
Remarques
préliminaires
Chaque
individu est confronté quotidiennement à un flux
d'informations plus ou moins important.
Si il n'y prend garde, il
risque d'être submergé. Le volume d'informations doit
être régulé afin que l'individu qui le
réceptionne puisse opérer les différentes
opérations qui lui permettront d'en tirer profit.
Le processus d'utilisation d'une information peut être résumé comme suit :
Réception
: cette étape inclut le décryptage et les processus
de compréhension associés,
Intégration
: l'individu établit les rapprochements possibles entre les
informations (connaissances) dont il disposait auparavant et
l'information nouvellement réceptionnée. Il prend
possession de cette information de telle sorte qu'elle ne forme plus
qu'un avec l'existant. Cependant, il garde à l'esprit la
nouveauté introduite et l'enrichissement qui en résulte.
L'information intégrée devient alors une connaissance
utilisable.
On peut noter à ce stade que les rapprochements
établis sont fonctions des connaissances activées au
moment de la réception. Le contexte a donc une importance
certaine lors de la réalisation de cette étape.
Utilisation
: l'individu va pouvoir dorénavant utiliser son nouveau corpus
de connaissances et le confronter à la réalité.
Les ajustements qu'il opérera dans ce cadre lui permettront
d'enrichir son savoir-faire sur la base des connaissances disponibles
et du contexte dans lequel ses dernières seront sollicitées.
Contexte
de rédaction de ce portail
Mes activités (c.f. Mon C.V.) m'amènent à chercher de l'information selon quatre axes principaux :
Psychologie : il s'agit d'améliorer la formulation des conseils et les techniques d'accompagnement que j'applique lorsque j'interviens auprès d'un utilisateur. De ce fait, je suis davantage intéressé par une information secondaire, c'est-à-dire qui a fait l'objet d'une pré-digestion. Mon objectif n'est pas de devenir psychologue mais d'utiliser à bon escient des techniques issues de la recherche en psychologie.
Technologies informatiques : comment faire évoluer les outils informatiques disponibles afin de répondre à la constante évolution des besoins des utilisateurs ? Dans ce cadre, je cible une information brute, cette dernière étant plus facile à « intégrer » dans le contexte où j'évolue quotidiennement.
Données financières : en quels partenaires avoir confiance ? Quelle pérennité ? Quelles perspectives d'évolution ? Il s'agit ici d'obtenir des indicateurs synthétiques fiables (Information secondaire) qui permettent de porter un jugement rapide sur une entreprise.
Gestion de l'information : comment gérer les informations disponibles auprès des utilisateurs du réseau informatique que j'administre ? Comment favoriser la circulation, le partage de l'information ? Comment convertir un sous-ensemble d'information en un savoir-faire accessible au plus grand nombre ?
c.f. : Typologie de l'information
Comme bon nombre d'entre nous, le coût d'acquisition de l'information est un problème. Une pratique quotidienne de recherche m'a permis d'apprendre que ce n'est pas l'accès à l'information qui est cher, mais sa localisation.
En effet, les différents services publics (bibliothèques municipales, universitaires, médiathèques, ...) regorgent de documents qu'il est facile de consulter ou de se procurer (prêt inter). Malheureusement, il est très difficile de se faire une idée des richesses disponibles tant le volume est important et les fichiers d'index peu engageants !
Il devient alors nécessaire de repérer l'information parmi le corpus disponible. Cette démarche est onéreuse en raison des coûts suivants :
Il est rarement possible d'obtenir un conseil téléphonique, la consultation physique s'impose avec ce qu'elle suppose en frais de déplacement, temps passé pour parfois des résultats décevants.
Les banques de données accessibles par les moyens actuels de télécommunication sont presque toujours payantes que ce soit en vertu d'un droit d'accès ou des coûts de communication inhérents à leur consultation.
Rare sont les bases de données qui répertorient les informations dans leur intégralité (texte intégrale). Elles utilisent un vocabulaire spécifique et restreint pour décrire « l'essence » du contenu d'un document. Les résultats d'une recherche sont donc conditionnés par le degré de maîtrise de ce vocabulaire, ce qui nécessite un apprentissage long et coûteux qui est bien souvent spécifique à la base consultée.
La montée en puissance des outils informatiques disponibles a favorisé l'avènement des nouvelles technologies de l'information. L'indexation en texte intégrale se généralise progressivement, d'autant plus que la numérisation des informations permet l'automatisation de leur traitement . De nombreux efforts ont été réalisés pour permettre une interrogation à distance des fichiers d'index existants. Il n'est pratiquement plus nécessaire de se déplacer pour effectuer une recherche. Si la consultation en ligne de l'intégralité d'un document reste marginale par rapport au corpus existant, elle tend à progresser régulièrement.
Internet offre la possibilité à chacun, concepteur et utilisateur d'informations, de manipuler les données existantes à moindre coût dans la mesure où :
L'information est disponible dans son intégralité en ligne,
L'information est répertoriée dans un format standard qui permet une indexation « plein texte » aisée et performante,
Les coûts de communication sont très faibles (Prix d'une communication locale).
Personnellement, si j'utilise régulièrement les services du prêt inter-bibliothèque pour obtenir les ouvrages répertoriés avec l'aide du réseau SIBIL , je préfère consulter les documents disponibles en ligne sur le web.
J'utilise donc de manière assidu trois moteurs de recherche :
Altavista : j'apprécie la précision avec laquelle on peut rédiger une requête complexe, même si l'exhaustivité des réponses laisse à désirer.
AllTheWeb : son interface formalisée n'offre pas la souplesse de celle d'Altavista, en revanche, la pertinence et l'exhaustivité des réponses est remarquable.
Profusion : ce méta-moteur permet une recherche simultanée sur les principaux moteurs existants. La syntaxe de requête est proche de celle d'Altavista ce qui m'évite d'en apprendre une de plus. Par ailleurs, il a le mérite d'éliminer les doublons.
Si Internet et l'ubiquité qu'il offre constitue une ressource importante, les palabres entre deux individus restent un moyen rapide et efficace d'obtenir une information pertinente. C'est pourquoi je recommande vivement de tisser un réseau relationnel local dense.
Quelles
ressources utiliser ?
Il est nécessaire de distinguer deux cas afin de pouvoir répondre et proposer une liste de choix potentiels :
L'utilisateur dispose
d'un minimum de connaissances
et d'un savoir-faire
concernant le domaine dans lequel il effectue sa recherche : sa
connaissance du vocabulaire et du réseau sémantique
exprimant les concepts du domaine devrait lui permettre de réaliser
une consultation fructueuse des répertoires d'indexation
existants quelque soit leur forme.
Ce type d'utilisateurs est
davantage concerné par l'Information
Scientifique et technique primaire.
L'utilisateur est novice
dans le domaine de sa recherche :
Il demande l'assistance
d'un intermédiaire (Humain ou logiciel) pour réaliser
sa recherche afin d'obtenir des réponses pertinences
rapidement.
Il effectue une recherche en « aveugle »qui
lui permettra d'obtenir un corpus de références
documentaires plus ou moins pertinentes. Le vocabulaire acquis lors
de l'exploitation de ces dernières facilitera la
reformulation de la question pour affiner la recherche. Cette
démarche suppose que l'utilisateur ait du temps.
Cette
catégorie d'utilisateurs est davantage concerné par
l'Information
scientifique et technique secondaire.
Il faut garder à l'esprit que l'interrogation d'une source de données, qu'elle soit numérique, bibliographique classique ou humaine, n'est pas seulement une question de vocabulaire et de sémantique. La connaissance des outils utilisés, de leurs fonctionnalités respectives et des procédures d'accès à ces dernières sont des facteurs tout aussi important.
C'est pourquoi, sauf exception, un utilisateur aura intérêt à se cantonner à un petit nombre d'outils dont il possédera parfaitement la maîtrise( c.f. exemple de recherche sur l'isolation thermique d'une chauffe-eau). Le risque de ne pas accéder à une donnée pertinente en raison d'un mauvais choix de la source est largement compensé par la pertinence des informations obtenues par la consultation d'un outil bien compris.
Enfin, il est toujours préférable, en vertu de l'importance du contexte (de rédaction de l'information et/ou de recherche de l'information), de choisir une source qui permette d'appréhender ce dernier. Clairement, les bases de données en « texte intégrale » vont dans ce sens. Il en est de même des sites Internet, qui offre généralement, la possibilité de repositionner dans la globalité du site la page consultée.
La
formulation d'une recherche : l'isolation thermique d'un chauffe-eau
Analyse du sujet
: on peut distinguer deux grands thèmes distincts dans la
formulation primaire du sujet.
Le premier traiterait de l'isolation thermique en générale.
Cette terminologie pouvant être évoquée selon
plusieurs angles, il faut faire appel au contexte de la recherche
pour choisir l'angle le plus pertinent. Le contexte suggère
la volonté d'obtenir des informations visant à
optimiser les performances d'un outil domestique (le chauffe-eau).
Il faudra donc orienter la recherche sur des données
techniques permettant de concevoir une isolation thermique
performante. On peut donc exclure les sources issues du monde de la
recherche fondamentale et privilégier la recherche appliquée
et donc les brevets technologiques existants.
Le second oriente les recherches sur des applications domestiques.
En effet, un chauffe-eau ne fera pas appel aux mêmes
techniques que celles utilisées dans l'industrie pour une
production de masse. Exclure les technologies industrielles peut
paraître une erreur, cependant, l'orientation de recherche
évoquée ci-dessus (les applications technologiques de
la thermo-dynamique) compense cette exclusion.
Formulation de
l'équation de recherche : compte tenu de l'analyse du
sujet que nous venons d'effectuer, il semble logique de mettre
l'accent sur le vocabulaire « isolation thermique ».
Selon les outils disponibles, cette opération est le plus
souvent réalisable par l'utilisation des parenthèses
qui introduisent une priorité dans la mise en oeuvre de la
recherche par l'outil. Cependant, le moteur de recherche de l'INIST
permet d'appliquer une pondération à chacun des termes
de la question, ce qui facilite notre démarche.
Par
ailleurs, il peut être intéressant d'opérer une
factorisation lors de la formulation. En effet, il est possible
d'associer plusieurs termes complémentaires au mot
« isolation » d'où une formulation du
type : isolation ET/PROCHE (thermique OU calorifuger).
Il est
souvent intéressant de raisonner par une approche contraire :
si il n'est pas possible d'obtenir une isolation parfaite, il est
sans doute possible de limiter la déperdition de chaleur.
Cette notion doit alors être introduite dans l'équation
de recherche comme une alternative complémentaire :
(isolation OU déperdition) ET/PROCHE (thermique OU
calorifuger OU chaleur).
Quelles sources
d'informations ? : La conception/fabrication étant
l'objectif de cette recherche, il est préférable
d'orienter la sélection des sources sur :
les
bases de brevets (Elles contiennent les informations relatives
aux concrétisations de la recherche fondamentale)
:
http://ep.espacenet.com
: une base complète avec une interrogation booléenne
limitante.
http://www.inpi.fr/Cibln/pages/cib_rqt_FS.html
: une recherche en langage naturel qui ne débouche pas
nécessairement sur des références pertinentes
mais à le mérite de proposer une classification
précise qui facilite l'acquisition du vocabulaire susceptible
d'affiner la recherche sur un autre site.
les
bases répertoriant les thèses
:
http://wwwlib.umi.com/dxweb/search
: possibilité de recherche très succincte, on indique
simplement les mots pour une recherche en « ET »
dans le titre. 10 réponses avec WATER HEATER qui traitent
essentiellement de la conception de « chauffe-eau »
utilisant les nouvelles sources d'énergie.
http://www.theses.org/
: une grille d'assistance à la formulation de l'équation
de recherche, mais aucune réponse
probante.
http://csidoc.insa-lyon.fr/these/recherche.html
: recherche en « ET » sur une liste de mots.
Quelques références traitant essentiellement des
techniques d'accumulation/récolte de l'énergie
solaire. Une référence intéressante sur la
conservation de chaleur :
http://csidoc.insa-lyon.fr/cgi-bin/bibvisu?NOTICES_W3=5168
.
les
bases bibliographiques
:
http://www.sibil.cnusc.fr:8020/rsf/sff_rsr.htm
: une base conçue par des professionnels pour gérer
leur stock et le partager. Une interrogation performante et
simple.
Les catalogues de librairies sont peu pertinents pour ce
type de recherche. En effet, la recherche s'effectue le plus souvent
sur les mots du titre et non pas sur ceux du sommaire et/ou de
l'index. Une recherche pointue et technique ne peut donc aboutir à
rien dans ces conditions.
Evaluation
de l'efficience des bases de données et autres sites internet
Face à la multitude des sources potentielles d'information, la tentation est grande de tenter de classer ces dernières selon divers critères comme :
La facilité de consultation,
La puissance des outils de recherche/navigation qui leurs sont associés,
La rapidité : affichage des informations, recherche...
Cependant, ainsi que je me suis attaché à le démontrer brièvement ci-dessus, la pertinence à un moment donné, dans un contexte donné d'un outil est une fonction très personnelle de l'utilisateur de cet outil.
De ce point de vue, le seul véritable critère de classement pertinent devrait porter sur une description précise et multiforme du contenu, de la forme et de la disponibilité des ressources proposées. C'est cette orientation qui a toujours prévalue dans l'élaboration des répertoires de ressources (Les index papiers des bibliothèques, les sommaires et les index des ouvrages et des périodiques, les pages jaunes des annuaires...) et c'est encore elle qui est utilisée pour l'élaboration des bases comme celles de Yahoo ou de Nomade .
La facilité de consultation, la puissance des outils de recherche et de navigation seront d'autant plus élevées que le contenu sera richement décris et répertorié.
La montée en charge du langage de description de données XML est révélatrice de l'intérêt porté à ces techniques.
L'utilisateur devrait pouvoir consulter une ressource sans rien connaître du sujet de cette dernière. Cela suppose que le contenu disponible soit à la fois simple et accessible à un néophyte sans pour autant occulter la complexité du sujet susceptible d'apporter un « plus » à l'utilisateur averti.
En bref, une bonne source d'information doit favoriser l'autonomisation de son utilisateur, il faut pour cela qu'elle présente les caractéristiques suivantes :
Instantanéité de l'accès au contenu (Réactivité) : l'utilisateur doit pouvoir réagir en temps réel en fonction de son contexte propre et déterminer si il doit approfondir ou non l'utilisation de la ressource considérée. Le contenu est-il rédiger de manière à permettre à l'utilisateur de se l'approprier facilement : présentation de cas concret, exemple...
Existence d'un descriptif du contenu (Conductibilité au sens physique du terme, exprimant ici la capacité de la ressource à transmettre son contenu) : sommaire et index riches facilitant un accès précis et pertinent à un élément particulier de la ressource.
Richesse de la trame de conception de la ressource (Complexité au sens de l'identité de la partie intégrée dans un tout) : la ressource doit favoriser la mise en oeuvre des mécanismes de traitement de l'information. La navigation dans le réseau sémantique de la ressource doit permettre à l'utilisateur de « fonctionner » par association d'idées. La ressource doit à la fois se suffir à elle-même et faciliter sa propre intégration dans un corpus plus vaste en proposant une ouverture sur ce dernier. C'est par exemple le principe retenu pour le classement des ressources répertoriées par le moteur de recherche Google.
La pondération du descriptif du contenu de la ressource par ces trois facteurs d'appréciation devrait permettre à l'utilisateur de procéder à un choix efficient en fonction de son contexte propre.