Le Web profond…refait surface avec les commandes avancées Google! Reviewed by Christian Bolduc on . Le Web invisible – ou profond – est le contenu documentaire enfoui dans les abysses d’Internet. Représentant plus de 90% de toutes les informations disponibles, Le Web invisible – ou profond – est le contenu documentaire enfoui dans les abysses d’Internet. Représentant plus de 90% de toutes les informations disponibles, Rating: 0

Le Web profond…refait surface avec les commandes avancées Google!

Par

icebergLe Web invisible – ou profond – est le contenu documentaire enfoui dans les abysses d’Internet. Représentant plus de 90% de toutes les informations disponibles, ce contenu caché et/ou inaccessible recèle des données qui peuvent pourtant être d’une grande utilité pour quiconque veut ou doit faire des recherches sérieuses sur un sujet particulier et moins « sexy ».

Mais sachant que seulement 4% à 15% des contenus sont effectivement indexés par les moteurs de recherche classiques – certaines études réduisent même ce pourcentage à 0,03% – un travail de recherche doit impérativement se faire avec l’aide de commandes précises et efficaces, bien entendu.

Voici donc quelques clés capables de faire remonter le contenu pertinent à la surface du Web.

Les moteurs de recherche

Alors que Google et Bing sont, avec respectivement 68% et 17% du trafic généré*, les moteurs de recherche généraux les plus visités, il existe une pléthore de moteurs de recherche spécialisés que les gens ne connaissent généralement pas et qui peuvent, rapidement, permettre à l’usager de trouver des documents d’une pertinence insoupçonnée.

Les opérateurs booléens

Pour accéder à ces contenus enfouis ainsi qu’aux bases de données spécialisées, il existe différentes clés que les spécialistes en documentation nomment les opérateurs booléens.

Au nombre de trois, ces opérateurs sont des mots qu’on utilise pour élargir, resserrer ou exclure des thèmes exploités dans la recherche: AND, OR, – (à ne pas utiliser les équivalents français et, ou, sauf car ils ne fonctionnent pas).

partie-5-1

  • Le AND (et) fait l’intersection entre deux mots (ou plus) contenus dans la recherche, c’est-à-dire qu’il ajoute seulement le contenu compris à la fois dans le mot A et le mot B.

Un exemple. Lorsqu’une commande est placée au restaurant: « je veux un café ET un thé ». Vous allez alors recevoir deux items, un café et un thé. Dans la logique mathématique booléenne, ça ne fonctionnera pas de cette façon. Seuls les éléments qui sont également compris dans le café et dans le thé seront sélectionnés.

  • Le OR (ou), a contrario, sélectionne TOUT ce qui est compris dans les mots A et B. C’est l’union entre les deux mots.

Voici, à titre d’exemple, comment on peut trouver une base de données thématiques de cette façon:

  • Taper base de données OR bases de données en y rattachant un mot clé pertinent: marketing, éducation, communication, Web, politique, agriculture, etc.

Le A – le B (ou vice versa) permet de trouver tout ce qui est dans A, – ce qui est dans B et ce qui est dans A et dans B. Voici un exemple pour trouver des informations sur le Marathon de Boston, mais en retranchant les mots associés à l’attentat d’avril 2013:

  • Marathon de Boston -Attentats -Bombe – Bombing -Bombs -explosion -explosions

Mais attention! la logique de ces opérateurs est radicalement différente de celle généralement admise en société:

Les opérateurs booléens sont très peu et incorrectement utilisés parce que la logique impliquée par ces opérateurs ne correspond pas à la logique utilisée habituellement par un individu. En effet, le raisonnement induit par les connecteurs logiques est différent selon que ces connecteurs logiques sont utilisés en tant qu’opérateurs booléens ou en tant qu’opérateurs dans le langage quotidien : en d’autres termes, tout dépend du contexte dans lequel sont utilisés ces connecteurs.

Jérôme Dinet

Les incontournables parenthèses 

Le guillemet (en anglais) permet d’extraire facilement une citation précise, isoler une expression ou des mots d’un texte quelconque.

Dans certains contextes, le guillemet impose également à Google la forme exacte d’un mot ou d’une phrase en rejetant celle qui a été modifiée – ou améliorée – par l’ajout et synonymes ou de mots/phrases de la même famille.

Quelques commandes avancées Google

Un autre redoutable moyen d’accéder à des contenus enfouis dans les sites Web gouvernementaux, corporatifs ou autres passe par la maitrise de ces quelques commandes avancées Google:

  • intext: cette commande permet de trouver le mot – ou expression – qui se trouve dans un texte, peut importe le format: PDF, Word, Excel, etc.;
  • allintext: commande qui va extraire des textes tous les mots – ou expressions – identifiés;
  • inurl: même commande que le intext, mais appliquée à l’adresse url;
  • allurl: même commande que le allintext, mais appliquée à l’adresse url;
  • intitle: même commande que le intext, mais appliquée au titre d’un texte;
  • allintitle: même commande que le allintext, mais appliquée au titre d’un texte.

On peut également ajouter, à ces commandes avancées, le filetype, c’est-à-dire le type de format du ou des documents recherchés. Bien que le PDF soit le format officiel auprès des autorités universitaires, gouvernementales, éditiques, etc, il ne faut pas oublier les logiciels libres (extensions de fichiers de plus en plus utilisées), fichiers Excel et autres qui sont également utilisés. On n’a qu’à choisir, enfin, l’extension privilégiée et l’ajouter à la fin de la requête: filetype:pdf

La commande site, finalement, permet de trouver de l’information dans un site en particulier. Particulièrement efficace pour avoir accès à du contenu en provenance de sites gouvernementaux dont la réputation est généralement mauvaise, cette commande permet d’en contourner les barrières. Ici, le site de la Nasa: site:nasa.gov »gemini8″.

Cette commande site est également la seule à pouvoir ajouter le – lors de la recherche. Il est alors possible de soustraire des sites précis ou thématiques, notamment Wikipedia: -site:wikipedia.org

Avec toutes ces commandes, il sera maintenant possible d’amalgamer, au besoin, les différentes fonctions afin d’optimiser la réussite des recherches faites sur le Web… en éliminant toutes les données encombrantes!

* Chiffres de décembre 2013

Sources:

 

Retour en haut de la page