|
RECHERCHER DES TITRESPar Julian Sher Lorsque vous entrez une requête dans Google ou dans un autre outil de recherche, l'ordinateur recherche les mots que vous avez rentrés DANS LA TOTALITE DE LA PAGE. Google est suffisamment intelligent pour présenter d'abord les pages web dans lesquelles le mot recherché occupe une place importante, notamment dans le titre ou dans les premières lignes, Mais ce n'est pas garanti : votre mot peut se trouver tout en bas de la page web. Cela signifie qu'un grand nombre des résultats ne sont pas pertinents : il peut y être question d'un tout autre sujet, et il peut n'y avoir qu'une seule occurrence de votre mot clé à la fin d'une très longue page web. Faites l'expérience : dans Google, saisissez une recherche simple sur le SIDA en Afrique. En entrant AIDS et Africa, vous obtiendrez plus de 750 000 pages (80 000 si vous entrez les mots dans l'interface française). pages. Dans certaines d'entre elles, les mots AIDS et Africa figurent en bonne place, mais beaucoup d'autres pages traitent d'autres maladies comme la malaria et déplorent que le sida monopolise l'attention de l'opinion ; d'autres pages portent sur le SIDA en Asie et ne mentionnent l'Afrique qu'à titre de comparaison. Ces pages apparaissent dans les réponses Google dès lors que les mots AIDS et Africa y figurent, même si le sujet principal de ces pages n'a rien à voir avec votre sujet. LA SOLUTION Une solution existe dans la page Recherche avancée de Google (http://www.google.com/advanced_search?hl=fr) Le menu OCCURENCES (Emplacement) vous permet de choisir dans un menu déroulant à quel emplacement vous voulez que votre mot clé se trouve dans la page. Pour faire apparaître ce menu, cliquer sur la flèche située à droite. La valeur par défaut est ANYWHERE ON THE PAGE (n'importe où dans la page), vous pouvez la modifier et choisir IN THE TITLE (dans le titre de la page) ou IN THE URL (dans l'adresse de la page) ou d'autres options en cliquant sur la petite flèche. L'emplacement le plus intéressant est le TITRE. Il permet de rechercher n'importe quel mot ou expression qui se trouvent dans le titre de la page.
Une chose est sûre : si les mots que vous cherchez apparaissent dans le titre d'une page web, la totalité de cette page est consacrée à votre sujet. Par exemple, dans la page de recherche avancée de Google, entrez les mots AIDS et Africa en précisant que ces mots devront se trouver dans le titre de la page web. De 750 000 pages, on passe à moins de 6000.
Le gros avantage est que vous êtes certain que toutes les pages de la liste de résultats porteront sur le concept du SIDA en Afrique, au lieu d'en avoir certains qui contiennent simplement les deux mots clé. LES LIMITES D'UNE RECHERCHE SUR LE TITRE Il faut savoir toute fois qu'il y a deux inconvénients à utiliser la recherche sur le titre. D'abord, dans certaines pages, les mots n'apparaissent pas dans le titre apparent de la page ; à l'inverse, Google peut passer à côté de certaines pages qui contiennent pourtant les mots recherchés dans leur titre. Comment est-ce possible ? Dans la recherche par titre, Google recherche dans les titres que les webmasters ont affectés à leurs pages. Ces titres sont écrits en code html caché, c'est à dire que l'ordinateur les lit mais qu'elles sont invisibles pour l'internaute. D'ordinaire, le titre affecté par le webmaster correspond au titre ou à l'intitulé que l'on voit dans la page web, mais ce n'est pas toujours le cas. Autrement dit, il se peut que vos résultats contiennent des pages dont le titre apparent ne contient pas les mots clés de votre requête. Par exemple, il existe sur le site des Nations Unies, à l'adresse www.un.org/peace/kosovo/pages/kosovo1.shtml, une page intéressante sur le Kosovo. En affichant le code source caché on voit que le webmaster a omis d'inscrire un titre, et pour Google la page a pour titre UNTITLED. Google ne retrouvera pas cette page si vous avez entré les mots UN Kosovo et précisé "dans le titre de la page". (Certains d'entre vous pousseront la curiosité jusqu'à afficher le code source en sélectionnant View/Source sur la barre d'outil d'Internet Explorer ou View/Page Source si vous travaillez avec Netscape.) Le deuxième inconvénient est que vous risquez de manquer des pages qui sont entièrement consacrées au sujet qui vous intéresse parce que leur titre ne contient pas les mots clés que vous avez choisis. Par exemple, il existe un excellente page sur les femmes, la pauvreté et le SIDA, dont le titre est "Threat More Devastating than Disease." Cette page ne ressortira pas si vous faites une recherche sur le titre avec les mots women, poverty et AIDS parce que ces mots ne figurent pas dans le titre. Tout cela signifie que la recherche sur le titre est une bonne stratégie pour commencer mais qu'il ne faut en aucun cas s'en contenter. Il faut toujours rechercher vos mots clés "N'importe où dans la page" pour être certain de voir toutes les pages pertinentes et de faire le tour de la question. RECHERCHE PAR ADRESSE
Pour pallier aux insuffisances de la recherche par titre, on peut changer l'option OCCURENCES (Emplacement) dans la page de Recherche avancée et demander "dans l'adresse de la page". C'est le webmaster du site qui décide quelle sera l'adresse web des pages du site. Généralement, pour plus de commodité, il leur affecte des mots clés simples qui lui permettent d'identifier facilement le sujet de la page. C'est ce que vous faites lorsque vous sauvegardez un document sur votre ordinateur : si vous écrivez le premier jet d'un article sur la sûreté nucléaire, vous l'appellerez nucleaire.doc pour le retrouver facilement quand vous en aurez besoin.
Par exemple, le Washington Post comprend des sous-sections qui portent les noms de fichiers suivants: www.washingtonpost.com En faisant une recherche "dans l'adresse", vous pourrez rapidement récupérer des sections entières d'un site web qui concernent votre sujet. Si vous voulez savoir ce que le Guardian contient sur le Kosovo, utilisez la page de Recherche avancée Google et entrez la requête suivante : guardian kosovo en précisant "dans l'adresse". De même, si vous voulez trouver des nouvelles sur le SIDA en Chine chez CNN, vous pouvez faire une recherche "dans l'adresse" depuis la page Recherche avancée Google en entrant la requête suivante : cnn aids china Si vous voulez savoir ce que le groupe Human Rights Watch (www.hrw.org) écrit sur le Mexique, essayez une recherche "dans l'adresse" dans Google Recherche avancée avec la requête suivante: hrw Mexico Les recherches limitées à l'adresse ou au titre ne sont
pas parfaites, mais ont l'avantage d'écarter les résultats
non pertinents qui ressortent dans une recherche générale
"n'importe où dans la page".
Julian
Sher, créateur et webmaster du site Journalism Net (www.journalismnet.com),
donne des cours de formation à l’Internet dans les salles de rédaction
du monde entier. Il peut être joint par email à jsher@journalismnet.com.
Cet article, ainsi que de nombreux autres contributions au magazine
"Media" avec des liens constamment actualisés, sont disponibles
sur le web depuis la page « astuces » de JournalismNet à l’adresse
www.journalismnet.com/tips/francais.htm.
©2002
Julian Sher. Tous
droits réservés. |
|
| JNet Anglais | AngleTerre | Europe | Etats-Unis | Canada | Francais | Trouver les personnes | Nouvelles | La Formation |