Publié le 31 août 2010

Les moteurs de recherche indexent les documents PDF et les proposent dans les résultats de recherche. Certains se retrouvent même sur la première page. Par exemple, pour la recherche « seo guide », le deuxième résultat est un document PDF, soit le Search Engine Optimization Starter Guide de Google.

résultats recherche seo guide

Présenter son PDF de manière efficace !

Il m’arrive fréquemment de vérifier quelles pages d’un site se retrouvent dans l’index pour me rendre compte que l’entreprise a produit des documents PDF de bonne qualité, mais qui perdent de leur attrait lorsqu’ils apparaissent dans les résultats de recherche.

Un mauvais exemple
J’ai cherché des documents PDF concernant l’horaire des jours fériés sur le site du Réseau de Transport de Longueuil.

Note : J’ai utilisé le mot « site: » pour chercher sur ce site en particulier et aussi le raccourci « filetype:pdf » pour chercher uniquement dans les fichiers en format PDF.)

Quatre résultats me sont apparus avec le titre Layout 1.  Pas facile de deviner rapidement de quoi parle le document en se fiant simplement au titre… Si un des résultats portait un titre comme : Horaire des jours fériés 2010, le choix serait plus évident. Heureusement, Google fait un bon travail pour trouver un extrait pertinent dans le texte, alors on peut quand même avoir une idée de celui qui est pertinent, mais on doit lire plus longtemps.

resultat recherche rtl longueuil

Comment optimiser ses documents PDF pour les moteurs de recherche

L’optimisation se fait de la même façon que pour une page web régulière. Il s’agit de donner des indices aux moteurs de recherche du sujet de notre document.

La plupart des éditeurs de textes comme Word (de Microsoft), Pages (de Apple) et Open Office Writer (de Sun) permettent de modifier les propriétés du document pour y inclure un titre, un sujet (description) et des mots-clés, ainsi que d’autres informations pertinentes à votre document. Ces informations suivront lorsque vous convertirez le document en PDF.

Google Docs ne permet toutefois pas de modifier ces propriétés. Par contre, si vous posséder un éditeur de PDF comme Adobe Acrobat (pas le lecteur, mais bien l’éditeur) ou un des ses équivalents « Open Source », il vous sera possible de modifier les propriétés du document.

Pour changer les propriétés du document, il faut cliquer sur File > Properties :

modifier-propriete-document-pdf


Voici donc les points auxquels vous devrez porter une attention particulière :

1. Le titre

Si vous ne pouviez qu’optimiser une seule chose sur votre document, le titre de celui-ci serait la première chose à changer. Pourquoi ? Parce que le titre apparaîtra dans les résultats de recherche et Google lui donne beaucoup d’importance. Si les mots-clés recherchés apparaissent dans le titre de votre document PDF, il a plus de chance d’être trouvé.

Si vous n’ajoutez pas de titre dans les propriétés du document, c’est généralement le premier texte disponible sur votre document ou le nom de fichier temporaire qui a été utilisé pour la création du texte qui servira de titre, donc les résultats peuvent être assez catastrophiques (comme dans le cas du « Layout 1″ présenté précédemment).

2. Le nom du fichier

Votre nom de fichier apparaîtra dans l’adresse URL et sera considéré par le moteur comme un indice que le document est pertinent pour les mots-clés recherchés. Si vous l’appelez « doc-version1-2010.pdf », il aura moins de chance de sortir pour les mots-clés « optimisation seo pour pdf » que s’il s’appelle « optimisation-seo-pdf.pdf ». Pour une question de lisibilité, je vous suggère de séparer vos mots-clés par des traits d’union.

3. Les mots-clés dans le texte

L’optimisation de votre texte dans un document PDF doit suivre la même logique que celui sur votre site web. Les mots-clés que vous ciblez doivent se retrouver dans votre texte, préférablement au début du texte et doivent être utilisés à quelques reprises.

4. Les en-têtes H1, H2, H3…

Votre éditeur de texte vous permet de catégoriser vos titres et sous-titres de paragraphes selon le format « Heading 1, 2, 3… ». Ces formats d’en-têtes correspondent aux en-têtes H1, H2, H3 qu’on retrouve sur une page HTML. Vos mots-clés les plus importants devraient être présents dans ces en-têtes.

modifier-entetes-headings


5. Un lien vers le PDF à partir des pages déjà indexées

Il faut faire un lien vers le document PDF à partir d’une page déjà indexée pour  s’assurer que les moteurs de recherche le trouvent. Si vous voulez positionner votre PDF pour certains mots-clés, pensez à faire le lien sur ces mots-clés dans le texte en utilisant un texte d’ancrage pertinent. Par exemple,en placement le lien sur « optimiser ses PDF pour le référencement », Google donnera de l’importance à notre document pour cette phrase clé.  Si d’autres sites font des liens vers votre document en utilisant les mêmes mots-clés, votre document gagnera encore de l’importance lorsqu’un internaute cherchera pour ce groupe de mots.

6. La description

La description qui accompagnera votre document PDF sur Google ne sera pas nécessairement celle qui se trouve dans la section « sujet » des propriétés du document. Google prendra une phrase qu’il trouve pertinente dans le document en fonction des mots-clés cherchés, comme il le fait pour votre tous les sites web.

Aussi, j’ai remarqué que Google utilisera souvent les informations du pied de page du document ainsi que des dates qu’il trouvera dans le texte pour créer la description associée à votre résultat de recherche. Par exemple, la description de ce bulletin en format PDF du site de l’Assemblée Nationale du Québec commence par « 2″, qui est le numéro de la première page paginée et « BULLETIN DE L’AAPQ-PRINTEMPS 2006″ qui est l’information de pied de page. Ensuite, le texte qui est écrit est pris du corps de texte de la page 2. (Le titre est sûrement le titre de travail qu’avait choisi le créateur du bulletin)

resultat-recherche-assemblée-nationale


Écrire une bonne description ne nuira sûrement pas et elle pourrait être utilisée comme extrait du document dans les moteurs des recherches, mais ce n’est pas garanti.

7. Les mots-clés (keywords) dans les propriétés du document

Il est possible d’ajouter des mots-clés à votre document dans la section « keywords » des propriétés du document. Comme pour les mots-clés inscrits dans la méta-étiquette « keyword » d’une page web, Google et Bing ne tiennent pas compte des mots-clés que vous entrez à cet endroit, car il y avait trop d’abus de la part des propriétaires de sites qui souhaitaient se classer pour tous les mots-clés possibles. Yahoo! y accordait une certaine importance, mais cela a changé puisqu’ils utilisent maintenant Bing comme moteur de recherche. Par contre, il n’est peut-être pas inutile d’y écrire quelques mots puisque d’autres types de moteurs de recherche peuvent voir le jour et donner de la valeur aux mots-clés inscrits à cet endroit. Ma recommandation serait d’y inscrire les 5 à  8 mots les plus pertinents. Si vous manquez de temps, il ne sera pas catastrophique de ne rien écrire à cet endroit.

8. PDF en texte et non en image

Assurez-vous que votre document PDF a été généré en texte en non en image. Vous pourrez le confirmer en sélectionnant du texte directement dans le PDF. Si c’est une image, il vous sera impossible de sélectionner du texte.

texte-selection-document-pdf


Application à d’autres types de documents

Les conseils mentionnés ici s’appliquent aussi aux autres types de documents (Word, Excel, PowerPoint…) que vous souhaiteriez rendre disponibles sur votre site internet.

Prenez donc le temps de les optimiser!

Produire un document de qualité nécessite beaucoup d’investissement en temps et en ressources, toutefois, l’optimiser pour les moteurs de recherche se fait très rapidement. Il faut simplement se donner la peine de le faire. Il ne faut pas oublier que ce n’est pas pour vous que vous créez ces documents, c’est pour eux! Prenez donc le temps!

En espérant trouver vos documents PDF dans mes prochaines recherches Google !


Références :

SEO for PDF Documents (Bruce Clay, 18 septembre 2009) : http://www.bruceclay.com.au/blog/archives/2009/09/seo-for-pdf-documents.html

SEO for PDFs – Optimizing PDF for Search (Seo Consultants, 23 mars 2010) :  http://www.seoconsultants.com/pdf/seo

Optimizing PDFs for SEO  (Small Business Search Marketing, 31 octobre 2006) :http://www.smallbusinesssem.com/optimizing-pdfs-for-seo/288/

Optimize PDF’s for SEO (Website Magazine, 20 février 2008) : http://www.websitemagazine.com/content/blogs/posts/archive/2008/02/20/Optimize-PDF-for-SEO.aspx

Eleven Tips for Optimizing PDFs for Search Engines (Search Engine Land, 12 septembre 2007) :  (http://searchengineland.com/eleven-tips-for-optimizing-pdfs-for-search-engines-12156