indexation des documents pdf
Si jusque ici la partie indexable de ces documents se limitait au contenu texte, Google est désormais en mesure d'indexer également le texte des images contenues dans les PDFs, par l'usage de technologies de reconnaissance des caractères (OCR). Cette nouvelle constitue à mon sens une avancée notable pour le chercheur sérieux, puisque l'on trouve fréquemment dans les fichiers PDF de l'information de qualité.
Une citation:
"Dire qu'il y a quelques années à peine, certains webmasters créaient des versions PDF pour protéger leur contenu qui devenait alors difficile à copier/coller."
Maintenant il ne vous reste plus qu'à créer de bons fichiers pdf, non pas à partir de documents 'word' comme certaines, mais de documents bien codés et de ne pas oublier de mettre des 'tags' valables lors de la génération de votre fichier.
Pour ce faire, un article qui commence à dater mais reste toujours valable : aide au référencement des fichiers pdf, repris sur ccm









