Comment réduire la taille d’un document PDF sans logiciel

Si vous utilisez un lecteur PDF gratuit, comme FOXIT, vous avez aux moins la possibilité de lire tous les fichiers PDF qu’on vous envoie. Maintenant pour faire des manipulations sur ces fichiers PDF c’est une autre histoire, il faudra fouiller le net pour trouver des outils gratuits et j’en ai parlé souvent sur ce blogue dans la rubrique PDF . Il y a un outil que j’utilise assez souvent c’est PDFmerge (pour joindre plusieurs fichiers PDF dans le même document PDF) . J’utilise aussi des convertisseurs de fichiers en PDF et bien sûr la sacro-sainte conversion html en PDF de chrome  (best in class). Sachez que j’utilise cette dernière option plusieurs fois par semaine pour mes petites affaires bancaires sur mon compte dropbox (non aucun secret bancaire).

Scanner un document vers le format PDF

Le problème : le poids du document après l’avoir scanné.

Quand vous scanner un document en PDF, le scanneur (qui est encore stupide) ne va pas savoir si c’est une photo ou un texte. Il va interpréter le document comme une photo. Résultat : c’est lourd. Le poids d’un fichier PDF (format A4) en sortie est d’environ 2 à 3 Mega!

La solution : comment alléger le poids du document de sortie

Avant de scanner : ajuster la résolution.

Déjà si vous trifouillez dans les options de votre scanneur (vous pouvez éventuellement choisir la précision de scan: Exemple passer de 200 DPI (PPP pixel par pouce) ça va diminuer le poids par quatre. Vous trouverez cette option dans la rubrique « résolution » de votre scanner ». Notez qu’une résolution à 75 PPP (ou 75 DPI en anglais) et bien suffisante pour un document texte (même scanné au format photo).

Après avoir scanné :

Vous avez scanné le document sans tenir compte de la résolution du scanneur et vous vous retrouvez avec un énorme fichier PDF après avoir scanné le testament de tante Berta. (ou bien vous recevez un énorme fichier pdf).

  • Solution 1 : ce n’est pas grave : aujourd’hui les  capacités de mémoires sont illimitées, pas besoin de faire grand chose. (la polution numérique, tout le monde s’en fout aujourd’hui) .
  • Solution 2 : vous ne savez pas envoyer de gros gros fichiers via votre mail, alors lisez mon dernier article sur le sujet (envoi de gros fichier) . Nostez que chez moi, si je télécharge un fichier de 20 méga ça va me coûter 50 centimes d’euros!!!
  • Solution 3 : réduire la taille du fichier en utilisant les ressources en ligne : tapez « free online pdf size reducer » sur n’importe quel moteur de recherche.
    • Hier, comme j’avais à régler ce problème : j’ai utilisé Smallpdf.com/compress-pdf : 1) faire glisser votre fichier dans la zone prévue à cet effet. (appuuyez sur « choose file » (choisir le fichier dans votre disque dur).

  • Attendre que le fichier soit chargé vers le service en ligne qui va faire la conversion dans la foulée.
  • Appuyez sur « Download file now » : soit sur votre disque dur, soit sur dropbox, soit sur googledrive

Voilà c’est terminé, votre fichier, s’il a été scanner avec une résolution de 200 PPP, va être réduit en taille considérablement (diminution du poid par 8 ). Bien sûr, ça marche d’autant mieux que le document que vous avez scanné est un document texte).

Notez que si vous voulez encore plus réduire la taille de vos fichier texte, il faudra passer par un outil OCR (reconnaissance optique de caractère  : heureusement il y a aussi un grand nombre d’outil OCR en ligne gratuits  qui marche très très bien. Sachez que si vous faites une conversion en OCR, le fichier résultant ne sera peut-être au même format que votre fichier papier original.

Précautions d’usage (comme d’hab).

Si le document que vous compressez en ligne est un document « sensible » préférez les solutions offline (hors ligne) ou version logiciel payant où la conversion se fait en local. Si c’est le testament de tante Berta qui vous lègue son chat : allez y franchement : vous pouvez utililiser les services en ligne. Enfin, si vous êtes dans un cyber café, le mieux c’est d’utiliser également les services en ligne, car dans un cyber café rien n’est privé (même si on vous dit le contraire, partez du principe que vous êtes en permanence espionné) .

Googledoc, propose l’OCR (reconnaissance optique de caractère) en 200 langues

Il m’arrive souvent de scanner un document texte que je veux ensuite corriger ou recopier. Je souhaite aussi pouvoir le retrouver dans mes archives. Il existe plusieurs services en ligne qui propose l’OCR (reconnaissance optique des caractèrs) et j’ai dressé une  liste des quelques services ocr gratuits en ligne.  L’OCR c’est très pratique, et Googledoc propose maintenant le service OCR avec la reconnaissance en  200 langues. Oui, c’est déjà disponible depuis longtemps, et aussi  sur  Skydrive (onedrive), mais je viens juste de tester, l’outil chez google drive.

Le service OCR de google drive permet donc : 

  • La reconnaissance optique des documents texte (dactylographiés) sous format photo (jpg) ou sous format PDF) et ce en 200 langues.
  • L’importation du fichier dans google drive et la conversion en fichier texte en dessous du fichier image.  Notez que si vous scannez un texte et que vous choisissez le format PDF, ça fonctionne de la même façon.
  • Une fois que la reconnaissance de caractère est faite, il est possible de faire une recherche dans les documents scannés, ce qui va faciliter grandement la recherche du document. **** (fonctionnalité déjà existante, mais si on ne fait pas la conversion OCR

Pour transformer un fichier scanné en texte sur google doc. 

  • Avoir un compte gmail ou google, c’est la condition, mais j’imagine que tout le monde a un compte google aujourd’hui.
  • Importez le fichier scanné en question via https://drive.google.com/drive  (« Nouveau », « importer un fichier »)

  • Une fois que le fichier est importé, faire un clic droit sur le fichier et demander lui de l’ouvrir avec Google Docs.

  • Le truc va mouliner quelques secondes et  hop miracle le texte de l’image est joint en bas du fichier photo ou PDF.

L’avantage d’une telle fonctionnalité disponible dans  googledrive, c’est que vous avez tout en un. Sachez tout de même que  depuis longtemps tous les documents images que vous importez avec google drive sont de toute façon analysés par google et si google trouve un texte dans une photo ou dans un document pdf, ce texte sera automatiquement référencé pour faciliter votre recherche de document.  Pour Google, c’est très important, car ça lui permet de vous connaître un peu plus pour vous balancer les pubs qui vont bien. Evidemment, les services secrets aussi peuvent accéder à vos archives, il faudra donc éviter de mettre des documents pas trop confidentiels.

Nota : ce service ne marche pas avec des lettres manuscrites, c’est dommage, mais un jour je pense que ça sera possible.

 

 

Convertii un convetisseur d’image ou PDF en fichier word via OCR en ligne

Si vous avez un document à numériser, il faut passer par un logiciel OCR (reconnaissance optique de caractères). Cette manipulation est devenue relativement aisée et peu chère (gratuite) depuis déjà quelques années.  il existe plusieurs applications en ligne et gratuite dont une bonne liste existe sur roget.biz (OCR gratuits, en ligne et sans logiciel).   Autrefois, l’OCR n’était accessible que par logiciel et ce n’était pas donné, maintenant c’est gratuit surtout si on en fait un usage sporadique (une dizaine de fois par an). Dans ce cas, vous pouvez justement tester l’application en ligne convertii.com qui offre 5 conversions par mois, avec des fichiers inférieurs à 2 Mo, ce qui sera suffisant dans la plupart des cas.

L’outil en ligne convertit des fichiers images ou des fichier pdf.  On sait très bien, que certains fichiers pdf, sont souvent des scans de document et sont donc des fichiers pdf d’image qui sont non copiable, dans ce cas, iil faudra passer obligatoirement par un OCR.

Pour utiliser l’outil convertii.com , il suffit de sélectionner un fichier et d’attendre le résultat de conversion par email. (c’est un processus classique qu’on retrouve sur la plupart des convertisseurs. Le mail arrive assez rapidement (quelques minutes).

Côté résultat, il faut déjà bien comprendre que plus le document d’origine est de qualité, plus la transcripton OCR vers word sera de qualité. Dans mon premier essai, le fichier converti n’a pas été totalement convertit en texte, mais en une série d’images que j’ai pu déplacer dans le fichier word.  Lors du deuxième essai, j’ai eu plus de chance du fait que le fichier source était d’excellente qualité.

Notez également que vous pouvez utiliser votre compte dropbox pour faire la conversion.

 convertii.com (ne pas oublier que ça existe!).

Précaution d’usage pour utiliser un tel outil :

  • Ne convertissez pas des dossier ultra confidentiels via ce type de service. En effet, on ne sait pas du tout qui est derrière cet outil et il peut s’agir d’un site d’espionnage de fichier.
  • N’essayez pas de convertir de texte manuscrit, ça ne marchera pas.
  • Ne soyez pas pressé, car si le service devient populaire, il se peut que votre email ne notification arrive après plusieurs dizaine de minutes, voire quelques heures.
  • Testez d’autre solution sur la liste :  OCR gratuits, en ligne et sans logiciel)

Pin It on Pinterest