Littérature à emporter

Home / Accueil

Ebooks / Elivres


Tools / Outils


Problems / Problèmes


RTF2PML

aide à la création de fichiers PDB pour eReader
à partir de fichiers RTF de Ms-Word.

Mis à jour le 25 juillet 2009


Description rapide

Connaissances de base

Les programmes utilisés

Préparation de votre fichier RTF

Installation et aperçu du programme

La conversion d´un fichier

La page d´informations d´eReader pour Windows

Les erreurs de conversion

Autres problèmes avec les images…

Les images au format EMF…

Création de dictionnaires

eReader et les tableaux…

Caractères non autorisés dans les noms de fichier(s)…

Remerciements

Contact

Description rapide du programme

Le programme RTF2PML sert à convertir vos textes au format RTF (produits par MS-Word uniquement) en un fichier texte d´extension .txt dont le contenu sera balisé au format PML (Palm Markup Language), dans le but de créer un fichier d´extension .pdb pour le lecteur d´ebooks eReader (le format PML est une sorte de langage HTML simplifié).

C´est en faisant glisser l´icône du fichier .txt sur celle du programme dropbook.exe que le fichier .pdb est créé. Il ne reste plus qu´à transférer ce fichier .pdb sur votre Palm pour le lire avec eReader.

L´utilisation de RTF2PML vous libère du souci de connaître sur le bout des doigts le langage PML. Ceci est particulièrement vrai pour les accents et autres caractères spéciaux, de même pour tout ce qui concerne la mise en page du texte que vous ferez avec le traitement de textes MS-Word.

Les tableaux ne sont pas correctement gérés par le programme. Vous aurez à les retravailler manuellement (voir plus bas sur cette page).


Connaissances de base

Pour créer un ebook avec RTF2PML, il n´est pas strictement obligatoire de connaître le langage PML (Palm Markup Language), mais ceci est fortement recommandé. Pour vous rafraîchir la mémoire, voyez la page de Mastik (en Français) et celle-ci ereader.com (en Anglais).

Prenez le temps de visiter ces sites si vous ne connaissez pas le langage PML. Vous y apprendrez comment faire des ebooks par vous même, et cela vous aidera à résoudre les problèmes que vous rencontrerez.

Les seuls fichiers RTF que ce programme peut convertir convenablement sont ceux enregistrés avec MS-Word ! La conversion correcte de fichiers produits par OpenOfficeWriter, Wordpad ou tout autre éditeur de texte n´est absolument pas garantie.

   Les utilisateurs d´OpenOfficeWriter ont maintenant la possibilité de convertir leurs fichiers .odt depuis OOWriter grâce à la macro odt2pml réalisée par Peter. Cette macro est très rapide et peut lancer « dropbook.exe ». De plus, elle est fournie avec d´autres macros qui vous aideront à mettre en forme votre texte. N´hésitez pas à contacter Peter pour lui suggérer des améliorations ou tout simplement pour le remercier d´avoir fait du bon travail.

Seule l´utilisation du programme RTF2PML et de Dropbook.exe seront décrites dans ce fichier, pour les autres, voyez les sites concernés.


Les programmes utilisés

Vous pouvez télécharger les différentes versions du programme et les faire cohabiter dans le même répertoire sans problème. Pour ma part, je n´utilise la version 1.5.2 que pour créer des dictionnaires car ce programme a quelques bogues.

DropBook 1.6 doit d´abord être installé, copiez ensuite le fichier dropbookpro.exe (que vous trouverez dans l´un des sous-répertoires de c:\Program Files\ dont le nom a un rapport avec Palm) avec les deux autres versions, finalement vous pouvez dé-installer la version 1.6

Pour configurer Dropbook 1.6, double-cliquez sur son icône puis cochez la case nommée Build unencrypted book.

Si votre fichier RTF contient des images, il vous faudra un convertisseur de format tel que XnView qui est gratuit (et qui a ma préférence). Bien entendu vous êtes libre d´utiliser le programme de votre choix, mais celui-ci doit être capable d´enregistrer les images au format PNG en 256 couleurs, ceci exclu donc d´emblée Paint fourni avec Windows car il ne sait pas le faire.


Préparation de votre fichier RTF

Il est possible, mais pas obligatoire, de remplir certains des champs des propriétés du fichier RTF (dans Word). Le programme RTF2PML peut utiliser 5 de ces 9 champs, qui contiendront :

Exemple : votre fichier RTF contient « Pêcheurs d´Islande » de Pierre Loti et que votre société (ou votre site) se nomme « Ma société » à l´adresse suivante : http://monsiteamoi.com sur lequel vous souhaitez diffuser le fichier loti_pecheurs_d_islande.pdb alors vous remplirez ces quatre champs comme ceci :

Ces informations seront recopiées dans les champs correspondants de l´entête du fichier PML produit par RTF2PML. Si vous laissez ces champs vides, les champs de l´entête seront vides également, et dans ce cas dropbook vous demandera ces informations lors de la conversion finale.

Le champ « Sujet » ne doit pas contenir l´extension « .pdb », le programme l´ajoutera automatiquement dans le champ correspondant du fichier TXT.

Le champ « Société » est utilisé pour remplir deux champs de l´entête PML, la première partie doit contenir le nom du site, la seconde l´adresse. Ces deux parties doivent être séparée par le caractère | que vous trouverez sur la touche 6 du clavier Français (celle du haut, pas celle du clavier numérique).


Installation et aperçu du programme

Ce programme peut être installé dans le répertoire de votre choix, dans lequel vous copierez également le programme dropbook.

ATTENTION : le programme RTF2PML va chercher les fichiers RTF dans tous les sous-répertoires de celui que vous choisirez avant de lancer la conversion.

   Bien que le programme puisse convertir de nombreux fichiers les uns après les autres, il n´est pas capable de déterminer ceux qu´il faut effectivement convertir et encore moins ignorer ceux qui ont déjà été convertis. Ne le placez donc pas au cœur même de votre bibliothèque, vous risqueriez d´avoir à attendre longtemps avant qu´il ne vous rende la main.

   Copiez le ou les fichiers RTF dans le répertoire contenant le programme RTF2PML.

Voici à quoi ressemble le programme RTF2PML (dans la version 4.1.3) :

Le programme s´ouvre sur le répertoire dans lequel vous l´avez placé. Sélectionnez le lecteur et le répertoire qui contient votre ou vos fichier(s) RTF (vous ne verrez pas les noms de ces fichiers).

Les deux seules options à votre disposition sont :

Si votre texte n´est pas écrit en Français, décochez la case nommée Activée.

Finalement, c´est sur le bouton nommé « Convertir » que vous cliquerez pour lancer la conversion.


La conversion d´un fichier

L´avancée de la conversion se fera comme dans les trois images ci-dessous :

 

 

 

Les fichiers TXT contenant vos textes au format PML sont créés dans le répertoire où se trouve le programme (voyez l´image ci-dessous) et ce même si vous n´avez pas copié les fichiers RTF dans ce répertoire.

Si vos fichiers RTF contiennent des images, celles-ci seront placées dans un répertoire nommé d´après le nom du fichier TXT généré complété par « _img ». Le fichier utilisé dans cet exemple contenant une image, le répertoire est donc nommé « pêcheurs d´islande_img » (ceci est imposé dans la définition du langage PML).

Si vous avez choisi de remplir les champs du fichier RTF avant de lancer la conversion, voici ce que contiendra l´entête du fichier PML :

Dans l´image ci-dessus vous pouvez voir les différents champs du fichier RTF tels qu´ils ont été convertis. Ceci vous montre la séparation du contenu du champ « Société » dans les champs PUBLISHER et COPYRIGHT , ce second champ ce voyant précédé par l´année (de la conversion).

Remarquez que le champ OUT contient le nom du futur fichier PDB complété de son extension.

Vous y noterez également la présence d´un champ EISBN laissé libre, à vous de le compléter si vous en avez besoin.

Les accents sont également convertis pour ces divers champs, chose que vous aurez à faire si vous n´avez pas rempli les propriétés du fichier RTF, Dropbook.exe ayant besoin au minimum du titre du futur fichier .pdb.


La page d´informations d´eReader pour Windows

La page d´information de la version Windows d´eReader (menu Afficher -> Info sur le livre ou CTRL I) permet de contrôler le contenu des champs de l´entête d´un ebook. Avec une déclaration telle que celle-ci :


\v TITLE="Titre de l´ebook" AUTHOR="Nom de l´auteur" PUBLISHER="Nom de l´\a233diteur" COPYRIGHT="copyright" EISBN="123456" OUT="l_image_de_couverture.pdb" \v

la page d´information d'eReader version Windows (cela fonctionne également sous Linux et très certainement sous Mac aussi) nous renvoi ceci :

Curieusement, le champ EISBN n´est pas repris dans cette page d´information, on se demande bien pourquoi.

Mais il y a mieux ! Si vous avez lu attentivement les spécifications du langage PML vous avez certainement remarqué qu´il y est fait mention d´une image nommée « cover.png ». Avez-vous trouvé à quoi sert cette image ? Non ? alors modifiez la déclaration précédente comme ceci :


\v TITLE="Titre de l´ebook" AUTHOR="Nom de l´auteur" PUBLISHER="Nom de l´\a233diteur" COPYRIGHT="copyright" EISBN="123456" OUT="l_image_de_couverture.pdb" \v \m="cover.png"

Créez une image au format PNG 256 couleurs et placez là dans le répertoire qui va bien (vous devriez savoir du quel il s´agit maintenant), créez le fichier .pdb et ouvrez le avec la version Windows d´eReader.

Cette image sera affichée à l´endroit où vous avez placé la déclaration dans le texte mais aussi dans la page d´information :

« cover.png » est une image tout à fait comme les autres, ce pourrait être la photo de l´auteur par exemple, la seule chose qui compte c´est qu´il doit y avoir une image nommée « cover.png » quelque part dans votre fichier TXT.

Quand je dis « quelque part », c´est réellement « quelque part » dans le fichier, essayez ceci :


\v TITLE="Titre de l´ebook" AUTHOR="Nom de l´auteur" PUBLISHER="Nom de l´\a233diteur" COPYRIGHT="copyright" EISBN="123456" OUT="l_image_de_couverture.pdb" \m="cover.png" \v

Avez-vous remarqué le bogue d´eReader ? Une image placée dans un commentaire est toujours affichée !

Maintenant je dois vous dire quelque chose qui ne va pas vous plaire : vous allez devoir modifier à la main cette déclaration \m="cover.png". En effet il n´y a pas moyen de savoir sous quel numéro sera nommée l´image que vous avez choisi comme image de couverture, MS-Word ne conservant pas les noms d´images.


Les erreurs de conversion

L´image ci-dessous vous montre quelques uns des problèmes pouvant survenir lorsque dropbook tente de créer le fichier PDB.

Le premier problème, visible en haut de l´image, est dû au fait que cette version dropbook ne sait utiliser que 31 caractères du nom du fichier TXT pour donner un nom au fichier PDB.


\v TITLE="LE DOCTEUR OX" AUTHOR="Jules Verne" PUBLISHER="http://fr.groups.yahoo.com/group/ebooksgratuits" COPYRIGHT="2005 Ebooks libres et gratuits" EISBN="" OUT="verne_le_docteur_ox.pdb" \v

Comme vous pouvez le constater dans cette portion du fichier PML ci-dessus, le champ OUT est correctement complété, ce message d´avertissement de dropbook est en fait envoyé avant que le fichier ne soit parcouru à la recherche du futur nom du fichier PDB. Vous pouvez allégrement ignorer ce message si, et seulement si, vous avez complété le champ Sujet de votre fichier .rtf.

Les versions 1.5.2 et 1.6 de dropbook n´utilisent pas le champ OUT du fichier PML, c´est le nom du fichier TXT qui est utilisé. Si vous utilisez l´une de ces versions, veillez à contrôler le nom du fichier PDB qui sera créé. La version 1.3 ne comporte pas ce bogue.

Avec la version 1.3 seuls 31 caractères (y compris le point et l´extension) du champ OUT seront utilisés pour nommer le fichier .pdb. Cependant, une fois le fichier créé vous pouvez donner un nom d´une longueur quelconque au fichier.

Avec la version 1.6 le caractère - (le tiret simple ou le signe moins) dans le nom du fichier .txt pose un problème. Ce caractère est considéré par dropbook comme un délimiteur de paramètres, provoquant l´affichage d´un message d´erreur puis d´une boite de dialogue. Pire, selon ce qu´il y a après ce tiret le programme peut se planter. Les versions 1.3 et 1.5.2 ne comportent pas ce bogue.

 

En second lieu, la série d´avertissements :

Warning: Chapter name is > 80 characters mismatched chapter markers?

vous indique que les titres des chapitres font plus de 80 caractères de longueur. Cela ne gêne pas le fonctionnement d´eReader, vous pouvez donc ignorer ces avertissements si vous êtes sûr(e) que vos titres de chapitre font plus de 80 caractères de longueur. Dans le cas contraire, cela indique un problème dans votre fichier .rtf.

 

Nous arrivons maintenant à deux vraies erreurs, l´une d´elle est facile à corriger, l´autre nécessitera une petite astuce pour la localiser.

Le problème facile à corriger est le suivant :

Error: Image "D:\rtf2pml\jules_verne_docteur_ox_source_img\1074061334.png" is too large

Ceci signifie que l´image 1074061334.png est d´une taille supérieure à 64 kilo-octets, taille maximale d´une image pour eReader. Il suffit de réduire la taille de l´image jusqu´à ce que celle-ci soit inférieure à cette limite. Pour cela, j´utilise le programme XnView mentionné dans le chapitre des téléchargements au début de ce tutorial.

Dropbook arrête immédiatement après la première image de taille trop importante qu´il rencontre. Dans le fichier RTF utilisé pour cet exemple il y a 25 images posant le même problème. Il importe de réduire les tailles de toutes ces images avant de poursuivre.

 

Reste à traiter la seconde erreur importante que contient le fichier PML :

Error: This file does not end in the normal font!

Le plus simple est de « forcer » la fermeture correcte du fichier PDB.

Pour y arriver, il suffit de placer la balise \n à la fin du fichier PML avant les notes de bas de page si votre texte en contient, cette astuce ne permettant pas d´y trouver une erreur.

Voici la fin du fichier PML avant l´ajout de la balise :


\c\iVotre aide est la bienvenue\a160! \i\bVOUS POUVEZ NOUS AIDER \a192 CONTRIBUER \a192 FAIRE CONNA\a206TRE CES CLASSIQUES LITT\a201RAIRES. \b\c

Puis après l´ajout de la balise \n (en bleu) :


\c\iVotre aide est la bienvenue\a160! \i\bVOUS POUVEZ NOUS AIDER \a192 CONTRIBUER \a192 FAIRE CONNA\a206TRE CES CLASSIQUES LITT\a201RAIRES. \b\c \n

Utilisons à nouveau dropbook pour créer le fichier PDB et…

…ça marche, le fichier PDB est créé. N´oubliez cependant pas que nous n´avons toujours pas corrigé l´erreur mais seulement forcé dropbook à créer le fichier PDB.

Ceci nous aide à trouver visuellement où se cache cette erreur comme vous pouvez le voir sur l´image ci-dessous :

Le programme n´a pas détecté le changement de casse après le mot « Inédits ». Pour retrouver l´erreur dans le fichier PML il suffit de rechercher dans celui-ci une partie de phrase facilement reconnaissable qui se trouve à proximité, ce qui nous donne ceci :


\t \t*\a1601919 L´\a233tonnante aventure de la mission Barsac \b \t \tIn\a233dits \t \t*\a1601989 Voyage \a224 reculons en Angleterre et en \a201cosse

La correction de cette erreur se fait par l´ajout d´une balise \b (en bleu) comme ci-dessous :


\t \t*\a1601919 L´\a233tonnante aventure de la mission Barsac \b \t \tIn\a233dits\b \t \t*\a1601989 Voyage \a224 reculons en Angleterre et en \a201cosse

Pour vérifier que c´est bien la seule erreur de ce genre dans le fichier PML, il suffit de retirer la balise \n que nous avons ajoutée à la fin du fichier et de relancer dropbook. Si d´autres erreurs sont présentes, dropbook vous l´annoncera.

 


Autres problèmes avec les images…

Il arrive parfois que le programme ne parvienne pas à convertir une image vers le format PNG 256 couleurs. Dans ce cas, le message suivant sera affiché :

L´image est le plus souvent insérée dans le fichier TXT après la balise PML « \m="nom_de_l_image.png" », il faut donc supprimer tout cela en conservant la balise.

En principe, l´image est dans son format d´origine dans le répertoire créé lors de la tentative d´extraction. Il arrive de temps à autres que l´image ne soit pas du tout extraite du fichier RTF.

Le nom de l´image est parfois précédé du chemin complet où on peut la trouver sur internet ou sur votre disque dur, pensez à ne conserver que le nom de l´image dans la balise.

Le plus simple pour récupérer l´image en question est d´enregistrer le fichier RTF au format HTML, de cette façon elle sera disponible dans son format d´origine, il ne restera plus qu´à la convertir au format PNG 256 couleurs (et éventuellement d´en réduire les dimensions).

Quelle que soit la façon dont vous récupérez l´image, pensez soit à la renommer comme indiqué dans la balise PML, soit à modifier le nom dans cette balise.

Il peut également être utile de remplacer l´image originale du fichier RTF par celle au format jpeg que vous venez de récupérer. De cette façon l´image ne posera plus de problème(s) lors d´une mise à jour de votre fichier RTF.


Les images au format EMF…

Le format EMF est maintenant reconnu et traité correctement.

Néanmoins je ne vous conseille pas de l´utiliser lorsque vous insérez vos images dans le fichier RTF : ce format a une très forte tendance à grossir démesurément à la moindre modification et l´utilisation du format EMF n´arrange pas les choses, bien au contraire. Avant d´inclure une de ces images, il est donc préférable de les convertir dans l´un des formats suivants : JPEG, BMP ou GIF (évitez le format PNG, et les GIF monochromes).


Création de dictionnaires

La version non enregistrée d´eReader (la gratuite donc) n´est pas capable d´utiliser les dictionnaires, il faut avoir la version payante d´eReader pour utiliser les dictionnaires !

Les versions de dropbook permettant de créer des dictionnaires sont la 1.5.2 et la 1.6. Ces versions comportent quelques bogues : rien de grave, mais des bogues aussi stupides sont irritants. Vous pouvez faire cohabiter la version 1.3 de ce programme dans le même répertoire sans problème, sauf pour les utilisateurs de Linux pour lesquels la version 1.3 ne fonctionne pas (du moins pas avec Wine lorsque j´ai faits les essais).

La création d´un dictionnaire est très simple : il suffit de donner le style « Titre 1 » aux mots servant de définition, puis de donner la définition de ces mots dans n´importe quel autre style (sauf « Titre x », bien entendu).


Suivez la flèche !

Puis dans le champ « catégorie » des propriétés du fichier RTF, vous placez le mot « DICO » (en majuscules).

Utilisez DropBook 1.5.2 ou 1.6 pour convertir le fichier PML produit par RTF2PML et placez le fichier PDB sur votre Palm. Ouvrez eReader (avec un PDB quelconque, mais vous pouvez également ouvrir directement le dictionnaire) et appuyez le stylet sur un mot à l´écran jusqu´à ce qu´un menu s´ouvre, dans ce menu, sélectionnez « Définition » (« Lookup » en Anglais) : le dictionnaire s´ouvre, soit sur le mot que vous avez sélectionné si il est présent dans le dictionnaire, soit sur un mot ayant une orthographe proche.

Vous savez maintenant comment faire un dictionnaire pour eReader. Avouez que c´est simple !

Ne créez pas de notes de bas de page dans un dictionnaire, cela ne marche pas !

Il est possible d´y mettre des images, mais il y a parfois des problèmes d´affichage dont je n´ai pas trouvé la cause.


eReader et les tableaux…

Le langage PML ne dispose d´aucun moyen pratique pour reproduire les tableaux. Un tableau de deux lignes et deux colonnes comme ci-dessous :

L1C1L1C2
L2C1L2C2

sera converti comme ceci :

<table>

<tr>

<td>L1C1</td>

<td>L1C2</td>

</tr>

<tr>

<td>L2C1</td>

<td>L2C2</td>

</tr>

</table>

Je n´ai pas d´autre solution à l´heure actuelle permettant de représenter correctement un tableau avec eReader. Le plus simple serait de présenter d´une autre façon leur contenu sans utiliser de tableaux.

N´allez surtout pas imaginer que j´ai choisi une solution simpliste pour ce problème des tableaux. J´ai eut énormément de mal à comprendre comment parvenir à ce résultat, plutôt décevant je vous l´accorde. Il y a bien une balise permettant d´afficher du texte à un certain pourcentage de la largeur de l´écran, mais cela n´est pas applicable d´une façon générale au vu de la largeur des écrans des Palms.


Caractères non autorisés dans les noms de fichier(s)…

À partir de la version 4.1.3, les fichiers contenant des caractères non autorisés dans leur nom seront rejetés, le message suivant sera alors affiché :

Les versions précédentes auraient provoqué l´affichage du message suivant :

La solution à ce problème est de renommer le fichier en n´utilisant que des caractères alphabétiques.

Le fichier concerné dans l´un et l´autre cas contenaient des caractères Cyrilliques que Windows a remplacé par des points d´interrogation lors de la tentative d´ouverture des fichiers.


Remerciements

Merci ŕ Bernard pour m´avoir signalé un bogue stupide lors d´une mise à jour du programme.

Merci ŕ Laurent D. pour m´avoir donné l´envie de corriger le problème induit par les « balises actives (smarttags) » de MS-Word.

Merci ŕ Walter H., de Suisse, pour m´avoir signalé l´oubli de la bonne configuration de Dropbook 1.6


Contact

Merci d´envoyer vos commentaires, questions et critiques à l´adresse suivante :

litteratureaemporterLE_SPAM_NON_MERCIfree.fr

(Remplacez LE_SPAM_NON_MERCI par @ pour envoyer un email.)