Encodage d'une transcription de xpdf vers Libre-Office.

La question :

Bonjour

Je me perds dans ce pb d'encodage pour la transcription d'un document de
xpdf vers Libre-Office.
Par quel bout prendre ce résultat?

«On dit que Léonard de Vinci, quand il s’apprêtait à peindre le»


Merci de votre aide

--
capfree

Poser votre question sur le forum Logiciels

Les 16 réponses :

On 14/10/2015 00:30, capfree a écrit :


On dit que Léonard de Vinci, quand il s’apprêtait à peindre le


Visiblement, c'est de l'UTF-8 affiché comme si c'était du Latin1.

Voyons sur <http://hapax.qc.ca/conversion.fr.html>.

Léonard -> 4C C3 A9 6F 6E 61 72 64 -> Léonard

s’apprêtait -> 73 E2 80 99 61 70 70 72 C3 AA 74 61 69 74
-> s’apprêtait

à -> C3 -> (erreur)

Mais

à + espace insécable -> C3 A0 -> à

Le 14/10/2015 01:28, Olivier Miakinen a écrit :


On 14/10/2015 00:30, capfree a écrit :


On dit que Léonard de Vinci, quand il s’apprêtait à peindre le


Visiblement, c'est de l'UTF-8 affiché comme si c'était du Latin1.

Voyons sur <http://hapax.qc.ca/conversion.fr.html>.


J'ai exploré les liens en bas de page, je comprends (presque) le
principe d’Unicode, c'est une impasse pour moi.

Je penserais que la clé de mon pb me serait plus accessible dans la
configuration des éditeurs - là, de xpdf -> kate, ou Libre-Office - pour
influer sur leur choix, ou bien comment exporter, toutes notions
desquelles je ne suis pas fortiche non plus.
Si l'on pouvait me diriger dans ces directions, ce serait sympa.

Sinon un autre recours je tenterais la fonction bourrin
rechercher/remplacer.

Merci



Léonard -> 4C C3 A9 6F 6E 61 72 64 -> Léonard

s’apprêtait -> 73 E2 80 99 61 70 70 72 C3 AA 74 61 69 74
-> s’apprêtait

à -> C3 -> (erreur)

Mais

à + espace insécable -> C3 A0 -> à




--
capfree

On 14/10/2015 10:54, capfree a écrit :



Je penserais que la clé de mon pb me serait plus accessible dans la
configuration des éditeurs - là, de xpdf -> kate, ou Libre-Office - pour
influer sur leur choix, ou bien comment exporter, toutes notions
desquelles je ne suis pas fortiche non plus.
Si l'on pouvait me diriger dans ces directions, ce serait sympa.


Je n'utilise pas ces logiciels, mais en effet c'est probablement par
là qu'il faudrait chercher.

Mais lorsque tu écris que cela donne Léonard par exemple, je ne peux
pas savoir si dans le fichier Libre Office il est écrit « Léonard »
en UTF-8 et le logiciel croit que c'est du Latin1, ou bien s'il est
déjà écrit « Léonard » en UTF-8 (c'est-à-dire que le texte serait
sur-encodé). Si tu veux, tu peux m'envoyer un fichier source et un
fichier résultat à mon adresse, qui est valide, et je te dirai ce
qu'il en est.

Si tu en as les moyens, merci d'envoyer des fichiers les plus petits
possibles, par exemple avec juste le mot « Léonard » ou « Léonard ».


Sinon un autre recours je tenterais la fonction bourrin
rechercher/remplacer.


Je crois que le format PDF est binaire, donc ça va être difficile
d'agir dessus. Mais si comme je le pense le format de Libre Office
est du XML, tu peux essayer un coup d'iconv ou de recode dessus.
Par exemple :
iconv -f UTF-8 -t ISO-8859-1 fichier_foo > fichier_bar

Le 14/10/2015 10:54, capfree a écrit :



J'ai exploré les liens en bas de page, je comprends (presque) le
principe d?Unicode, c'est une impasse pour moi.

Je penserais que la clé de mon pb me serait plus accessible dans la
configuration des éditeurs - là, de xpdf -> kate, ou Libre-Office - pour
influer sur leur choix, ou bien comment exporter, toutes notions
desquelles je ne suis pas fortiche non plus.
Si l'on pouvait me diriger dans ces directions, ce serait sympa.

Sinon un autre recours je tenterais la fonction bourrin
rechercher/remplacer.

Merci


J'ai oublié de dire que j'ai essayé d'enregistrer avec l'extension txt
sans meilleur résultat.

--
capfree

Le 14/10/2015 00:30, capfree a écrit :


Bonjour

Je me perds dans ce pb d'encodage pour la transcription d'un document de
xpdf vers Libre-Office.
Par quel bout prendre ce résultat?

«On dit que Léonard de Vinci, quand il s’apprêtait à peindre le»


Peux-tu mettre le pdf en téléchargement quelque part ? Cela permettrait
de tester.

Personnellement je n'ai jamais observé ce genre de problème en important
un pdf dans LibreOffice.

JBF


--
Seuls des formats ouverts peuvent assurer la pérennité de vos documents

Poser votre question sur le forum Logiciels

Questions similaires :

Office

Lucas Levrel wrote: > > Toujours une histoire d'usage et de besoin. > Par exemple pour faire des schémas simple et rapide avec un outil > multiplateforme, supportant le PDF (en import/export)[/color] Quand tu parles d'import de PDF : on peut modifier un schéma...

recherchev dans libre office calc

Le 1 janvier 2014, Bill a écrit : [/color] Il s'agit seulement qu'ils soient triés pour chaque din donné (critère de tri secondaire, ou tertiaire, ou...). De toute façon ça ne coûte rien d'essayer. -- LL E? ???? ??? ????? ???? (????????)

Logiciel libre de vote électronique

Yliur , dans le message <20140910133846.64cf9014@free.fr>, a écrit : Ce sont des fonctions qui sont conçues pour hacher des mots de passe, et manifestement en imitant les vieilles fonctions crypt() Unix qui faisaient du 3DES avec deux caractères de sel. Je n'ai pas vérifié ce que faisait...

Passage Word -> Open Office

Bonjour, Je me renseigne concernant la migration d'une petite administration de Word vers OO. - Y a t'il une quelconque restriction juridique a utiliser OO en administration ? Une déclaration a faire ? Une licence spéciale ? Quelque chose a payer ? - Quels sont les retours de personnes qui...

Recherche appli web collaborative libre de traduction

In article <4b13f25b$0$14672$426a74cc@news.free.fr>, julien writes: spip permet ça, iest écrit en php il me semble qu'un sous ensemble de spip pourrait peut-être répondre à ton attente avec peu de rustines à faire bien qu'il ne soit pas conçu pour cet usage (mais bien pour le...