Автор Гілка: Проблеми з кодуванням символів  (Прочитано 10085 раз)

Відсутній laiesklepiy

  • Новачок
  • *
  • дописів: 15
  • Карма: +0/-0
Привіт усім шановним користувачам форуму.
Допоможіть мені. Маю pdf файл, коли відкриваю його все нормально, але скопіювавши текст в OpenOffice, весь текст якимись ієрогліфами (теж сама проблема в pdftotext). Пробував підібрати кодування з допомогою firefox, але текст не став читабильним.
Файл додаю. Буду вдячний будь якій допомозі.

Відсутній laiesklepiy

  • Новачок
  • *
  • дописів: 15
  • Карма: +0/-0
Re: Проблеми з кодуванням символів
« Відповідей #1 : 2013-05-20 17:30:46 »
Додаю файл.

Відсутній f1g4r0

  • Кореспондент
  • ***
  • дописів: 160
  • Карма: +0/-0
  • Vita sine libertate, nihil!
Re: Проблеми з кодуванням символів
« Відповідей #2 : 2013-05-20 20:37:05 »
Привіт усім шановним користувачам форуму.
Допоможіть мені. Маю pdf файл, коли відкриваю його все нормально, але скопіювавши текст в OpenOffice, весь текст якимись ієрогліфами (теж сама проблема в pdftotext). Пробував підібрати кодування з допомогою firefox, але текст не став читабильним.
Файл додаю. Буду вдячний будь якій допомозі.

? може спробувати визначити кодування.. ?  наприклад, тут http://2cyr.com/decode/
*[ Ніхто крім нас ] *                        //Arch + dwm + SVD

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1923
  • Карма: +4/-0
Re: Проблеми з кодуванням символів
« Відповідей #3 : 2013-05-20 21:15:24 »
pdtotext 1.pdf | iconv -t iso8859-1 | iconv -f cp1251
Fedora 35 (x86-64)

Відсутній laiesklepiy

  • Новачок
  • *
  • дописів: 15
  • Карма: +0/-0
Re: Проблеми з кодуванням символів
« Відповідей #4 : 2013-05-20 23:42:21 »
Дякую усім. Сайт http://2cyr.com/decode/ допоміг, а ось команда pdftotext 1.pdf | iconv -t iso8859-1 | iconv -f cp1251 ні.

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3628
  • Карма: +2/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Re: Проблеми з кодуванням символів
« Відповідей #5 : 2013-05-22 09:04:54 »
Треба було так:
pdftotext 1.pdf - | iconv -t cp1252//IGNORE | iconv -f cp1251 > converted.txt
Denounce the demagogues
King diamonds to discard
Deploy the dialogue
Your word against the law

Відсутній laiesklepiy

  • Новачок
  • *
  • дописів: 15
  • Карма: +0/-0
Re: Проблеми з кодуванням символів
« Відповідей #6 : 2013-05-22 09:23:27 »
О, дякую, працює. :)