Наверняка вы уже знаете, как перейти от собственного документа Microsoft Office к PDF с помощью функций, включенных в офисный пакет Microsoft, если вы используете его с Wine в GNU / Linux. И даже если вы используете LibreOffice или другой офисный пакет, вам также будет легко перенести документ в формат PDF делиться им более удобным способом благодаря инструментам, которые уже включают этот тип пакета. Прежде чем вам приходилось использовать для этого другие инструменты, для этого появились определенные плагины, и, наконец, они уже были интегрированы в наборы.
Но не это мы будем объяснять в этой статье, а нас интересует обратный процесс, то есть конвертировать PDF в документ Word или LibreOffice, будь то .doc, .docx и т. д. И хотя это не так типично, как обратное преобразование, которое я объяснил в первом абзаце, многим людям необходимо преобразовать документы PDF в несколько более удобный формат для их редактирования. Вот почему мы собираемся объяснить простые шаги для преобразования PDF в Word.
Индекс
- 1 В чем разница между PDF-файлом и другими форматами:
- 2 Как конвертировать Word в PDF:
- 2.1 Из Microsoft Office:
- 2.2 Из LibreOffice / OpenOffice:
- 3 Конвертировать PDF в Word
PDF означает Portable Document Format, то есть переносимый формат документа. Он был разработан Adobe Systems и в настоящее время является одним из самых популярных форматов, поскольку не зависит от программных и аппаратных платформ, которые мы используем, а значит, и портативности. Это означает, что мы сможем визуализировать контент из нескольких очень разных операционных систем и программ, что делает его королем Интернета для доступа к таким разнородным компьютерам, которые существуют.
Это стало настолько важным, что в 2008 году он был стандартизирован в соответствии с ISO 32000-1, но не все из них имеют преимущества, такие как портативность, простота просмотра, небольшой размер и индивидуальная конфигурация, у него также есть скрытое лицо. Например, редактирование этих файлов PDF означает покупку платного программного обеспечения, такого как продукты Adobe Acrobat в их PRO-версиях. Поскольку его трудно редактировать или невозможно без специального программного обеспечения, с ним трудно работать, поэтому его стремятся превратить в редактируемый документ, как мы научим вас в этом руководстве.
Кстати, это правда, что для Linux есть некоторые альтернативы, такие как PDF Studio Pro или PDF Edit, но, честно говоря, альтернативы недостаточно зрелы и не так полны, как у Adobe …
Как конвертировать Word в PDF:
Из Microsoft Office:
Чтобы преобразовать любой офисный документ, будь то .doc, .docx, .ppt, .pptx,. и т. д., если вы работаете с офисным пакетом Microsoft Офис или Office 365 с веб-платформы, вы можете выполнить следующие действия для преобразования в формат PDF:
- Откройте программу, с которой хотите работать. Это может быть Word, PowerPoint и т. Д.
- Перейдите в меню «Файл».
- Щелкните «Экспорт».
- И выберите формат PDF.
- В раскрывающемся меню вы можете выбрать имя PDF-документа и место его сохранения, а также выбрать между обычным или легким форматом (особенно для публикации в Интернете). Если вы отобразите параметры, это также позволит вам выбрать страницы для преобразования, закладки и т. Д.
- При принятии и сохранении офисный документ начнет экспортироваться в PDF, и он будет у нас готов.
То же самое, если работать с веб-интерфейс Office в облаке или из офисных приложений Microsoft Office 365 для Android …
Из LibreOffice / OpenOffice:
Если вы используете бесплатный офисный пакет, он будет таким же или проще. С LibreOffice или OpenOffice вам просто нужно выполнить следующие действия:
- Откройте программу, с которой вы работаете, например Presentation, Writer, …
- Открыв документ, который вы хотите экспортировать в PDF, перейдите в меню «Файл».
- Выберите опцию Экспорт в PDF.
- Выберите имя и куда сохранить.
- Готово, у вас уже есть PDF-файл.
Конвертировать PDF в Word
В случае обратной операции офисные пакеты обычно не имеют параметров для преобразования PDF в редактируемый документ, или, если они есть, они не так видны, как в случае параметров для преобразования документа в PDF. Например, если у нас есть LibreOffice установлен (и пакет libreoffice-common) в нашем дистрибутиве, мы можем использовать простую команду для преобразования PDF в один из форматов, совместимых с нашим любимым бесплатным пакетом. Как? Ну вот так:
cd /nombre/directorio/donde/esta/pdf soffice --infilter="writer_pdf_import" --convert-to doc nombre.pdf
Благодаря этому нам удается преобразовать документ с именем name.pdf (который вы должны заменить на имя вашего PDF-файла) в .doc, чтобы иметь возможность редактировать его с удобством. Конечно, вы должны запустить его из каталога, в котором должен работать PDF … Если хотите, вы можете изменить формат документа на другой, например .odt и т. Д.
Другая форма Это может быть здесь, в данном случае для Word-совместимого .docx:
libreoffice --invisible --convert-to docx:"MS Word 2007 XML" nombre.pdf
И на самом деле это не единственные варианты для преобразования такого типа, есть другие альтернативы. Если хотите, можете установить пакет Abiword и беги следующая команда:
abiword --to=doc nombre.pdf
El последний ресурс было бы приобрести программное обеспечение Adobe Acrobar Pro, чтобы иметь возможность редактировать PDF-файлы или конвертировать их в другие форматы, среди которых .doc и .docx. Но для этого вы должны использовать виртуальную машину с Mac или Windows, чтобы иметь возможность запускать ее, или напрямую установить Adobe Acrobat Pro с помощью Wine.
Если есть сомнения, не забывай оставьте свои комментарии…
Содержание статьи соответствует нашим принципам редакционная этика. Чтобы сообщить об ошибке, нажмите здесь.
Вы можете быть заинтересованы
pdf > tiff > cuneiform > doc
тебе вообще не приходило в голову, что если кроме shareware для такой задачи ничего нет, значит задача не совсем тривиальна?
★★★☆
(25.10.10 17:09:54 MSD)
- Показать ответы
- Ссылка
Ответ на:
комментарий
от vostrik 25.10.10 17:09:54 MSD
Ответ на:
комментарий
от vostrik 25.10.10 17:09:54 MSD
Ответ на:
комментарий
от tmlder 25.10.10 17:17:23 MSD
Открыть опенофисом и сохранить как .doc (только у вас получится совершенно нередактируемый текст — по одному блоку на каждую строчку).
☆☆☆☆☆
(25.10.10 17:36:20 MSD)
- Ссылка
Ответ на:
комментарий
от vostrik 25.10.10 17:34:10 MSD
если его так до сих пор и не научили — html или rtf в doc конвертится на раз.
★★★☆
(25.10.10 17:38:42 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от toybike 25.10.10 17:24:50 MSD
Ответ на:
комментарий
от tmlder 25.10.10 17:46:43 MSD
на финфаке спроси
Led ★★★☆☆
(25.10.10 17:52:41 MSD)
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 17:46:43 MSD
Вы скажите, зачем это вам надо? Если тупо, чтобы «отмазаться», то лучше всего — распустить pdf на страницы (например, png) и повставлять их в опенофисе, потом сохранить как .doc.
Если чтобы можно было редактировать — то текст можно получить при помощи pdftotext, картинки — при помощи pdfimages, потом все соединить.
Если серединка на половинку — опенофисом, как я выше говорил.
☆☆☆☆☆
(25.10.10 17:53:54 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 17:46:43 MSD
Ответ на:
комментарий
от tmlder 25.10.10 17:46:43 MSD
pdftotext file.pdf file.doc
коли в условии задачи ничего не сказано про картинки, etc.
p.s. или сейчас выяснится, что нужно соблюсти форматирование, формулы, рисунки и т.п. ??
swarnk ★★
(25.10.10 18:01:14 MSD)
- Показать ответы
- Ссылка
Ответ на:
комментарий
от swarnk 25.10.10 18:01:14 MSD
что нужно соблюсти форматирование, формулы, рисунки и т.п. ??
В этом случае единственный надежный способ — мой (распустить pdf на страницы и повтыкать каждую ручками или скриптом в ОО, потом сохранить как .doc). Естественно, редактировать нельзя будет.
☆☆☆☆☆
(25.10.10 18:03:03 MSD)
- Ссылка
Ответ на:
комментарий
от toybike 25.10.10 17:57:39 MSD
Читайте внимательнее пост.
tmlder
(25.10.10 18:07:17 MSD)
- Ссылка
Ответ на:
комментарий
от swarnk 25.10.10 18:01:14 MSD
Ответ на:
комментарий
от overmind88 25.10.10 18:03:04 MSD
Ответ на:
комментарий
от Eddy_Em 25.10.10 17:53:54 MSD
Это нужно для того чтобы бы полученный сконвертированный pdf документ можно было редактировать в worde.
tmlder
(25.10.10 18:09:20 MSD)
- Показать ответы
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:08:15 MSD
Вы скажите, зачем это вам надо?
swarnk ★★
(25.10.10 18:11:03 MSD)
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:09:20 MSD
Тогда забудьте. Либо выдерните текст из pdf (если он, конечно, с текстом) при помощи pdftotext и сохраните при помощи ОО как .doc, либо (если хотите поиздеваться над тем …, который надумал редактировать pdf) — откройте pdf при помощи ОО и сохраните как .doc.
Да, если не секрет: что побудило вас задать такой, мягко говоря, глупый вопрос? pdf-то чем-то создавался? Куда оригинал дели?
☆☆☆☆☆
(25.10.10 18:12:24 MSD)
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:09:20 MSD
Ну только что попробовал открыть pdftotext test.pdf test.doc документ в word (прости господи). Открывается. Редактируется. Что дальше?
swarnk ★★
(25.10.10 18:13:04 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от vostrik 25.10.10 17:38:42 MSD
html или rtf это языки разметки а pdf это поток байт представляющий графический образ для печати на принтере. поэтому его можно только finereader-ом/OCR распознавать
Karapuz ★★★★★
(25.10.10 18:14:18 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:09:20 MSD
полученный сконвертированный pdf документ можно было редактировать в worde
открой файл в Acrobat и скопируй все в Word
Karapuz ★★★★★
(25.10.10 18:15:15 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от Karapuz 25.10.10 18:15:15 MSD
открой файл в Acrobat и скопируй все в Word
Чем этот способ лучше открывания файла опенофисом и сохранения в формате .doc? Все равно ничего невозможно будет редактировать (точнее, можно, но с большими костылями). И разметка поплывет…
☆☆☆☆☆
(25.10.10 18:17:44 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от Eddy_Em 25.10.10 18:17:44 MSD
Ответ на:
комментарий
от unikum 25.10.10 18:20:29 MSD
Судя по формулировке вопроса, у ТС линукс, а какому-то нехорошему человеку надо редактировать в мастдае pdf. И этот нехороший человек эти самые pdf где-то украл, т.к. исходников у него нет. Плагиат!
☆☆☆☆☆
(25.10.10 18:21:58 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от swarnk 25.10.10 18:13:04 MSD
Ответ на:
комментарий
от Eddy_Em 25.10.10 18:21:58 MSD
Ответ на:
комментарий
от tmlder 25.10.10 18:22:41 MSD
О! Брависсимо! Я ждал этого вопроса.
Конечно нет. Про таблицы, форматирование вы в первом своем сообщении тактично умолчали….
swarnk ★★
(25.10.10 18:24:31 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:22:41 MSD
Картинки, таблицы, форматирование осталось?
Если вам надо, чтобы это все осталось, да еще и в таком виде, чтобы можно было редактировать, да еще и чтобы не испортилось оформление документа, то мой вам совет: забудьте о своей нездоровой идее. pdf предназначен для чтения и печати, но никак не для редактирования.
Еще раз спрашиваю: куда исходники этого pdf’а дели?
☆☆☆☆☆
(25.10.10 18:25:09 MSD)
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:23:38 MSD
Я уже несколько раз просил, чтобы вы объяснили, зачем вам это понадобилось. Ответ был? Нет. Значит — плагиат!
☆☆☆☆☆
(25.10.10 18:25:55 MSD)
- Ссылка
Нет. Потому что не нужно, тем более в какой-то док (это для докторов что ли?).
Ставь под винду что-нибудь типа адобепдфедит/фокситпдфедит.
amorpher ★★★★★
(25.10.10 18:26:10 MSD)
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:22:41 MSD
Даже сам себя процитирую
p.s. или сейчас выяснится, что нужно соблюсти форматирование, формулы, рисунки и т.п. ??
swarnk ★★
(25.10.10 18:26:34 MSD)
- Ссылка
Не айс/не юникс вей
То finereader 8 portable под wine. Открывает pdf, сохраняет в doc.
kraftello ★★★★★
(25.10.10 18:28:32 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от swarnk 25.10.10 18:24:31 MSD
Поздравляю что дождались!
Теперь можете задавать вопросы типа «Я что телепат?» или идти подстричься.
tmlder
(25.10.10 18:30:43 MSD)
- Ссылка
Спасибо за совет.
Мне глубоко пофиг Unix вэй это или как-то другой. У меня есть задача, которую надо решить.
tmlder
(25.10.10 18:31:35 MSD)
- Ссылка
Ответ на:
комментарий
от Karapuz 25.10.10 18:14:18 MSD
facepalm. а на выходе cuneiform у нас что, поток байт с картинкой пдфа замаскированный под html?
★★★☆
(25.10.10 18:34:35 MSD)
- Ссылка
Сделать скриншоты страниц PDF и вставить картинки в doc. Profit.
Редактировать можно GIMP-ом.
Nervous ★★★★★
(25.10.10 18:35:53 MSD)
- Показать ответы
- Ссылка
Ответ на:
комментарий
от Nervous 25.10.10 18:35:53 MSD
Зачем скриншот, когда есть ImageMagic?
☆☆☆☆☆
(25.10.10 18:45:37 MSD)
- Ссылка
Ответ на:
комментарий
от Nervous 25.10.10 18:35:53 MSD
Ответ на:
комментарий
от vostrik 25.10.10 17:09:54 MSD
>pdf > tiff > cuneiform > doc
извращение полнейшее.
Топикстартеру: кто мешает использовать виндовое в вайне?
petrosyan ★★★★★
(25.10.10 18:48:28 MSD)
- Показать ответы
- Ссылка
Ответ на:
комментарий
от petrosyan 25.10.10 18:48:28 MSD
Спасибо за совет! Виндовое приложение под вайном тоже подойдет как вариант.
Можете посоветовать какое? Чтобы freeware было.
tmlder
(25.10.10 18:52:22 MSD)
- Показать ответы
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:52:22 MSD
Почему бы вам не делать все через одно место, а редактировать то, из чего этот самый pdf был сгенерирован?
☆☆☆☆☆
(25.10.10 18:54:06 MSD)
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:52:22 MSD
>Можете посоветовать какое?
Adobe Acrobat (не Reader!)
Чтобы freeware было.
Пиратским воспользуйся, как обычно.
Led ★★★☆☆
(25.10.10 18:56:51 MSD)
- Показать ответ
- Ссылка
Ответ на:
комментарий
от Led 25.10.10 18:56:51 MSD
Ответ на:
комментарий
от tmlder 25.10.10 18:58:41 MSD
>Проще найти free чем кряк
И где ты «free» Word нашёл?
Led ★★★☆☆
(25.10.10 19:17:03 MSD)
- Ссылка
Ответ на:
комментарий
от tmlder 25.10.10 18:52:22 MSD
$yaourt -Ss pdf2
community/pdf2djvu 0.7.4-2
Creates DjVu files from PDF files
aur/kpdf2 0.3.1-7 (19)
An old version of KDE's PDF reader, made obsolete by Occular.
aur/pdf2html 1.4-3 (108)
Converts pdf files to html files.
aur/pdf2line 0.0.1-2 (19)
Simple command-line utility to convert PDF into text
aur/pdf2svg 0.2.1-3 (97)
A pdf to svg convertor
- Ссылка
одной утилитой не выйдет,
попробуйте или предложенные уже в теме конвертеры в другие форматы, например текст или изображение, а можно просто попробовать в просмотрщике pdf скопировать данные в буффер и вставить в ООо writer
если текст , то открываете его в openoffice.org writer (например) и редактируете, сохранение в .doc там есть
если изображение, то можно воспользоваться распознавалками , cuneiform например, возможно удастся сохранить часть форматирования.
Sylvia ★★★★★
(26.10.10 02:36:57 MSD)
- Ссылка
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Is there any free software available on Ubuntu that can convert a pdf file to a .doc file?
Braiam
66.5k30 gold badges175 silver badges264 bronze badges
asked Apr 28, 2011 at 13:44
1
Download Abiword
from Ubuntu Software Center
or you can install it by typing following command in terminal:
sudo apt-get install abiword
Then perform the conversion:
abiword --to=doc example.pdf
answered Apr 7, 2013 at 7:38
1
openoffice
(or alternatively the libreoffice
fork) both have pdf import plugins and .doc export functionality… though both aspects suffer from conversion issues AFAIK.
By this I mean that the conversion fidelity isn’t always 100%.
Abiword also works in a similar way, if OpenOffice doesn’t work on your system.
answered Apr 28, 2011 at 14:58
jmetzjmetz
1,1518 silver badges9 bronze badges
2
I’ve had great success with PDF to Word online. This is not a desktop application, but a service, that works better than other things I’ve used.
answered Apr 28, 2011 at 18:01
KendorKendor
4,7589 gold badges48 silver badges57 bronze badges
5
Install AbiWord from Ubuntu Software Center
Open Pdf Files with it.
Use Save As.. to save pdf in Word Doc format.
Its this easy
answered May 4, 2012 at 3:51
1
I prefer converting PDF files first to HTML using pdftohtml included in the poppler-utils package, for example by means of a file manager context menu script merely consisting of this command:
pdftohtml -noframes -q -p -c "$1" "${1%.pdf}-img.html"
Then I open the resulting HTML file in LibreOffice Writer, and (after a little editing) Save As any other document format I like.
Note: Adding -i parameter to the command above produces HTML file without images.
answered May 10, 2014 at 15:10
SadiSadi
10.9k7 gold badges48 silver badges61 bronze badges
2
Есть множество различных причин, почему вам нужно конвертировать PDF файл в редактируемый текстовый файл, мы здесь не будем обсуждать причины, но обсудим способ как это можно осуществить в Linux. Возможно, вам нужно посмотреть(изменить) старый документ, но у вас есть лишь PDF версия. Преобразовать PDF файл в Windows, очень легко, но что делать, если вы используете Linux? Думаю этим вопросом задавались многие.
Не стоит беспокоиться. Мы покажем вам, как очень быстро и легко конвертировать PDF файлы в редактируемый текст с помощью инструмента командной строки(терминал) с помощью пакета под названием pdftotext, что является частью утилиты «Poppler-Utils». Этот инструмент может быть уже установлен по умолчанию в системе. Чтобы проверить, установлен ли в вашей системе pdftotext, нажмите «Ctrl + Alt + T», чтобы открыть окно терминала. Введите следующую команду в командной строке и нажмите клавишу «Enter».
dpkg -s poppler-utils
Если пакет установлен, хотя должен быть установлен так как проверив в версии Ubuntu 14.04 LTS мы видим следующий текст который нам сообщает, что пакет уже установлен в системе:
Package: poppler-utils
Status: install ok installed
Priority: optional
Section: utils
Installed-Size: 432
Maintainer: Ubuntu Developers <ubuntu-devel-discuss@lists.ubuntu.com>
Architecture: i386
Multi-Arch: foreign
Source: poppler
Version: 0.24.5-2ubuntu4
Replaces: pdftohtml, xpdf-reader, xpdf-utils (<< 3.02-2~)
Provides: pdftohtml, xpdf-utils
Depends: libc6 (>= 2.4), libcairo2 (>= 1.12.0), libfreetype6 (>= 2.2.1), libgcc1 (>= 1:4.1.1), liblcms2-2 (>= 2.2+git20110628), libpoppler44 (>= 0.24.5), libstdc++6 (>= 4.1.1)
Breaks: xpdf-utils (<< 3.02-2~)
Conflicts: pdftohtml
Description: PDF utilities (based on Poppler)
Poppler is a PDF rendering library based on Xpdf PDF viewer.
.
This package contains command line utilities (based on Poppler) for getting
information of PDF documents, convert them to other formats, or manipulate
them:
* pdfdetach — lists or extracts embedded files (attachments)
* pdffonts — font analyzer
* pdfimages — image extractor
* pdfinfo — document information
* pdfseparate — page extraction tool
* pdftocairo — PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
* pdftohtml — PDF to HTML converter
* pdftoppm — PDF to PPM/PNG/JPEG image converter
* pdftops — PDF to PostScript (PS) converter
* pdftotext — text extraction
* pdfunite — document merging tool
Homepage: http://poppler.freedesktop.org/
Original-Maintainer: Loic Minier <lool@dooz.org>
1. В том случае если оказалось, что в вашей версии дистрибутива пакет pdftotext не установлен, введите следующую команду в командной строке и нажмите клавишу «Enter».
sudo apt-get install poppler-utils
- В утилите Poppler-Utils есть несколько инструментов, которые позволяют конвертировать PDF в другие форматы, манипулируя PDF файлами, и извлекая информацию из файлов.
2. Для примера, давайте представим, что у нас в домашней директории имеется файл с названием Book.pdf, какую команду в нашем случае нужно выполнить чтобы преобразовать данный файл в файл текстового формата для чтения и редактирования например с помощью текстового редактора Gedit или любого другого.
- Ниже приводится пример основной команды которая используется для преобразования PDF-файла в редактируемый текстовый файл. Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, далее введите следующую команду в командной строке и нажмите клавишу «Enter».
pdftotext /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt
В нашем случае linux это моя учетная запись, вы изменяйте на вашу, далее файл Book.pdf с которым мы и проводим опыты, далее через пробел мы так же прописываем путь в ту же директорию где нам создать готовый текстовый файл с результатом конвертации.
В моем случае я забросил в папку документы простенький документ почти на 3 метра, справочник по HTML, далее выполняю команду:
pdftotext CSS Manual.pdf CSS Manual.txt
- Мы имеем готовый текстовый файл результат конвертирования с формата pdf. Конечно очень важно в вашем случае прописать полный и правильный путь к файлу который необходимо конвертировать, чтобы соответствовать расположению и имени вашего оригинального PDF файла и где вы хотите сохранить полученный текстовый файл. Так же не забываем о волшебной клавише под названием Tab при вводе пути и названия файла, убережет ваше время и автоматически подберется тот путь и то название файла которое нужно.
3. Конечно готовый преобразованный текст может иметь разрывы строк которых вы возможно и не хотите как и я. Разрывы строк вставляются после каждой строки текста в файле PDF. Чтобы убрать разрывы и лишнюю табуляцию, мы можем сохранить макет нашего pdf документа (заголовки и многое другого) от оригинального PDF файла в текстовом файле преобразовав с помощью специального флага «-layout».
В итоге готовая команда уже будет иметь следующий вид:
pdftotext -layout /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt
проверив результаты конвертации, скажу честно, уже все намного в более порядочном виде, но все же имеется много мелочей которые необходимо отредактировать.
4. Вам нужно преобразовать не целый документ, а определенный диапазон страниц от и до, например с 10 по 100, как будет смотреться готовая команда для конвертации спросите вы. Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, далее введите следующую команду в командной строке и нажмите клавишу «Enter».
pdftotext -f 10 -l 100 /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt
5. Как преобразовать PDF файл который зашифрован паролем от владельца спросите вы? Решение данного вопроса так же имеется и имеет следующую готовую комбинацию:
pdftotext -0pw ‘пароль’ /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt
- Чтобы вы не попутали при возможном выполнении команды выше, в атрибуте 0pw используется не буква О, а цифра ноль.
6. Как преобразовать файл который защищен паролем, не зашифрован как в варианте выше, так же имеется простое решение, в терминале выполняем готовую комбинацию, пример:
pdftotext -upw ‘пароль’ /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt
7. Вы можете также указать Тип конца строки, символ, который добавляется в преобразованный текст. Это особенно полезно, если вы планируете использовать файл в разных операционных системах, таких как Windows или Mac. Чтобы сделать это, используйте флаг «-eol» (символ в середине флага является строчной буквой «o», не ноль), затем пробел и указываем окончания для строк который вы хотите использовать («Unix», «Dos», или «Mac»).
- Готовая команда будет иметь следующий вид, Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, далее введите следующую команду в командной строке и нажмите клавишу «Enter».
pdftotext -eol unix /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt
Если вам мало информации по возможности преобразования pdf документов в разнообразные форматы, вы всегда можете прочесть справку, выполнив в терминале команду — man pdftotext. На этом пожалуй материал завершен, если у вас будут вопросы, пожалуйста, спрашивайте в комментариях к материалу ниже, всем удачи.
Лицензия: CC BY-SA 4.0
Благодарность автору!
Похожие материалы:
Помогла ли вам статья?
Да
Нет
Статья оказалась полезной для 0 человек
Помогла ли вам статья?
Да
Нет
Статья оказалась полезной для 0 человек
- Печать
Страницы: [1] Вниз
Тема: Как сконвертировать PDF в docrtfodt (Прочитано 6470 раз)
0 Пользователей и 1 Гость просматривают эту тему.
YURAS_
Нужно перегнать книжку з ПДФа в обычный текстовый документ — док, ртф, одт (не тхт ). Какую софтину посоветуете? Желательно з ГУИ на ГТК+. Заранее спасибо.
aliftin
А OpenOffice разве этого не умеет? PDF editor, но он может только в txt или xml.
Если мы не можем до чего то дотянуться, мы виним в этом не свой рост, не отсутствие табуретки, а свою цель.
kostryukov
а может чтонибудь консольное есть?
aliftin
Если мы не можем до чего то дотянуться, мы виним в этом не свой рост, не отсутствие табуретки, а свою цель.
YURAS_
Кажется еще есть консольные — pdf2djvu
Из огня да в полымья)
Пользователь решил продолжить мысль 12 Сентября 2009, 20:37:19:
А OpenOffice разве этого не умеет?
Вроди не умеет.
Пользователь решил продолжить мысль 12 Сентября 2009, 22:39:00:
Ну тут еще говорят что то умеет http://www.accesspdf.com/pdftk/.
Судя по описанию — не умеет.
« Последнее редактирование: 12 Сентября 2009, 22:39:00 от YURAS_ »
kostryukov
А OpenOffice разве этого не умеет?
Вроди не умеет.
разве?)
aptitude search pdf
i ooobasis3.1-extension-pdf-import - PDF import extension for OpenOffice.org 3.1
pdftohtml
pdftotext
timur73_73
Foxit reader + OpenOffice (в первом выделить весь текст, во второй вставить и сохранить в формате doc)
Runtu 14.04.2 LTS х64, XFCE 4, 2x Intel(R) Core(TM)2 Duo CPU E6550 2.33GHz, RAM 4Gb, GeForce 210/PCIe/SSE2 512Mb
aliftin
AbiWord умеет это делать, но без картинок, только текст.
Если мы не можем до чего то дотянуться, мы виним в этом не свой рост, не отсутствие табуретки, а свою цель.
BMJ
AbiWord действительно импортировал из ПДФ, однако в очень непонятной кодировке.
ОпенОфис тоже импортировал, но только разметку документа (линии). Текст потерялся.
Кажется, что реально на это способен только ФайнРидер!
YURAS_
Всем спасибо. Юзал расширение для ОпенОфис.
- Печать
Страницы: [1] Вверх