Read works files in word


Download Article


Download Article

When your originally used your computer, did you always write your documents in Microsoft Works? But now that Microsoft Word is more readily available and Microsoft Works is in a drastic decline, have you found that you need these files still? There is a way to convert them over to Word format. Use these steps to know how-to convert them to Word format.

Steps

  1. Image titled Convert Microsoft Works to Microsoft Word Step 1

    1

    Open up Microsoft Word with a new document present.

  2. Image titled Convert Microsoft Works to Microsoft Word Step 2

    2

    Use the process you normally use to open any documents you have saved.

    Advertisement

  3. Image titled Convert Microsoft Works to Microsoft Word Step 3

    3

    Insert the drive and browse to folder of the file you need to convert.

  4. Image titled Convert Microsoft Works to Microsoft Word Step 4

    4

    Click the drop-down arrow of the tab known as «Files of type» (as in the 2003 version of Word). You’ll need to locate where it says Microsoft Works (or something real close to that).

  5. Image titled Convert Microsoft Works to Microsoft Word Step 5

    5

    Click this option (Microsoft Works). Your file should now be displayed.

  6. Image titled Convert Microsoft Works to Microsoft Word Step 6

    6

    Double-click your file.

  7. Image titled Convert Microsoft Works to Microsoft Word Step 7

    7

    Save the file as a new Microsoft Word document. Use the Save-as method to save your file.

  8. Advertisement

Ask a Question

200 characters left

Include your email address to get a message when this question is answered.

Submit

Advertisement

Thanks for submitting a tip for review!

Things You’ll Need

  • Microsoft Word program
  • Media with the Microsoft Works files stored on them
  • Computer mouse and keyboard

About This Article

Thanks to all authors for creating a page that has been read 82,852 times.

Is this article up to date?

Содержание

  • Способ 1: Word
  • Способ 2: LibreOffice
  • Способ 3: OpenOffice
  • Способ 4: WordPad
  • Способ 5: AlReader
  • Способ 6: ICE Book Reader
  • Способ 7: Calibre
  • Способ 8: Universal Viewer
  • Вопросы и ответы

Формат DOCX

DOCX – это текстовый формат серии электронных форматов Office Open XML. С ним, в первую очередь, манипулируют текстовые процессоры. Работу с ним также поддерживают некоторые «читалки» и другой софт.

Способ 1: Word

Учитывая, что DOCX – это разработка компании Microsoft, которая является базовым форматом для приложения Word, начиная с версии 2007 года, начнем наш обзор именно с этой программы. Названное приложение поддерживает абсолютно все стандарты указанного формата, умеет просматривать документы DOCX, создавать их, редактировать и сохранять.

Скачать Microsoft Word

  1. Запустите Word. Переместитесь в раздел «Файл».
  2. Переход во вкладку Файл в программе Microsoft Word

  3. В боковом меню сделайте щелчок по «Открыть».
    Переход в окно открытия документа в программе Microsoft Word

    Вместо двух вышеуказанных шагов можно оперировать сочетанием Ctrl+O.

  4. Вслед за запуском инструмента открытия выполните передвижение в тот каталог винчестера, где локализован искомый текстовый элемент. Обозначьте его и кликните «Открыть».
  5. Окно открытия документа в программе Microsoft Word

  6. Содержимое показано через графическую оболочку Ворд.

Документ DOCX открыт в программе Microsoft Word

Существует и более легкий вариант открытия DOCX в Word. Если на ПК инсталлирован Microsoft Office, то данное расширение автоматически будет ассоциироваться с программой Ворд, если, конечно, вы вручную не зададите иные настройки. Поэтому достаточно перейти к объекту указанного формата в Проводнике Windows и произвести по нему клик мышью, сделав это дважды левой кнопкой.

Открытие файла DOCX в окне Проводника Windows с помощью программы Microsoft Word

Данные рекомендации подойдут только в том случае, если у вас установлена версия Word 2007 или более новая. А вот ранние версии по умолчанию открывать DOCX не умеют, так как были созданы раньше, чем появился данный формат. Но все-таки существует возможность сделать так, чтобы и приложения старых версий могли запускать файлы с указанным расширением. Для этого просто нужно установить специальный патч в виде пакета совместимости.

Подробнее: Как открыть DOCX в MS Word 2003

Способ 2: LibreOffice

В офисном продукте LibreOffice также есть приложение, умеющее работать с изучаемым форматом. Имя ему — Writer.

Скачать LibreOffice бесплатно

  1. Перейдя в стартовую оболочку пакета, сделайте щелчок по «Открыть файл». Эта надпись расположена в боковом меню.
    Переход в окно открытия файла через боковое меню в стартовом окне LibreOffice

    Lumpics.ru

    Если вы привыкли пользоваться горизонтальным меню, то последовательно щелкните по наименованиям «Файл» и «Открыть…».

    Переход в окно открытия файла через верхнее горизонтальное меню в стартовом окне LibreOffice

    Для любителей использовать горячие клавиши тоже имеется свой вариант: наберите Ctrl+O.

  2. Все три названных действия приведут к открытию инструмента запуска документа. В окне произведите перемещение в ту область винчестера, в которой помещен искомый файл. Обозначьте этот объект и сделайте щелчок по «Открыть».
  3. Окно открытия файла в программе LibreOffice

  4. Содержимое документа предстанет перед пользователем через оболочку Writer.

Документ DOCX открыт в программе LibreOffice Writer

Запустить файловый элемент с изучаемым расширением можно, перетянув объект из Проводника в стартовую оболочку LibreOffice. Данную манипуляцию следует производить с зажатой левой кнопкой мыши.

Перетягивание документа DOCX из окна Проводника Windows в окно программы LibreOffice

В случае, если вы уже запустили Writer, то можно выполнить процесс открытия и через внутреннюю оболочку данной программы.

  1. Сделайте щелчок по пиктограмме «Открыть», которая имеет форму папки и размещена на панели с инструментами.
    Переход в окно открытия файла через иконку на панели инструментов в программе LibreOffice Writer

    Если вы привыкли выполнять операции через горизонтальное меню, то вам подойдет последовательное нажатие пунктов «Файл» и «Открыть».

    Переход в окно открытия файла через верхнее горизонтальное меню в программе LibreOffice Writer

    Можно применить также Ctrl+O.

  2. Данные манипуляции приведут к открытию инструмента запуска объекта, дальнейшие операции в котором были уже описаны ранее при рассмотрении вариантов запуска через стартовую оболочку ЛибреОфис.

Окно открытия файла в программе LibreOffice Writer

Способ 3: OpenOffice

Конкурентом LibreOffice считается OpenOffice. В нем также имеется собственный текстовый процессор, который тоже называется Writer. Только в отличие от двух ранее описанных вариантов, с его помощью можно просматривать и изменять содержимое DOCX, но сохранение придется выполнять в другом формате.

Скачать OpenOffice бесплатно

  1. Запустите стартовую оболочку пакета. Щелкните по наименованию «Открыть…», располагающемуся в центральной области.
    Переход в окно открытия файла через кнопку в стартовом окне OpenOffice

    Можете проделать процедуру открытия и через верхнее меню. Для этого щелкните в нем по наименованию «Файл». Далее перейдите по «Открыть…».

    Переход в окно открытия файла через верхнее горизонтальное меню в стартовом окне OpenOffice

    Можно для запуска инструмента открытия объекта воспользоваться привычной комбинацией Ctrl+O.

  2. Какое бы действие из вышеописанных вы не избрали, оно приведет к активации инструмента запуска объекта. Переместитесь в этом окне в ту директорию, где помещен DOCX. Обозначьте объект и щелкайте «Открыть».
  3. Окно открытия файла в программе OpenOffice

  4. Документ будет отображен в ОупенОфис Writer.

Документ DOCX открыт в программе OpenOffice

Как и при использовании предыдущего приложения, вы можете перетянуть в стартовую оболочку OpenOffice нужный объект из Проводника.

Перетягивание документа DOCX из окна Проводника Windows в стартовое окно программы OpenOffice

Запуск объекта, имеющего расширение DOCX, также можно произвести вслед за запуском Writer.

  1. Для активации окна запуска объекта щелкните по значку «Открыть». Он имеет форму папки и расположен на панели с инструментами.
    Переход в окно открытия файла через иконку на панели инструментов в программе OpenOffice Writer

    Для указанной цели можно воспользоваться и меню. Сделайте щелчок по «Файл», а затем перейдите по «Открыть…».

    Переход в окно открытия файла через верхнее горизонтальное меню в программе OpenOffice Writer

    Как вариант используйте сочетание Ctrl+O.

  2. Любое из трех указанных действий инициирует активацию инструмента запуска объекта. Операции в нем нужно выполнять по тому же алгоритму, который был описан для способа с запуском документа через стартовую оболочку.

Окно открытия файла в программе OpenOffice Writer

В целом нужно отметить, что из всех изученных тут текстовых процессоров, OpenOffice Writer менее всего подходит для работы с DOCX, так как не умеет создавать документы с таким расширением.

Способ 4: WordPad

Изучаемый формат умеют запускать и отдельные текстовые редакторы. Например, это может сделать встроенная программа Windows — WordPad.

  1. Для того, чтобы активировать ВордПад, выполните клик по кнопке «Пуск». Переместитесь по самой нижней надписи в меню – «Все программы».
  2. Переход в раздел всех программ через меню Пуск

  3. В открывшемся списке выберите папку «Стандартные». В ней представлен список стандартных программ Windows. Найдите и дважды кликните в нем по наименованию «WordPad».
  4. Запуск программы WordPad через меню Пуск

  5. Приложение WordPad запущено. Для того, чтобы перейти к открытию объекта, произведите щелчок по пиктограмме слева от наименования раздела «Главная».
  6. Переход к запуску меню в программе WordPad

  7. В запустившемся меню нажмите «Открыть».
  8. Переход в окно открытия документа в программе WordPad

  9. Запустится обычный инструмент открытия документов. Использовав его, выполните перемещение к той директории, где помещен текстовый объект. Обозначьте этот элемент и жмите «Открыть».
  10. Окно открытия документа в программе WordPad

  11. Документ будет запущен, но в верхней части окна появится сообщение о том, что ВордПад поддерживает не все возможности DOCX и часть контента может быть утрачена или отображаться некорректно.

Документ DOCX открыт в программе WordPad

Учитывая все вышеприведенные обстоятельства, нужно сказать, что использование WordPad для просмотра, а тем более редактирования содержимого DOCX является менее предпочтительным, чем эксплуатация для этих целей описанных в предыдущих способах полноценных текстовых процессоров.

Способ 5: AlReader

Поддерживают просмотр изучаемого формата и некоторые представители софта для прочтения электронных книг («читалки»). Правда, пока что указанная функция присутствует далеко не у всех программ данной группы. Читать DOCX можно, например, при помощи «читалки» AlReader, которая отличается очень большим количеством поддерживаемых форматов.

Скачать AlReader бесплатно

  1. Вслед за открытием AlReader, активировать окно запуска объекта можно через горизонтальное или контекстное меню. В первом случае щелкните «Файл», а затем в раскрывшемся перечне переместитесь по «Открыть файл».
    Переход в окно открытия файла через верхнее горизонтальное меню в программе AlReader

    Во втором случае в любом месте окна произведите щелчок правой кнопки мыши. Запускается перечень действий. В нем следует выбрать вариант «Открыть файл».

    Переход в окно открытия файла через контекстное меню в программе AlReader

    Открытие окна с помощью горячих клавиш в AlReader не работает.

  2. Инструмент открытия книги запущен. Он имеет не совсем привычную форму. Перейдите в данном окошке в ту директорию, где локализирован объект DOCX. Требуется произвести обозначение и нажать «Открыть».
  3. Окно открытия файла в программе AlReader

  4. Вслед за этим книга будет запущена через оболочку AlReader. Данное приложение прекрасно читает форматирование указанного формата, но отображает данные не в обычном виде, а в приспособленном для прочтения книг.

Документ DOCX открыт в программе AlReader

Открытие документа можно произвести и путем перетягивания из Проводника в графическую оболочку «читалки».

Перетягивание документа DOCX из окна Проводника Windows в стартовое окно программы AlReader

Конечно, читать книги формата DOCX приятнее в AlReader, чем в текстовых редакторах и процессорах, но указанное приложение предлагает лишь возможность прочтения документа и конвертацию в ограниченное количество форматов (TXT, PDB и HTML), но не имеет инструментов для внесения изменений.

Способ 6: ICE Book Reader

Еще одна «читалка», с помощью которой можно читать DOCX — ICE Book Reader. Но процедура запуска документа в этом приложении будет несколько сложнее, так как она связана с задачей добавления объекта в библиотеку программы.

Скачать ICE Book Reader бесплатно

  1. Вслед за запуском Book Reader автоматически откроется окно библиотеки. Если оно не открылось, то произведите щелчок по значку «Библиотека» на панели инструментов.
  2. Переход в библиотеку в программе ICE Book Reader

  3. Вслед за открытием библиотеки жмите на значок «Импортировать текст из файла» в форме пиктограммы «+».
    Переход к открытию окна импорта в библиотеке через значок на панели инструментов в программе ICE Book Reader

    Вместо этого действия можно произвести следующую манипуляцию: кликните «Файл», а затем «Импортировать текст из файла».

  4. Переход к открытию окна импорта в библиотеке через верхнее горизонтальное меню в программе ICE Book Reader

  5. Открывается инструмент импорта книги в виде окна. Перейдите в нем в тот каталог, где локализован текстовый файл изучаемого формата. Обозначьте его и кликните «Открыть».
  6. Окно импорта книги в программе ICE Book Reader

  7. После данного действия окно импорта будут закрыто, а наименование и полный путь к выбранному объекту появится в списке библиотеки. Чтобы запустить документ через оболочку Book Reader, обозначьте добавленный элемент в списке и жмите Enter. Либо кликните по нему мышью два раза левой кнопкой.
    Открытие документа в библиотеке в программе ICE Book Reader

    Существует и иной вариант прочитать документ. Обозначьте наименование элемента в списке библиотеки. Кликните «Файл» в меню, а затем «Читать книгу».

  8. Открытие документа в библиотеке через верхнее горизонтальное меню в программе ICE Book Reader

  9. Документ будет открыт через оболочку Book Reader с присущими программе особенностями воспроизведения форматирования.

Документ DOCX открыт в программе ICE Book Reader

В программе можно только читать документ, но не редактировать.

Способ 7: Calibre

Ещё более мощной читалкой с функцией каталогизации книг является Calibre. Она также умеет оперировать с DOCX.

Скачать Calibre бесплатно

  1. Произведите запуск Calibre. Кликните по кнопке «Добавить книги», расположенной в верхней области окна.
  2. Переход в окно добавления книги в программе Calibre

  3. Это действие вызывает инструмент «Выбрать книги». С его помощью нужно отыскать на винчестере целевой объект. Вслед за тем, как он обозначен, жмите «Открыть».
  4. Окно выбрать книги в программе Calibre

  5. Программа выполнит процедуру добавления книги. Вслед за этим её наименование и основная информация о ней отобразится в главном окне Calibre. Для того, чтобы запустить документ, нужно щелкнуть дважды левой клавишей мышки по наименованию или, обозначив его, нажать на кнопку «Просмотр» в верхней части графической оболочки программы.
  6. Переход к открытию книги в программе Calibre

  7. Вслед за данным действием документ запустится, но открытие будет выполнено с помощью Microsoft Word или другого приложения, которое назначено по умолчанию для открытия DOCX на данном компьютере. Учитывая тот факт, что открыт будет не оригинал документа, а его импортированная в Calibre копия, то ему будет присвоено автоматически другое название (допускается только латиница). Под этим названием объект и будет отображен в Word или иной программе.

Документ DOCX импортированный в Calibre открыт в программе Microsoft Office

В целом Calibre больше подходит для каталогизации объектов DOCX, а не для быстрого их просмотра.

Способ 8: Universal Viewer

Документы с расширением DOCX можно также просмотреть с помощью отдельной группы программ, которые являются универсальными просмотрщиками. Эти приложения позволяют просмотреть файлы разнообразнейшего направления: текст, таблицы, видео, изображения и т.д. Но, как правило, по возможностям работы с конкретным форматам они уступают узкоспециализированным программам. Это в полной мере справедливо и для DOCX. Одним из представителей данного типа софта является Universal Viewer.

Скачать Universal Viewer бесплатно

  1. Выполните запуск Универсал Вьювер. Для активации инструмента открытия можно выполнить любое из следующих действий:
  2. Каждое из указанных действий приведет к запуску инструмента открытия объекта. В нем вам придется переместиться в тот каталог, где расположен объект, являющийся целью манипуляций. Вслед за выделением вам следует щелкнуть «Открыть».
  3. Окно открытия файла в программе Universal Viewer

  4. Документ будет открыт через оболочку приложения Универсал Вьювер.
  5. Документ DOCX открыт в программе Universal Viewer

    Ещё более легкий вариант открыть файл заключается в перемещении из Проводника в окошко Универсал Вьювер.

    Перетягивание документа DOCX из окна Проводника Windows в стартовое окно программы Universal Viewer

    Но, как и программы для чтения, универсальный просмотрщик позволяет только просмотреть содержимое DOCX, а не редактировать.

Как видим, в настоящее время обрабатывать файлы формата DOCX способно довольно большое количество приложений разных направлений, работающих с текстовыми объектами. Но, несмотря на такое обилие, полностью все возможности и стандарты формата поддерживает только Microsoft Word. Его бесплатный аналог LibreOffice Writer тоже имеет практически полный набор для обработки данного формата. А вот текстовый процессор OpenOffice Writer позволит только читать и вносить изменения в документ, но сохранять данные придется в другом формате.

Если же файл DOCX представляет собой электронную книгу, то удобно её будет читать с помощью «читалки» AlReader. Для внесения книги в библиотеку подойдут программы ICE Book Reader или Calibre. Если вы просто хотите просмотреть, что находится внутри документа, то для этих целей можно воспользоваться универсальным просмотрщиком Universal Viewer. Встроенный в Виндовс текстовый редактор ВордПад позволит просмотреть содержимое, не устанавливая стороннего программного обеспечения.

В этой статье вы узнаете, как в Python считывать и записывать файлы MS Word.

  • Установка библиотеки Python-Docx
  • Чтение файлов MS Word с помощью модуля Python-Docx
  • Чтение параграфов
  • Чтение прогонов
  • Написание файлов MS Word с помощью модуля Python-Docx
  • Запись абзацев
  • Запись прогонов
  • Запись заголовков
  • Добавление изображений
  • Заключение

Существует несколько библиотек, которые можно использовать для чтения и записи в Python файлов MS Word. Мы будем использовать модуль python-docx .

Выполните приведенную ниже pip команду в терминале, чтобы загрузить модуль python-docx:

$ pip install python-docx

Создайте новый файл MS Word и переименуйте его в my_word_file.docx. Я сохранил файл в корне диска E. Файл my_word_file.docx должен иметь следующее содержимое

Чтение файлов MS Word с помощью модуля Python-Docx

Чтобы считать указанный файл, импортируйте модуль docx, а затем создайте объект класса Document из модуля docx. Затем передайте путь к файлу my_word_file.docx в конструктор класса Document:

import docx

doc = docx.Document("E:/my_word_file.docx")

Объект doc класса Document теперь можно использовать для чтения содержимого файла my_word_file.docx.

С помощью объекта класса Document и пути к файлу можно получить доступ ко всем абзацам документа с помощью атрибута paragraphs. Пустая строка также читается как абзац.

Извлечем все абзацы из файла my_word_file.docx и затем отобразим общее количество абзацев документа:

all_paras = doc.paragraphs
len(all_paras)

Вывод:

Теперь поочередно выведем все абзацы, присутствующие в файле my_word_file.docx:

for para in all_paras:
    print(para.text)
    print("-------")

Вывод:

-------
Introduction
-------

-------
Welcome to stackabuse.com
-------
The best site for learning Python and Other Programming Languages
-------
Learn to program and write code in the most efficient manner
-------

-------
Details
-------

-------
This website contains useful programming articles for Java, Python, Spring etc.
-------

Вывод демонстрирует все абзацы, присутствующие в файле my_word_file.docx.

Также можно получить доступ к определенному абзацу, индексируя свойство paragraphs как массив. Давайте выведем пятый абзац в файле:

single_para = doc.paragraphs[4]
print(single_para.text)

Вывод:

The best site for learning Python and Other Programming Languages

Прогон в текстовом документе представляет собой непрерывную последовательность слов, имеющих схожие свойства. Например, одинаковые размеры шрифта, формы шрифта и стили шрифта.

Вторая строка файла my_word_file.docx содержит текст «Welcome to stackabuse.com». Слова «Welcome to» написаны простым шрифтом, а текст «stackabuse.com» — жирным. Следовательно, текст «Welcome to» считается одним прогоном, а текст, выделенный жирным шрифтом «stackabuse.com», считается другим прогоном.

Чтобы получить все прогоны в абзаце, можно использовать свойство run атрибута paragraphобъекта doc.

Считаем все прогоны из абзаца №5 (четвертый указатель) в тексте:

single_para = doc.paragraphs[4]
for run in single_para.runs:
    print(run.text)

Вывод:

The best site for
learning Python
 and Other
Programming Languages

Аналогичным образом приведенный ниже скрипт выводит все прогоны из 6-го абзаца файла my_word_file.docx:

second_para = doc.paragraphs[5]
for run in second_para.runs:
    print(run.text)

Вывод:

Learn to program and write code in the
most efficient manner

Чтобы записать файлы MS Word, создайте объект класса Document с пустым конструктором.

Для записи абзацев используйте метод add_paragraph() объекта класса Document. После добавления абзаца нужно вызвать метод save(). Путь к файлу, в который нужно записать абзац, передается в качестве параметра методу save(). Если файл не существует, то будет создан новый файл. Иначе абзац будет добавлен в конец существующего файла MS Word.

Приведенный ниже скрипт записывает простой абзац во вновь созданный файл my_written_file.docx.

mydoc.add_paragraph("This is first paragraph of a MS Word file.")
mydoc.save("E:/my_written_file.docx")

После выполнения этого скрипта вы должны увидеть новый файл my_written_file.docx в каталоге, который указали в методе save(). Внутри файла должен быть один абзац, который гласит: «This is first paragraph of a MS Word file.».

Добавим в файл my_written_file.docx еще один абзац:

mydoc.add_paragraph("This is the second paragraph of a MS Word file.")
mydoc.save("E:/my_written_file.docx")

Этот абзац будет добавлен в конец файла my_written_file.docx.

Вы также можете записать прогоны с помощью модуля python-docx. Для этого нужно создать дескриптор абзаца, к которому хотите добавить прогон:

third_para = mydoc.add_paragraph("This is the third paragraph.")
third_para.add_run(" this is a section at the end of third paragraph")
mydoc.save("E:/my_written_file.docx")

В приведенном выше скрипте записывается абзац с помощью метода add_paragraph()объекта mydoc класса Document. Метод add_paragraph() возвращает дескриптор для вновь добавленного пункта.

Чтобы добавить прогон к новому абзацу, необходимо вызвать метод add_run() для дескриптора абзаца. Текст прогона передается в виде строки в метод add_run(). Затем необходимо вызвать метод save() для создания фактического файла.

В файлы MS Word также можно добавлять заголовки. Для этого нужно вызвать метод add_heading(). Первым параметром метода add_heading() является текстовая строка для заголовка, а вторым – размер заголовка.

Приведенный ниже скрипт добавляет в файл my_written_file.docx три заголовка уровня 0, 1 и 2:

mydoc.add_heading("This is level 1 heading", 0)
mydoc.add_heading("This is level 2 heading", 1)
mydoc.add_heading("This is level 3 heading", 2)
mydoc.save("E:/my_written_file.docx")

Чтобы добавить в файлы MS Word изображения, используется метод add_picture(). Путь к изображению передается как параметр метода add_picture(). Также можно указать ширину и высоту изображения с помощью атрибута docx.shared.Inches().

Приведенный ниже скрипт добавляет изображение из локальной файловой системы в файл my_written_file.docx. Ширина и высота изображения будут 5 и 7 дюймов:

mydoc.add_picture("E:/eiffel-tower.jpg", width=docx.shared.Inches(5), height=docx.shared.Inches(7))
mydoc.save("E:/my_written_file.docx")

После выполнения всех скриптов, рассмотренных в этой статье, окончательный файл my_written_file.docx должен выглядеть следующим образом:

Добавление изображений

Он должен содержать три абзаца, три заголовка и одно изображение.

И этой статьи вы узнали, как читать и записывать файлы MS Word с помощью модуля python-docx.

Дайте знать, что вы думаете по этой теме материала в комментариях. Мы очень благодарим вас за ваши комментарии, лайки, отклики, дизлайки, подписки!

С помощью модуля python-docx можно создавать и изменять документы MS Word с расширением .docx. Чтобы установить этот модуль, выполняем команду

> pip install python-docx

При установке модуля надо вводить python-docx, а не docx (это другой модуль). В то же время при импортировании модуля python-docx следует использовать import docx, а не import python-docx.

Чтение документов MS Word

Файлы с расширением .docx обладают развитой внутренней структурой. В модуле python-docx эта структура представлена тремя различными типами данных. На самом верхнем уровне объект Document представляет собой весь документ. Объект Document содержит список объектов Paragraph, которые представляют собой абзацы документа. Каждый из абзацев содержит список, состоящий из одного или нескольких объектов Run, представляющих собой фрагменты текста с различными стилями форматирования.

import docx

doc = docx.Document('example.docx')

# количество абзацев в документе
print(len(doc.paragraphs))

# текст первого абзаца в документе
print(doc.paragraphs[0].text)

# текст второго абзаца в документе
print(doc.paragraphs[1].text)

# текст первого Run второго абзаца
print(doc.paragraphs[1].runs[0].text)
6
Название документа
Простой абзац с жирным и курсивным текстом
Простой абзац с 

Получаем весь текст из документа:

text = []
for paragraph in doc.paragraphs:
    text.append(paragraph.text)
print('n'.join(text))
Название документа
Простой абзац с жирным и курсивным текстом
Заголовок, уровень 1
Выделенная цитата
Первый элемент маркированного списка
Первый элемент нумерованного списка

Стилевое оформление

В документах MS Word применяются два типа стилей: стили абзацев, которые могут применяться к объектам Paragraph, стили символов, которые могут применяться к объектам Run. Как объектам Paragraph, так и объектам Run можно назначать стили, присваивая их атрибутам style значение в виде строки. Этой строкой должно быть имя стиля. Если для стиля задано значение None, то у объекта Paragraph или Run не будет связанного с ним стиля.

Стили абзацев

  • Normal
  • Body Text
  • Body Text 2
  • Body Text 3
  • Caption
  • Heading 1
  • Heading 2
  • Heading 3
  • Heading 4
  • Heading 5
  • Heading 6
  • Heading 7
  • Heading 8
  • Heading 9
  • Intense Quote
  • List
  • List 2
  • List 3
  • List Bullet
  • List Bullet 2
  • List Bullet 3
  • List Continue
  • List Continue 2
  • List Continue 3
  • List Number
  • List Number 2
  • List Number 3
  • List Paragraph
  • Macro Text
  • No Spacing
  • Quote
  • Subtitle
  • TOCHeading
  • Title

Стили символов

  • Emphasis
  • Strong
  • Book Title
  • Default Paragraph Font
  • Intense Emphasis
  • Subtle Emphasis
  • Intense Reference
  • Subtle Reference
paragraph.style = 'Quote'
run.style = 'Book Title'

Атрибуты объекта Run

Отдельные фрагменты текста, представленные объектами Run, могут подвергаться дополнительному форматированию с помощью атрибутов. Для каждого из этих атрибутов может быть задано одно из трех значений: True (атрибут активизирован), False (атрибут отключен) и None (применяется стиль, установленный для данного объекта Run).

  • bold — Полужирное начертание
  • underline — Подчеркнутый текст
  • italic — Курсивное начертание
  • strike — Зачеркнутый текст

Изменим стили для всех параграфов нашего документа:

import docx

doc = docx.Document('example.docx')

# изменяем стили для всех параграфов
for paragraph in doc.paragraphs:
    paragraph.style = 'Normal'

doc.save('restyled.docx')

А теперь восстановим все как было:

import docx

os.chdir('C:\example')

doc1 = docx.Document('example.docx')
doc2 = docx.Document('restyled.docx')

# получаем из первого документа стили всех абзацев
styles = []
for paragraph in doc1.paragraphs:
    styles.append(paragraph.style)

# применяем стили ко всем абзацам второго документа
for i in range(len(doc2.paragraphs)):
    doc2.paragraphs[i].style = styles[i]

doc2.save('restored.docx')

Изменим форматирвание объектов Run второго абзаца:

import docx

doc = docx.Document('example.docx')

# добавляем стиль символов для runs[0]
doc.paragraphs[1].runs[0].style = 'Intense Emphasis'
# добавляем подчеркивание для runs[4]
doc.paragraphs[1].runs[4].underline = True

doc.save('restyled2.docx')

Запись докуменов MS Word

Добавление абзацев осуществляется вызовом метода add_paragraph() объекта Document. Для добавления текста в конец существующего абзаца, надо вызвать метод add_run() объекта Paragraph:

import docx

doc = docx.Document()

# добавляем первый параграф
doc.add_paragraph('Здравствуй, мир!')

# добавляем еще два параграфа
par1 = doc.add_paragraph('Это второй абзац.')
par2 = doc.add_paragraph('Это третий абзац.')

# добавляем текст во второй параграф
par1.add_run(' Этот текст был добавлен во второй абзац.')

# добавляем текст в третий параграф
par2.add_run(' Добавляем текст в третий абзац.').bold = True

doc.save('helloworld.docx')

Оба метода, add_paragraph() и add_run() принимают необязательный второй аргумент, содержащий строку стиля, например:

doc.add_paragraph('Здравствуй, мир!', 'Title')

Добавление заголовков

Вызов метода add_heading() приводит к добавлению абзаца, отформатированного в соответствии с одним из возможных стилей заголовков:

doc.add_heading('Заголовок 0', 0)
doc.add_heading('Заголовок 1', 1)
doc.add_heading('Заголовок 2', 2)
doc.add_heading('Заголовок 3', 3)
doc.add_heading('Заголовок 4', 4)

Аргументами метода add_heading() являются строка текста и целое число от 0 до 4. Значению 0 соответствует стиль заголовка Title.

Добавление разрывов строк и страниц

Чтобы добавить разрыв строки (а не добавлять новый абзац), нужно вызвать метод add_break() объекта Run. Если же требуется добавить разрыв страницы, то методу add_break() надо передать значение docx.enum.text.WD_BREAK.PAGE в качестве единственного аргумента:

import docx

doc = docx.Document()

doc.add_paragraph('Это первая страница')
doc.paragraphs[0].runs[0].add_break(docx.enum.text.WD_BREAK.PAGE)
doc.add_paragraph('Это вторая страница')

doc.save('pages.docx')

Добавление изображений

Метод add_picture() объекта Document позволяет добавлять изображения в конце документа. Например, добавим в конец документа изображение kitten.jpg шириной 10 сантиметров:

import docx

doc = docx.Document()

doc.add_paragraph('Это первый абзац')
doc.add_picture('kitten.jpg', width = docx.shared.Cm(10))

doc.save('picture.docx')

Именованные аргументы width и height задают ширину и высоту изображения. Если их опустить, то значения этих аргументов будут определяться размерами самого изображения.

Добавление таблицы

import docx

doc = docx.Document()

# добавляем таблицу 3x3
table = doc.add_table(rows = 3, cols = 3)
# применяем стиль для таблицы
table.style = 'Table Grid'

# заполняем таблицу данными
for row in range(3):
    for col in range(3):
        # получаем ячейку таблицы
        cell = table.cell(row, col)
        # записываем в ячейку данные
        cell.text = str(row + 1) + str(col + 1)

doc.save('table.docx')

import docx

doc = docx.Document('table.docx')

# получаем первую таблицу в документе
table = doc.tables[0]

# читаем данные из таблицы
for row in table.rows:
    string = ''
    for cell in row.cells:
        string = string + cell.text + ' '
    print(string)
11 12 13 
21 22 23 
31 32 33 

Дополнительно

  • Документация python-docx

Поиск:
MS • Python • Web-разработка • Word • Модуль

Каталог оборудования

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Производители

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Функциональные группы

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Понравилась статья? Поделить с друзьями:
  • Read word to html
  • Read the word document
  • Read word on android
  • Read word files python
  • Read the word combinations перевод 5 класс