Форматы текстовых файлов для word

From Wikipedia, the free encyclopedia

The following is a list of filename extensions used by programs in the Microsoft Office suite.

Word[edit]

Legacy
Legacy filename extensions denote binary Microsoft Word formatting that became outdated with the release of Microsoft Office 2007. Although the latest version of Microsoft Word can still open them, they are no longer developed. Legacy filename extensions include:
  • .doc – Legacy Word document; Microsoft Office refers to them as «Microsoft Word 97 – 2003 Document»
  • .dot – Legacy Word templates; officially designated «Microsoft Word 97 – 2003 Template»
  • .wbk – Legacy Word document backup; referred as «Microsoft Word Backup Document»
OOXML
Office Open XML (OOXML) format was introduced with Microsoft Office 2007 and became the default format of Microsoft Word ever since. Pertaining file extensions include:
  • .docx – Word document
  • .docm – Word macro-enabled document; same as docx, but may contain macros and scripts
  • .dotx – Word template
  • .dotm – Word macro-enabled template; same as dotx, but may contain macros and scripts
  • .docb – Word binary document introduced in Microsoft Office 2007
  • .pdf – PDF documents
  • .wll – Word add-in
  • .wwl – Word add-in

Excel[edit]

Legacy
Legacy filename extensions denote binary Microsoft Excel formats that became outdated with the release of Microsoft Office 2007. Although the latest version of Microsoft Excel can still open them, they are no longer developed. Legacy filename extensions include:
  • .xls – Legacy Excel worksheets; officially designated «Microsoft Excel 97-2003 Worksheet»
  • .xlt – Legacy Excel templates; officially designated «Microsoft Excel 97-2003 Template»
  • .xlm – Legacy Excel macro
  • .xll_ – Excel 4 for Mac add-in
  • .xla_ — Excel 4 for Mac add-in
  • .xla5 – Excel 5 for Mac add-in
  • .xla8 – Excel 98 for Mac add-in
OOXML
Office Open XML (OOXML) format was introduced with Microsoft Office 2007 and became the default format of Microsoft Excel ever since. Excel-related file extensions of this format include:
  • .xlsx – Excel workbook
  • .xlsm – Excel macro-enabled workbook; same as xlsx but may contain macros and scripts
  • .xltx – Excel template
  • .xltm – Excel macro-enabled template; same as xltx but may contain macros and scripts
Other formats
Microsoft Excel uses dedicated file formats that are not part of OOXML, and use the following extensions:
  • .xlsb – Excel binary worksheet (BIFF12)
  • .xla – Excel add-in that can contain macros
  • .xlam – Excel macro-enabled add-in
  • .xll – Excel XLL add-in; a form of DLL-based add-in[1]
  • .xlw – Excel work space; previously known as «workbook»

PowerPoint[edit]

Legacy

  • .ppt – Legacy PowerPoint presentation
  • .pot – Legacy PowerPoint template
  • .pps – Legacy PowerPoint slideshow
  • .ppa – PowerPoint (2007?) add-in
  • .ppam – PowerPoint 2007 add-in with macros enabled

OOXML

  • .pptx – PowerPoint presentation
  • .pptm – PowerPoint macro-enabled presentation
  • .potx – PowerPoint template
  • .potm – PowerPoint macro-enabled template
  • .ppam – PowerPoint add-in
  • .ppsx – PowerPoint slideshow
  • .ppsm – PowerPoint macro-enabled slideshow
  • .sldx – PowerPoint slide
  • .sldm – PowerPoint macro-enabled slide
  • .pa – PowerPoint add-in

Access[edit]

Microsoft Access 2007 introduced new file extensions:

  • .ACCDA – Access add-in file
  • .ACCDB – The file extension for the new Office Access 2007 file format. This takes the place of the MDB file extension.
  • .ACCDE – The file extension for Office Access 2007 files that are in «execute only» mode. ACCDE files have all Visual Basic for Applications (VBA) source code hidden. A user of an ACCDE file can only execute VBA code, but not view or modify it. ACCDE takes the place of the MDE file extension.
  • .ACCDT – The file extension for Access Database Templates.
  • .ACCDR – is a new file extension that enables you to open a database in runtime mode. By simply changing a database’s file extension from .accdb to .accdr, you can create a «locked-down» version of your Office Access database. You can change the file extension back to .accdb to restore full functionality.
  • .ACCDU – Access add-in file
  • .MDA – Access add-in file
  • .MDE – Access add-in file

OneNote[edit]

  • .one – OneNote export file

Outlook[edit]

  • .ecf – Outlook 2013+ add-in file

Billing[2][edit]

Publisher[edit]

  • .pub – a Microsoft Publisher publication

XPS Document

  • .xps – a XML-based document format used for printing (on Windows Vista and later) and preserving documents.

See also[edit]

  • Microsoft Office
  • Microsoft Office XML formats
  • Filename extension
  • Alphabetical list of file extensions
  • Office Open XML

External links[edit]

  • Introducing the Microsoft Office (2007) Open XML File Formats
  • Introduction to new file-name extensions

References[edit]

  1. ^ «Excel 2007 XLL Software Development Kit Documentation». MSDN. Microsoft. Retrieved 4 June 2013.
  2. ^ Stross, Randall (2014). Planet google : one company’s audacious plan to organize everything we know. Free Press. ISBN 978-1-4165-8047-8. OCLC 893105047.

__NO

Создание и сохранение документа Word
Создание и сохранение документа Word

Создание документа

Для того, чтобы создать новый документ, в программе Word необходимо перейти:

Файл – Создать

При этом вы можете выбрать как пустой документ, так и документ по заранее подготовленному шаблону. Список шаблонов отобразится на экране.

Word2016_sozdanie-documenta-word_sreda31

Помимо предложенных шаблонов вы можете выбрать одну из категорий, для того, чтобы увидеть больше шаблонов в этой категории: Наборы макетов, Бизнес, Личное, Календари, Карточки, Событие, Образование.

Нажав на одну из этих категорий вы откроете ее. Кроме того, справа отобразится полный перечень возможных категорий.

Word2016_kategorii-shablonov-word_sreda31

Для того, чтобы вернуться назад, необходимо нажать кнопку Домой около строки поиска.

Word2016_sozdanie-documenta-word-2_sreda31

Строкой поиска можно воспользоваться для того, чтобы быстро найти необходимый шаблон.

Открытие документов

Для того, чтобы открыть документ в Word необходимо перейти на вкладку Файл — Открыть.

word2016_otkrytie-dokumentov_sreda31
  • Последние — список последних открытых вами документов.
  • OneDrive — доступно при подключении учетной записи Microsoft. Позволяет открыть документы, сохраненные в облаке.
  • Этот компьютер — открытие документов, расположенных на вашем компьютере.
  • Добавление места — позволяет добавить облачные службы хранения данных.
  • Обзор — отобразит классическое окно для поиска и открытия файлов.

Сохранение документа

Для первоначального сохранения документа Word необходимо в меню выбрать: Файл — Сохранить как

word2016_sohranenie_sreda31

В левой части открывшегося окна необходимо выбрать место сохранения файла: по умолчанию файл сохраняется в папку, которая назначена в настройках, но можно сохранить документ на OneDrive либо в любом другом месте на компьютере.

В право части окна можно указать название файла и его формат.

Для выбора необходимой папки нажимаем Обзор или Дополнительные параметры, выбираем нужную папку и нажимаем Сохранить.

Для сохранения документа Word, которые был создан ранее, можно использовать описанный выше алгоритм либо  в меню выбрать: Файл — Сохранить. Документ будет сохранен в ту же папку, из которой он был открыт.

Форматы файлов Word

Word позволяет открывать и сохранять файлы в следующих форматах:

.docx Стандартный формат, используется по умолчанию.
.doc Устаревший формат. Использовался в версиях Word 1997-2004 гг.
Имеет ограниченную функциональность в сравнении с форматом .docx
Используется для совместимости со старыми версиями
.dotx Формат, используемый для сохранения шаблонов Word.
.dot Устаревший формат. Использовался для сохранения шаблонов   в версиях Word 1997-2004 гг.
.docm Формат, поддерживающий работу с макросами.
.dotm Формат, поддерживающий работу с макросами в шаблонах.
.pdf Сторонний формат.
.xps Текстовый формат, разработанный Microsoft. Функциональность ограничена.
.mht Формат, предназначенный для просмотра документа в Интернете.
.mhtml
.htm
.html
.rtf Сторонний формат, поддерживаемый различными разработчиками текстовых редакторов.   Функциональность ограничена по сравнению с форматами Word.
.txt Только текст без форматирования.
.xml Универсальный язык, поддерживающий разметку документов.
.odt Формат OpenOffice

Работа с PDF в Word

Word 2016 позволяет редактировать файлы формата .pdf

Из Word откройте pdf-файл:

Файл — Открыть

word2016_otkrytie-dokumentov_sreda31

После внесения изменений файл можно сохранить как в pdf, так и в формате word:

Файл — Сохранить как 

Восстановление несохраненных документов Word

Иногда стечение обстоятельств приводит к тому, что наши документы не сохраняются и мы теряем информацию.

В некоторых случаях эта проблема поправима.

Откройте вашу документ Word и перейдите в меню Файл — Сведения — Управление документов — Восстановить несохраненные документы.

Поле этого откроется папка, в которую Word сохраняет данные для последующего восстановления. Если какие-то данные были сохранены автоматически, вы увидите их в этой папке.

Также мы рекомендуем вам включить автосохранение. Сделать это можно в меню Файл — Параметры, раздел Сохранение. Можно указать интервал, через которые ваши документы будут сохраняться.

Расписание ближайших групп:

Загружаю…

Форматы документов Microsoft Word — от старого DOC до нового DOCX

Документ Microsoft Word представляет собой файл с расширением doc или docx. До 90-х годов XX века расширение doc использовалось для текстовых файлов, которые не содержат разметки. И сейчас можно убедиться, что файл такого типа легко создать с помощью, например, программы «Блокнот». Правда, он не будет иметь богатого форматирования, но легко открывается программой Ворд, в которой набранному в блокноте тексту можно придать более оформленный вид. Когда корпорация Майкрософт выпустила программу Ворд, разработчики решили использовать в ней расширение doc. К настоящему времени этот текстовый редактор является самым популярным в мире, поэтому файл с расширением doc ассоциируют с этим программным продуктом и называют просто «вордовский формат».

Что такое формат?

Старый формат DOC отличался сложным содержанием, и нормально читался только в MS Office

Старый формат DOC отличался сложным содержанием, и нормально читался только в MS Office

В отличие от других текстовых форматов этого же производителя, например, RTF (Rich Text Format File), внутреннее содержание doc более сложное и запутанное. В формате Word сохраняется не только символьная информация, но и различные объекты (например, схемы, диаграммы, формулы, сценарии). Разработчики используют закрытый код, в котором посторонний разобраться не сможет. Чтобы увидеть «внутренности», файл можно открыть, например, в блокноте. В RTF любопытствующий увидит стройные ряды данных, похожие на содержание кода интернет-страниц. Во втором случае — пугающую кашу из знаков самого разнообразного происхождения и вида. В отличие от зашифрованного документа Word, файл RTF не содержит непечатных бинарных символов, легко открывается во всех текстовых и даже графических редакторах. В то же время практически ни одна программа (кроме соответствующего продукта от компании Майкрософт) не обладает способностью адекватно открыть для просмотра и редактирования документ Word. Сейчас офисный пакет этой компании очень широко распространен и доступен любому пользователю.

Современные форматы «вордовских» документов

Даже бесплатные современные редакторы документов умеют корректно работать с DOCX

Даже бесплатные современные редакторы документов умеют корректно работать с DOCX

Кроме того, сложности могут возникнуть даже при использовании разных версий офисного пакета Майкрософт. Дело в том, что начиная с версии Word 2007 года документ по умолчанию сохраняется с расширением не doc, а docx. Поэтому если установлен пакет офиса, выпущенный ранее, то необходима конвертация для устаревших версий. Конверторы для обеспечения совместимости предлагаются самой компанией Майкрософт (Microsoft Office Compatibility Pack), так что обычно при открытии docx, например, в версии Ворд 2003, сложностей не возникает, но при этом может потеряться часть данных форматирования и возможностей редактирования.

Компания Майкрософт была вынуждена пойти на изменение формата Word под давлением международных организаций, которые требовали подвести его под какие-либо стандарты. Был выбран вариант, основанный на языке разметки XML, который часто используется в документах интернет. Документ с расширением docx имеет некоторые преимущества перед устаревшим форматом, в частности, меньший вес, что имеет значение при передаче документа через интернет. Поэтому при ограниченных скоростях передачи данных пользователям имеет смысл использовать более современный формат Word.

Отблагодари меня, поделись ссылкой с друзьями в социальных сетях:

Читайте также

Оставить комментарий ВКонтакте

Электронные документы — это одни из наиболее широко используемых компьютерных файлов. Благодаря высокому уровню развития современных компьютерных сетей распространять электронные документы становится удобнее, чем печатные. Многообразие устройств, используемых для представления документов, обуславливает большое количество проприетарных и открытых файловых форматов. Редактор документов работает с самыми популярными из них.

Форматы Описание Просмотр Редактирование Скачивание
DOC Расширение имени файла для текстовых документов, созданных программой Microsoft Word + +
DOCX Office Open XML
разработанный компанией Microsoft формат файлов на основе XML, сжатых по технологии ZIP. Предназначен для представления электронных таблиц, диаграмм, презентаций и текстовых документов
+ + +
DOTX Word Open XML Document Template
разработанный компанией Microsoft формат файлов на основе XML, сжатых по технологии ZIP. Предназначен для шаблонов текстовых документов. Шаблон DOTX содержит настройки форматирования, стили и т.д. и может использоваться для создания множества документов со схожим форматированием
+ + +
ODT Формат текстовых файлов OpenDocument, открытый стандарт для электронных документов + + +
OTT OpenDocument Document Template
Формат текстовых файлов OpenDocument для шаблонов текстовых документов. Шаблон OTT содержит настройки форматирования, стили и т.д. и может использоваться для создания множества документов со схожим форматированием
+ + в онлайн-версии
RTF Rich Text Format
Формат документов, разработанный компанией Microsoft, для кроссплатформенного обмена документами
+ + +
TXT Расширение имени файла для текстовых файлов, как правило, с минимальным форматированием + + +
PDF Portable Document Format
Формат файлов, используемый для представления документов независимо от программного обеспечения, аппаратных средств и операционных систем
+ +
PDF/A Portable Document Format / A
Подмножество формата PDF, содержащее ограниченный набор возможностей представления данных. Данный формат является стандартом ISO и предназначен для долгосрочного архивного хранения электронных документов.
+ +
HTML HyperText Markup Language
Основной язык разметки веб-страниц
+ + в онлайн-версии
EPUB Electronic Publication
Бесплатный открытый стандарт для электронных книг, созданный Международным форумом по цифровым публикациям (International Digital Publishing Forum)
+
XPS Open XML Paper Specification
Открытый бесплатный формат фиксированной разметки, разработанный компанией Microsoft
+
DjVu Формат файлов, предназначенный главным образом для хранения отсканированных документов, особенно тех, которые содержат комбинацию текста, рисунков и фотографий +
OTT OTT файл текстового формата, предназначенный для преобразования и хранения различных бланков, шаблонов официальных документов, презентаций. +
DOCM DOCM представляет собой формат XML программы Microsoft Word, используемый для текстовых документов в программе Microsoft Office 2007. +
DOTM DOTM – Шаблон документа Open XML Microsoft Word с поддержкой макросов (макросы не поддерживается, так как VBA проприетарный язык MS) +
FODT FODT — это файл документа, используемый текстовым процессором OpenOffice. Файл использует язык разметки XML. FODT заменяет формат ODT, который использует метод архивации ZIP. +
WPS WPS это текстовый документ, созданный в «Microsoft Works Word Processor» и не включает в себя продвинутых вариантов форматирования и макросов, которые бывают в документах «Word». +
WPT Шаблон текстового документа +
XML xml — это текстовый файл в формате XML (от англ. eXtensible Markup Language) — расширяемый язык разметки, он описывает документ и частично описывает поведение программ, читающих XML-документы. +
DjV Формат файлов, предназначенный главным образом для хранения отсканированных документов, особенно тех, которые содержат комбинацию текста, рисунков и фотографий +
FB2 FictionBook — формат представления электронных версий книг в виде XML-документов, где каждый элемент книги описывается своими тегами. +
HTM HTML — стандартизированный язык разметки документов. +
MHT Архивный формат веб-страниц, используемый для комбинирования кода HTML и ресурсов, которые обычно представлены в виде внешних ссылок в один файл. +

Время на прочтение
7 мин

Количество просмотров 49K

Статья от 19 февраля 2008 года

На прошлой неделе Microsoft опубликовала спецификации форматов бинарных файлов для Office. Эти форматы выглядят безумно. Формат файла Excel 97-2003 представляет собой 349-страничный файл PDF. И это ещё не всё! В документе содержится такой комментарий:

Каждый лист [workbook] в Excel хранится в составном файле.

Видите ли, файлы Excel 97-2003 – это составные документы OLE, которые в свою очередь представляют собой некое подобие файловой системы в одном файле. Чтобы в этом разобраться, нужно прочитать 9 страниц документации. А сами спецификации больше похоже на структуры данных в С, чем на то, что мы привыкли называть спецификациями. Это иерархическая система файлов.

Если вы подумали, что почитаете эти форматы и за выходные набросаете утилитку для экспорта вордовских документов в свой блог, или создающую экселевские таблички на основе ваших персональных финансовых данных, то сложность и длина этих спецификаций должны были отбить у вас всю охоту. Нормальный программист решит, что формат бинарников из Office:

  • сделан запутанным специально
  • придуман каким-то страдающим от старческого маразма представителем кибернетической расы боргов
  • создан безумно плохими программистами
  • не может быть правильно создан или прочитан

И ошибётся. Если покопаться, то можно показать, как и почему эти форматы стали такими сложными, почему они не имеют ничего общего с плохим программированием, и что можно с этим сделать.

Первое, что нужно понять – цели у разработчиков форматов бинарников кардинально отличались от целей разработчиков, допустим, HTML.

Они должны были очень быстро работать на очень старых компьютерах. Во времена первых версий Excel для Windows 1 мегабайт памяти был не редкостью, а работать достаточно комфортно программа должна была на процессорах 80386 с частотой 20 МГц. Множество оптимизаций сделано для ускорения открытия и сохранения файлов:

  • Это форматы бинарных файлов, поэтому загрузка записи обычно означает копирование последовательности байтов с диска в память, в которой появляется структура данных С. Не происходит никакого разбора или лексического анализа данных, так как это в разы медленнее простого копирования.
  • Формат файлов запутан в нужных местах для ускорения типичных операций. К примеру, у Excel 95 и 97 была функция «простого сохранения», которая использовалась в качестве ускоренного варианта документа OLE, полная версия которого была не слишком быстрой для повсеместного использования. У Word было нечто подобное под названием «быстрое сохранение». Для быстрого сохранения длинных документов 14 раз из 15 все изменения просто добавлялись в конец файла, а весь файл не перезаписывался с нуля. Для жёстких дисков того времени это означало, что можно было успеть сохранить документ, допустим, за 1 секунду вместо 30. Также это означало, что удалённые части документа всё ещё хранились в файле – а людям, как оказалось, это не было нужно.

Они были разработаны с прицелом на библиотеки. Если вам нужно было написать функцию импорта бинарника с нуля, вам нужно было поддерживать вещи вроде Windows Metafile Format (для рисования) и OLE Compound Storage. При работе под Windows для них есть библиотеки, поэтому поддержка таких функций была тривиальным делом. Но если писать всё с нуля, всё пришлось бы делать самому.

У Office была поддержка составных документов, к примеру, можно было включить электронную таблицу в файл Word. Идеальный парсер Word должен был суметь сделать что-то умное с включённой таблицей.

Они не разрабатывались для использования в других приложениях. Довольно разумное на тот момент предположение заключалось в том, что формат Word будет писать и читать только программа Word. Поэтому когда программист из команды разработчиков Word принимал решение о смене формата файла, его волновали лишь а) скорость работы и б) минимальное количество строк в коде Word. Идеи вещей типа SGML и HTML, заменяемых, открытых и стандартизированных форматов, не были популярными, пока интернет не сделал такие вещи практичными. Этот момент пришёл через 10 лет после разработки форматов файлов Office. Всегда предполагалось использование программ для экспорта и импорта. У Word есть поддержка формата для простого обмена документами по имени RTF, существовавшего почти с самого начала.

Им нужно было отразить всю сложность приложений. Каждую галочку, каждую возможность форматирования и каждую функцию Microsoft Office необходимо было хранить в файлах. Поэтому для создания идеального клона Word, читающего его файлы, нужно было реализовать все его функции. Если вы создаёте программу для работы с текстом – конкурента Word, которая должна уметь загружать его файлы, у вас может занять немного времени сама загрузка указанных в файле опций. Но реальное отображение их всех на странице – это задача более сложная. А если её не решить, то ваши клиенты откроют вордовский файл в вашем клоне, и всё форматирование может поломаться.

Им нужно было отражать историю развития программ. Множество сложных вещей в форматах – это старые, сложные, ненужные и редко используемые функции. Они присутствуют там лишь для обратной совместимости и потому, что для разработчиков ничего не стоит оставить код в покое. Но чтобы тщательно выполнить работу разборки или записи этих файлов, вам придётся повторить всю эту работу, что была проделана в Microsoft за 15 лет. В текущие версии Word и Excel вложены тысячи человеко-часов работы, и для клонирования этих программ вам придётся вложить свои тысячи человеко-часов. Формат файла – это просто краткое обобщение всех поддерживаемых приложением функций.

Просто для примера разберём одну возможность подробнее. Лист Excel – это набор разных записей BIFF. Рассмотрим самую первую запись в спецификации – это запись под именем 1904.

В спецификации об этой записи написано весьма туманно. Просто написано, что «запись 1904 показывает, используется ли система дат 1904». Классический пример бесполезной спецификации. Если бы вы были разработчиком, и наткнулись бы на такое «объяснение», вы бы весьма оправданно пришли к заключению, что Microsoft что-то скрывает. Такое описание недостаточно само по себе, вам нужно искать дополнительную информацию. Я поясню: существует два типа листов Excel. В одних даты начинаются с 1/1/1900 (в них же ошибка високосного года специально создана для совместимости с форматом 1-2-3), в других – с 1/1/1904. Excel поддерживает оба варианта – поскольку первая его версия, для Mac, использовала второй вариант, который был системным, а Excel для Windows должен был иметь возможность импортировать файлы 1-2-3, использовавшие даты с 1/1/1900. Уже на этом месте можно расплакаться.

Оба типа файлов, 1900 и 1904, встречаются в изобилии в дикой природе, в зависимости от того, пришли они с Mac или Windows. Автоматическая конвертация дат может привести к ошибкам, поэтому Excel сам тип файла не меняет. Для разборки файлов Excel приходится работать с обоими. А это значит, что вам не просто нужно загрузить этот бит из файла, но ещё и переписать весь код разбора и показа дат, чтобы обрабатывать оба варианта. Это работа на несколько дней.

Работая над клоном Excel вы встретите множество таких скрытых деталей по работе с датами. Когда Excel преобразовывает числа в даты? Как работает форматирование? Почему 1/31 интерпретируется как 31 января текущего года, а 1/50 – как первое января 1950? Все эти детали нельзя описать без того, чтобы получившееся описание не сравнялось по объёму с исходниками Excel.

И это только одна из сотен BIFF-записей, и одна из простейших. Большинство из них настолько сложные, что могут заставить взрослого программиста рыдать.

Единственное возможное решение будет следующим. Конечно, Microsoft оказала большую услугу, опубликовав форматы файлов, но импортировать их или сохранять в них от этого легче не будет. Это безумно сложные приложения, и вы не можете просто реализовать 20% самых популярных функций и рассчитывать, что 80% остальных людей будут счастливы. Спецификации бинарников в лучшем случае сохранят вам пару минут при реверс-инжиниринге сложной системы.

Но я обещал рассказать, что с этим делать. Почти всем популярным приложениям не нужно заниматься чтением и записью бинарников от Office. Есть две альтернативы: дать Office работать самому, или использовать более простые форматы файлов.

Пусть Office работает сам. У Word и Excel есть весьма полные модели объектов, доступные через COM Automation, благодаря чему в программе можно сделать всё. Во многих случаях лучше повторно использовать код из Office вместо попыток написать его заново. Примеры:

  1. У вас есть веб-приложение, которому нужно вывести файлы Word в формате PDF. Я бы сделал это так: несколько строк на Word VBA загружают файл и сохраняют его в PDF через встроенный в Word 2007 механизм. Этот код можно вызывать напрямую, даже из ASP или ASP.NET, работающего под IIS. Первый запуск Word займёт несколько секунд. В последствии Word будет находиться в памяти под управлением COM-системы. Для обычных веб-приложений такая система работает довольно быстро.
  2. Та же задача под Linux. Купите один сервер Windows 2003, установите на него лицензионный Word, и настройте простой веб-сервис. Работы на полдня, с применением C# и ASP.NET
  3. Та же задача но с возможностью масштабирования. Настройте балансировку нагрузки перед любым необходимым количеством коробок из второго шага. Никакого программирования не потребуется.

Такой подход сработает со всеми распространёнными задачами, связанными с Office. К примеру:

  • Открытие листа Excel, сохранение некоторых данных в ячейках, подсчёт и выдача результата.
  • Использования Excel для создания графиков в формате GIF
  • Вытаскивание любой информации из файла Excel без разбора форматов файлов
  • Преобразование файла Excel в CSV (другой подход – использовать драйверы Excel ODBC и забирать данные через SQL-запросы)
  • Редактирование документов Word
  • Заполнение форм в Word
  • Преобразование файлов между разными форматами, которые поддерживает Office (существуют возможности импортирования десятков форматов текстовых процессоров и электронных таблиц).

Во всех этих случаях есть возможность объяснить объектам Office, что они работают не в интерактивном режиме, так что им не надо обновлять экран и запрашивать ввод пользователя. На этом пути есть несколько подводных камней, и он официально не поддерживается Microsoft, так что перед началом работы прочтите соответствующий материал.

Используйте форматы попроще. Если вам просто нужно программно создать документы для Office, почти всегда есть формат получше, который затем можно свободно открыть в Word или Excel.

  • Для создания табличных данных и использования их в Excel используйте CSV.
  • CSV не поддерживает вычисления, так что для их использования возьмите формат WK1, доставшийся от Lotus 1-2-3. Он гораздо проще, чем у Excel, и открывается им на раз.
  • Если вам ну очень надо создавать нативные файлы Excel, возьмите очень старую его версию. 3.0 – хороший выбор, там не было составных документов. Сохраните в Excel 3.0 минимальный файл только с теми функциями, которые вам необходимы, и используйте его как пример минимальной BIFF-записи.
  • Для документов Word используйте HTML
  • Если вам очень надо создать файл для Word с модным форматированием, проще всего создать RTF. Всё, что умеет Word, можно написать в RTF, но этот формат текстовый, так что в нём что-то можно поменять руками и он будет работать. Вы можете создать красиво отформатированный файл в Word, сохранить в RTF и использовать простую замену текста.

В общем, если вы не пытаетесь создать конкурента для Office, который может читать и писать все файлы из Office (для чего вам потребуются тысячи часов работы), то попытки чтения или записи в его бинарные файлы окажутся самым затратным способом для любой задачи, которая у вас есть.

Понравилась статья? Поделить с друзьями:
  • Форматы текстовых файлов в word 2003
  • Форматы текстовых данных в microsoft excel
  • Форматы текста word vba
  • Форматы таблиц excel скачать
  • Форматы сохранения файлов в текстовом процессоре word