Содержание
KWord использует два открытых, независимо разработанных стандарта для формата своего файла. Это сочетание было выбрано ради баланса между удобством и открытостью разработки.
Прежде всего, нужно сказать, что все файлы KWord - это просто несколько файлов XML, сжатых ради экономии места.
Выберите версию KWord:
Файлы XML сжаты в один архивный файл с помощью алгоритма tar.
Эти файлы можно разжать командой:
%
tar -xzvf
имя_файла
Тем самым документ KWord будет разархивирован в свои составляющие файлы.
Текстовая часть во всех файлах KWord описана в формате XML (eXtensible Markup Language - расширяемый язык разметки).
Более подробно с документами XML, их обработчиками и технологиями можно познакомиться на следующих страницах:
Веб-страницы консорциума World Wide Web, посвященные XML |
Путеводитель по ресурсам XML.org |
Вопросы и ответы по XML |
Документ KWord включает в себя как минимум два файла XML:
maindoc.xml
В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML согласно официальному DTD. Копия DTD для KWord 1.1 хранится по адресу: http://www.koffice.org/DTD/kword-1.1.dtd.
documentinfo.xml
В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню ->. Эта информация полезна для сбора данных об авторах, их контактах и пр.
Копия DTD для KOffice 1.1 хранится здесь: http://www.koffice.org/DTD/document-info-1.1.dtd.
Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.
Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и ресурсе для разработчиков KDE.
Текстовые файлы сжимаются в единый файл с помощью алгоритма zip. Это изменение было сделано ради улучшения производительности и уменьшения требований к памяти, а также потому, что оно очень широко используется в других открытых офисных пакетах.
Эти файлы можно разжать командой:
%
unzip
имя_файла
Тем самым документ KWord будет разархивирован в свои составляющие файлы.
Текстовая часть во всех файлах KWord описана в формате XML (eXtensible Markup Language - расширяемый язык разметки).
Более подробно с документами XML, их обработкой и технологиями можно познакомиться на следующих страницах:
Веб-страницы консорциума World Wide Web, посвященные XML |
Путеводитель по ресурсам XML.org |
Вопросы и ответы по XML |
Все документы KWord состоят как минимум из трёх файлов:
maindoc.xml
В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML согласно официальному DTD.
Копия DTD для KWord 1.2 хранится здесь: http://www.koffice.org/DTD/kword-1.2.dtd.
documentinfo.xml
В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню ->. Эта информация полезна для сбора данных об авторах, их контактах и пр.
Копия DTD для KOffice 1.2 хранится здесь: http://www.koffice.org/DTD/document-info-1.2.dtd.
mimetype
Этот файл содержит типы MIME файлов KWord. KDE использует эту информацию, чтобы отличать файлы KWord от других файлов.
Этот файл обязательно содержит строку: application/x-kword
Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.
Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и ресурсе для разработчиков KDE.
Текстовые файлы сжимаются в единый файл с помощью алгоритма zip. Это изменение было сделано ради улучшения производительности и уменьшения требований к памяти, а также потому, что оно очень широко используется в других открытых офисных пакетах.
Эти файлы можно разжать командой:
%
unzip
имя_файла
Тем самым документ KWord будет разархивирован в свои составляющие файлы.
Текстовая часть во всех файлах KWord описана в формате XML (eXtensible Markup Language - расширяемый язык разметки).
Более подробно с документами XML, их обработкой и технологиями можно познакомиться на следующих страницах:
Веб-страницы консорциума World Wide Web, посвященные XML |
Путеводитель по ресурсам XML.org |
Вопросы и ответы по XML |
Все документы KWord состоят как минимум из трёх файлов:
maindoc.xml
В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML согласно официальному DTD.
Копия DTD для KWord 1.3 хранится здесь: http://www.koffice.org/DTD/kword-1.3.dtd.
documentinfo.xml
В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню ->. Эта информация полезна для сбора данных об авторах, их контактах и пр.
Копия DTD для KOffice 1.3 хранится здесь: http://www.koffice.org/DTD/document-info-1.2.dtd.
mimetype
Этот файл содержит типы MIME файлов KWord. KDE использует эту информацию, чтобы отличать файлы KWord от других файлов.
Этот файл обязательно содержит строку: application/x-kword
Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.
Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и ресурсе для разработчиков KDE.