|
Чистка
HTML-кода в документов MS Word
В Dreamweaver
можно открыть или импортировать документы, сохраненные в MS Word в формате
HTML, а затем использовать команду Clean Up Word HTML, чтобы удалить сторонний
код HTML, создаваемый при сохранении в MS Word. Код, который удаляет Dreamweaver,
служит для представления документа в Word, а для представления этого же
документа в HTML уже не нужен. Сохраните копию вашего первоначального
файла (с расширением .doc) как резервную, т. к. вы не сможете повторно
открыть документ HTML в редакторе Word после применения команды Clean
Up Word HTML. Указанная команда доступна для документов, сохраненных как
файлы HTML редактором MS Word 97 или его следующими версиями.
Чтобы очистить
HTML-код документа, созданного в MS Word:
1 Сохраните
ваш документ в MS Word в формате HTML.
2 Откройте документ HTML в Dreamweaver, используя любой из предложенных
методов:
- выберите команду File > Import > Import Word HTML и укажите импортируемый
файл.
Dreamweaver открывает файл и затем автоматически отображает диалоговое
окно Clean Up Word HTML.
- выберите команду File > Open и укажите открываемый файл.
При этом начинает автоматически вестись журнал статистики исправлений
HTML, если в параметрах HTML Rewriting указана настройка Warn when Fixing
or Removing Tags. Однако журнал не является частью очистки кода Word HTML.
Нажмите кнопку Continue, чтобы закрыть диалоговое окно. Затем в Dreamweaver
выберите команду Commands > Clean Up Word HTML .
3 При любом из перечисленных методов может возникать небольшая задержка
пока Dreamweaver пытается определить, какая версия Word использовалась
для сохранения файла. Если Dreamweaver не может это выяснить, выберите
правильную версию с помощью раскрывающегося списка.
4 Укажите, какие настройки должна использовать команда Clean Up Word HTML.
Вкладка Basic показывает следующие настройки:
- Remove all Word Specific Markup удаляет из кода все специфические
элементы, вставляемые редактором Word, в том числе XML в тегах HTML, используемые
в Word метаданные, теги связей в заголовке документа, разметку Word XML,
условные теги и их содержимое, а также пустые абзацы и границы. Вы можете
выбрать каждую из этих настроек отдельно на вкладке Detailed;
- Clean up CSS удаляет все созданные в Word стили CSS, в том числе
встроенные стили CSS, когда это возможно (т. е. когда родительский стиль
имеет те же самые свойства стиля), атрибуты стиля, начинающиеся с "mso",
атрибуты стиля CSS, относящиеся к таблицам, и все неиспользуемые определения
стиля из заголовка документа. Можно уточнить эту настройку, используя
вкладку Detailed;
- Clean up <font> tags удаляет теги HTML, преобразовывая
текст, находящийся по умолчанию в теле документа;
- Fix Invalidly Nested Tags удаляет теги разметки шрифта, вставленные
MS Word вне тегов параграфа и заголовка;
- Set background color позволяет ввести шестнадцатеричное значение,
чтобы установить цвет фона вашего документа. Если вы не указываете цвет
фона, то ваш документ HTML будет иметь серый фон. По умолчанию Dreamweaver
предлагает шестнадцатеричное значение, соответствующее белому цвету;
- Apply Source Formatting применяет к документу настройки форматирования,
которые вы определяете в параметрах Code Format и файле SourceFormat.txt.
- Show log on completion выводит окно предупреждения, содержащее
подробности изменений, сделанных в документе в процессе очистки.
5 Нажмите кнопку ОК.
В зависимости
от размера вашего документа и количества отобранных настроек для завершения
очистки может потребоваться несколько секунд. Введенные вами значения
автоматически сохраняются как параметры, заданные по умолчанию для следующей
процедуры очистки HTML Word.
|
|