Очистка html кода word

Очистка HTML кода

При помощи нашего сервиса Вы можете конвертировать любой текст из Word в html-разметку, а также добавлять и удалять теги из html-кода. Полученный текст легко использовать для публикации контента в различных CMS. Также Вы можете использовать наш визуальный редактор для моментального просмотра и редактирования.

Описание функционала сервиса HTMLCleanup

Наш сервис позволяет превращать HTML-код в удобный читаемый текст, пригодный для публикации как обычный текстовый документ или при помощи редакторов CMS. Также доступна функция визуального редактирования.

Сервис предоставляет 16 опций очистки, которые могут быть использованы в различных комбинациях друг с другом.

1. Styles — удаление css-стилей для отдельных тегов и всего документа.

Пример 1:

Исходный текст:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.

После обработки:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.

Пример 2:

Исходный текст:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.

После обработки:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet

2. Classes and ID’s — удаление css-селекторов классов и Id.

Пример 1:

Исходный текст:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.Aenean commodo ligula eget dolor.

После обработки:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.
Aenean commodo ligula eget dolor.

Пример 2:

Исходный текст:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.
Aenean commodo ligula eget dolor.

После обработки:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet.
Aenean commodo ligula eget dolor.

3. Span tags — удаление всех тегов span.

Пример 1:

Исходный текст:

Lorem ipsum dolor sit amet.

Lorem ipsum dolor sit amet

Lorem ipsum dolor sit amet.

  • Lorem ipsum dolor sit amet
  • Lorem ipsum dolor sit amet.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet

    Lorem ipsum dolor sit amet.

  • Lorem ipsum dolor sit amet
  • Lorem ipsum dolor sit amet.

    4. Comments — удаление комментариев из html-кода.

    Пример 1:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    5. Empty-attributes — удаление пустых селекторов атрибутов.

    Пример 1:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.
    Aenean commodo ligula eget dolor.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.
    Aenean commodo ligula eget dolor.

    Пример 2:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.
    Aenean commodo ligula eget dolor.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.
    Aenean commodo ligula eget dolor.

    6. Empty new lines — удаление пустых строк.

    Пример 1:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet

    Lorem ipsum dolor sit amet


    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet

    Lorem ipsum dolor sit amet


    7. Empty tags — удаление пустых тегов.

    Пример 1:

    Исходный текст:

    Text

    После обработки:

    Text

    Пример 2:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.


    Text text.

    Text text.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.


    Text text.

    Text text.

    8. Non-breaking spaces — удаление неразрывных пробелов ( ).

    Пример 1:

    Исходный текст:

     

    Lorem ipsum dolor sit amet.

          

     

       

    Lorem ipsum dolor sit amet.Lorem ipsum dolor sit amet.
    Lorem ipsum dolor sit amet.Lorem  ipsum dolor.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.Lorem ipsum dolor sit amet.
    Lorem ipsum dolor sit amet.Lorem ipsum dolor.

    9. Links — удаление ссылок (без удаления элементов-привязок).

    Пример 1:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Loremipsum dolor sit amet.

    Loremipsum dolor sit amet.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    10. Tables — удаление таблиц.

    Пример 1:

    Исходный текст:

    Table1

    Table2

    Lorem Ipsum

    Lorem ipsum Lorem ipsum2
    Ipsum Lorem Ipsum Lorem2

    Table3

    После обработки:

    Table1

    Table2

    Table3

    11. Forms — удаление тегов форм ввода.

    Пример 1:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    First name:

    Last name:

    Aenean commodo ligula eget dolor.

    После обработки:

    Lorem ipsum dolor sit amet.

    Aenean commodo ligula eget dolor./p>

    12. Images — удаление изображений.

    Пример 1:

    Исходный текст:


    test

    test

    test

    testText

    test

    После обработки:

    13. Tags with whitespace — удаление тегов с пробелами.

    Пример 1:

    Исходный текст:

    Text

     

    Text 

    Text

    Text

    Text

    После обработки:

    Text

    Text 

    Text

    Text

    Text

    14. All tag attributes (except href and src) — удаление атрибутов тегов (кроме href и src).

    Пример 1:

    Исходный текст:

    Title

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    testText

    Lorem ipsum dolor.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.
    Aenean commodo ligula eget dolor.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    После обработки:

    Title

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Text

    Lorem ipsum dolor.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.
    Aenean commodo ligula eget dolor.

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    15. JS code scripts — удаление для js-скриптов.

    Пример 1:

    Исходный текст:

    После обработки:

    Пример 2:

    Исходный текст:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    После обработки:

    Lorem ipsum dolor sit amet.

    Lorem ipsum dolor sit amet.

    16. All tags — удаление всех html-тегов.

    Пример 1:

    Исходный текст:

    Title

    Title of text


    1.Lorem ipsum Lorem ipsum.

    2.Lorem ipsum dolor sit amet

    • Text1
    • Text2
    • Test1
    • Test2

    Title of paragraph

    3.Lorem ipsum dolor sit amet.

    testImage

    testLink image

    Table name

    Lorem ipsum Lorem ipsum2
    Ipsum Lorem Ipsum Lorem2

    4.Lorem ipsum dolor sit amet.

    First input name:

    Last input name:

    После обработки:

    Title of text
    1.Lorem ipsum Lorem ipsum.
    2.Lorem ipsum dolor sit amet.
    Text1 Text2 Test1 Test2
    Comment
    Title of paragraph
    3.Lorem ipsum dolor sit amet.
    Image
    Link image
    Table name Lorem ipsum Lorem ipsum2 Ipsum Lorem Ipsum Lorem2
    4.Lorem ipsum dolor sit amet.
    First input name Last input name

    Функция найти и заменить в HTML-коде

    Функция позволяет находить и заменять в html-коде текстовые фрагменты и теги на заданные пользователем. Замена срабатывает в html-редакторе, изменения в котором передаются в визуальный редактор.

    Политика конфиденциальности

    HTMLCleanup использует cookie-файлы для улучшения взаимодействия с пользователями и сбора аналитики по анонимным посетителям. Все пользовательские операции выполняются на стороне клиента и не хранятся на наших серверах. Мы используем Google Analytics для сбора анонимной статистики и Google Adsense для показа персонализированной рекламы.

    HTML Cleaner

    HTML Cleaner – сервис очистки html тегов от «мусора», который остается в документе после сохранения страницы в формате html из программы MS Word.

    html-cleaner

    Давным давно я написал подобный плагин, но он был сделан на скорую руку, сейчас механизм полностью переписан.

    Очистка кода происходит методом перебора введенной строки из которой формируется новая, содержащая «чистый» код. Плагин удаляет абсолютно все из тегов, в том числе и из тегов html 5. В непарных тегах проставляется символ /(слеш). Удаляются пустые теги, например конструкция <p></p> будет удалена, так как она ничего не содержит.

    Как работает html cleaner?

    Есть два способа:

    1. В программе MS Word выберите данные, которые хотите очистить от мусора, чтобы выбрать все, нажмите Ctrl + A. Вставьте скопированный текст в поле ниже(должна быть выбрана вкладка «Вставить данные MS Office»), нажмите кнопку «Готово».
    2. Перед тем, как оптимизировать код выберите в Word «Сохранить как…», далее укажите Тип файла «Веб-страница с фильтром», затем откройте сохраненный файл в текстовом редакторе, скопируйте код и вставьте в поле ниже(должна быть выбрана вкладка «Вставить HTML»), нажмите кнопку «Готово».

    В результате Вы получите девственно чистый html код.
    Не тронутыми остаются следующие атрибуты:

    colspan, rowspan, href, src, type, value, lang, tabindex, title, code, alt, target, dir, span, action, method, style

    Включить форматирование HTML

    Не забывайте оставлять свои комментарии, которые помогут мне исправить ошибки или сделать доработки.

    Post Views: 109 880

    (5)(2)

    Короткая ссылка на страницу:


    • Метки


      clean. word, html, html 5, MS Word, автоматически, код, очистить html от word, чистка

    Здесь будет показан код после обработки

    Пусть для примера необходимо очистить нижеприведенный код, от тегов MS Word.

    <html>
    <head>
    <meta http-equiv=Content-Type content="text/html; charset=windows-1251">
    <meta name=Generator content="Microsoft Word 11 (filtered)">
    <title>Для удобства создания веб-страниц рекомендуется использовать
    HTML-редактор
    <style>
    
    </style>
    
    </head>
    <body lang=RU link=blue vlink=purple>
    <div class=Section1>
    <p><span style='font-size:14.0pt'>Для удобства создания веб-страниц рекомендуется
    использовать HTML-редактор. Существует бесплатные, так и платные  HTML-редакторы,
    и выбрать один из них может быть непростой задачей.</span></p>
    
    <p><span style='font-size:14.0pt'>Для начала изучения HTML можно использовать простой
    текстовый редактор, такой как Notepad, WordPad или любой другой. По мере
    освоения навыков работы с </span><span lang=EN-US style='font-size:14.0pt'>html</span><span
    lang=EN-US style='font-size:14.0pt'> </span><span style='font-size:14.0pt'>кодом
    и увеличения самого кода </span><span lang=EN-US style='font-size:14.0pt'>html</span><span
    style='font-size:14.0pt'>, для удосьва лучше использовать специализированные
    программы с более богатым функционалом, например Coffecup, Notepad++, Brackets,
    Notetab или BlueGriffon. Преимущество использования более продвинутых и
    функциональных редакторов в том, что вы получаете больше инструментов,
    способных значительно ускорить процесс разметки и создания контента.</span></p>
    
    <p><span style='font-size:14.0pt'>Список бесплатных редакторов кода </span><span
    lang=EN-US style='font-size:14.0pt'>Html</span></p>
    
    <table class=MsoNormalTable border=1 cellpadding=0 width="90%"
     style='width:90.0%;border:solid windowtext 1.0pt'>
     <tr>
      <td valign=top style='border:solid windowtext 1.0pt;padding:7.5pt 7.5pt 7.5pt 7.5pt'>
      <p class=MsoNormal>Блокнот<span
      lang=EN-US> (Notepad Windows)</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>1<sup>st</sup> Page 2000</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>AceHTML Freeware</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>AkelPad</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Alaborn iStyle</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Alleycode HTML Editor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Aptana Studio</span><span lang=EN-US><br>
      </span><span lang=EN-US>AS
      Writer</span><span lang=EN-US><br>
      </span><span lang=EN-US>Atom</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Axma Story Maker</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Bred </span><span lang=EN-US><br>
      </span><span lang=EN-US>Cats
      Html</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Codelobster PHP Edition Free</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Code Writer</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>CodeX Writer </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>CoffeeCup Free HTML Editor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Crimson Editor</span><span lang=EN-US><br>
      </span><span lang=EN-US>DocPad</span><span
      lang=EN-US><br>
      </span><span lang=EN-US>DTMLome
      </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>DzSoft WebPad</span><span lang=EN-US><br>
      </span><span lang=EN-US>Edit
      Pad Lite</span><span lang=EN-US><br>
      </span><span lang=EN-US>Editra</span><span
      lang=EN-US><br>
      </span><span
      lang=EN-US>Extra Hide Studio</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Free Notepad</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>GrindinSoft Notepad</span><span lang=EN-US><br>
      </span><span lang=EN-US>HAPedit
      </span><span lang=EN-US><br>
      </span><span lang=EN-US>HEFS</span><span
      lang=EN-US><br>
      </span><span
      lang=EN-US>HateML Pro</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>HippoEDIT</span><span lang=EN-US><br>
      </span><span lang=EN-US>HOD
      Html Editor (hhe) </span></p>
      </td>
      <td valign=top style='border:solid windowtext 1.0pt;padding:7.5pt 7.5pt 7.5pt 7.5pt'>
      <p class=MsoNormal><span
      lang=EN-US>HotHTML</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>HTML Cool Edit </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>HTMLGenerator</span><span lang=EN-US><br>
      </span><span lang=EN-US>HTML-Kit</span><span
      lang=EN-US><br>
      </span><span
      lang=EN-US>HtmlList Html Editor</span><span lang=EN-US><br>
      </span><span lang=EN-US>HTML
      ON</span><span lang=EN-US><br>
      </span><span lang=EN-US>HTML
      pad </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>HtmlPad FisherMan</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>HTMLReader</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>HTML Source Creator</span><span lang=EN-US><br>
      </span><span lang=EN-US>Jet
      HTML</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>KaSab Web Editor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Komodo Edit</span><span lang=EN-US><br>
      </span><span lang=EN-US>Leafier</span><span
      lang=EN-US><br>
      </span><span lang=EN-US>LightPad
      </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Lite Site</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Macro HTML</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Mastak Hyper Bricks</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>MAX’s HTML Beauty++</span><span lang=EN-US><br>
      </span><span lang=EN-US>Neon
      HTML</span><span lang=EN-US><br>
      </span><span lang=EN-US>Notepad2</span><span
      lang=EN-US><br>
      </span><span lang=EN-US>Notepad++</span><span
      lang=EN-US><br>
      </span><span lang=EN-US>Phase
      HtmlEditor </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>PlainEdit.NET</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Programmer’s Notepad</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>PS Pad editor</span><span lang=EN-US><br>
      </span><span lang=EN-US>Quick
      Page</span></p>
      </td>
      <td valign=top style='border:solid windowtext 1.0pt;padding:7.5pt 7.5pt 7.5pt 7.5pt'>
      <p class=MsoNormal><span
      lang=EN-US>RJ TextEd</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>SA HTML Editor</span><span lang=EN-US><br>
      </span><span lang=EN-US>SciTE</span><span
      lang=EN-US><br>
      </span><span
      lang=EN-US>Site Create</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>ShimNET Web Editor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Smart Web Builder</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Source Editor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Starcaster</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Sun Write</span><span lang=EN-US><br>
      </span><span lang=EN-US>SuperEdi</span><span
      lang=EN-US><br>
      </span><span
      lang=EN-US>TED Notepad</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>TextEdit</span><span lang=EN-US><br>
      </span><span lang=EN-US>TigerPad</span><span
      lang=EN-US><br>
      </span><span lang=EN-US>TopStyle
      Lite</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Trellian CodePad </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Tverd</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>VB HTML Editor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Visual Studio Code</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Visual Workshop</span><span lang=EN-US><br>
      </span><span lang=EN-US>Webbo</span><span
      lang=EN-US><br>
      </span><span lang=EN-US>WebCoder</span><span
      lang=EN-US><br>
      </span><span
      lang=EN-US>Web Design Toy </span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Web Development Studio</span><span lang=EN-US><br>
      </span><span lang=EN-US>WebTide</span><span
      lang=EN-US><br>
      </span><span
      lang=EN-US>WINsoft WebEditor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>Wolf Web Editor</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>X-KISoft HTML Editir</span><span lang=EN-US><br>
      </span><span
      lang=EN-US>ZiperCooL’s HTML Editor</span></p>
      </td>
     </tr>
    </table>
    
    <p><span lang=EN-US> </span></p>
    </div>
    </body>
    </html>
    
    

    Чтобы получить чистый html-код необходимо отметить пункты:

    1. Отметить пункт Очистить html-код
    2. Удалять следующие теги: span div
    3. Удалять следующие атрибуты: style class width height align
    4. Дополнительные атрибуты: border;cellpadding;valign

    В результате получаем следующий html-код:

    Для удобства создания веб-страниц рекомендуется использовать
    HTML-редактор
    <p>Для удобства создания веб-страниц рекомендуется использовать HTML-редактор. Существует бесплатные, так и платные  HTML-редакторы, и выбрать один из них может быть непростой задачей.</p>
    <p>Для начала изучения HTML можно использовать простой текстовый редактор, такой как Notepad, WordPad или любой другой. По мере освоения навыков работы с html кодом и увеличения самого кода html, для удосьва лучше использовать специализированные программы с более богатым функционалом, например Coffecup, Notepad++, Brackets, Notetab или BlueGriffon. Преимущество использования более продвинутых и функциональных редакторов в том, что вы получаете больше инструментов, способных значительно ускорить процесс разметки и создания контента.</p>
    <p>Список бесплатных редакторов кода Html</p>
    <table>
     <tr> <td> <p>Блокнот (Notepad Windows)<br> 1<sup>st</sup>Page 2000<br> AceHTML Freeware<br> AkelPad<br> Alaborn iStyle<br> Alleycode HTML Editor<br> Aptana Studio<br> AS Writer<br> Atom<br> Axma Story Maker<br> Bred<br> Cats Html<br> Codelobster PHP Edition Free<br> Code Writer<br> CodeX Writer<br> CoffeeCup Free HTML Editor<br> Crimson Editor<br> DocPad<br> DTMLome <br> DzSoft WebPad<br> Edit Pad Lite<br> Editra<br> Extra Hide Studio<br> Free Notepad<br> GrindinSoft Notepad<br> HAPedit <br> HEFS<br> HateML Pro<br> HippoEDIT<br> HOD Html Editor (hhe) </p> </td> <td> <p>HotHTML<br> HTML Cool Edit<br> HTMLGenerator<br> HTML-Kit<br> HtmlList Html Editor<br> HTML ON<br> HTML pad<br> HtmlPad FisherMan<br> HTMLReader<br> HTML Source Creator<br> Jet HTML<br> KaSab Web Editor<br> Komodo Edit<br> Leafier<br> LightPad <br> Lite Site<br> Macro HTML<br> Mastak Hyper Bricks<br> MAX’s HTML Beauty++<br> Neon HTML<br> Notepad2<br> Notepad++<br> Phase HtmlEditor<br> PlainEdit.NET<br> Programmer’s Notepad<br> PS Pad editor<br> Quick Page</p> </td> <td> <p>RJ TextEd<br> SA HTML Editor<br> SciTE<br> Site Create<br> ShimNET Web Editor<br> Smart Web Builder<br> Source Editor<br> Starcaster<br> Sun Write<br> SuperEdi<br> TED Notepad<br> TextEdit<br> TigerPad<br> TopStyle Lite<br> Trellian CodePad<br> Tverd<br> VB HTML Editor<br> Visual Studio Code<br> Visual Workshop<br> Webbo<br> WebCoder<br> Web Design Toy<br> Web Development Studio<br> WebTide<br> WINsoft WebEditor<br> Wolf Web Editor<br> X-KISoft HTML Editir<br> ZiperCooL’s HTML Editor</p> </td> </tr>
    </table>
    

    Удалание атрибутов внутри всего html-кода

    Чтобы удалить дополнительные атрибуты, введите их названия строчными латинскими буквами через знак ;. Например, ввод строки data-in;id будет означать удаление атрибутов data-in и id во всем тексте.

    Замена атрибутов для указанного тега

    Например, у тега <img> содержимое атрибута src заменить на нужное вам.

    Пусть в html-коде необходимо конструкцию <img src=»files/disk/name.png»> заменить на <img src=»/images/name.png»>

    Указываем замену на /images/.

    Если в заменяемой строке указать [N],то вместо [N] будет вставлен текущий индекс найденного совпадения. Например, если для <img src=»files/disk/name.png»> указать заменить на /images/ris[N].png, то первое найденное совпадение будет заменено на <img src=»/images/ris1.png»>, а четвертое — на <img src=»/images/ris4.png»> (и т.д.).

    Для замены с условием, необходимо в поле если атрибут содержит ввести условие замены. Например, если атрибут содержит подстроку /chart/.

    Удаление атрибутов для указанного тега

    Чтобы удалить атрибуты для указанного тега, введите их названия строчными латинскими буквами через знак ;. Например, ввод строки width;class будет означать удаление атрибутов width и class только для текущего тега.

    I have quite big document in html format that generated from Microsoft Word. It is soooo messy and full of bloated things (like unknow tag, unknow namespace etc and other bloated things)

    is there any way to convert it into plain html sytax ?

    pnuts's user avatar

    pnuts

    58k11 gold badges85 silver badges137 bronze badges

    asked Jun 28, 2009 at 7:37

    nightingale2k1's user avatar

    nightingale2k1nightingale2k1

    9,98515 gold badges69 silver badges96 bronze badges

    Try HTML Tidy. I hear it works quite well on HTML generated by MS Word (definitely at least up to Word 2000, but probably on more recent versions too).

    answered Jun 28, 2009 at 7:59

    David Z's user avatar

    0

    This isn’t really a programming question, but (at least recent versions of) Word can save to «Web Page, Filtered», which removes Office-specific tags and properties and only leaves the tags necessary for the document to be rendered in a web browser. So, if you have Word, you could try using it to open the HTML document and save it in that format.

    answered Jun 28, 2009 at 7:40

    Vladimir Panteleev's user avatar

    You’re probably looking for HTML Tidy, which has adapters in pretty much every language out there. It has options to clean up Microsoft Word HTML output (and many other features).

    answered Jun 28, 2009 at 7:59

    cletus's user avatar

    cletuscletus

    613k166 gold badges907 silver badges942 bronze badges

    try Cleanup HTML on-line tool to clean up word HTML

    answered Mar 13, 2011 at 10:48

    robeid's user avatar

    0

    April 10 2014, 18:49

    Category:

    • IT
    • Cancel

    Не знаю, как с подобной задачей справлялись другие, но когда нужно что-то опубликовать в блог или выложить на сайт статью из текстового документа (MS word, *,doc, *.docx, *.odt …) найденная штука облегчает жизнь. Потому что когда просто копируешь-вставляешь текст, копируется много мусора (стили, размер текста, цвет и так далее), что может выглядеть очень ужасно в итоге. До этого всегда копировал текст в HTML и руками проставлял все теги (абзацы, ссылки, зажирнения, подчёркивания, курсив, абзацы).
    Благодаря статье на Habrahabr, нашел что можно прямо в интернете «почистить» HTML код. Чем и спешу поделиться:

    Для «очистки кода» потребуется всего 3 действия:

    1. Открыть документ, скопировать нужную часть текста
    2. Открыть страницу http://www.tinymce.com/ и вставить текст в окно редактора
    3. Затем выбрать Tools — <>Source Code
    Снимок23
    Получившийся код уже вставляете в ваш блог, админку сайта и пр.)) Надеюсь пригодится
    Profit )))

    Like this post? Please share to your friends:
  • Очистить ячейку excel клавиша
  • Очистить ячейку excel без формулы
  • Очистить ячейки при условии excel
  • Очистить ячейки при изменении ячейки excel
  • Очистить ячейки в excel с определенным значением