Sorry for resurrecting an ancient thread, but I recently wanted to do this, but I wanted a 100% portable bash script to do it. So here’s my solution using only grep and sed.
The below was bashed out very quickly, and so could be made much more elegant, but I’m just getting started really with sed/awk etc…
curl "http://www.webpagewithtableinit.com/" 2>/dev/null | grep -i -e '</?TABLE|</?TD|</?TR|</?TH' | sed 's/^[ t]*//g' | tr -d 'n' | sed 's/</TR[^>]*>/n/Ig' | sed 's/</?(TABLE|TR)[^>]*>//Ig' | sed 's/^<T[DH][^>]*>|</?T[DH][^>]*>$//Ig' | sed 's/</T[DH][^>]*><T[DH][^>]*>/,/Ig'
As you can see I’ve got the page source using curl, but you could just as easily feed in the table source from elsewhere.
Here’s the explanation:
Get the Contents of the URL using cURL, dump stderr to null (no progress meter)
curl "http://www.webpagewithtableinit.com/" 2>/dev/null
.
I only want Table elements (return only lines with TABLE,TR,TH,TD tags)
| grep -i -e '</?TABLE|</?TD|</?TR|</?TH'
.
Remove any Whitespace at the beginning of the line.
| sed 's/^[ t]*//g'
.
Remove newlines
| tr -d 'nr'
.
Replace </TR>
with newline
| sed 's/</TR[^>]*>/n/Ig'
.
Remove TABLE and TR tags
| sed 's/</?(TABLE|TR)[^>]*>//Ig'
.
Remove ^<TD>
, ^<TH>
, </TD>$
, </TH>$
| sed 's/^<T[DH][^>]*>|</?T[DH][^>]*>$//Ig'
.
Replace </TD><TD>
with comma
| sed 's/</T[DH][^>]*><T[DH][^>]*>/,/Ig'
.
Note that if any of the table cells contain commas, you may need to escape them first, or use a different delimiter.
Hope this helps someone!
TextCompare
TextCompare
Compare ExcelPDF DiffImage DiffReadability ToolsCSV Tools
LoginRegister
Convert HTML to CSV online easily. Enter string or upload file with HTML content and get CSV output.
CSV Output Options
Delimiter
Header Row
Skip Empty Lines
Enclose fields in quotes
Quote character
End of Line
WindowsUnix/Mac
Give Rating
Very DissatisfiedDissatisfiedNeutralSatisfiedVery SatisfiedEmpty
HTML to CSV Converter Online
How to convert HTML to CSV?
- Enter HTML in input textarea or choose and upload .html file.
- Choose options like delimiter, quote character, csv header etc.
- Click on
Process
button to get CSV output.
References
- HTML
- CSV
Libraries Used
- Papa Parse
Выберите файл для преобразования
Перетащите файлы сюда. Максимальный размер файла 100 МБ или зарегистрируйтесь
Вы можете перевести html документ в csv и во множество других форматов с помощью бесплатного онлайн конвертера.
Как сконвертировать csv в html?
Шаг 1
Загрузите html-файл
Выберите файл, который вы хотите конвертировать с компьютера, Google Диска, Dropbox или перетащите его на страницу.
Шаг 2
Выберите «в csv»
Выберите csv или любой другой формат, в который вы хотите конвертировать файл (более 200 поддерживаемых форматов)
Шаг 3
Скачайте ваш csv файл
Подождите пока ваш файл сконвертируется и нажмите скачать csv-файл
Бесплатное онлайн преобразование html в csv
Быстро и легко
Просто перетащите ваши файлы в формате html на страницу, чтобы конвертировать в csv или вы можете преобразовать его в более чем 250 различных форматов файлов без регистрации, указывая электронную почту или водяной знак.
Не беспокойтесь о безопасности
Мы удаляем загруженные файлы html мгновенно и преобразованные csv файлы через 24 часа. Все файлы передаются с использованием продвинутого шифрования SSL.
Все в облаке
Вам не нужно устанавливать какое-либо программное обеспечение. Все преобразования html в csv происходят в облаке и не используют какие-либо ресурсы вашего компьютера.
Hypertext Markup Language with a client-side image map
Расширение файла | .html |
Категория файла | 🔵 documents |
Программы |
🔵 Internet Explorer 🔵 Mozilla Firefox 🔵 Google Chrome 🔵 Opera 🔵 Safari 🔵 Other internet browsers |
Описание | 🔵 HTML – специальный формат, связанный с веб-страницами, при разработке которых применялся соответствующий язык разметки. Множество станиц, соединенных ссылками, образуют веб-сайты. Файлы с подобным расширением изменяются текстовыми редакторами, так как представляют собой стандартный текстовый документ. Однако, чтобы избежать некорректного отображения рекомендуется использовать специализированное ПО, например, Adobe Dreamweaver. Открыть файлы HTML позволяют все современные браузеры, при этом по умолчанию исходный код не отображается. Его можно посмотреть в меню веб-браузера, выбрав категорию «Просмотр источника» либо с помощью текстового редактора. Файлы с расширением HTML включают текстовое содержание и ссылки в виде текста на внешние объекты, например, картинку внутри статьи. |
Технические детали | 🔵 Язык HTML был создан Т. Бернерсом-Ли для обмена научно-технической информацией людьми, не имеющими глубоких знаний в области верстки. В его основе лежит использование множества тегов, обрамленных в угловые скобки. Современные браузеры без труда интерпретируют язык HTML4, предоставляя пользователю отформатированный текст. Сейчас появилась пятая версия со спецификацией DOM (ранее SGML). |
Разработчик | 🔵 World Wide Web Consortium & WHATWG |
MIME type |
🔵 text/html |
Comma Separated Values File
Расширение файла | .csv |
Категория файла | 🔵 documents |
Программы |
🔵 Microsoft Excel 🔵 Microsoft Works 🔵 Corel Quattro Pro 🔵 Apache OpenOffice 🔵 LibreOffice 🔵 Microsoft Notepad 🔵 Libre Office 🔵 MobiSystems OfficeSuite Pro 7 |
Описание | 🔵 CSV – представляет собой особый текстовый формат, данные внутри которого разделены запятыми. Разработаны в начале 70-х годов XX века для импортирования различной табличной информации и переноса объемных сведений между базами в текстовом формате. Каждая строка файла выступает как один ряд базы данных. С помощью приложения крупноформатных таблиц файлы CSV способны систематизироваться в ячейки и добавляться в соответствующую базу. Параметры каждой колонки разделяются с помощью запятых, при наличии зарезервированных символов (например, точка с запятой или новая строчка) в роли разделителя выступают двойные кавычки. Это позволяет беспрепятственно передавать информацию между разными программами. CSV в ряде случаев именуют плоскими файлами. Они могут открываться большинством редакторов, способных работать с таблицами и текстами, среди которых как аутентичный Excel, так и утилиты с открытым кодом наподобие Apache Open Office и Libre Office. |
Технические детали | 🔵 На персональных компьютерах расширение CSV включает в себя множество значений, представленных в виде таблиц ASCII. При этом текстовые строки четко организованы, поэтому все значения отделены друг от друга запятыми или двойными кавычками (если есть зарезервированные символы). Использование различных разделителей допускает наличие неодинаковой кодировки. |
Разработчик | 🔵 Microsoft |
MIME type |
🔵 text/comma-separated-values |
FAQ
❓ Как я могу конвертировать html в csv?
Во-первых, выберите html файл, который вы хотите конвертировать или перетащить его. Во-вторых, выберите csv или любой другой формат, в который вы хотите преобразовать файл. Затем нажмите кнопку конвертировать и подождите, пока файл не преобразуется
⏳ Как долго я должен ждать, чтобы преобразовать html в csv?
Преобразование Изображение обычно занимает несколько секунд. Вы преобразовать html в csv очень быстро.
🛡️ Это безопасно конвертировать html в csv на OnlineConvertFree?
Конечно! Мы удалить загруженные и преобразованные файлы, так что никто не имеет доступ к вашей информации. Все типы преобразования на OnlineConvertFree (в том числе html в csv) 100% безопасны.
📱 Можно ли преобразовать html в csv без установки программного обеспечения?
Да! OnlineConvertFree не требует установки. Вы можете конвертировать любые файлы (в том числе html в csv) онлайн на вашем компьютере или мобильном телефоне.
About HTML tables conversion to CSV data
The HTML to CSV Converter was created for online transform code of HTML tables into CSV(Comma Separated Values) data. It’s very simple and easy way to transform and share HTML to CSV data.
How it Works?
Just paste or upload your HTML data to the textarea above and click to the button «Convert» and you will instantly get CSV data.
Example of HTML conversion to CSV
Before:
<!DOCTYPE html> <html> <head> <style>h1{color:orange;text-align:center;}</style> </head> <body> <h1>HTML example!</h1> <p>This is a paragraph.</p> <table> <thead> <tr> <td>id</td> <td>firstName</td> <td>lastName</td> <td>age</td> </tr> </thead> <tr> <td>1</td> <td>Kim</td> <td>Kardashian</td> <td>39</td> </tr> <tr> <td>2</td> <td>Ariana</td> <td>Grande</td> <td>26</td> </tr> <tr> <td>3</td> <td>Cristiano</td> <td>Ronaldo</td> <td>35</td> </tr> <tr> <td></td> </tr> </table> </body> </html>
After:
id,firstName,lastName,age 1,Kim,Kardashian,39 2,Ariana,Grande,26 3,Cristiano,Ronaldo,35
After the conversion, you can apply the CSV data to your project or use it for some other purpose.