?

Log in

No account? Create an account

НАБЛЮДАТЕЛЬ


Вдруг кому понадобится

Recent Entries · Archive · Friends · Profile

* * *
Массовое преобразование файлов html в txt. Все тэги и скрипты при этом игнорируются. Нашел здесь. Как скачать много html файлов, все знают. А вот для дальнейшей работы с текстами может быть удобнее, чтобы эти тексты были в формате txt. Мне например, понадобилось, чтобы сделать из множества маленьких файликов html, книгу в формате fb2. Нужно, чтобы в системе был установлен браузер lynx.
#!/bin/sh
# h2t, convert all htm and html files of a directory to text

for file in `ls *.htm`
do
new=`basename $file htm`
lynx -dump $file > ${new}txt
done
#####
for file in `ls *.html`
do
new=`basename $file html`
lynx -dump $file > ${new}txt
done

Вот этот скрипт сделал все меньше, чем за минуту. Скопировать текст в любимый текстовый редактор, сохранить без расширения, под любым названием. Я сохранил как "html-convert". Потом даем ему права исполняемого файла, копируем в папку с файлами html и запускаем в терминале.
$ cd ~/Folder-with-your-htmls
$ ./html-convert
* * *
* * *
[User Picture]
On August 3rd, 2017 08:56 am (UTC), lilac2012 commented:
спасибо!
[User Picture]
On August 3rd, 2017 09:18 am (UTC), curiosus002 replied:
О, а у вас тоже линукс? Мало нас. Большая часть здешней публики если не на Windows, то, скорее, на Маках. Там это проще делается, случайно наткнулся, пока искал способ.
[User Picture]
On August 3rd, 2017 09:33 am (UTC), lilac2012 replied:
Нет, я просто подумала, что в крайнем случае могу его посадить.
[User Picture]
On August 3rd, 2017 09:41 am (UTC), curiosus002 replied:
Ну да. Для бытовых нужд большинство популярных дистрибутивов линукса годится безо всяких тонких настроек. И они менее требовательны к компьютерному железу, в отличие от той же винды-десятки. А если захочется чего-то большего, то информации сейчас много, особенно если на английском искать.
* * *

Previous Entry · Leave a comment · Share · Next Entry