テキストダウンローダー


URLからその内容をパソコンに落とすのを自動化するソフトのことをダウンローダーと呼ぶそうです。多量にものを読むとき、いったんダウンロードして、テキスト整形をかけて、たとえばザウルスで読むというようなニーズがあると思います。


ダウンローダーで検索すると、画像やムービーにも対応とかいろいろありますが、自分のニーズとしてはむしろそういうものを排除してテキストだけ、ダウンロードできるものが欲しい。


一方、テキストダウンローダーという名称で検索するといくつかあることはあるのですが、このブログのように中国語(簡体字繁体字)、日本語、英語が混じったサイトに対応していなかったりして、帯に短し、たすきに長しという状況です。


とりあえず、URLをそのままの形(HTML)でダウンロードし、Rubyでテキスト整形するというような形でしのいでいこうかと思っています。(たぶんそれが正解と思う。)