人気コンテンツ今日: |
リンク切れhtmlファイルをまとめて削除するスクリプトsasaki 金曜, 2007-12-14 17:44
ドリームウェーバーで「サイト全体のリンクチェック...」を実行すると「リンク切れリスト(単独ファイルリスト)」を作ってくれる。 こんな感じのリスト images/old.jpg
このリストが 1万6千行もあった(おいおい!)ので、削除する。 さすがに手作業で消すには社会保険庁の年金照合作業のような気がするので、シェルスクリプトか、Perlスクリプトで一気に消したい。
■リンク切れhtmlファイルをまとめて削除する流れは以下の通り。 1. リンク切れリストの改行をLFにして保存する。 (list.txtという名前) 2. リンク切れリストをhtmlドキュメントルートに置く。(FTPでアップしておく) 3. htmlドキュメントルートに移動して、リンク切れリスト内のファイルを削除していく。 (ドキュメントルートは、/home/web/puclic_htmlとする) $ cd /home/web/public_html/
※ 必ず、バックアップしたディレクトリで実験してから本番を行うこと。 ※ robots.txtが削除リストに入っているので消しておく。
結局、rubyやperlのお世話になるまでもなかった...。
印刷用 | カウント(99)
|
Webマスターな生活amazon広告英語お勧め教材! 英語の学校でも使っているのですが、1つのストーリーを3分で読めて、内容も面白く、もっと早く出会いたかった本です。 Apple好きで英語も勉強したいならこの一冊! 天気情報ブログパーツ |