Link を抽出する Perl script がどっか行ったので


http://d.hatena.ne.jp/ma_ko/20071231 を見て下さい


Leopard 引越時に忘れたから適当にでっちあげ。

#!/usr/bin/env ruby
#
#  Created by /bin/bash: niutil: command not found on 2007-11-04.
#  Copyright (c) /bin/bash: niutil: command not found. All rights reserved.
#  What?
#  This_script.rb
#  How to use?
#  This_script.rb
if ENV['IS_RUNNING_IN_TEXTMATE'] && ENV['TM_FILEPATH'] === $0
  ARGV.concat(%w(http://hogefuga.jp/))
end

begin
  require "rubygems"
  require "hpricot"
  require "open-uri"
  require "nkf"
  
  url = ARGV.shift
  doc = Hpricot(open(url))
  doc.search("a").each do |elem|
    puts URI.join(url, elem.attributes['href']) # 絶対パス化
  end

rescue Exception => e
  p e.message
  p e.backtrace
end

hoge.rb としておいて

hoge.rb http://ajp.amjpathol.org/cgi/content/full/166/6/1827/DC1 | grep xls | xargs wget

とかする。
上は Textmate からのペーストだけど、niutil がなくなったからユーザー名が消えてるw