image

  • フォト Amazonギフト券
    ※この時計の時刻は、閲覧しているパソコンのものであり、必ずしも正確な時間とは限りません

検索

最近のトラックバック

無料ブログはココログ

« ピックアップ: RubyとWiiリモコンをつなぐ, グーグルが起こす第二の革命, etc... | トップページ | ピックアップ:情報漏えい発生時の対応ポイント集, 教わり上手な人の8つのTIPS, etc... »

2007-09-04

格フレーム検索 を ruby から利用してみる

- http://nlp.kuee.kyoto-u.ac.jp/nl-resource/caseframe.html
> > Automatically Constructed Case Frames; Webから自動構築した大規模格フレーム βバージョン
にある 格フレーム検索 ( http://reed.kuee.kyoto-u.ac.jp/cf-search/ )
を ruby から利用する例の実験をしてみた。(あくまでも事前実験...)

$ ruby frame.rb

============
積む:動2
--------
<ガ格>
nil
--------
<数量>人:6,者:6,人:5,選手:4,員:3,職員:3,自分:3,奴:2,方:2,生:2,少女:2,それぞれ:2,上人:2,僧:2,ギルド:2,隊:2,生徒:2,各人:2,...
nil
<数量>人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%3C%BF%F4%CE%CC%3E%BF%CD
者: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BC%D4
人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BF%CD
選手: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C1%AA%BC%EA
員: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%B0%F7
職員: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BF%A6%B0%F7
自分: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BC%AB%CA%AC
奴: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C5%DB
方: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%CA%FD
生: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C0%B8
少女: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BE%AF%BD%F7
それぞれ: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%A4%BD%A4%EC%A4%BE%A4%EC
上人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BE%E5%BF%CD
僧: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C1%CE
ギルド: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%A5%AE%A5%EB%A5%C9
隊: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C2%E2
生徒: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C0%B8%C5%CC
各人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%B3%C6%BF%CD

...  以下省略 ...

ソースはこれ。
require 'rubygems'
require 'hpricot'
require 'mechanize'
require 'open-uri'
require 'kconv'
require 'cgi'

$KCODE="euc"

# 格フレーム検索の URL
url = 'http://reed.kuee.kyoto-u.ac.jp/cf-search/'
text ='修行を 積む'

# text = ARGV[0]

agent = WWW::Mechanize.new                     # インスタンス生成
agent.user_agent_alias = 'Mac Safari'          #  User-Agentの設定
page = agent.get(url)                          # ページ取得

search_form = page.forms[0]

search_form.fields.find {|f| f.name == 'text'}.value = text            # テキストボックス"text"に入力
search_results = agent.submit(search_form, search_form.buttons.first)  # フォームのsubmitボタンを押す

# puts search_results.body                     # 結果の取得

doc = Hpricot(search_results.body)

doc.search("/html/body") do |b|
  kaku =  b.search("h3/text()").to_html
  if (kaku != "") then
    puts "============"
    puts kaku.tosjis
    (b/'table/tr/td').each do |td|
      data = td.search("text()").to_html
      if (data != "") then
        puts "--------"
        puts puts(CGI.unescapeHTML(data).tosjis)
        td.search("a") do |a|
          name = a.search("text()").to_html
          href = a.attributes['href']
          printf(" %s: %s¥n", name.tosjis, href)
        end
      end
    end
  end
end
#--- End of File ---

« ピックアップ: RubyとWiiリモコンをつなぐ, グーグルが起こす第二の革命, etc... | トップページ | ピックアップ:情報漏えい発生時の対応ポイント集, 教わり上手な人の8つのTIPS, etc... »

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/184434/16337498

この記事へのトラックバック一覧です: 格フレーム検索 を ruby から利用してみる :

« ピックアップ: RubyとWiiリモコンをつなぐ, グーグルが起こす第二の革命, etc... | トップページ | ピックアップ:情報漏えい発生時の対応ポイント集, 教わり上手な人の8つのTIPS, etc... »

mokuji

2013年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

google

  • twitter
  • __
  • _
    Googleボットチェッカー

合わせて読む

  • 合わせて読む
    フィードメーター - katoy: cocolog あわせて読みたい

リンク