image

  • フォト Amazonギフト券
    ※この時計の時刻は、閲覧しているパソコンのものであり、必ずしも正確な時間とは限りません

検索

最近のトラックバック

無料ブログはココログ

« 2007年9月3日 | トップページ | 2007年9月5日 »

2007年9月4日

2007-09-04

ピックアップ:情報漏えい発生時の対応ポイント集, 教わり上手な人の8つのTIPS, etc...

- http://www.moongift.jp/2007/09/nampure_auto_generator/
> > MOONGIFT: » パズルも自動生成の時代へ「ナンプレ自動生成」:オープンソースを毎日紹介

xfy でも数独を作れるはず。
問題生成、問題回答 の機能を実装するのも可能だろう。

- http://www.moongift.jp/2007/09/webstemmer/
> > MOONGIFT: » タイトル・本文抽出クローラー「Webstemmer」:オープンソースを毎日紹介

> ...
Pythonで作られたクローラーで、Webクローラー/レイアウト分析/テキスト抽出/URL DB操作/簡易的なテキスト抽出の5つの機能が提供されている。 ...

- http://www.ipa.go.jp/security/awareness/johorouei/
> > 情報処理推進機構:セキュリティセンター:情報漏えい発生時の対応ポイント集

- http://www.fx-it.com/blog/2007/09/_macpower_1.html
> > アスキー 「MacPOWER」 一時?休刊 (f/x [エフエックス] ITメディア・タンク)

専門雑誌の受難の時代だ。

- http://webcast.berkeley.edu/course_details.php?seriesid=1906978233
> > UC Berkeley Webcasts:2005年秋「The Structure and Interpretation of Computer Programs」(各動画はRealMedia形式)

- http://yanbe.org/twitterm/
> > TwitTerm: コマンドライン上で動作するTwitterクライアント

- http://dsas.blog.klab.org/archives/51094702.html
> > DSAS開発者の部屋:Erlang で付箋Webアプリケーションを作ってみました。

- http://wiredvision.jp/news/200709/2007090421.html
> > WIRED VISION / 中世イスラム芸術と『ペンローズ・タイル』、そのエピソード

- http://d.hatena.ne.jp/favre21/20070903#1188856371
> > モチベーションは楽しさ創造から - なぜ、あの人には教えたくなるのか? 教わり上手な人の8つのTIPS

- http://labs.unoh.net/2007/09/unicode-on-mac.html
> > ウノウラボ Unoh Labs: Mac OS X上のUnicode

- http://jp.techcrunch.com/archives/google-wiki-prepares-to-launch/
> > TechCrunch Japanese アーカイブ » Google Wikiの準備が本格化

格フレーム検索 を ruby から利用してみる

- http://nlp.kuee.kyoto-u.ac.jp/nl-resource/caseframe.html
> > Automatically Constructed Case Frames; Webから自動構築した大規模格フレーム βバージョン
にある 格フレーム検索 ( http://reed.kuee.kyoto-u.ac.jp/cf-search/ )
を ruby から利用する例の実験をしてみた。(あくまでも事前実験...)

$ ruby frame.rb

============
積む:動2
--------
<ガ格>
nil
--------
<数量>人:6,者:6,人:5,選手:4,員:3,職員:3,自分:3,奴:2,方:2,生:2,少女:2,それぞれ:2,上人:2,僧:2,ギルド:2,隊:2,生徒:2,各人:2,...
nil
<数量>人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%3C%BF%F4%CE%CC%3E%BF%CD
者: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BC%D4
人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BF%CD
選手: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C1%AA%BC%EA
員: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%B0%F7
職員: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BF%A6%B0%F7
自分: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BC%AB%CA%AC
奴: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C5%DB
方: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%CA%FD
生: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C0%B8
少女: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BE%AF%BD%F7
それぞれ: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%A4%BD%A4%EC%A4%BE%A4%EC
上人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%BE%E5%BF%CD
僧: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C1%CE
ギルド: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%A5%AE%A5%EB%A5%C9
隊: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C2%E2
生徒: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%C0%B8%C5%CC
各人: index.cgi?cckey=%C0%D1%A4%E0%3A%C6%B02%3A%A5%AC%B3%CA%3A%B3%C6%BF%CD

...  以下省略 ...

ソースはこれ。
require 'rubygems'
require 'hpricot'
require 'mechanize'
require 'open-uri'
require 'kconv'
require 'cgi'

$KCODE="euc"

# 格フレーム検索の URL
url = 'http://reed.kuee.kyoto-u.ac.jp/cf-search/'
text ='修行を 積む'

# text = ARGV[0]

agent = WWW::Mechanize.new                     # インスタンス生成
agent.user_agent_alias = 'Mac Safari'          #  User-Agentの設定
page = agent.get(url)                          # ページ取得

search_form = page.forms[0]

search_form.fields.find {|f| f.name == 'text'}.value = text            # テキストボックス"text"に入力
search_results = agent.submit(search_form, search_form.buttons.first)  # フォームのsubmitボタンを押す

# puts search_results.body                     # 結果の取得

doc = Hpricot(search_results.body)

doc.search("/html/body") do |b|
  kaku =  b.search("h3/text()").to_html
  if (kaku != "") then
    puts "============"
    puts kaku.tosjis
    (b/'table/tr/td').each do |td|
      data = td.search("text()").to_html
      if (data != "") then
        puts "--------"
        puts puts(CGI.unescapeHTML(data).tosjis)
        td.search("a") do |a|
          name = a.search("text()").to_html
          href = a.attributes['href']
          printf(" %s: %s¥n", name.tosjis, href)
        end
      end
    end
  end
end
#--- End of File ---

« 2007年9月3日 | トップページ | 2007年9月5日 »

mokuji

2013年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

google

  • twitter
  • __
  • _
    Googleボットチェッカー

合わせて読む

  • 合わせて読む
    フィードメーター - katoy: cocolog あわせて読みたい

リンク