[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[orca-users:01876] Re: OS よりも電子カルテ部門



有家@補足です。

date: Wed, Oct 09, 2002 at 08:58:56PM +0900
from: Yoshinori Ariie <PBA00250@xxxxxxxxx>
>
> 「診療圏」は要するに「地図」ですので、多くの経営指標と異なり2次元データであり
> しかも地名は固有名詞であるという2重の難関があります。
> もっとも全てのデータで郵便番号が正確に入力されていれば後半の問題は解決しますが
> error check の意味でも、やはり「地名」の解析が必要になるでしょう。
> 一筋縄では難しいかと思います。


ずっと先の宿題にしようと思っていたし、深入りするつもりは無いのですが
ここまで書いたので、以下思いつくままに。

Rubyの文字列クラス String のサブクラスとして住所クラス Address というものを
考えてみました。

   Address.new("愛媛県松山市美沢1丁目")

なんていう感じです。
このクラスに以下の3つのメソッドを作ります。
またその中から参照する2つのデータベースを外部に作ります。

▼メソッド
  m1) Address.proper
        あいまいな住所表記を正規化するメソッド
        下のd1に登録されている住所表記にする。
		それが無理ならスペルチェックする。
  m2) Address.zip
        住所データから7桁の郵便番号を求めるメソッド
        下のデータベースd1を参照して出力する。
  m3) Address.position
        住所データから緯度と経度の座標 (x, y) を求めるメソッド
        下のデータベースd2を参照して出力する。
 
▼データベース
  d1) 住所(地名)と郵便番号(7桁の10進数字)の対応表
  d2) 住所(地名)と緯度・経度 (x, y) の対応表

これだけ揃えば診療圏の分析を始められるかなと思います。

最初のメソッド Address.proper の機能があいまいですが
ここでもし、地名(固有名詞、自然言語)の解析なんていうことに正面から
取り組まなければならないのなら、たいへんな課題になってしまいそうです..

データベース d1 は郵政事業庁の

 http://www.post.yusei.go.jp/newnumber/

にCSVファイルがLHA圧縮されたものが公開されていますが
データベース d2 のようなものは見たことがありません。
国土地理院の

 http://www.gsi.go.jp/

にあるデータなどから何とかできればよいのですが..
(ゼンリンなどのデータベースは当然オープンではないでしょうから)

# こうしたことは医療機関に限らず重要な経営分析の基本だと思いますが
# 一般企業のマーケティングリサーチなどはどうやっているのでしょう。


-- 
pba00250@xxxxxxxxx
yoariie@xxxxxxxxxxxxxxx
-------------------------
有家佳紀  Yoshinori Ariie