[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[orca-users:10212] Re: etch ORCA でのデータ移行



武藤@Debianぷろじぇくとです。

At Fri, 28 Dec 2007 19:26:03 +0900,
kitagawa wrote:
> >やはり、うまく変換できなかった原因は 漢字コードの問題だったようです。
> 
>  敵は本能寺におりましたか。nkf の場合、外字に出会うとそこで処理を中止して「何食わぬ顔で正常終了してしまう」はずですから、使い物にならないファイルができてしまいます。このまま移行プログラムにかけると、患者情報では、「必須データ未入力」とかのエラーは出るでしょうが、CSVファイルが悲惨な状態になっていることなど知らんぷりです。エラーメッセージやORCVTPTINF_ERR.txtからは絶対にわかりません。CSVファイルが尻切れトンボなのをエデイタで見て初めてうろたえることになります。ちょん切れた部分の、正に次の文字が外字であったことに思い至らなければ、原因は、この時点でさえ、想像もつかないでしょうね。膨大な時間と労力をかけて、全然関係のない所に原因を求めるはめにならざるをえないのです。(私の場合1週間まるまるムダにしました)

システムのエンコーディングとは別に、PostgreSQLは各データベースごとに
エンコーディングを持たせることができます。
ORCAは互換性等のためにPostgreSQLではEUC-JPで動いていたのでしょうから、
それに対して何かを食わせるときには、たとえシステムのエンコーディングが
UTF-8だったとしても(UTF-8環境下のエディタで開くと化けたとしても)データは
EUC-JPにしないと駄目でしょう。

#もちろんそういう間違いをするユーザがいるという想定をした上でフィルタ側で
  対処すべきという話もあります。
-- 
武藤 健志@ kmuto @ kmuto.jp
           Debian/JPプロジェクト   (kmuto@xxxxxxxxxx, kmuto@xxxxxxxxxxxx)
           株式会社トップスタジオ  (kmuto@xxxxxxxxxxxxxxx)
URI: http://kmuto.jp/ (Debianな話題など)