このページは福井県立大学の田中求之が2006年1月まで運用していた Mac のサーバ運用に関する会議室 「Web Scripter's Meeting」の記録です。情報が古くなっている可能性がありますのでご注意ください。

ファイルメーカーで「議事録データベース」?

発言者:笹田
( Date Tuesday, May 05, 1998 16:12:50 )


はじめまして。KPNの笹田と申します。

「議会議事録」をwebで全文公開したいと思っています。テキストデータが
ものすごい量なので、ファイルメーカーで「議事録データベース」が
できるのかと、悩んでいます。

ファイルメーカーって、テキストボックスの字数制限があったはずですよね。

また、何か良い方法があれば、ご教授ください。

初歩的な質問で申し訳ありませんが、コメントをよろしくお願いします。

重松修 さんからのコメント
( Wednesday, May 06, 1998 03:44:40 )

全文をファイルメーカーに登録しないといけないのですか?
もし、そうでないなら、議会議事録の一部(検索したりする必要性が高い
部分)だけをファイルメーカーに登録して、議事録の全文は個別のテキスト
ファイルのまま用意して、そのファイル名をファイルメーカーに登録し、
議事録を読みたいときは、そちらへ飛ぶようにすれば簡単だと思います。

笹田 さんからのコメント
( Wednesday, May 06, 1998 06:20:36 )

重松さんありがとうございます。やっぱり、この方法が簡単で現実的ですよね。

でも、オンブズマンの方たちからの要望の中には、全文検索をして欲しい
という要望があります。個人的には、あまり意味がないのではないかと思うの
ですが、全文をキーワードサーチする機能があったほうが良いということら
しいです。

全文サーチはやはりむずかしいのでしょうね。

重松修 さんからのコメント
( Wednesday, May 06, 1998 07:02:22 )

全文検索は遅くて使いものにならないと思いますよ。。。(^^;;

木下@キー・プランニング さんからのコメント
( Wednesday, May 06, 1998 09:02:23 )

テキストフィールドの制限は、半角64,000文字、全角32,000文字までとなっています。
これを超えるものがあるなら、レコードを分割して登録するしかないですね。

全文検索は、中間一致検索にこだわらず前方一致や完全一致の検索条件でOKなら、
不可能ではないでしょうが、かなりマシンパワーがないと遅いでしょう。

中間一致も含めた検索も、索引の作り方次第で、不可能ではないと思いますが、RAMや
HDの容量や、CPUの速度に余裕がないと速度的には辛いかもしれません。

私のサイトに、中間一致検索の高速版のサンプル「郵便番号検索 -カスタムWeb版」が
置いてありますので(テンプレートのダウンロードも可)、興味があったら試して
みてください。

→  KEY Planning Web

サトー@東京 さんからのコメント
( Thursday, May 07, 1998 17:43:41 )

ちょっとマト外れかもしれませんが、書き込みさせていただきます。

重松修 さんのおっしゃるように、議事録一部はファイルメーカーへ、
議事録全体はテキストとして保存しておく方法をとったとして、
全文検索は、Jeditなどの「マルチファイル検索」機能を使う方法はいかがですか?
(※マルチファイル検索は、ご存知ですか? 
  私は、結構最近までその機能を知りませんでした。
  ファイルを開かずにフォルダ内にあるテキストファイル全体に対して、
  任意の文字列を検索します。                   
  Windowsでは「秀丸エディタ」の「grepの実行」で同様の検索を行なえます。
  また、AppleScriptを使えばもっと凝った検索も実現可能です。          )

ちょっと発言の意図が分かりづらくなってしまいましたが、ようは・・・
検索対象としたいデータの全てをあえてファイルメーカーに入力して管理する必要はなく
ばらばらのテキストファイルでも、十分にあとで活用する方法はある
と言うこと・・・が言いたかったのです(^^; 
テキストで保管するときも、1月ごとなどでフォルダを分けておく位の整理は必要ですが・・・

下手な文章ですみません。失礼します・・・


小川誠 さんからのコメント
( Tuesday, May 12, 1998 20:26:11 )

みなさん,こんにちは

ファイルメーカメーリングリストオーナの小川誠です.


ちょっと試しただけなので自信があまりないのですが,ファイル
メーカの仕様?なのか,繰り返しフィールドにはその繰り返し
フィールドごとに全角32,000文字が入ります.つまり,
10個繰り返せば32万文字が入力可能です.しかし,検索は,その
繰り返しフィールドに1個入れてやれば検索してくれますので,長
すぎる文章の場合は繰り返しフィールドに分割してやれば良いので
はないかと思います.


ファイルメーカで検索を行う際のポイントは如何にインデックスを
活用した検索をさせるかだと思います.したがって,効果的なイン
デックスをFM側で作成することになるのですが,木下さんが
紹介して下さっている,とりあえず全部をカンマなどで区切って索
引を作らせる手法は,デ−タが短い場合は良いのですが,長い文字
列の場合は索引の計算式が多くなりすぎて重くなるのと,文字数の
制限にかかってしまい全文検索のようなシステムには向きません.


最近WAISを使った全文検索システムを見ていて,この辞書を使って
索引を作成する手法が使えないかと考えています.構文解析までは
無理としてもあらかじめ検索語を辞書として別に用意して,その検
索語がフィールドに含まれていればその語を索引として検索用の
フィールドに入れてしまうというものです.

この手法の問題点はデ−タの更新が行われるたびにスクリプトを起
動し,その処理にかなり時間がかかることです.議事録なら,そう
頻度が多く修正されるものでもないと思いますのでこうした手法に
よってファイルメーカで全文検索をそれほどストレス無くできるの
ではないかと思います.



→  freeWAIS-sf 日本語化情報