このページは福井県立大学の田中求之が2006年1月まで運用していた Mac のサーバ運用に関する会議室 「Web Scripter's Meeting」の記録です。情報が古くなっている可能性がありますのでご注意ください。

Phantom 2.1f1

発言者:たまちゃん
( Date Friday, January 16, 1998 23:30:58 )


Phantom 2.1f1が出ています。以下、Version Hisotryより。

New In Version (2.1f1)

* A file suffix can now be 11 characters long.  A file name is still restricted to 32 characters.
* In local file crawls, special characters can be used in files names.  The starting points must have special characters % encoded. The following characters can be used: +/"^&*()_%$#@!~?
* The <script></script> tags are removed from the first 250 characters.
* The default search page (/phantom.acgi$) can be completely turned off.  In Web Server Preference, specify a file as the default page.
* Advertiser GIFs can now have a height/width attribute.
* Phantom retains puncuation in the middle of words.  For example, 8/12/97 is now a single word. 234.67 is now a single word. cd-rom is a single word.
* Phantom is now uses the same algoritm when indexing a page and when parsing words entered on a search form.
* The .customHF tag now is used to indicate which session's header and footer is to be used on the search result page.  The syntax is .customHF=4 where 4 is the session number.
* The .session tag accepts multiple session numbers.  They must be comma separatered.  For example, .session="1,2,3".
* On a local file crawl, a new session field specifies the "root" folder of the web server serving those files.
* The file extension .shtml is now included by default.
* Sessions with many start points now are displayed correctly.  There is still a problem with resaving that session if the number of start points exceeds 32K.




→  Download Maxum Demos

田中求之 さんからのコメント
( Saturday, January 17, 1998 02:09:27 )

ダウンロードしてありますが、まだ動かしてないです。ML を見ててもけっこう精力
的にバグフィックスは行われているのは分かっているんですが、2.0 の頃のバグに
懲りて、とりあえず動いているものを取り換える気にならないんですよね (^_^;;

あいかわらず 2.0.3b を使ってます。

ヤマネ ケン さんからのコメント
( Monday, January 19, 1998 00:31:05 )

先日は英語版と日本語版の違いを教えていただいてありがとうございました。
ネットクローククイックスタートの欄を見て挑戦しました。
NetCloak.acgi$をパスさせると確かにOKなのですが、バックグラウンドに
選択していたgifがでてきません。
使用しているのはOS8のWeb共有、MacHTTP2.2.2両方でためしてみましたが、
結果は同じでした。
できれば、初心者向きにネットクロークの使い方を教えてください。

田中求之 さんからのコメント
( Monday, January 19, 1998 12:55:19 )

>バックグラウンドに
>選択していたgifがでてきません。

GIF のパスはどのように書いてますか?

<IMG SRC="/Image/xxxx.gif">

のように、サーバーのルートからきちんとパスを書いておく必要があります。
画像名だけ書いてページと同じところに置いたのでは表示されない可能性が
あります。

田中求之 さんからのコメント
( Friday, January 23, 1998 20:07:24 )

私のところでは Phantom 2.1fc が 68K Mac で起動しないという問題が出ているの
ですが、他に同様のトラブルが出ている方、いらっしゃいますか?

たまちゃん さんからのコメント
( Sunday, January 25, 1998 01:30:00 )

今、手元に適当な68K Macがないので、68K用のPhantom 2.1fcをPPC Macで動かし
たところ、

The database cannot be used.

というエラーが出ました。Phantom 2.1f1のPPC版では出なかったメッセージです。

2.1f1の1つ前に2.05b5というバージョンが出ていたのですが、こちらの方では
問題がなかったのでしょうか?

68K Macでのテストは休み明けにでもやってみます。

田中求之 さんからのコメント
( Sunday, January 25, 1998 03:19:29 )

>The database cannot be used.
>というエラーが出ました

それそれ! そのエラーです。

ということは、やはり 68K のバグの可能性が高いなぁ。ここは 68K の開発に
関して以前から問題があるからなぁ…

2.0.3b がとりあえず動いているので、それからしばらくベータに手を出すのを
止めていたのですが(もっとも、不審なパケットを吐くという問題があるようなん
ですが)、fc ということで落としてみたら、この始末…

う〜む、68K の品質管理に問題ありと見た。

たまちゃん さんからのコメント
( Sunday, January 25, 1998 10:04:22 )

>68K Macでのテストは休み明けにでもやってみます。

休み明けではないのですが。(^_^;;)

68K Macで試しましたが、やはり上記のメッセージが出ました。データベースファ
イルを捨てて、1から構築しようとしても駄目でした。

(1)起動と終了が出来る。
(2)1時間位いろいろと動かしてみる。
(3)変更した設定が保存されている。

程度のことはリリースする前に確かめておくべきだと思うのですが、最近は特に
68K用のプログラムでおざなりにされているようですね。

田中求之 さんからのコメント
( Thursday, March 05, 1998 20:21:00 )

2.1f が 68K でエラーを出す原因は、4D engine がコンフリクトを起こしている
ためとのこです。ただし、この問題の修正されたバージョンはまだ出ていません。

たまちゃん さんからのコメント
( Tuesday, May 12, 1998 11:55:15 )

2.1f4が出ています。確かめましたが、まだ 2-byte character には対応して
いません。

→  Download Maxum Product Demos

田中求之 さんからのコメント
( Tuesday, May 12, 1998 14:31:14 )

メーリングリストの方では何もアナウンスがありませんね、このバージョン
に関しては。

2バイト対応ということになると、かなり大幅な作り替えが必要ですから、
2.1 のようなマイナーアップグレードではなく、3.0 のようなメジャー
アップグレードを待たないといけないと思いますよ。

Phantom の場合、検索のためにキーワードの Index を作るわけですが、これが
2バイト対応にするということは

1:日本語も含めて、各種2バイト言語の文字コードが正しく認識できる
  (現状ではヘッダの Charset による指定はあてにできないので、文字列
  を元に解析できる能力が必要)
  (また、必要に応じて変換する)

2:その言語の単語の切り分けができる

3:検索結果のページ(ここにはページの内容の先頭部分が含まれる)において
  適切な文字コード変換とヘッダーをつけられる

といったことが必要になるわけですが、このためには、Phantom 自身の仕様を
大幅に作り替える必要があります。

けっこう大きな問題になりそうなのが3で、たとえばヒットしたページが3つあった
として、1つは英語、2つめはフランス語、3つ目は日本語、のページだった場合に
どの言語のページとして見せるのか、あるいは文字コードの変換はどうするのか?
(SHIFT-JIS と ISO8859-1 は完全にバッティングします)ということが問題
になります。HTML4 + StylSheet でなんとかなるとしても、現状では、対応して
ないブラウザも多いことを考えると、現実的とは言いがたいです。

実際、今の Phantom を使って、日本の複数のサイトを検索させようとすると
(キーワードは英語のみでよしとして)、ページが SJIS, JIS, EUC の
3つのコードで書かれたものが混在するために、検索結果の表示がぐちゃぐちゃ
になります(これがあるので、以前から構想していた、サーチエンジンにこの
会議室に来られている方のページを登録して連帯するという計画を断念した
のです)。

個人的には、2バイト対応の計画を持っていることは喜ばしいことだと思いますが
どこまで使えるものに仕上げてくるのかに関しては、現状ではかなり疑問を感じて
います。

重松修 さんからのコメント
( Tuesday, May 12, 1998 15:27:48 )

私もこの問題は根が深いと思います。

単純に2バイトに対応する程度ではだめですからね。漢字コードの問題や他の言語とのバッティングも含めて、
仕様を根本から変えるほどのバージョンアップが必要だと思います。

とくに日本語は単語の区切りがないので、正しく日本語を解析してインデックスを構築しなければならないでしょうが、
これは相当骨の折れることだと思います。また、「車」と「クルマ」はどっちも「くるま」でヒットしたほうがいいと思います。

私も掲示板に検索機能をつけようと思っているのですが、どうやればいいものが出来るかの見当すらつきません。

日本語解析ライブラリという機能拡張書類がなんとなく役に立ちそうな気がするんですが。少なくとも読みに戻す
ことができるようなので。