Navigation :
Top/mknmz
mknmz
mknmz
機能
namazuのデ−タ−ベ−ス作成
書式
mknmz [オプション] <対象Directory>...
使用例
mknmz -O /home/mori/namazu/proceedings /home/mori/doc_sci/proceedings/
オプション
対象ファイル:
- -a, --all すべてのファイルを対象とする
- -t, --media-type=MTYPE 対象ファイルの文書形式を指定する
- -h, --mailnews --media-type='message/rfc822' と同じ
- --mhonarc --media-type='text/html; x-type=mhonarc' と同じ
- -F, --target-list=FILE インデックス対象のファイルのリストを読み込む
- --allow=PATTERN 対象とするファイル名の正規表現を指定する
- --deny=PATTERN 拒絶するファイル名の正規表現を指定する
- --exclude=PATTERN 除外するパス名の正規表現を指定する
- -e, --robots 次の記述を含む HTMLファイルを除外する
- -M, --meta HTMLの metaタグをフィールド指定検索に用いる
- -r, --replace=CODE URIを置換するためのコードを指定する
- --html-split HTMLファイルを 単位で分割処理する
- --mtime=NUM 変更日制限 find(1) の -mtime と同じ規則 例: -50 で 50 日以内、+50 で 50 日より古いものだけ
形態素解析:
- -c, --use-chasen 日本語の単語のわかち書きに ChaSen を用いる
- -k, --use-kakasi 日本語の単語のわかち書きに KAKASI を用いる
- -m, --use-chasen-noun 名詞のみを抽出する
- -L, --indexing-lang=LANG インデックス時に言語に特化した処理を行なう
文字列処理:
- -E, --no-edge-symbol 単語の両端の記号は削除する
- -G, --no-okurigana 送り仮名を削除する
- -H, --no-hiragana 平仮名のみの単語は登録しない
- -K, --no-symbol 記号をすべて削除する
要約:
- -U, --no-encode-uri URIのencodeを行わない
- -x, --no-heading-summary HTML のヘディングによる要約作成を行わない
インデックス作成:
- --update=INDEX 更新するインデックスを指定する
- -Y, --no-delete 削除された文書の検出を行わない
- -Z, --no-update 文書の更新・削除を反映しない
その他:
- -s, --checkpoint チェックポイント機構を作動させる
- -C, --show-config 現在の設定を表示する
- -f, --config=FILE 設定ファイルを指定する
- -I, --include=FILE カスタマイズ用ファイルを読み込む
- -O, --output-dir=DIR インデックスの出力先を指定する
- -T, --template-dir=DIR NMZ.{head,foot,body}.* のディレクトリを指定する
- -q, --quiet インデックス処理の最中にメッセージを表示しない
- -v, --version ヴァージョンを表示する
- -V, --verbose 口やかましいモード
- --debug デバッグモード
- --help このヘルプを表示する