Ground Sunlight

Windowsで作る - PHPプログラミングの開発環境

トレース:

mroonga:10.7:config

差分

このページの2つのバージョン間の差分を表示します。

この比較画面にリンクする

--- mroonga:10.7:config [2020/11/10 11:37]
y2sunlight [TokenMecab]
+++ mroonga:10.7:config [2020/11/11 10:00] (現在)
y2sunlight [TokenMecab]
@@ 行 1: / 行 1: @@
-> 編集中
 ====== Mroonga9.12 全文検索の構成 ======
 Version 9.12 (MariaDB 10.4.12)
@@ 行 52: / 行 50: @@
 |リンゴ|りんご|カタカナ <nowiki>=></nowiki> ひらがな|
-結論から先に言うと、ノーマライザーとして [[https://groonga.org/ja/docs/reference/normalizers/normalizer_auto.html|NormalizerAuto]] をべきです。以下、チュートリアルに従ってその理由を説明します。
+結論から先に言うと、ノーマライザーとしては [[https://groonga.org/ja/docs/reference/normalizers/normalizer_auto.html|NormalizerAuto]] を使用すべきです。以下、チュートリアルに従ってその理由を説明します。
 \\
@@ 行 213: / 行 211: @@
 |none|トークナイズしません。|
 |TokenDelimit|空白区切りでトークナイズします。|
+|TokenRegexp|正規表現検索をサポートするトークナイザーです。|
 |TokenUnigram|ユニグラム(1-Gram)でトークナイズします。|
 |TokenBigram|バイグラム(2-Gram)でトークナイズします。|
@@ 行 221: / 行 220: @@
 <code sql>
-SHOW VARIABLES LIKE 'mroonga_default_parser';
+SHOW VARIABLES LIKE 'mroonga_default_tokenizer';
 </code>
@@ 行 235: / 行 234: @@
 \\
-===== TokenMecab =====
+==== TokenMecab ====
-本編で使用している MariaDB with Mroonga (Windows版バイナリ) ではパーサとして形態素解析エンジンの Mecab がバンドルされていて直ぐに利用することができます。Mecab の本体は以下の配置されています：
+本編で使用している MariaDB with Mroonga (Windows版バイナリ) ではパーサとして形態素解析エンジンの Mecab がバンドルされていて直ぐに利用することができます。Mecab の本体は以下に配置されています：
 <code>
@@ 行 338: / 行 337: @@
-===== トークンフィルタ― =====
+===== トークンフィルター =====
+Mroongaではトークン化の後に、トークンに所定の処理を行うトークンフィルターを指定することができます。トークンフィルターを CREATE TABLE 文の中で指定するには、''COMMENT'' を使用した以下の構文を使用します：
+<code sql>
+FULLTEXT [INDEX] [インデックス名] (カラム1,...) COMMENT 'token_filters "フィルター名"'
+</code>
+以下の３つの組込みフィルターを使用できます。詳しくはGroongaの[[https://groonga.org/ja/docs/reference/token_filters.html|ドキュメント]]を参照して下さい。
-> TODO
+  * [[https://groonga.org/ja/docs/reference/token_filters/token_filter_nfkc100.html|TokenFilterNFKC100]] \\  NormalizerNFKC100 と同じ正規化をトークン化後に使用できます。\\
+  * [[https://groonga.org/ja/docs/reference/token_filters/token_filter_stem.html|TokenFilterStem]] \\ トークンをステミングします（語形の変化を取り除き、同一の単語表現に変換する処理）。\\
+  * [[https://groonga.org/ja/docs/reference/token_filters/token_filter_stop_word.html|TokenFilterStopWord]]  \\ トークンからストップワードを除去します。
 \\

mroonga/10.7/config.1604975839.txt.gz · 最終更新: 2020/11/10 11:37 by y2sunlight