概念検索

 

概念検索パネル
検索方法として概念検索を選択した場合は、以下の概念検索パネルが表示されます.


使用方法
① 検索項目 検索対象とするテキスト項目を指定するメニューです. 項目設定 で検索項目の「テキスト項目」を指定することで、メニュー内容をカスタマイズできます.
② 文章入力ボックス ここに質問文章(※)を貼り付けて入力します.
③ 集合作成 概念検索パネルで指定した検索条件に基いて集合を作成し、集合表に追加します. このボタンは詳細モードの調査でのみ表示されます.
④ 検索実行 概念検索パネルで指定した検索条件に基いて検索を実行し、検索結果ウィンドウを表示します.
質問文章 検索したい内容(トピック)を表現した文章を指定します.短かすぎると検索漏れを招きます. 長すぎると検索ノイズを生みます.請求項1~3つ分ぐらいの長さを目安にしてください. また作文するとキーワード性の高い言葉だけを含む短い文章になりやすく検索漏れを招きます. 在りものの文章をコピー&ペースト入力することをお勧めします.
文章行の追加 複数の質問文章を用意できる場合は、1つの文章入力ボックスにまとめて入力するより、 「条件追加」ボタンで文章行を増やし1行1文章にして入力したほうが、各文章から自動選出される検索語の質が向上します. これは、文章間で共通に使われている言葉は、検索トピックを代表する言葉として優先的に選出されるためです.
文章行は最大 20 行まで追加できます.

検索語と追加語リスト
下例は「条件追加」ボタンで文章行を増やして請求項3つ入力した後に、「件数確認」ボタンを押下して 検索語リストと追加語リストを表示した状態を示しています.


① 選択指定 検索語毎に以下が指定可能です.
この検索語を使用し重みを4倍する.質問文書を変更しても◎のまま検索語リストに残る
この検索語を使用する.質問文書を変更しても○のまま検索語リストに残る
この検索語を使用する(デフォルト)
×この検索語を使用しない
② 検索語 質問文章から検索語として選出された言葉が表示されます. なお検索語リストは、列ヘッダをクリックすることで列の値でソート(並べ替え)できます.
③ ヒット数 検索項目で指定したテキスト部位に検索語が出現している文書(公報)の件数です. ただし検索項目が「全文(FK)」など公開と登録に跨る場合は、公開公報の件数となります.
④ 出現文章 この検索語が出現している質問文章の文章番号がカンマ区切りで表示されます.
⑤ 辞書展開語 この検索語を見出しまたは内容に含む辞書データから、この検索語以外の言葉をインデントして表示します. 基となる検索語をクリックすると、辞書編集 の画面に遷移します. 編集後にその内容を検索語リストに反映するには「件数確認」ボタンを押して下さい.
⑥ 選択指定 追加語毎に以下が指定可能です.
この追加語を使用し重みを4倍する
この追加語を使用する
×この追加語を使用しない
⑦ 追加語 セルをクリックすると、追加語の入力または編集が可能な状態になります. セル内の文字列は空白等で区切ってあっても全体として1つの言葉として扱われます.
⑧ 全体件数 検索語と追加語をOR条件で結合してできる検索式により求めた検索件数です. ただし既に 再検索 している場合は、関連語の条件も加えた再検索後の件数が表示されます.
なお件数確認ボタンを押下すると、この全体件数以外に、質問文章毎の検索件数も文章行右端に表示されます.
検索語リスト 質問文章から自動選出された言葉のリストです. 質問文章に現れる確率P(3つの質問文章中2つに現れれば2/3)、対象DB中の文書に現れる確率Q(ヒット数/全件数)、検索語の重みW(※下記参照)から、選択値 W×(P-Q) を求め、それが大きい順に最大30語を選出し提示します.
追加語リスト ユーザが追加した言葉のリストです.質問文章に例えば"文書抽出"というフレーズがあった場合、システムは検索漏れを防ぐため、 "文書"と"抽出"に分解し各々を検索語とします.その分ノイズを招きやすいので、上例ではフレーズ"文書抽出"を追加しています. また上例では"雛形"が最も選択値が高い検索語ですが、ヒット数が小さすぎるため類義語"テンプレート"を追加し、検索漏れを予防しています.追加語は30語まで指定できます.
検索語の重み 検索語リストの列「重み」をチェックすると表示されます. 確率モデルという重みづけ方式、 具体的には log(1 + α × 全件数 / ヒット数) により求めています( α はチューニング用定数).
概念検索 検索には検索語リストと追加語リスト中の言葉をOR条件で結合してできる検索式が用いられます.すなわち質問文章は直接的には検索には用いられません. 各言葉はヒット数から求めた重みを持ち、ヒットした文書に、その文書内頻度および文書長を加味したスコアとして加算されます.このスコア合計が大きい順に検索結果を 提示するのが概念検索です.

文章行メニュー
文章行の左端プルダウンメニューから、質問文章に対する各種操作が可能です.


① 文章番号 質問文章の識別番号です.検索語リストの出現文章には、この番号が表示されます.
② ×指定 この質問文章の使用を停止します.
③ クリア・削除 クリアは文章入力ボックスを空にします.削除はこの文章行を削除します.
④ コピー・貼り付け コピーは質問文章を内部領域にコピーします.貼り付けは内部領域にあるデータを文章入力ボックスにコピーします.
⑤ 追加(直後) 実行した文章行の直後に空の文章行を追加します.
⑥ 辞書編集 質問文章から言葉を抽出して提示します(下例左).辞書編集したい言葉(例えば"規則")をクリックすると 辞書編集 の画面に遷移して"規則"を見出しとする辞書データを追加します(下例右). この辞書データを編集してご使用ください.


なお上例左の"文書"のように予め辞書に登録されている場合は、辞書展開語と共に提示します. また質問文章から抽出された言葉が1つの場合は、上例左の選択ダイアログを介さずに直接、辞書編集画面に遷移します.
⑦ 表示 質問文章全体を別ウィンドウ内に表示します.「件数確認」により検索語リストを求めた後に、この表示を実行すると、 下例のように質問文章内に出現している検索語または追加語をハイライト表示します.




データメニュー
概念検索のデータメニューから、文章表に対する以下の操作が可能です.


① 読込 サーバ側に保存しておいた文章表データを文章表に読込むため以下のダイアログを表示します. 読込むデータ(行)をクリックして選択後、「実行」ボタンを押下して下さい. 他ダイアログと同様の手順で、ID検索により他ユーザのデータを読込むこともできます. なお読込みに際しては、現在の文章表データは失われますのでご注意ください.

② 保存 現在の文章表データをサーバ側に保存するため以下のダイアログを表示します. 上書き保存の場合は、対象データ(行)をクリックして選択後、「上書き保存」ボタンを押下して下さい.

③ ダウンロード 現在の文章表データをエクセルファイル形式でダウンロードします.