KXEN Text Coder(KTC)
~ テキストコーディングコンポーネント ~
![]() |
|
顧客の声が隠されるテキストデータを、予測モデルに活用できる形に変換。 |
|
カスタマーサポートへの問い合わせやアンケートデータなど、マイニング可能な形に情報を変換し、予測モデルの精度を向上させます。 |
▌KTCコンポーネントの概要
|
コールセンターのテキストログのようなテキスト情報には、顧客に関する重要な情報が隠されています。 KXEN Text Coder(KTC)は自由形式のテキストを含むフィールドを、マイニングで使用できる形式に変換するテキストコーディングコンポーネントです。KTCはテキスト変数の内容を単語に分割し、頻出やランキング方法によって最も関連性の高い言葉だけをマイニングに使用する変数として保持します。KTCで作成された変数はシームレスに既存の説明変数と組み合わせられ、分類、回帰、クラスタリングのようなモデル作成に使用されます。KTCは多言語対応のコンポーネントで自動で言語を認識します。 |
▌KTCコンポーネントの機能 |
|||||
他言語対応 |
|||||
| ● | KTCは他言語対応で、言語モデルはストップリストやステミングルールを編集することで簡単にカスタマイズできます。 |
||||
| ● | 入力された言語はKTCで自動的に認識され、ユーザーはテキスト変数に対してその都度言語を適用する必要はありません。KTCはストップリストを使い言語検出を行います。 |
||||
重要な言葉の特定 |
|||||
| ● | KTCはテキスト変数をステミングルールを用いて、生成された多様な単語をルートワードのみに削減します。これらのルールは多言語だけでなく専門分野の単語に対しても適応することが可能です。 |
||||
シームレスな組み込み |
|||||
| ● | KTCはKXEN Analytic Frameworkの一部分であるため、現在のハードウェアやOS環境にシームレスな組込みが可能です。 |
||||
モデル精度の向上に寄与 |
|||||
| ● | KTCで抽出された情報は分類/回帰やクラスタリングモデルで活用されます。モデルの予測・記述の質を高めるだけでなく、グループ化された言葉を探索することでコンセプトを構築することができ、また言葉同士の関連性を把握することができます。
|
||||
|
|||||










