Chatbot, AI and IoT Solutions with Jetrun
自然対話AIプラットフォームを「CEATEC JAPAN 2017」に出展

「文概要分析」

― 文章から概要を抜き出す、文の要約から生成まで ―

文中から「いつ」 「どこで」「誰が」「何を」「どのように」といった概要を示す単語を抜き出し、文の概要作成に必要な情報を整理・仕分けします。

多量の文章を人の目でチェックするのは時間と手間がかかりますよね。
長文になればなるほど、確認するスピード、チェック後の品質が気になりませんか?

1.文章の要約を可能にする3つの特長

・概要抽出機能で必要な情報を抽出

文章の長短に関係なく文章を構成するための要素として、重要な単語の組み合わせを抽出します。
文節単位で評価していくため、細かい分析ができます。

・テンプレートを作成する

時間、場所、手段、金額、規模、対象などが分かれば、その情報をもとに文章を自動的に生成することが出来ます。

・同一の属性をまとめる

テンプレートの内容に含まれる属性が似たものは、類似記事とみなすことが出来ます。
ニュースキュレーションへの応用が可能です。

文章を要約する

【 SAMPLE文 】
「昨日、池袋でアイドルが野外ライブを開いた。20代を中心に若い層のファン100名が駆けつけた。同じ日にS百貨店のセールもあって、中高年の主婦層が300名駆けつけた。一時渋谷はパニックになった。」

↓ ↓ ↓ 要約すると  ↓ ↓ ↓
昨日、渋谷でアイドルの野外ライブとS百貨店のセールがあって、パニックになった。


 【 SAMPLE文 】
「昨日、 S百貨店に行く途中にハチ公前にAKBのまゆゆに似ている子がいて、本物かと思って一瞬焦った。」

↓ ↓ ↓ 要約すると  ↓ ↓ ↓
昨日、 ハチ公前にAKBのまゆゆに似ている子がいて、焦った。


文章を全て読まなくても内容を把握できます。
また、似たような属性を持っている文章同士を結びつける事ができます。

文概要分析の4つのエッセンス

1.語彙も言い回しも豊富な高機能辞書

数千万語以上のワードを持つ高機能辞書「 TrueText」
新語や略語だけでなく、類語(シソーラス)から医療・学校名・地名・センシティブワードといった、専門用語にも対応。また、定期メンテナンスで品質をチェックしています。

2.語彙の言い回しも豊富

私たち人間が理解できる言葉の揺れ(表記の違い)が、TrueTextでも容易に認識できます。 辞書に圧倒的な量の「ゆらぎワード」を持っているからです。

3.キーワードカテゴライズ

辞書に登録されている語彙は、当社独自の約1900のカテゴリに分類します。
約1900のカテゴリに分類した多次元データベースが根底の技術を支えています。

4.リスクワード検知

誘導語や差別表現として利用される隠語から、薬物や武器の名前など、様々なカテゴリからリスクワードを洗い出し、ユーザに見せたくない言葉を抽出・集計してシャットアウトすることができます。

文概要分析技術を裏で支える高機能辞書

当社が提供する文概要分析技術は、言語解析エンジンTrueTextを活用しています。
TrueTextはそのバックボーンに解析用の大規模な語彙を保有し、それを活用することで、他社には出来ない、ニュースの自動仕分けを可能にしています。

多種多様な話題カテゴリと多次元タグ

多くの語彙を持つ当社ですが、それを更に特徴付けているのが、1900を越えるJetrun独自の話題カテゴリです。
映画や音楽などのコンテンツ系のカテゴリはもちろん、政治に関するカテゴリなども保有しておりますので、とても幅広い分野に対応が可能です。
また、膨大な言葉それぞれに多次元タグという形で【複数の意味】を持たせています。 ユーザーが一般的にイメージする言葉の意味をタグとして付与しており、 たとえ文章に書かれていなくても、様々な観点でテキストの分析が可能です。

利用イメージ

導入形態とご利用価格

幅広く安心の導入形態をご用意しております。
詳しくは、下記リンクよりご確認いただけます。
導入実績はこちらから | 導入形態・ご利用価格はこちらから

NTTドコモ様が提供する"レコメンドサービス"にも採用されています。

Information