Skip to content

単語頻度の集計

この機能はテキストデータの中から単語を抽出し、その出現頻度をカウントする機能を提供します。
特定の単語がテキスト内にどれだけ使用されているかを分析し、それを視覚化するためのワードクラウドも生成できます。
利用例としては、顧客フィードバックからキーワードを抽出してトレンドを把握する、SNS の投稿から話題の単語を見つけるなどがあります。
グループごとの分析も可能で、例えば商品カテゴリや地域ごとによく使われる単語を調べることができます。


入出力定義

定義内容
入力データ
出力データ
ボニートくんワードクラウド

サンプル

単語頻度の集計

ボニートくんで「ワードクラウド」を確認

ワードクラウドでは、テキストデータにおいて頻繁に出現する単語が大きく、目立つように表示され、あまり出現しない単語は小さく表示されます。
ワードクラウドから分かることは以下の通りです。

  • 主要な特徴や考慮点: 大きく表示されている単語は、ユーザーが最も重視している特徴や懸念点を反映しています。例えば、「吸引力」「軽い」「使いやすい」などが大きく表示されている場合、これらはユーザーにとって掃除機を評価する際の重要な要素であると言えます。
  • ポジティブな評価: ポジティブな単語が目立つ場合(例えば、「静か」「パワフル」「簡単」など)、レビューが全体的に肯定的であることを示唆しています。
  • ネガティブな評価: 一方で、「うるさい」「重い」「壊れる」などのネガティブな単語が目立つ場合、消費者が不満に感じている点がこれらの特徴であることを示しています。
  • 改善点や問題点: あまりポジティブでない単語やフレーズが目立つ場合は、メーカーが改善を考えるべき領域を示唆している可能性があります。
  • 製品の多様性: 様々な単語が表示されている場合、これはレビューにおいて多くの異なる特徴や問題点が言及されていることを示し、製品の多様な側面が顧客によって評価されていることを表しています。

ただし、ワードクラウドはあくまでも頻出単語の視覚化ツールであり、単語間の関係性や文脈は示されません。
したがって、具体的なレビュー内容や顧客の意見を詳細に理解するためには、実際のレビューテキストを分析する必要があります。
また、ワードクラウドは単語の出現頻度のみを考慮するため、頻出するが重要でない単語(例えば、「が」「の」などの助詞や接続詞)は事前にフィルタリングするか、解析の際に考慮しないようにする必要があります。