この分析は、ロボット掃除機のレビューテキストを形態素解析し、形態素ごとの関連性を分析したものです。
主な指標
支持度(Support)
特定のアイテムセット(単語の組み合わせ)がデータ全体に対してどれくらいの割合で出現するかを示します。
例: 画像の気 -> なるの支持度は 0.08163265306122448 です。これは、気となるが一緒に出現する割合を意味します。
確信度(Confidence)
条件部(左側の単語)が発生した場合に、結論部(右側の単語)が発生する確率を示します。
例: 画像の気 -> なるの確信度は 1 です。これは、気が出現したときになるが必ず出現することを意味します。
リフト(Lift)
条件部と結論部が独立して出現する場合に比べて、条件部が発生したときに結論部がどれだけ頻繁に出現するかを示します。
例: 画像の気 -> なるのリフトは 4.454545454545454 です。これは、気となるが独立して出現する場合に比べて、4.45 倍の頻度で一緒に出現することを意味します。
具体的なサンプルの解説
-
気 -> なる
- 支持度: 0.08163265306122448
- データ全体の約 8.16%で気となるが一緒に出現。
- 確信度: 1
- リフト: 4.454545454545454
- 気が出現する場合、なるが出現する可能性が通常の 4.45 倍。
-
段差 -> 乗り越える
-
支持度: 0.04081632653061224
- データ全体の約 4.08%で段差と乗り越えるが一緒に出現。
-
確信度: 0.6666666666666666
- 段差が出現する場合の約 66.67%で乗り越えるが出現。
-
リフト: 16.333333333333332
- 段差が出現する場合、乗り越えるが出現する可能性が通常の 16.33 倍。
-
悪い -> 腰
- 支持度: 0.04081632653061224
- データ全体の約 4.08%で悪いと腰が一緒に出現。
- 確信度: 1
- リフト: 12.250000000000002
- 悪いが出現する場合、腰が出現する可能性が通常の 12.25 倍。
まとめ
支持度は、アイテムセット(単語の組み合わせ)の出現頻度を示し、データ全体に対する割合を表します。
確信度は、条件が発生した場合に結論も発生する確率を示します。
リフトは、条件と結論がどれだけ強く関連しているかを示し、独立した場合との比較を行います。
これらの指標を組み合わせることで、レビューテキスト内の単語の関連性を深く理解することができます。
例えば、段差と乗り越えるが頻繁に一緒に出現することから、ロボット掃除機が段差を乗り越える能力に対する関心が高いことが読み取れます。