この分析は、ロボット掃除機のレビューテキストを形態素解析し、形態素ごとの関連性を分析したものです。
主な指標
支持度(Support)
特定のアイテムセット(単語の組み合わせ)がデータ全体に対してどれくらいの割合で出現するかを示します。
例:画像の「気 -> なる」の支持度は 0.08163265306122448 です。これは、「気」と「なる」が一緒に出現する割合を意味します。
確信度(Confidence)
条件部(左側の単語)が発生した場合に、結論部(右側の単語)が発生する確率を示します。
例:画像の「気 -> なる」の確信度は 1 です。これは、「気」が出現したときに「なる」が必ず出現することを意味します。
リフト(Lift)
条件部と結論部が独立して出現する場合に比べて、条件部が発生したときに結論部がどれだけ頻繁に出現するかを示します。
例:画像の「気 -> なる」のリフトは 4.454545454545454 です。これは、「気」と「なる」が独立して出現する場合に比べて、4.45 倍の頻度で一緒に出現することを意味します。
具体的なサンプルの解説
-
気 -> なる
- 支持度: 0.08163265306122448
- データ全体の約 8.16%で「気」と「なる」が一緒に出現。
- 確信度: 1
- リフト: 4.454545454545454
- 「気」が出現する場合、「なる」が出現する可能性が通常の 4.45 倍。
-
段差 -> 乗り越える
-
支持度: 0.04081632653061224
- データ全体の約 4.08%で「段差」と「乗り越える」が一緒に出現。
-
確信度: 0.6666666666666666
- 「段差」が出現する場合の約 66.67%で「乗り越える」が出現。
-
リフト: 16.333333333333332
- 「段差」が出現する場合、「乗り越える」が出現する可能性が通常の 16.33 倍。
-
悪い -> 腰
- 支持度: 0.04081632653061224
- データ全体の約 4.08%で「悪い」と「腰」が一緒に出現。
- 確信度: 1
- リフト: 12.250000000000002
- 「悪い」が出現する場合、「腰」が出現する可能性が通常の 12.25 倍。
まとめ
支持度は、アイテムセット(単語の組み合わせ)の出現頻度を示し、データ全体に対する割合を表します。
確信度は、条件が発生した場合に結論も発生する確率を示します。
リフトは、条件と結論がどれだけ強く関連しているかを示し、独立した場合との比較を行います。
これらの指標を組み合わせることで、レビューテキスト内の単語の関連性を深く理解することができます。
例えば、「段差」と「乗り越える」が頻繁に一緒に出現することから、ロボット掃除機が段差を乗り越える能力に対する関心が高いことが読み取れます。