Jakie produkty najczęściej pojawiają się wspólnie w koszykach klientów? Jakie usługi są chętnie wybierane razem? Odpowiedzi na te pytania mogą stać się kluczem do zwiększenia wartości koszyka klienta, dzięki sprzedaży krzyżowej (ang. cross-selling). Dobrym wstępem do eksploracji danych pod tym kątem jest budowanie tabel krzyżowych.
Proces wybierania przez klienta produktów z półki, technicznie przypomina wybieranie dowolnej liczby odpowiedzi z pytania wielokrotnego wyboru. Stąd, możemy posłużyć się w analizie zestawem wielokrotnych odpowiedzi, który skrzyżowany sam ze sobą da nam informację o częstości współwystępowania ze sobą w koszykach poszczególnych par produktów.
W powyższej tabeli bazą procentowania są wszystkie koszyki. Wartość w komórce tabeli prezentuje procent koszyków, w których znalazły się obie kategorie produktowe. Przykładowe pary produktów, które często pojawiały się w koszykach to:
- „piwo” i „dania mrożone” – 18% koszyków,
- „ryby” i „warzywa i owoce” – 15% koszyków,
- „wino” i „słodycze” – 15% koszyków.
Przekątna tej tabeli stanowi skrzyżowanie kategorii z nią samą, w związku z czym wartości te interpretujemy jako przeciętną częstość występowania danego produktu w danych. W drugiej tabeli wykorzystana została statystyka „% z N w wierszu”.
Interpretacja dzięki temu jest jeszcze ciekawsza.
Przyjrzyjmy się parze „słodycze” (w wierszach) i „wino” (w kolumnach). Po sprawdzeniu wszystkich koszyków ze słodyczami, okazuje się, że 52% spośród nich zawiera również wino. Możemy zatem powiedzieć, że oferując wino klientowi, który zdecydował się na słodycze, robimy to z 52%-ową ufnością. Reguła „Jeśli słodycze, to wino” wydaje się być dość słaba, niemniej znacznie poprawia skuteczność sprzedaży wina. Skąd to wiem? Z porównania wartości ufności reguły z tym, jak często kupowane jest wino w całej populacji (tabela 1, 30%). Gdybyśmy zaproponowali wino 100 losowo wybranym klientom, to ofertę zaakceptowałoby 30-stu z nich (czyli 30%). Jeśli jednak posłużymy się naszą regułą i będziemy oferować wino tylko osobom kupującym słodycze, nasza skuteczność wzrośnie do 52%!
Tak zbudowane tabele mogą również posłużyć do konstruowania wstępnych wniosków dotyczących naturalnej segmentacji klientów. Ale to już temat na osobny wpis…