Przyjacielu! Kim jesteś?

Czyli rozprawka na temat znajomych w sieci. A skoro w niej jestem od 1992 roku to wiele poglądów na ten temat słyszałem i wiele prowadząc zmasowaną obronę stworzyłem.

Kolejny raz słyszę, że odpowiedni „data mining” na poczynaniach moich znajomych w sieci pozwala z bardzo duża dozą prawdopodobieństwa określić jakie to rzeczy ja będę robił. Wielokrotnie próbuje mi się udowodnić, że skoro mój znajomy sieciowy X lubi w wolnych chwilach pograć w texas holdem to ja na pewno mam skłonności do hazardu. Za każdym razem włos jeży mi się na głowie ponieważ przed oczami pojawiają mi się konsekwencje tamtych pomysłów.

Na przykład, wyobrażam sobie wyszukiwarkę, która dowiadując się czego szukali moi znajomi podpowiada mi całkowicie nie to co chcę odnaleźć.

A dlaczego spytasz? A dlatego, że ja nie znam moich sieciowych znajomych tak aby dało się zbudować model podobieństwa, a nawet jeśli część z nich znam to Ty nie dowiesz się których.

Znajomi w wielu systemach społecznościowych to krótkie relacje. W Xbox Live zagrałem fajnie z kimś w drużynie i dodał mnie do swoich znajomych, na naszej-klasie znajomi z szkoły (ale też z pracy), w goldenline, linkedin znajomi z pracy, biznesów, ale też z forum goldenline’owego, na sympatii różnie bywa ale raczej relacja jest towarzyska tj. skoro się znamy to rozmawiamy, na Facebooku… no właśnie tu pojawia się problem ponieważ pojawia się tu mydło i powidło od rodziny, żony, profilu dziecka po kolegę z podstawówki, domu obok, są tam też osoby z różnych imprez, na których się było, wakacji, konferencji, a czasem ludzie, których dodano tylko dlatego, że napisali ciekawy komentarz lub założyli adekwatną grupę i jest jeszcze grupa osób których nazywam zbieraczami czy też kolekcjonerów awatarów którzy jak sama nazwa wskazuje nie tworzą relacji tylko polują na ludzi nieświadomie akceptujących znajomość.

Wiem, że powinienem zacząć tą wyliczankę od IRC’a pierwszej real-time społeczności (tj. jak nie było „lagów” czy też nieuchronnych „splitów” można było nazwać to zjawisko real-time) ale zostawiłem go w spokoju bo tu szanujący się użytkownicy najczęściej budowali relacje wykraczające poza obszary wirtualne a IRCa traktowali jako bardzo zaawansowany zestaw do komunikacji.

Mam taką tezę, że każdy użytkownik posiadający ponad 100 osób znajomych na Facebooku posiada w nich co najmniej 10 osób, z którymi nie utrzymuje relacji np. miałby problem z określeniem co ta osoba robi, gdzie teraz jest, czym się interesuje.

W związku z tym, że moi sieciowi znajomi to w większości krótkie relacje, które wydarzyły się w różnych okresach mojego życia jest wręcz niemożliwe aby określić czy ten człowiek z którym wymieniam się komentarzami na facebooku będzie wykonywał czynności podobne do moich. Paradoksalnie im więcej ktoś posiada relacji w sieci tym mniej o twórcach tych relacji wie, a skoro tak jest to działalność ich może być diametralnie inna. Ciężko będzie ten błąd skorygować cwanym algorytmem, ponieważ problemem jest określenie, które relacje nie są wirtualne i potrawią mniej więcej określić podobieństwa zachowań.

W wielu wypadkach taniej tj. bez kosztownych „data miningów” zdać się na stereotyp grupy, w której użytkownika umieścimy i nieustannie badać i modyfikować stereotypy 😉

Dlatego jeśli szykujesz system, który na podstawie moich relacji będzie mi podpowiadał co mam teraz zrobić wiedz, że wywieszę Cię na pręgierzu i będę rzucał w Ciebie nietrafionymi propozycjami ;-E nie wiem tylko czy to czasem nie zagwarantuje Ci jednego wiernego użytkownika więcej.