0. Sformułowanie problemu

W pierwszym odcinku serialu „Numb3rs” matematyka zostaje przedstawiona jako narzędzie do opisu i przewidywania rzeczywistości, a nie jedynie abstrakcyjna dziedzina nauki. Punkt wyjścia stanowi proste, lecz fundamentalne założenie:

zachowania ludzi – nawet przestępcze – nie są losowe i podlegają prawom statystyki.

W pilocie wykorzystane zostają idee z kilku kluczowych obszarów matematyki:

Analiza statystyczna danych
Zdarzenia (porwania) traktowane są jako punkty danych w przestrzeni. Ich rozmieszczenie nie jest przypadkowe – odpowiednia analiza pozwala wykryć regularności ukryte w pozornym chaosie.

Modele probabilistyczne
Każde miejsce w mieście ma pewne prawdopodobieństwo wystąpienia kolejnego zdarzenia. Zamiast pytać „gdzie był sprawca?”, matematyka pozwala zapytać „gdzie najprawdopodobniej uderzy ponownie?”.

Geometria i analiza przestrzenna
Miasto zostaje opisane jako przestrzeń geometryczna, w której lokalizacje przestępstw tworzą wzorzec (klaster). Środek ciężkości tych punktów przybliża obszar działania sprawcy.

Redukcja niepewności
Celem matematyki nie jest wskazanie jednego punktu, lecz zawężenie obszaru poszukiwań – zmniejszenie entropii informacyjnej śledztwa.

Matematyczny wstęp odcinka prowadzi do kluczowej tezy serialu:

„Liczby nie rozwiązują spraw same – ale pozwalają zadawać lepsze pytania.”

To właśnie ta filozofia stanowi fundament całego „Numb3rs”: matematyka jako język opisu świata, w którym nawet zbrodnia pozostawia po sobie mierzalny ślad.

Matematyczne wprowadzenie

Niech \Omega\subset\mathbb{R}^2 będzie obszarem miasta, a x_i\in\Omega,\ i=1,\dots,n lokalizacjami zdarzeń (napadów).
Szukamy punktu x_0\in\Omega bazy przestępcy – maksymalizującego pewną funkcję wiarygodności S(x) :
\hat{x}_0\in\mathrm{Opt}(\mathcal{F}\mid\mathcal{X}).


1. Modele centro-graficzne

1.1 Wprowadzenie i sens modeli centro-graficznych

Modele centro-graficzne należą do najprostszych metod estymacji lokalizacji bazy przestępcy.
Opierają się wyłącznie na geometrii rozmieszczenia zdarzeń i ignorują czynniki psychologiczne, środowiskowe oraz czasowe.

Formalnie:
niech x_i\in\mathbb{R}^2,\ i=1,\dots,n oznaczają miejsca popełnionych przestępstw.
Szukamy punktu \hat{x}_0 będącego geometrycznym centrum aktywności, który traktujemy jako pierwsze przybliżenie bazy.


1.2. Środek arytmetyczny

Definicja

Najprostszy estymator bazy to średnia arytmetyczna współrzędnych:

\sum_{i=1}^{n}(x_i-\hat{x}_0)=0.

Interpretacja kryminologiczna

Zalety

Wady


1.3. Mediana geometryczna

Definicja

Punkt minimalizujący sumę odległości:

0\in\sum_{i=1}^{n}\frac{x-x_i}{|x-x_i|}\Big|_{x=\hat{x}_0}.

Interpretacja

Zalety

Wady


1.4. Estymator minimaksowy

Definicja

Punkt minimalizujący maksymalną odległość:

\hat{x}_0=\arg\min_x \sup_u R(x,u).

Interpretacja

Zastosowanie

Ograniczenia


1.5. Elipsa standardowa i macierz kowariancji

Definicja macierzy kowariancji

\Sigma=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})(x_i-\bar{x})^{T}.

Znaczenie geometryczne

Interpretacja kryminologiczna


1.6. Ważony środek ciężkości

Definicja

\hat{x}_0=\tilde{\mathbf{w}}^{\top}\mathbf{x},\quad \tilde{\mathbf{w}}=\frac{\mathbf{w}}{\mathbf{1}^{\top}\mathbf{w}}.

Znaczenie wag

Zalety


1.7. Odległość sieciowa zamiast euklidesowej

W miastach rzeczywista odległość to nie norma euklidesowa, lecz koszt w grafie dróg G .

Definicja

d_G(u,v)=\min_{\gamma:u\to v}\sum_{e\in\gamma}w(e).

Centro-graficzne estymatory można liczyć z d_G zamiast |\cdot| .


Zadanie

Czy zdarzenia kryminalne są losowe? – analiza wstępna

W pewnym mieście w ciągu miesiąca odnotowano 10 porwań. Ich lokalizacje (w kilometrach, w lokalnym układzie współrzędnych) dane są jako:

(x_i,y_i)={(2,3),(3,4),(4,3),(3,2),(10,10),(11,9),(9,11),(10,9),(9,10),(11,11)}.

Zadania:

  1. Sprawdź, czy zdarzenia mają charakter losowy w przestrzeni.
  2. Wyznacz środki skupień zdarzeń.
  3. Zinterpretuj wynik w kontekście kryminalistyki.

Rozwiązanie

1. Model matematyczny zdarzeń

Każde przestępstwo modelujemy jako punkt w przestrzeni:

(x_i,y_i)\in\mathbb{R}^2.

Cały zbiór danych zapisujemy jako:

\mathcal{D}={(x_i,y_i)}_{i=1}^{10}.

Na tym etapie narracja kryminalna zostaje przekształcona w problem geometryczno-statystyczny.


2. Analiza struktury przestrzennej

Punkty w zbiorze \mathcal{D} nie są rozmieszczone jednorodnie. Widać dwa klastry, co sugeruje, że proces generujący zdarzenia nie jest losowy (niejednorodny).


3. Środek ciężkości (centroid)

Środek skupienia punktów definiujemy jako średnią arytmetyczną:

\bar{x}=\frac{1}{n}\sum_{i=1}^n x_i,\qquad \bar{y}=\frac{1}{n}\sum_{i=1}^n y_i.

Dla pierwszego skupienia otrzymujemy w przybliżeniu:

(\bar{x}_1,\bar{y}_1)\approx(3,3).

Dla drugiego skupienia:

(\bar{x}_2,\bar{y}_2)\approx(10,10).


4. Interpretacja statystyczna

Gdyby zdarzenia były losowe, punkty:

Matematycznie oznacza to, że rozkład zdarzeń nie jest jednorodnym procesem losowym w przestrzeni.


Wniosek kryminalistyczny

Obecność skupień wskazuje na:

Formalnie uzasadnia to przejście do estymacji:

p(x\mid\mathcal{D}),

a w kolejnych sekcjach do estymatorów typu:

\hat{x}_{MAP}=\arg\max_x p(x\mid\mathcal{D}),

\hat{x}_{MMSE}=\int x,p(x\mid\mathcal{D}),dx.



Opis idei

Modele centro-graficzne są najprostszą matematyczną próbą odpowiedzi na pytanie:
„Gdzie znajduje się centralny punkt aktywności przestępczej?”

Zakładają one, że baza sprawcy leży „pośrodku” zbioru miejsc zdarzeń. Nie modelują zachowania sprawcy, lecz geometrię punktów.

Znaczenie wzorów

Każdy wzór odpowiada innemu kryterium optymalności geometrycznej.

Sens matematyczny

Są to klasyczne problemy optymalizacji wypukłej:

L \infty → centrum Chebysheva.

L2 → średnia,

L1 → mediana,



2. Modele zaniku odległości

2. Wprowadzenie do modeli zaniku odległości

Modele zaniku odległości (distance–decay models) opisują empiryczną prawidłowość, zgodnie z którą częstotliwość działań przestępczych maleje wraz z rosnącą odległością od bazy sprawcy.
W kontekście profilowania geograficznego zakłada się, że sprawca ponosi koszt przestrzenny (czas, ryzyko, wysiłek), który rośnie z dystansem.

Formalnie: niech x_0 oznacza bazę sprawcy, a x_i lokalizację przestępstwa. Wtedy prawdopodobieństwo zdarzenia w punkcie x_i zależy od odległości d(x_0,x_i) .


2.1. Ogólna postać modelu zaniku odległości

Modele zaniku odległości zapisuje się w postaci funkcji malejącej:

p(x_i\mid x_0)=f(d(x_0,x_i)),\quad f'(d)<0.

Funkcja f określa, jak szybko spada atrakcyjność celu wraz z odległością.


2.2. Zanik potęgowy

Jednym z najczęściej stosowanych modeli jest prawo potęgowe:

f(d)=d^{-h},\quad h>0.

Interpretacja:

Znaczenie kryminologiczne:


2.3. Zanik wykładniczy

Alternatywą jest zanik wykładniczy:

f(d)=\exp(-\alpha d),\quad \alpha>0.

Interpretacja:

Zastosowanie:


2.4. Model z buforem bezpieczeństwa

Empirycznie obserwuje się, że sprawcy unikają najbliższego sąsiedztwa bazy, co prowadzi do wprowadzenia strefy buforowej:

f(d)=(d-b)^{-h}\,\mathbf{1}_{[b,\infty)}(d).

gdzie b>0 oznacza promień bufora.

Znaczenie:


2.5. Zanik mieszany

W praktyce stosuje się modele łączone:

f(d)=\exp(-\alpha d),d^{-h}.

S(x)=\sum_{i=1}^{n}\left[\frac{1}{d_G(x,x_i)^f}H(d_G(x,x_i)-b)+\frac{k}{b}\big(1-H(d_G(x,x_i)-b)\big)\right].

2.6. Modele z normalizacją probabilistyczną

Aby f(d) było poprawną gęstością:

p(x_i\mid x_0)=\frac{f(d(x_0,x_i))}{\int_{\Omega} f(d(x_0,x)),dx}.

Zapewnia to porównywalność modeli na różnych obszarach miejskich.


2.7. Zanik odległości w modelu Rossmo

W klasycznym modelu Rossmo funkcja punktacji ma postać:

S(x)=\sum_{i=1}^{n} K_b!\left(d(x,x_i)\right).

Model ten łączy:


2.8. Zanik odległości w modelach bayesowskich

W ujęciu bayesowskim:

p(x_0\mid{x_i})\propto\prod_{i=1}^{n} f(d(x_0,x_i)),p(x_0).

Funkcja f pełni rolę funkcji wiarygodności.


2.9. Odległość euklidesowa a sieciowa

W miastach odległość zastępuje się kosztem w grafie dróg G :

d_G(u,v)=\min_{\gamma:u\to v}\sum_{e\in\gamma}w(e).

Modele zaniku odległości są wtedy definiowane jako f(d_G) .


Zadanie

Załóżmy, że położenie punktu bazowego sprawcy opisuje zmienna losowa
X\in\mathbb{R}^2.

Dane są lokalizacje zdarzeń:

\mathcal{D}={x_1,\dots,x_n},\quad x_i\in\mathbb{R}^2.

Przyjmij:

p(X)=\mathcal{N}(X;\mu_0,\Sigma_0),

p(x_i\mid X)=\mathcal{N}(x_i;X,\Sigma).

Zadania:

  1. Zapisać wzór Bayesa dla p(X\mid\mathcal{D}).
  2. Wyznaczyć postać rozkładu a posteriori.
  3. Wskazać estymator MAP i MMSE.

Rozwiązanie

1. Wzór Bayesa

Rozkład a posteriori dany jest wzorem:

p(X\mid\mathcal{D})=\frac{p(\mathcal{D}\mid X)p(X)}{p(\mathcal{D})}.

Ponieważ dane są niezależne warunkowo:

p(\mathcal{D}\mid X)=\prod_{i=1}^n p(x_i\mid X).


2. Postać rozkładu a posteriori

Podstawiając rozkłady normalne:

p(X\mid\mathcal{D})\propto \left(\prod_{i=1}^n \mathcal{N}(x_i;X,\Sigma)\right)\mathcal{N}(X;\mu_0,\Sigma_0).

Iloczyn rozkładów normalnych prowadzi ponownie do rozkładu normalnego:

p(X\mid\mathcal{D})=\mathcal{N}(X;\mu_n,\Sigma_n).

gdzie:

\Sigma_n^{-1}=\Sigma_0^{-1}+n\Sigma^{-1},

\mu_n=\Sigma_n\left(\Sigma_0^{-1}\mu_0+\Sigma^{-1}\sum_{i=1}^n x_i\right).


3. Estymatory

MAP (Maximum A Posteriori):

\hat{X}_{MAP}=\arg\max_X p(X\mid\mathcal{D})=\mu_n.

MMSE (Mean Minimum Square Error):

\hat{X}_{MMSE}=\mathbb{E}[X\mid\mathcal{D}]=\mu_n.

Dla rozkładu normalnego MAP i MMSE pokrywają się.


Interpretacja kryminalistyczna

Rozkład a posteriori:

p(X\mid\mathcal{D})

opisuje:

Model probabilistyczny nie wskazuje punktu deterministycznie, lecz cały obszar o największej wiarygodności operacyjnej.



Opis idei

Modele te formalizują empiryczne prawo kryminologii:

Im dalej od bazy, tym mniejsze prawdopodobieństwo działania sprawcy.

Matematyka opisuje jak szybko to prawdopodobieństwo maleje.

Znaczenie wzorów

Funkcje zaniku (potęgowe, wykładnicze) opisują tempo spadku intensywności zdarzeń wraz z odległością.

Wprowadzenie strefy buforowej oznacza:

Sens matematyczny

Są to funkcje wagowe, które:

zamieniają „odległość” w „koszt psychologiczny”.

deformują geometrię przestrzeni,


3. Model Rossmo w poszukiwaniu bazy przestępcy

3. Wprowadzenie do modelu Rossmo

Model Rossmo jest klasycznym i najbardziej rozpowszechnionym matematycznym narzędziem profilowania geograficznego. Jego celem jest wyznaczenie obszaru o najwyższym prawdopodobieństwie lokalizacji bazy przestępcy (miejsce zamieszkania, pracy lub zaplecza logistycznego) na podstawie rozmieszczenia zdarzeń przestępczych.

Formalnie: dla zbioru lokalizacji przestępstw {x_i}_{i=1}^n na obszarze \Omega\subset\mathbb{R}^2 konstruuje się funkcję punktacji S(x) , której maksimum wskazuje najbardziej prawdopodobną bazę.


3.1. Założenia modelu Rossmo

Model opiera się na czterech empirycznych założeniach:

  1. sprawca działa relatywnie blisko swojej bazy,
  2. prawdopodobieństwo działania maleje wraz z odległością (distance–decay),
  3. istnieje strefa buforowa wokół bazy,
  4. wpływ każdego zdarzenia jest addytywny.

Matematycznie baza x_0 jest traktowana jako punkt maksymalizujący funkcję agregującą wpływy wszystkich zdarzeń.


3.2. Funkcja odległości

Dla dowolnego punktu testowego x\in\Omega i zdarzenia x_i definiuje się odległość:

d_i(x)=d(x,x_i).

W praktyce:


3.3. Strefa buforowa

Wprowadza się promień bufora b>0 , taki że aktywność sprawcy w bezpośrednim sąsiedztwie bazy jest ograniczona:

d_i(x)<b\Rightarrow\text{obnizona punktacja}.

Bufor modeluje unikanie rozpoznania i ryzyka identyfikacji.


3.4. Klasyczna funkcja punktacji Rossmo

Podstawowa postać funkcji Rossmo:

S(x)=\sum_{i=1}^{n}K_b\big(d_i(x)\big).

Gdzie:


3.5. Interpretacja składników funkcji


3.6. Estymator bazy przestępcy

Baza jest wyznaczana jako maksimum funkcji punktacji:

\hat{x}_0=\arg\max_x \ell(x).

W praktyce otrzymuje się mapę cieplną, a nie pojedynczy punkt.


3.7. Dyskretyzacja obszaru

Obszar miasta dzieli się na siatkę komórek {x^{(j)}} i oblicza:

S(x^{(j)});\text{dla wszystkich }j.

Pozwala to na wizualizację wyników w systemach GIS.


3.8. Kalibracja parametrów modelu

Parametry (f,b,k) są dobierane empirycznie:

(f,b,k)=\arg\max \sum_{m} \log p(\hat{x}_0^{(m)}\mid \text{dane}_m).

W serialu Numb3rs proces ten jest pomijany.


3.9. Wersja probabilistyczna modelu Rossmo

Model punktacji można interpretować probabilistycznie:

p(x_0\mid{x_i})\propto S(x_0).

Po normalizacji:

p(x_0)=\frac{S(x_0)}{\int_{\Omega} S(x),dx}.


3.10. Zastosowanie odległości sieciowej

W miastach rzeczywista wersja modelu przyjmuje postać:

S(x)=\sum_{i=1}^{n} f(d_G(x,x_i)).

Uwzględnia to infrastrukturę komunikacyjną i bariery przestrzenne.



Zadanie

Dany jest jednowymiarowy rozkład a posteriori parametru x :

p(x\mid\mathcal{D})=\mathcal{N}(x;\mu,\sigma^2).

Zadania:

  1. Wyznaczyć estymator MAP.
  2. Wyznaczyć estymator MMSE.
  3. Porównać oba estymatory i zinterpretować wynik.

Rozwiązanie

1. Estymator MAP

Definicja estymatora MAP:

\hat{x}_{MAP}=\arg\max_x p(x\mid\mathcal{D}).

Dla rozkładu normalnego maksimum gęstości osiągane jest w średniej:

\hat{x}_{MAP}=\mu.


2. Estymator MMSE

Definicja estymatora MMSE:

\hat{x}_{MMSE}=\mathbb{E}[x\mid\mathcal{D}].

Dla rozkładu normalnego:

\hat{x}_{MMSE}=\int x,\mathcal{N}(x;\mu,\sigma^2),dx=\mu.


3. Porównanie

W tym przypadku zachodzi równość:

\arg\max_{x\in\Omega} S(x)=\int_{\Omega} x\,p(x\mid\mathcal{D})\,dx.


Uogólnienie

Dla dowolnego rozkładu a posteriori:

Formalnie:

\arg\max_{x\in\Omega} S(x)\neq\int_{\Omega} x\,p(x\mid\mathcal{D})\,dx.

dla rozkładów:


Interpretacja kryminalistyczna

W kontekście lokalizacji sprawcy:

MAP jest użyteczny operacyjnie (punkt do sprawdzenia),
MMSE lepiej opisuje oczekiwane położenie przy dużej niepewności.


Opis idei

Model Rossmo łączy:

w jedną funkcję punktacji przestrzennej.

Nie szuka jednego punktu — tworzy krajobraz matematyczny, którego maksimum wskazuje najbardziej prawdopodobną bazę.

Znaczenie wzorów

Sens matematyczny

Model Rossmo to:

deterministyczny odpowiednik modelu bayesowskiego.

heurystyczna aproksymacja estymatora MAP,


4. Modele probabilistyczne

4. Wprowadzenie do podejścia bayesowskiego

Modele bayesowskie stanowią najbardziej formalne i statystycznie spójne podejście do problemu lokalizacji bazy przestępcy.
W przeciwieństwie do modeli centro-graficznych i Rossmo, nie produkują jednego punktu, lecz pełny rozkład prawdopodobieństwa położenia bazy.

Niech:

Celem jest wyznaczenie rozkładu a posteriori p(x_0\mid x_1,\dots,x_n).


4.1. Twierdzenie Bayesa

Podstawą jest klasyczna postać twierdzenia Bayesa:

p(x_0\mid{x_i})=\frac{p({x_i}\mid x_0),p(x_0)}{p({x_i})}.

Gdzie:


4.2. Niezależność warunkowa zdarzeń

Najczęściej zakłada się warunkową niezależność zdarzeń:

p({x_i}\mid x_0)=\prod_{i=1}^{n} p(x_i\mid x_0).

To założenie upraszcza obliczenia i jest standardowe w praktyce.


4.3. Funkcja wiarygodności oparta na zaniku odległości

Każde zdarzenie generowane jest z rozkładu zależnego od odległości od bazy:

p(x_i\mid x_0)=\frac{f(d(x_0,x_i))}{\int_{\Omega} f(d(x_0,x)),dx}.

Funkcja f jest funkcją distance–decay (np. potęgową lub wykładniczą).


4.4. Przykładowe postacie funkcji wiarygodności

Zanik potęgowy:
f(d)=d^{-h},\quad h>0.

Zanik wykładniczy:
f(d)=\exp(-\alpha d),\quad \alpha>0.

Model z buforem:
f(d)=\mathbf{1}_{d>b}(d-b)^{-h}.


4.5. Rozkład a priori bazy przestępcy

Rozkład a priori koduje wiedzę środowiskową:

p(x_0)\propto \rho(x_0).

Gdzie \rho(x) może zależeć od:


4.6. Pełny rozkład a posteriori

Łącząc elementy otrzymujemy:

p(x_0\mid{x_i})\propto p(x_0)\prod_{i=1}^{n} f(d(x_0,x_i)).

To centralne równanie bayesowskiego profilowania geograficznego.


4.7. Estymatory bazy (Maximum A Posteriori i Mean Minimum Square Error)

Estymator MAP:

\hat{x}_0^{\mathrm{MAP}}=\arg\max_x p(x).

Estymator średni:

\hat{x}_0^{\mathrm{MMSE}}=\mathbb{E}[x_0\mid\mathcal{D}].

MAP odpowiada intuicji „najbardziej prawdopodobnego miejsca”.


4.8. Dyskretyzacja i obliczenia numeryczne

W praktyce obszar \Omega dyskretyzuje się na komórki x^{(j)} :

p(x^{(j)}\mid{x_i})\propto p(x^{(j)})\prod_{i=1}^{n} f(d(x^{(j)},x_i)).

Pozwala to tworzyć mapy prawdopodobieństwa.


4.9. Modele hierarchiczne

Parametry modelu traktuje się jako zmienne losowe:

p(x_0,h,\alpha\mid{x_i})\propto p({x_i}\mid x_0,h,\alpha)p(x_0)p(h)p(\alpha).

Pozwala to uwzględnić niepewność parametrów.


4.10. Ujęcie czasowe (model dynamiczny)

Jeśli baza może się zmieniać w czasie:

p(x_0(t)\mid x_0(t-1))=\mathcal{N}(x_0(t-1),\Sigma).

Otrzymujemy filtrację bayesowską (np. filtr Kalmana).


4.11. Związek z modelem Rossmo

Model Rossmo można interpretować jako nienormalizowaną aproksymację MAP:

S(x)\approx \log p(x_0=x\mid{x_i}).

Bayes dostarcza pełnej interpretacji probabilistycznej.


Zadanie

Niech x\in\Omega\subset\mathbb{R}^2 oznacza potencjalne położenie punktu bazowego sprawcy, a x_i – lokalizacje n zdarzeń kryminalnych.

Dana jest funkcja punktacji:

\hat{x}=\arg\max_{x\in\Omega} S(x).

Zadania:

  1. Wyjaśnić znaczenie składników funkcji S(x).
  2. Opisać rolę parametru b.
  3. Wskazać, jak wyznaczyć estymator MAP położenia sprawcy.

Rozwiązanie

1. Struktura funkcji punktacji

Funkcja S(x) przypisuje każdemu punktowi x wartość, interpretowaną jako wiarygodność położenia sprawcy.

Składnik:

d_G(x,x_i)^{-f}

opisuje zanik wpływu zdarzenia wraz z odległością.

Człon:

\mathbf{1}_{d_G>b}

eliminuje obszar buforowy blisko miejsca przestępstwa.


2. Strefa buforowa

Dla:

d_G(x,x_i)\le b

funkcja przyjmuje wartość stałą:

\frac{k}{b}.

Zapobiega to niefizycznej osobliwości:

d_G(x,x_i)^{-f}\to\infty

oraz modeluje zachowanie sprawcy unikającego bezpośredniego sąsiedztwa miejsca przestępstwa.


3. Estymator MAP

Punkt bazowy sprawcy wyznaczamy jako maksimum funkcji punktacji:

\hat{x}=\arg\max_{x\in\Omega} S(x).

Funkcja S(x) pełni rolę nienormalizowanego log-posterioru.


Interpretacja kryminalistyczna

Powierzchnia:

x\mapsto S(x)

tworzy mapę ryzyka, w której:

Maksimum mapy wskazuje najbardziej prawdopodobną lokalizację punktu bazowego sprawcy.


Opis idei

Podejście bayesowskie odpowiada na pytanie:

„Jakie jest prawdopodobieństwo, że baza znajduje się w punkcie x, biorąc pod uwagę dane i wiedzę wstępną?”

Nie daje punktu — daje rozkład prawdopodobieństwa.

Znaczenie wzorów

Sens matematyczny

To pełny model statystyczny:

pozwala aktualizować wiedzę wraz z nowymi danymi.

jawnie koduje niepewność,

umożliwia wnioskowanie,


5. Modele sieciowe

Miasto jako graf G=(V,E) .

5.1. Odległość sieciowa

d_G(u,v)=\min_{\gamma:u\to v}\sum_{e\in\gamma} w(e).

Zastępuje odległość euklidesową w gęstej zabudowie.


5.2. Model kosztu podróży

C(x)=\sum_{i=1}^n \exp(-\alpha d_G(x,x_i)).


5. Modele sieciowe

5. Wprowadzenie do modeli sieciowych

Modele sieciowe stanowią istotne uogólnienie modeli opartych na odległości euklidesowej.
W realnym środowisku miejskim przestępca nie porusza się „w linii prostej”, lecz wzdłuż sieci ulic, chodników, linii transportu publicznego i przejść.
Dlatego przestrzeń operacyjna jest naturalnie modelowana jako graf ważony.

Niech G=(V,E) będzie grafem miasta, gdzie:


5.1. Odległość sieciowa (network distance)

Podstawową wielkością jest odległość w grafie:

d_G(u,v)=\min_{\gamma:u\to v}\sum_{e\in\gamma} w(e).

Jest to minimalny koszt przejścia pomiędzy punktami u i v .


5.2. Zastąpienie metryki euklidesowej metryką sieciową

W modelach distance–decay i Rossmo zamiast d(x,x_i) stosuje się:

d(x,x_i);\longrightarrow; d_G(x,x_i).

Prowadzi to do realistyczniejszych map prawdopodobieństwa, szczególnie w miastach o złożonej topologii.


5.3. Graf miasta jako przestrzeń stanów

Baza przestępcy x_0 jest elementem zbioru węzłów:

x_0\in V.

Lokalizacje zdarzeń x_i są rzutowane na najbliższe węzły grafu.


5.4. Funkcja punktacji w modelu sieciowym

Uogólniona funkcja punktacji przyjmuje postać:

S(x)=\sum_{i=1}^{n} f(d_G(x,x_i)).

Gdzie f jest funkcją zaniku odległości (np. wykładniczą).


5.5. Model Rossmo na grafie

Sieciowa wersja modelu Rossmo:

S(x)=\sum_{i=1}^n\left(d_G(x,x_i)^{-f}H(d_G-b)+\tfrac{k}{b}H(b-d_G)\right).

Pozwala uwzględnić:


5.6. Centralność grafowa jako wskaźnik bazy

Niektóre węzły grafu są naturalnie bardziej „centralne”:

Centralność bliskości:
C_C(v)=\frac{1}{\sum_{u\in V} d_G(v,u)}.

Centralność pośrednictwa:
C_B(v)=\sum_{s\ne v\ne t}\frac{\sigma_{st}(v)}{\sigma_{st}}.

Wysoka centralność sugeruje logistycznie dogodne lokalizacje baz.


5.7. Model kosztu podróży

Każda trasa niesie koszt:

C(\gamma)=\sum_{e\in\gamma} w(e).

Prawdopodobieństwo zdarzenia maleje z minimalnym kosztem:

p(x_i\mid x_0)\propto \exp(-\alpha d_G(x_0,x_i)).


5.8. Modele probabilistyczne na grafie

Bayesowska wersja modelu sieciowego:

p(x_0\mid{x_i})\propto p(x_0)\prod_{i=1}^{n} f(d_G(x_0,x_i)).

Prior p(x_0) może zależeć od centralności węzła.


5.9. Dynamiczne grafy miejskie

Miasto może się zmieniać w czasie:

G=G(t).

Odległość staje się funkcją czasu:

d_G(u,v,t).

Pozwala to modelować:

zmienną dostępność komunikacji.

godziny szczytu,

zamknięcia ulic,



Zadanie

Niech \Omega\subset\mathbb{R}^2 będzie obszarem miasta.
Dana jest funkcja punktacji (np. Rossmo):

S(x),\quad x\in\Omega.

Zdefiniuj mapę gorących punktów oraz wskaż sposób predykcji obszaru kolejnego zdarzenia.

Zadania:

  1. Znormalizować funkcję S(x).
  2. Zdefiniować gęstość ryzyka p(x).
  3. Wyznaczyć obszar o największym prawdopodobieństwie zdarzenia.

Rozwiązanie

1. Normalizacja funkcji punktacji

Aby nadać funkcji interpretację probabilistyczną, normalizujemy ją:

Z=\int_{\Omega} S(x),dx.

Definiujemy:

p(x)=\frac{S(x)}{Z}.

Wówczas:

\int_{\Omega} p(x),dx=1.


2. Mapa gorących punktów

Mapa gorących punktów to funkcja:

x\mapsto p(x),

która każdemu punktowi w mieście przypisuje intensywność ryzyka.

Obszary, dla których:

p(x)\ \text{jest duze},

tworzą gorące punkty kryminalne.


3. Predykcja obszaru zdarzenia

Definiujemy obszar predykcji jako zbiór:

H_\alpha={x\in\Omega:\ p(x)\ge q_\alpha},

gdzie q_\alpha jest kwantylem spełniającym:

\int_{H_\alpha} p(x),dx=\alpha.

Najczęściej wybiera się:

\alpha\in{0.1,0.2,0.3}.


Interpretacja kryminalistyczna

Mapa gorących punktów:

Działania policyjne koncentruje się na H_\alpha , co:

pozwala racjonalnie alokować zasoby.

zmniejsza koszty,

zwiększa skuteczność,


Opis idei

Miasto nie jest płaszczyzną euklidesową — jest grafem.

Sprawca porusza się:

Odległość geometryczna zostaje zastąpiona kosztem przejścia w grafie.

Znaczenie wzorów

Sens matematyczny

To przejście od geometrii klasycznej do:

algorytmów najkrótszej ścieżki.

teorii grafów,

optymalizacji na sieciach,


6. Optymalizacja zachowania sprawcy

6. Wprowadzenie do teorii racjonalnego wyboru

Modele racjonalnego wyboru zakładają, że sprawca podejmuje decyzje w sposób quasi-racjonalny, dążąc do maksymalizacji oczekiwanej użyteczności przy jednoczesnym uwzględnieniu kosztów, ryzyka i ograniczeń środowiskowych.
W kontekście poszukiwania bazy przestępcy oznacza to, że lokalizacja bazy jest wynikiem optymalizacji długoterminowej strategii działania.


6.1. Przestrzeń decyzji sprawcy

Niech:

Sprawca wybiera zarówno x_0 , jak i zbiór celów {x_i} w ramach ograniczeń środowiskowych.


6.2. Funkcja użyteczności

Podstawowym obiektem jest funkcja użyteczności:

U(x,x_0)=Z(x)-\lambda R(x,x_0)-C(x,x_0).

Gdzie:


6.3. Koszt przestrzenny

Koszt przemieszczania się rośnie z odległością:

C(x,x_0)=\alpha d(x,x_0).

W wersji sieciowej:

C(x,x_0)=\alpha d_G(x,x_0).


6.4. Model ryzyka wykrycia

Ryzyko jest funkcją:

Formalnie:

R(x,x_0)=r(x)+\beta d(x,x_0).


6.5. Oczekiwana użyteczność globalna

Sprawca maksymalizuje oczekiwaną użyteczność:

\mathbb{E}[U(x,x_0)]=\int_{\Omega} U(x,x_0),p(x),dx.


6.6. Optymalny wybór bazy

Baza przestępcy jest rozwiązaniem problemu optymalizacyjnego:

x_0^*=\arg\max_{x_0\in\Omega}\mathbb{E}[U(x,x_0)].

Interpretacyjnie: baza minimalizuje koszty i ryzyko przy zachowaniu dostępu do atrakcyjnych celów.


6.7. Model wielozdarzeniowy

Dla wielu przestępstw:

U(x_0)=\sum_{i=1}^{n}\left[Z(x_i)-\lambda R(x_i,x_0)-C(x_i,x_0)\right].

Sprawca wybiera x_0 maksymalizujące tę sumę.


6.8. Związek z modelami zaniku odległości

Po eliminacji stałych składników:

U(x_0)\propto-\sum_{i=1}^{n} d(x_i,x_0).

To prowadzi bezpośrednio do mediany geometrycznej i modeli zaniku odległości.


6.9. Interpretacja probabilistyczna

Prawdopodobieństwo wyboru bazy:

p(x_0)=\frac{\exp(\theta U(x_0))}{\sum_{y\in\Omega}\exp(\theta U(y))}.

Jest to klasyczny model logitowy z teorii wyboru dyskretnego.


6.10. Ograniczenia racjonalności

W praktyce sprawca nie maksymalizuje dokładnie:

x_0\approx\arg\max U(x_0)+\varepsilon.

Składnik losowy \varepsilon modeluje błędy poznawcze i emocje.


6.11. Ujęcie dynamiczne

Jeżeli sprawca uczy się w czasie:

x_0(t+1)=x_0(t)+\eta\nabla U(x_0(t)).

Opisuje to adaptacyjne przesuwanie bazy.


6.12. Związek z modelami bayesowskimi

Funkcja użyteczności indukuje prior:

p(x_0)\propto \exp(\theta U(x_0)).

Łączy teorię racjonalnego wyboru z bayesowskim profilowaniem geograficznym.


6.13. Zalety podejścia zaniku odległości


6.14. Ograniczenia modelu


6.15. Podsumowanie matematyczne

Optymalizacja zachowania sprawcy sprowadza się do rozwiązania:

x_0^*=\arg\max_{x_0}\sum_{i=1}^{n}\left[Z(x_i)-\lambda R(x_i,x_0)-\alpha d(x_i,x_0)\right].


Zadanie

Niech miasto będzie modelowane jako graf:

G=(V,E),

gdzie:

Niech:

Zadania:

  1. Zdefiniować metrykę grafową d_G.
  2. Wyjaśnić różnicę między metryką euklidesową a grafową.
  3. Zastąpić metrykę euklidesową w funkcji punktacji.

Rozwiązanie

1. Definicja metryki grafowej

Odległość grafowa między punktami x,y\in V dana jest jako:

d_G(x,y)=\min_{\gamma:x\to y}\sum_{e\in\gamma} w(e),

gdzie:


2. Porównanie z metryką euklidesową

Metryka euklidesowa:

d_E(x,y)=|x-y|_2

ignoruje:

Metryka grafowa spełnia:

d_G(x,y)\ge d_E(x,y).


3. Funkcja punktacji z metryką grafową

W funkcji Rossmo zastępujemy odległość:

d_E(x,x_i)\Rightarrow d_G(x,x_i).

Otrzymujemy:

S=\sum d_G^{-f}(>b)+k/b(\le b).


Interpretacja kryminalistyczna

Metryka grafowa:

Punkt bazowy sprawcy minimalizuje koszt przemieszczania, a nie odległość „w linii prostej”.


Opis idei

Sprawca nie jest losowy — optymalizuje decyzje:

Baza jest wynikiem rozwiązania problemu decyzyjnego.

Znaczenie wzorów

Funkcja użyteczności łączy:

Prawdopodobieństwo wyboru wynika z optymalizacji, nie z przypadku.

Sens matematyczny

To teoria:

równowagi koszt–ryzyko–zysk.

optymalizacji,

decyzji,


7. Podsumowanie: matematyczne modele lokalizacji bazy przestępcy

Przedstawione w pracy modele matematyczne opisujące problem lokalizacji bazy przestępcy tworzą spójne kontinuum metod, które różnią się poziomem formalizacji, zakresem założeń oraz stopniem realizmu w opisie zachowania sprawcy i struktury przestrzeni miejskiej. Ich wspólnym celem jest wyjaśnienie obserwowanego wzorca przestrzennego zdarzeń przestępczych poprzez rekonstrukcję ukrytej zmiennej, jaką jest lokalizacja punktu bazowego sprawcy.

Najprostsze podejścia, określane mianem modeli centro-graficznych, opierają się wyłącznie na własnościach geometrycznych zbioru punktów reprezentujących miejsca zdarzeń. Średnia arytmetyczna, mediana geometryczna czy centrum minimaksowe są w istocie rozwiązaniami klasycznych problemów optymalizacyjnych w różnych normach. Ich znaczenie polega nie tyle na wysokiej trafności predykcyjnej, ile na dostarczeniu geometrycznej intuicji oraz punktu odniesienia dla bardziej złożonych modeli. Stanowią one matematyczny odpowiednik „pierwszego przybliżenia” lokalizacji bazy.

Kolejnym krokiem są modele zaniku odległości, które wprowadzają element zachowania sprawcy poprzez empiryczne założenie, że intensywność działań maleje wraz z odległością od bazy. Funkcje zaniku nie tylko modyfikują geometrię przestrzeni, lecz nadają jej znaczenie psychologiczne i logistyczne, przekształcając odległość w koszt. Wprowadzenie strefy buforowej dodatkowo oddaje realistyczną tendencję sprawców do unikania aktywności w bezpośrednim sąsiedztwie miejsca zamieszkania.

Model Rossmo stanowi istotny punkt zwrotny, ponieważ integruje elementy geometryczne i behawioralne w jedną funkcję punktacji przestrzennej. Z matematycznego punktu widzenia model ten można interpretować jako deterministyczną, nienormalizowaną aproksymację estymatora największego prawdopodobieństwa a posteriori. Jego główną zaletą jest zdolność generowania map rankingowych, które wskazują obszary priorytetowe, a nie pojedyncze punkty. Jednocześnie brak jawnej interpretacji probabilistycznej ogranicza formalną analizę niepewności.

Pełną formalizację problemu przynoszą modele bayesowskie, które traktują lokalizację bazy jako zmienną losową i pozwalają na wyznaczenie pełnego rozkładu a posteriori. Podejście to umożliwia jawne uwzględnienie wiedzy wstępnej, niepewności danych oraz aktualizację wniosków wraz z napływem nowych informacji. Z matematycznego punktu widzenia jest to najbardziej spójna rama teoretyczna, w której wcześniejsze modele można interpretować jako szczególne przypadki lub heurystyczne przybliżenia.

Znaczący wzrost realizmu zapewniają modele sieciowe, w których przestrzeń miejska opisywana jest jako graf. Zastąpienie odległości euklidesowej metryką sieciową pozwala uwzględnić rzeczywiste ograniczenia ruchu, bariery przestrzenne oraz infrastrukturę komunikacyjną. Matematycznie oznacza to przejście od klasycznej geometrii do teorii grafów i optymalizacji na sieciach, co znacząco zwiększa dokładność predykcji kosztem złożoności obliczeniowej.

Uzupełnieniem modeli przestrzennych są modele dynamiczne, które wprowadzają czas jako istotny wymiar analizy. Umożliwiają one opis ewolucji zachowania sprawcy, adaptacji do działań policji oraz zmian strategii operacyjnej. W ujęciu matematycznym są to modele stochastyczne i procesy dynamiczne, które pozwalają badać stabilność, trajektorie oraz niepewność długoterminowych prognoz.

Całość wieńczy podejście oparte na teorii racjonalnego wyboru, w którym lokalizacja bazy jest wynikiem optymalizacji funkcji użyteczności obejmującej zysk, koszt i ryzyko. Modele te nadają analizie wymiar decyzyjny i ekonomiczny, łącząc kryminologię z teorią optymalizacji i wyboru dyskretnego. W tym ujęciu wzorce przestrzenne przestępczości są konsekwencją racjonalnych decyzji podejmowanych w określonym środowisku przestrzennym.

Podsumowując, zaprezentowane modele nie konkurują ze sobą, lecz tworzą hierarchię uogólnień — od czysto geometrycznych opisów, przez heurystyki behawioralne, aż po pełne modele probabilistyczne i decyzyjne. Każdy kolejny poziom zwiększa realizm i moc wyjaśniającą kosztem złożoności matematycznej i obliczeniowej. W praktyce operacyjnej skuteczne profilowanie geograficzne opiera się na hybrydach tych podejść, co dokładnie odzwierciedla sposób, w jaki matematyka jest wykorzystywana w nowoczesnej kryminologii predykcyjnej — również w narracji serialu Numb3rs, choć tam w formie uproszczonej i zdramatyzowanej.



8.Bibliografia

Rossmo, D. K., Geographic Profiling, CRC Press, Boca Raton, 2000.

Rossmo, D. K., “Geographic profiling”, Crime Mapping and Crime Prevention, vol. 8, 1999, pp. 159–175.

Brantingham, P. J., Brantingham, P. L., Environmental Criminology, Sage Publications, 1991.

Brantingham, P. J., Brantingham, P. L., “Nodes, paths and edges: Considerations on the complexity of crime and the physical environment”, Journal of Environmental Psychology, 1993.

Paulsen, D. J., “Human vs. machine: A comparison of the accuracy of geographic profiling methods”, Journal of Investigative Psychology and Offender Profiling, 2006.

Chainey, S., Ratcliffe, J., GIS and Crime Mapping, Wiley, 2005.

Mohler, G. O., et al., “Self-exciting point process modeling of crime”, Journal of the American Statistical Association, 2011.

Short, M. B., et al., “A statistical model of criminal behavior”, Mathematical Models and Methods in Applied Sciences, 2008.

Becker, G. S., “Crime and punishment: An economic approach”, Journal of Political Economy, 1968.

Bernasco, W., “A sentimental journey to crime: Effects of residential history on crime location choice”, Criminology, 2010.

https://pi.math.cornell.edu/~numb3rs/luthy/num101.html

Nick Levine, „CrimeStat: A Spatial Statistics Program for the Analysis of Crime Incident Locations”

G. O. Mohler, Mathematical Modeling of Crime Hotspots, SIAM Review

E. T. Jaynes, Probability Theory: The Logic of Science, Cambridge University Press

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *