0. Sformułowanie problemu
W pierwszym odcinku serialu „Numb3rs” matematyka zostaje przedstawiona jako narzędzie do opisu i przewidywania rzeczywistości, a nie jedynie abstrakcyjna dziedzina nauki. Punkt wyjścia stanowi proste, lecz fundamentalne założenie:
zachowania ludzi – nawet przestępcze – nie są losowe i podlegają prawom statystyki.
W pilocie wykorzystane zostają idee z kilku kluczowych obszarów matematyki:
Analiza statystyczna danych
Zdarzenia (porwania) traktowane są jako punkty danych w przestrzeni. Ich rozmieszczenie nie jest przypadkowe – odpowiednia analiza pozwala wykryć regularności ukryte w pozornym chaosie.
Modele probabilistyczne
Każde miejsce w mieście ma pewne prawdopodobieństwo wystąpienia kolejnego zdarzenia. Zamiast pytać „gdzie był sprawca?”, matematyka pozwala zapytać „gdzie najprawdopodobniej uderzy ponownie?”.
Geometria i analiza przestrzenna
Miasto zostaje opisane jako przestrzeń geometryczna, w której lokalizacje przestępstw tworzą wzorzec (klaster). Środek ciężkości tych punktów przybliża obszar działania sprawcy.
Redukcja niepewności
Celem matematyki nie jest wskazanie jednego punktu, lecz zawężenie obszaru poszukiwań – zmniejszenie entropii informacyjnej śledztwa.
Matematyczny wstęp odcinka prowadzi do kluczowej tezy serialu:
„Liczby nie rozwiązują spraw same – ale pozwalają zadawać lepsze pytania.”
To właśnie ta filozofia stanowi fundament całego „Numb3rs”: matematyka jako język opisu świata, w którym nawet zbrodnia pozostawia po sobie mierzalny ślad.
Matematyczne wprowadzenie
Niech będzie obszarem miasta, a
lokalizacjami zdarzeń (napadów).
Szukamy punktu – bazy przestępcy – maksymalizującego pewną funkcję wiarygodności
:
1. Modele centro-graficzne
1.1 Wprowadzenie i sens modeli centro-graficznych
Modele centro-graficzne należą do najprostszych metod estymacji lokalizacji bazy przestępcy.
Opierają się wyłącznie na geometrii rozmieszczenia zdarzeń i ignorują czynniki psychologiczne, środowiskowe oraz czasowe.
Formalnie:
niech oznaczają miejsca popełnionych przestępstw.
Szukamy punktu będącego geometrycznym centrum aktywności, który traktujemy jako pierwsze przybliżenie bazy.
1.2. Środek arytmetyczny
Definicja
Najprostszy estymator bazy to średnia arytmetyczna współrzędnych:
Interpretacja kryminologiczna
- zakłada, że sprawca działa symetrycznie wokół bazy,
- brak preferencji kierunkowych i barier,
- odpowiada „intuicyjnemu środkowi” mapy przestępstw.
Zalety
- bardzo szybki obliczeniowo,
- łatwy do wizualizacji (często używany narracyjnie, jak w Numb3rs).
Wady
- silna wrażliwość na obserwacje odstające,
- ignoruje sieć dróg i strefy buforowe.
1.3. Mediana geometryczna
Definicja
Punkt minimalizujący sumę odległości:
Interpretacja
- minimalizuje „łączny koszt podróży” sprawcy,
- lepiej odpowiada sytuacji, gdy pojedyncze zdarzenia są daleko od reszty.
Zalety
- odporność na punkty odstające,
- lepsza stabilność niż średnia.
Wady
- brak postaci jawnej (wymaga algorytmów iteracyjnych),
- nadal brak modelu bufora bezpieczeństwa.
1.4. Estymator minimaksowy
Definicja
Punkt minimalizujący maksymalną odległość:
Interpretacja
- baza jako punkt zapewniający, że żadne zdarzenie nie jest zbyt daleko,
- model „zasięgu operacyjnego” sprawcy.
Zastosowanie
- gdy zakładamy ograniczony promień działania,
- przydatny w analizie logistycznej.
Ograniczenia
- ignoruje gęstość zdarzeń,
- nadmiernie zależny od skrajnych punktów.
1.5. Elipsa standardowa i macierz kowariancji
Definicja macierzy kowariancji
Znaczenie geometryczne
- wektory własne
wskazują główne kierunki aktywności,
- wartości własne mierzą rozciągłość tras.
Interpretacja kryminologiczna
- baza zwykle leży wzdłuż głównej osi elipsy,
- wskazuje preferencje komunikacyjne (linie metra, arterie).
1.6. Ważony środek ciężkości
Definicja
Znaczenie wag
może oznaczać:
– intensywność zdarzenia,
– wartość łupu,
– pewność danych.
Zalety
- elastyczność,
- możliwość uwzględnienia jakości informacji.
1.7. Odległość sieciowa zamiast euklidesowej
W miastach rzeczywista odległość to nie norma euklidesowa, lecz koszt w grafie dróg .
Definicja
Centro-graficzne estymatory można liczyć z zamiast
.
Zadanie
Czy zdarzenia kryminalne są losowe? – analiza wstępna
W pewnym mieście w ciągu miesiąca odnotowano 10 porwań. Ich lokalizacje (w kilometrach, w lokalnym układzie współrzędnych) dane są jako:
Zadania:
- Sprawdź, czy zdarzenia mają charakter losowy w przestrzeni.
- Wyznacz środki skupień zdarzeń.
- Zinterpretuj wynik w kontekście kryminalistyki.
Rozwiązanie
1. Model matematyczny zdarzeń
Każde przestępstwo modelujemy jako punkt w przestrzeni:
Cały zbiór danych zapisujemy jako:
Na tym etapie narracja kryminalna zostaje przekształcona w problem geometryczno-statystyczny.
2. Analiza struktury przestrzennej
Punkty w zbiorze nie są rozmieszczone jednorodnie. Widać dwa klastry, co sugeruje, że proces generujący zdarzenia nie jest losowy (niejednorodny).
3. Środek ciężkości (centroid)
Środek skupienia punktów definiujemy jako średnią arytmetyczną:
Dla pierwszego skupienia otrzymujemy w przybliżeniu:
Dla drugiego skupienia:
4. Interpretacja statystyczna
Gdyby zdarzenia były losowe, punkty:
- nie tworzyłyby klastrów,
- nie posiadałyby stabilnych centrów geometrycznych.
Matematycznie oznacza to, że rozkład zdarzeń nie jest jednorodnym procesem losowym w przestrzeni.
Wniosek kryminalistyczny
Obecność skupień wskazuje na:
- ograniczoną mobilność sprawcy,
- istnienie punktu kotwiczenia,
- możliwość dalszego modelowania probabilistycznego.
Formalnie uzasadnia to przejście do estymacji:
a w kolejnych sekcjach do estymatorów typu:
Opis idei
Modele centro-graficzne są najprostszą matematyczną próbą odpowiedzi na pytanie:
„Gdzie znajduje się centralny punkt aktywności przestępczej?”
Zakładają one, że baza sprawcy leży „pośrodku” zbioru miejsc zdarzeń. Nie modelują zachowania sprawcy, lecz geometrię punktów.
Znaczenie wzorów
- Średnia arytmetyczna minimalizuje sumę kwadratów odległości → faworyzuje punkty skrajne.
- Mediana geometryczna minimalizuje sumę odległości liniowych → odporna na obserwacje odstające.
- Centrum minimaksowe minimalizuje najgorszą odległość → modeluje strategię „najdalej nie gorzej”.
Każdy wzór odpowiada innemu kryterium optymalności geometrycznej.
Sens matematyczny
Są to klasyczne problemy optymalizacji wypukłej:
→ centrum Chebysheva.
→ średnia,
→ mediana,
2. Modele zaniku odległości
2. Wprowadzenie do modeli zaniku odległości
Modele zaniku odległości (distance–decay models) opisują empiryczną prawidłowość, zgodnie z którą częstotliwość działań przestępczych maleje wraz z rosnącą odległością od bazy sprawcy.
W kontekście profilowania geograficznego zakłada się, że sprawca ponosi koszt przestrzenny (czas, ryzyko, wysiłek), który rośnie z dystansem.
Formalnie: niech oznacza bazę sprawcy, a
lokalizację przestępstwa. Wtedy prawdopodobieństwo zdarzenia w punkcie
zależy od odległości
.
2.1. Ogólna postać modelu zaniku odległości
Modele zaniku odległości zapisuje się w postaci funkcji malejącej:
Funkcja określa, jak szybko spada atrakcyjność celu wraz z odległością.
2.2. Zanik potęgowy
Jednym z najczęściej stosowanych modeli jest prawo potęgowe:
Interpretacja:
- duże prawdopodobieństwo w pobliżu bazy,
- długi „ogon” rozkładu – sporadyczne zdarzenia daleko od bazy.
Znaczenie kryminologiczne:
- modeluje sprawców mobilnych,
- dobrze opisuje rozkłady empiryczne tras w miastach.
2.3. Zanik wykładniczy
Alternatywą jest zanik wykładniczy:
Interpretacja:
- szybki spadek prawdopodobieństwa,
- działania skoncentrowane blisko bazy.
Zastosowanie:
- przestępstwa oportunistyczne,
- ograniczona mobilność sprawcy.
2.4. Model z buforem bezpieczeństwa
Empirycznie obserwuje się, że sprawcy unikają najbliższego sąsiedztwa bazy, co prowadzi do wprowadzenia strefy buforowej:
gdzie oznacza promień bufora.
Znaczenie:
- redukcja ryzyka rozpoznania,
- unikanie świadków znających sprawcę.
2.5. Zanik mieszany
W praktyce stosuje się modele łączone:
2.6. Modele z normalizacją probabilistyczną
Aby było poprawną gęstością:
Zapewnia to porównywalność modeli na różnych obszarach miejskich.
2.7. Zanik odległości w modelu Rossmo
W klasycznym modelu Rossmo funkcja punktacji ma postać:
Model ten łączy:
- zanik odległości,
- strefę buforową,
- sumowanie wpływów wszystkich zdarzeń.
2.8. Zanik odległości w modelach bayesowskich
W ujęciu bayesowskim:
Funkcja pełni rolę funkcji wiarygodności.
2.9. Odległość euklidesowa a sieciowa
W miastach odległość zastępuje się kosztem w grafie dróg :
Modele zaniku odległości są wtedy definiowane jako .
Zadanie
Załóżmy, że położenie punktu bazowego sprawcy opisuje zmienna losowa
Dane są lokalizacje zdarzeń:
Przyjmij:
- rozkład a priori:
- model obserwacji (likelihood):
Zadania:
- Zapisać wzór Bayesa dla
- Wyznaczyć postać rozkładu a posteriori.
- Wskazać estymator MAP i MMSE.
Rozwiązanie
1. Wzór Bayesa
Rozkład a posteriori dany jest wzorem:
Ponieważ dane są niezależne warunkowo:
2. Postać rozkładu a posteriori
Podstawiając rozkłady normalne:
Iloczyn rozkładów normalnych prowadzi ponownie do rozkładu normalnego:
gdzie:
3. Estymatory
MAP (Maximum A Posteriori):
MMSE (Mean Minimum Square Error):
Dla rozkładu normalnego MAP i MMSE pokrywają się.
Interpretacja kryminalistyczna
Rozkład a posteriori:
opisuje:
- najbardziej prawdopodobne położenie punktu bazowego sprawcy,
- poziom niepewności lokalizacji (kowariancja
),
- wpływ danych empirycznych i wiedzy wstępnej.
Model probabilistyczny nie wskazuje punktu deterministycznie, lecz cały obszar o największej wiarygodności operacyjnej.
Opis idei
Modele te formalizują empiryczne prawo kryminologii:
Im dalej od bazy, tym mniejsze prawdopodobieństwo działania sprawcy.
Matematyka opisuje jak szybko to prawdopodobieństwo maleje.
Znaczenie wzorów
Funkcje zaniku (potęgowe, wykładnicze) opisują tempo spadku intensywności zdarzeń wraz z odległością.
Wprowadzenie strefy buforowej oznacza:
- brak aktywności tuż przy bazie,
- ochronę przed rozpoznaniem.
Sens matematyczny
Są to funkcje wagowe, które:
zamieniają „odległość” w „koszt psychologiczny”.
deformują geometrię przestrzeni,
3. Model Rossmo w poszukiwaniu bazy przestępcy
3. Wprowadzenie do modelu Rossmo
Model Rossmo jest klasycznym i najbardziej rozpowszechnionym matematycznym narzędziem profilowania geograficznego. Jego celem jest wyznaczenie obszaru o najwyższym prawdopodobieństwie lokalizacji bazy przestępcy (miejsce zamieszkania, pracy lub zaplecza logistycznego) na podstawie rozmieszczenia zdarzeń przestępczych.
Formalnie: dla zbioru lokalizacji przestępstw na obszarze
konstruuje się funkcję punktacji
, której maksimum wskazuje najbardziej prawdopodobną bazę.
3.1. Założenia modelu Rossmo
Model opiera się na czterech empirycznych założeniach:
- sprawca działa relatywnie blisko swojej bazy,
- prawdopodobieństwo działania maleje wraz z odległością (distance–decay),
- istnieje strefa buforowa wokół bazy,
- wpływ każdego zdarzenia jest addytywny.
Matematycznie baza jest traktowana jako punkt maksymalizujący funkcję agregującą wpływy wszystkich zdarzeń.
3.2. Funkcja odległości
Dla dowolnego punktu testowego i zdarzenia
definiuje się odległość:
W praktyce:
– odległość euklidesowa,
- lub
– odległość sieciowa w grafie dróg.
3.3. Strefa buforowa
Wprowadza się promień bufora , taki że aktywność sprawcy w bezpośrednim sąsiedztwie bazy jest ograniczona:
Bufor modeluje unikanie rozpoznania i ryzyka identyfikacji.
3.4. Klasyczna funkcja punktacji Rossmo
Podstawowa postać funkcji Rossmo:
Gdzie:
– wykładnik zaniku odległości,
– promień strefy buforowej,
– współczynnik korekcyjny,
– funkcja wskaźnikowa.
3.5. Interpretacja składników funkcji
- składnik
opisuje zanik atrakcyjności celu,
- człon
zapobiega nadmiernemu faworyzowaniu obszaru tuż przy zdarzeniu,
- sumowanie po
kumuluje wpływ wszystkich przestępstw.
3.6. Estymator bazy przestępcy
Baza jest wyznaczana jako maksimum funkcji punktacji:
W praktyce otrzymuje się mapę cieplną, a nie pojedynczy punkt.
3.7. Dyskretyzacja obszaru
Obszar miasta dzieli się na siatkę komórek i oblicza:
Pozwala to na wizualizację wyników w systemach GIS.
3.8. Kalibracja parametrów modelu
Parametry są dobierane empirycznie:
W serialu Numb3rs proces ten jest pomijany.
3.9. Wersja probabilistyczna modelu Rossmo
Model punktacji można interpretować probabilistycznie:
Po normalizacji:
3.10. Zastosowanie odległości sieciowej
W miastach rzeczywista wersja modelu przyjmuje postać:
Uwzględnia to infrastrukturę komunikacyjną i bariery przestrzenne.
Zadanie
Dany jest jednowymiarowy rozkład a posteriori parametru :
Zadania:
- Wyznaczyć estymator MAP.
- Wyznaczyć estymator MMSE.
- Porównać oba estymatory i zinterpretować wynik.
Rozwiązanie
1. Estymator MAP
Definicja estymatora MAP:
Dla rozkładu normalnego maksimum gęstości osiągane jest w średniej:
2. Estymator MMSE
Definicja estymatora MMSE:
Dla rozkładu normalnego:
3. Porównanie
W tym przypadku zachodzi równość:
Uogólnienie
Dla dowolnego rozkładu a posteriori:
- MAP zależy od maksimum gęstości,
- MMSE zależy od całego rozkładu.
Formalnie:
dla rozkładów:
- asymetrycznych,
- wielomodalnych,
- z ciężkimi ogonami.
Interpretacja kryminalistyczna
W kontekście lokalizacji sprawcy:
- MAP wskazuje najbardziej prawdopodobny punkt,
- MMSE wskazuje punkt średni, minimalizujący średni błąd lokalizacji.
MAP jest użyteczny operacyjnie (punkt do sprawdzenia),
MMSE lepiej opisuje oczekiwane położenie przy dużej niepewności.
Opis idei
Model Rossmo łączy:
- geometrię,
- zanik odległości,
- strefę buforową,
w jedną funkcję punktacji przestrzennej.
Nie szuka jednego punktu — tworzy krajobraz matematyczny, którego maksimum wskazuje najbardziej prawdopodobną bazę.
Znaczenie wzorów
- Sumowanie wpływów wszystkich zdarzeń oznacza superpozycję informacji.
- Każde zdarzenie „głosuje” na bazę.
- Funkcja punktacji nie jest prawdopodobieństwem, ale skalarem rankingowym.
Sens matematyczny
Model Rossmo to:
deterministyczny odpowiednik modelu bayesowskiego.
heurystyczna aproksymacja estymatora MAP,
4. Modele probabilistyczne
4. Wprowadzenie do podejścia bayesowskiego
Modele bayesowskie stanowią najbardziej formalne i statystycznie spójne podejście do problemu lokalizacji bazy przestępcy.
W przeciwieństwie do modeli centro-graficznych i Rossmo, nie produkują jednego punktu, lecz pełny rozkład prawdopodobieństwa położenia bazy.
Niech:
– nieznana baza przestępcy,
– zaobserwowane lokalizacje przestępstw.
Celem jest wyznaczenie rozkładu a posteriori
4.1. Twierdzenie Bayesa
Podstawą jest klasyczna postać twierdzenia Bayesa:
Gdzie:
– rozkład a priori (wiedza wstępna),
– funkcja wiarygodności,
– stała normalizacyjna.
4.2. Niezależność warunkowa zdarzeń
Najczęściej zakłada się warunkową niezależność zdarzeń:
To założenie upraszcza obliczenia i jest standardowe w praktyce.
4.3. Funkcja wiarygodności oparta na zaniku odległości
Każde zdarzenie generowane jest z rozkładu zależnego od odległości od bazy:
Funkcja jest funkcją distance–decay (np. potęgową lub wykładniczą).
4.4. Przykładowe postacie funkcji wiarygodności
Zanik potęgowy:
Zanik wykładniczy:
Model z buforem:
4.5. Rozkład a priori bazy przestępcy
Rozkład a priori koduje wiedzę środowiskową:
Gdzie może zależeć od:
- gęstości zaludnienia,
- typów zabudowy,
- dostępności komunikacyjnej,
- historii przestępstw.
4.6. Pełny rozkład a posteriori
Łącząc elementy otrzymujemy:
To centralne równanie bayesowskiego profilowania geograficznego.
4.7. Estymatory bazy (Maximum A Posteriori i Mean Minimum Square Error)
Estymator MAP:
Estymator średni:
MAP odpowiada intuicji „najbardziej prawdopodobnego miejsca”.
4.8. Dyskretyzacja i obliczenia numeryczne
W praktyce obszar dyskretyzuje się na komórki
:
Pozwala to tworzyć mapy prawdopodobieństwa.
4.9. Modele hierarchiczne
Parametry modelu traktuje się jako zmienne losowe:
Pozwala to uwzględnić niepewność parametrów.
4.10. Ujęcie czasowe (model dynamiczny)
Jeśli baza może się zmieniać w czasie:
Otrzymujemy filtrację bayesowską (np. filtr Kalmana).
4.11. Związek z modelem Rossmo
Model Rossmo można interpretować jako nienormalizowaną aproksymację MAP:
Bayes dostarcza pełnej interpretacji probabilistycznej.
Zadanie
Niech oznacza potencjalne położenie punktu bazowego sprawcy, a
– lokalizacje
zdarzeń kryminalnych.
Dana jest funkcja punktacji:
Zadania:
- Wyjaśnić znaczenie składników funkcji
- Opisać rolę parametru
- Wskazać, jak wyznaczyć estymator MAP położenia sprawcy.
Rozwiązanie
1. Struktura funkcji punktacji
Funkcja przypisuje każdemu punktowi
wartość, interpretowaną jako wiarygodność położenia sprawcy.
Składnik:
opisuje zanik wpływu zdarzenia wraz z odległością.
Człon:
eliminuje obszar buforowy blisko miejsca przestępstwa.
2. Strefa buforowa
Dla:
funkcja przyjmuje wartość stałą:
Zapobiega to niefizycznej osobliwości:
oraz modeluje zachowanie sprawcy unikającego bezpośredniego sąsiedztwa miejsca przestępstwa.
3. Estymator MAP
Punkt bazowy sprawcy wyznaczamy jako maksimum funkcji punktacji:
Funkcja pełni rolę nienormalizowanego log-posterioru.
Interpretacja kryminalistyczna
Powierzchnia:
tworzy mapę ryzyka, w której:
- jasne obszary oznaczają wysoką wiarygodność,
- ciemne obszary – niską.
Maksimum mapy wskazuje najbardziej prawdopodobną lokalizację punktu bazowego sprawcy.
Opis idei
Podejście bayesowskie odpowiada na pytanie:
„Jakie jest prawdopodobieństwo, że baza znajduje się w punkcie x, biorąc pod uwagę dane i wiedzę wstępną?”
Nie daje punktu — daje rozkład prawdopodobieństwa.
Znaczenie wzorów
- rozkład a priori: wiedza o mieście, gęstości, infrastrukturze.
- Funkcja wiarygodności –: model zachowania sprawcy.
- rozkład a posteriori: połączenie danych i wiedzy.
Sens matematyczny
To pełny model statystyczny:
pozwala aktualizować wiedzę wraz z nowymi danymi.
jawnie koduje niepewność,
umożliwia wnioskowanie,
5. Modele sieciowe
Miasto jako graf .
5.1. Odległość sieciowa
Zastępuje odległość euklidesową w gęstej zabudowie.
5.2. Model kosztu podróży
5. Modele sieciowe
5. Wprowadzenie do modeli sieciowych
Modele sieciowe stanowią istotne uogólnienie modeli opartych na odległości euklidesowej.
W realnym środowisku miejskim przestępca nie porusza się „w linii prostej”, lecz wzdłuż sieci ulic, chodników, linii transportu publicznego i przejść.
Dlatego przestrzeń operacyjna jest naturalnie modelowana jako graf ważony.
Niech będzie grafem miasta, gdzie:
– zbiór węzłów (skrzyżowania, przystanki),
– zbiór krawędzi (ulice, tunele),
– wagi (czas, dystans, ryzyko).
5.1. Odległość sieciowa (network distance)
Podstawową wielkością jest odległość w grafie:
Jest to minimalny koszt przejścia pomiędzy punktami i
.
5.2. Zastąpienie metryki euklidesowej metryką sieciową
W modelach distance–decay i Rossmo zamiast stosuje się:
Prowadzi to do realistyczniejszych map prawdopodobieństwa, szczególnie w miastach o złożonej topologii.
5.3. Graf miasta jako przestrzeń stanów
Baza przestępcy jest elementem zbioru węzłów:
Lokalizacje zdarzeń są rzutowane na najbliższe węzły grafu.
5.4. Funkcja punktacji w modelu sieciowym
Uogólniona funkcja punktacji przyjmuje postać:
Gdzie jest funkcją zaniku odległości (np. wykładniczą).
5.5. Model Rossmo na grafie
Sieciowa wersja modelu Rossmo:
Pozwala uwzględnić:
- bariery przestrzenne,
- mosty, tunele,
- kierunkowość ruchu.
5.6. Centralność grafowa jako wskaźnik bazy
Niektóre węzły grafu są naturalnie bardziej „centralne”:
Centralność bliskości:
Centralność pośrednictwa:
Wysoka centralność sugeruje logistycznie dogodne lokalizacje baz.
5.7. Model kosztu podróży
Każda trasa niesie koszt:
Prawdopodobieństwo zdarzenia maleje z minimalnym kosztem:
5.8. Modele probabilistyczne na grafie
Bayesowska wersja modelu sieciowego:
Prior może zależeć od centralności węzła.
5.9. Dynamiczne grafy miejskie
Miasto może się zmieniać w czasie:
Odległość staje się funkcją czasu:
Pozwala to modelować:
zmienną dostępność komunikacji.
godziny szczytu,
zamknięcia ulic,
Zadanie
Niech będzie obszarem miasta.
Dana jest funkcja punktacji (np. Rossmo):
Zdefiniuj mapę gorących punktów oraz wskaż sposób predykcji obszaru kolejnego zdarzenia.
Zadania:
- Znormalizować funkcję
- Zdefiniować gęstość ryzyka
- Wyznaczyć obszar o największym prawdopodobieństwie zdarzenia.
Rozwiązanie
1. Normalizacja funkcji punktacji
Aby nadać funkcji interpretację probabilistyczną, normalizujemy ją:
Definiujemy:
Wówczas:
2. Mapa gorących punktów
Mapa gorących punktów to funkcja:
która każdemu punktowi w mieście przypisuje intensywność ryzyka.
Obszary, dla których:
tworzą gorące punkty kryminalne.
3. Predykcja obszaru zdarzenia
Definiujemy obszar predykcji jako zbiór:
gdzie jest kwantylem spełniającym:
Najczęściej wybiera się:
Interpretacja kryminalistyczna
Mapa gorących punktów:
- nie wskazuje jednego punktu,
- lecz ograniczony obszar operacyjny.
Działania policyjne koncentruje się na , co:
pozwala racjonalnie alokować zasoby.
zmniejsza koszty,
zwiększa skuteczność,
Opis idei
Miasto nie jest płaszczyzną euklidesową — jest grafem.
Sprawca porusza się:
- ulicami,
- tunelami,
- środkami transportu.
Odległość geometryczna zostaje zastąpiona kosztem przejścia w grafie.
Znaczenie wzorów
- Metryka grafowa mierzy realny wysiłek.
- Centralność węzłów wskazuje logistycznie dogodne miejsca baz.
- Modele sieciowe eliminują błędy „linii prostej”.
Sens matematyczny
To przejście od geometrii klasycznej do:
algorytmów najkrótszej ścieżki.
teorii grafów,
optymalizacji na sieciach,
6. Optymalizacja zachowania sprawcy
6. Wprowadzenie do teorii racjonalnego wyboru
Modele racjonalnego wyboru zakładają, że sprawca podejmuje decyzje w sposób quasi-racjonalny, dążąc do maksymalizacji oczekiwanej użyteczności przy jednoczesnym uwzględnieniu kosztów, ryzyka i ograniczeń środowiskowych.
W kontekście poszukiwania bazy przestępcy oznacza to, że lokalizacja bazy jest wynikiem optymalizacji długoterminowej strategii działania.
6.1. Przestrzeń decyzji sprawcy
Niech:
– lokalizacja bazy,
– potencjalne miejsce przestępstwa,
– obszar miejski.
Sprawca wybiera zarówno , jak i zbiór celów
w ramach ograniczeń środowiskowych.
6.2. Funkcja użyteczności
Podstawowym obiektem jest funkcja użyteczności:
Gdzie:
– oczekiwany zysk,
– ryzyko wykrycia,
– koszt podróży,
– awersja do ryzyka.
6.3. Koszt przestrzenny
Koszt przemieszczania się rośnie z odległością:
W wersji sieciowej:
6.4. Model ryzyka wykrycia
Ryzyko jest funkcją:
- odległości,
- intensywności patroli,
- widoczności przestrzeni.
Formalnie:
6.5. Oczekiwana użyteczność globalna
Sprawca maksymalizuje oczekiwaną użyteczność:
6.6. Optymalny wybór bazy
Baza przestępcy jest rozwiązaniem problemu optymalizacyjnego:
Interpretacyjnie: baza minimalizuje koszty i ryzyko przy zachowaniu dostępu do atrakcyjnych celów.
6.7. Model wielozdarzeniowy
Dla wielu przestępstw:
Sprawca wybiera maksymalizujące tę sumę.
6.8. Związek z modelami zaniku odległości
Po eliminacji stałych składników:
To prowadzi bezpośrednio do mediany geometrycznej i modeli zaniku odległości.
6.9. Interpretacja probabilistyczna
Prawdopodobieństwo wyboru bazy:
Jest to klasyczny model logitowy z teorii wyboru dyskretnego.
6.10. Ograniczenia racjonalności
W praktyce sprawca nie maksymalizuje dokładnie:
Składnik losowy modeluje błędy poznawcze i emocje.
6.11. Ujęcie dynamiczne
Jeżeli sprawca uczy się w czasie:
Opisuje to adaptacyjne przesuwanie bazy.
6.12. Związek z modelami bayesowskimi
Funkcja użyteczności indukuje prior:
Łączy teorię racjonalnego wyboru z bayesowskim profilowaniem geograficznym.
6.13. Zalety podejścia zaniku odległości
- silne podstawy ekonomiczne,
- intuicyjna interpretacja,
- łatwa integracja z GIS i Bayesem.
6.14. Ograniczenia modelu
- nadmierne założenie racjonalności,
- trudna estymacja funkcji zysku i ryzyka,
- nieuwzględnianie impulsów i patologii.
6.15. Podsumowanie matematyczne
Optymalizacja zachowania sprawcy sprowadza się do rozwiązania:
Zadanie
Niech miasto będzie modelowane jako graf:
gdzie:
– węzły (skrzyżowania),
– krawędzie (drogi).
Niech:
oznacza odległość grafową (najkrótszą drogę),
– lokalizacje zdarzeń,
– potencjalne położenie sprawcy.
Zadania:
- Zdefiniować metrykę grafową
- Wyjaśnić różnicę między metryką euklidesową a grafową.
- Zastąpić metrykę euklidesową w funkcji punktacji.
Rozwiązanie
1. Definicja metryki grafowej
Odległość grafowa między punktami dana jest jako:
gdzie:
– ścieżka w grafie,
– waga krawędzi (długość, czas przejazdu).
2. Porównanie z metryką euklidesową
Metryka euklidesowa:
ignoruje:
- jednokierunkowość dróg,
- bariery urbanistyczne,
- rzeczywisty czas przemieszczania.
Metryka grafowa spełnia:
3. Funkcja punktacji z metryką grafową
W funkcji Rossmo zastępujemy odległość:
Otrzymujemy:
Interpretacja kryminalistyczna
Metryka grafowa:
- lepiej odzwierciedla rzeczywiste zachowanie sprawcy,
- uwzględnia strukturę miasta,
- zwiększa trafność gorących punktów.
Punkt bazowy sprawcy minimalizuje koszt przemieszczania, a nie odległość „w linii prostej”.
Opis idei
Sprawca nie jest losowy — optymalizuje decyzje:
- maksymalizuje zysk,
- minimalizuje ryzyko,
- ogranicza koszty.
Baza jest wynikiem rozwiązania problemu decyzyjnego.
Znaczenie wzorów
Funkcja użyteczności łączy:
- ekonomię,
- psychologię,
- geometrię.
Prawdopodobieństwo wyboru wynika z optymalizacji, nie z przypadku.
Sens matematyczny
To teoria:
równowagi koszt–ryzyko–zysk.
optymalizacji,
decyzji,
7. Podsumowanie: matematyczne modele lokalizacji bazy przestępcy
Przedstawione w pracy modele matematyczne opisujące problem lokalizacji bazy przestępcy tworzą spójne kontinuum metod, które różnią się poziomem formalizacji, zakresem założeń oraz stopniem realizmu w opisie zachowania sprawcy i struktury przestrzeni miejskiej. Ich wspólnym celem jest wyjaśnienie obserwowanego wzorca przestrzennego zdarzeń przestępczych poprzez rekonstrukcję ukrytej zmiennej, jaką jest lokalizacja punktu bazowego sprawcy.
Najprostsze podejścia, określane mianem modeli centro-graficznych, opierają się wyłącznie na własnościach geometrycznych zbioru punktów reprezentujących miejsca zdarzeń. Średnia arytmetyczna, mediana geometryczna czy centrum minimaksowe są w istocie rozwiązaniami klasycznych problemów optymalizacyjnych w różnych normach. Ich znaczenie polega nie tyle na wysokiej trafności predykcyjnej, ile na dostarczeniu geometrycznej intuicji oraz punktu odniesienia dla bardziej złożonych modeli. Stanowią one matematyczny odpowiednik „pierwszego przybliżenia” lokalizacji bazy.
Kolejnym krokiem są modele zaniku odległości, które wprowadzają element zachowania sprawcy poprzez empiryczne założenie, że intensywność działań maleje wraz z odległością od bazy. Funkcje zaniku nie tylko modyfikują geometrię przestrzeni, lecz nadają jej znaczenie psychologiczne i logistyczne, przekształcając odległość w koszt. Wprowadzenie strefy buforowej dodatkowo oddaje realistyczną tendencję sprawców do unikania aktywności w bezpośrednim sąsiedztwie miejsca zamieszkania.
Model Rossmo stanowi istotny punkt zwrotny, ponieważ integruje elementy geometryczne i behawioralne w jedną funkcję punktacji przestrzennej. Z matematycznego punktu widzenia model ten można interpretować jako deterministyczną, nienormalizowaną aproksymację estymatora największego prawdopodobieństwa a posteriori. Jego główną zaletą jest zdolność generowania map rankingowych, które wskazują obszary priorytetowe, a nie pojedyncze punkty. Jednocześnie brak jawnej interpretacji probabilistycznej ogranicza formalną analizę niepewności.
Pełną formalizację problemu przynoszą modele bayesowskie, które traktują lokalizację bazy jako zmienną losową i pozwalają na wyznaczenie pełnego rozkładu a posteriori. Podejście to umożliwia jawne uwzględnienie wiedzy wstępnej, niepewności danych oraz aktualizację wniosków wraz z napływem nowych informacji. Z matematycznego punktu widzenia jest to najbardziej spójna rama teoretyczna, w której wcześniejsze modele można interpretować jako szczególne przypadki lub heurystyczne przybliżenia.
Znaczący wzrost realizmu zapewniają modele sieciowe, w których przestrzeń miejska opisywana jest jako graf. Zastąpienie odległości euklidesowej metryką sieciową pozwala uwzględnić rzeczywiste ograniczenia ruchu, bariery przestrzenne oraz infrastrukturę komunikacyjną. Matematycznie oznacza to przejście od klasycznej geometrii do teorii grafów i optymalizacji na sieciach, co znacząco zwiększa dokładność predykcji kosztem złożoności obliczeniowej.
Uzupełnieniem modeli przestrzennych są modele dynamiczne, które wprowadzają czas jako istotny wymiar analizy. Umożliwiają one opis ewolucji zachowania sprawcy, adaptacji do działań policji oraz zmian strategii operacyjnej. W ujęciu matematycznym są to modele stochastyczne i procesy dynamiczne, które pozwalają badać stabilność, trajektorie oraz niepewność długoterminowych prognoz.
Całość wieńczy podejście oparte na teorii racjonalnego wyboru, w którym lokalizacja bazy jest wynikiem optymalizacji funkcji użyteczności obejmującej zysk, koszt i ryzyko. Modele te nadają analizie wymiar decyzyjny i ekonomiczny, łącząc kryminologię z teorią optymalizacji i wyboru dyskretnego. W tym ujęciu wzorce przestrzenne przestępczości są konsekwencją racjonalnych decyzji podejmowanych w określonym środowisku przestrzennym.
Podsumowując, zaprezentowane modele nie konkurują ze sobą, lecz tworzą hierarchię uogólnień — od czysto geometrycznych opisów, przez heurystyki behawioralne, aż po pełne modele probabilistyczne i decyzyjne. Każdy kolejny poziom zwiększa realizm i moc wyjaśniającą kosztem złożoności matematycznej i obliczeniowej. W praktyce operacyjnej skuteczne profilowanie geograficzne opiera się na hybrydach tych podejść, co dokładnie odzwierciedla sposób, w jaki matematyka jest wykorzystywana w nowoczesnej kryminologii predykcyjnej — również w narracji serialu Numb3rs, choć tam w formie uproszczonej i zdramatyzowanej.
8.Bibliografia
Rossmo, D. K., Geographic Profiling, CRC Press, Boca Raton, 2000.
Rossmo, D. K., “Geographic profiling”, Crime Mapping and Crime Prevention, vol. 8, 1999, pp. 159–175.
Brantingham, P. J., Brantingham, P. L., Environmental Criminology, Sage Publications, 1991.
Brantingham, P. J., Brantingham, P. L., “Nodes, paths and edges: Considerations on the complexity of crime and the physical environment”, Journal of Environmental Psychology, 1993.
Paulsen, D. J., “Human vs. machine: A comparison of the accuracy of geographic profiling methods”, Journal of Investigative Psychology and Offender Profiling, 2006.
Chainey, S., Ratcliffe, J., GIS and Crime Mapping, Wiley, 2005.
Mohler, G. O., et al., “Self-exciting point process modeling of crime”, Journal of the American Statistical Association, 2011.
Short, M. B., et al., “A statistical model of criminal behavior”, Mathematical Models and Methods in Applied Sciences, 2008.
Becker, G. S., “Crime and punishment: An economic approach”, Journal of Political Economy, 1968.
Bernasco, W., “A sentimental journey to crime: Effects of residential history on crime location choice”, Criminology, 2010.
https://pi.math.cornell.edu/~numb3rs/luthy/num101.html
Nick Levine, „CrimeStat: A Spatial Statistics Program for the Analysis of Crime Incident Locations”
G. O. Mohler, Mathematical Modeling of Crime Hotspots, SIAM Review
E. T. Jaynes, Probability Theory: The Logic of Science, Cambridge University Press