Strategický Přehled Projektu
Tento dokument představuje technický návrh systému pro detekci a počítání osob v budovách. Jeho primárním cílem je zvýšení bezpečnosti a podpora záchranných složek v krizových situacích s důrazem na soulad s evropskými nařízeními AI Act a GDPR.
Exekutivní Shrnutí
Projekt řeší potřebu přesných a aktuálních dat o počtu osob v zasažených objektech. Navržené řešení je postaveno na hybridní architektuře, která kombinuje výkonné edge zařízení (NVIDIA Jetson) pro analýzu v reálném čase a cloudovou platformu pro centralizaci dat a správu. Tento přístup zajišťuje nízkou latenci, maximální ochranu soukromí a finanční udržitelnost.
Klíčovým technologickým prvkem je detekční model YOLOv11 spolu se sledovacím algoritmem BoT-SORT, což představuje optimální kompromis mezi přesností, rychlostí a vyspělostí ekosystému. Zásadním aspektem projektu je jeho klasifikace jako vysoce rizikového AI systému dle AI Act, což vyžaduje striktní dodržování regulačních požadavků, zejména v oblasti řízení rizik, transparentnosti a ochrany dat prostřednictvím anonymizace v reálném čase.
Technologický Stack
- ➤Model: YOLOv11
- ➤Tracker: BoT-SORT
- ➤Hardware: NVIDIA Jetson Orin
- ➤Optimalizace: TensorRT INT8
Architektura
- ➤Model: Hybridní (Edge + Cloud)
- ➤Zpracování: Na okraji sítě (Edge)
- ➤Správa: V cloudu (Azure)
- ➤Data: Anonymizovaná metadata
Vysoce Rizikový AI Systém
Dle AI Act je systém klasifikován jako vysoce rizikový, což vyžaduje přísné dodržování předpisů v oblasti robustnosti, transparentnosti a lidského dohledu.
Analýza Klíčových Technologií
Jádrem systému je software pro detekci a sledování osob. Jeho výběr není pouze o maximálním výkonu, ale o strategickém kompromisu mezi přesností, rychlostí, efektivitou a rizikem.
Srovnávací Analýza Detekčních Modelů
Následující radarový graf porovnává klíčové kandidáty napříč čtyřmi dimenzemi. Ideální model má velkou, vyváženou plochu, což značí dobré vlastnosti ve všech sledovaných oblastech.
YOLOv11
Charakteristika: Evoluce od Ultralytics.
Síla: Extrémně vyspělý a stabilní ekosystém, skvělá dokumentace, jednoduchá integrace a optimalizace.
Slabina: Na papíře mírně nižší přesnost (mAP) než nejnovější akademické modely.
YOLOv12
Charakteristika: Akadjemický model zaměřený na "attention".
Síla: Velmi vysoká přesnost, nízká latence.
Slabina: Nízká vyspělost ekosystému, vyšší integrační riziko, nejistá dlouhodobá podpora.
RT-DETRv2
Charakteristika: Transformerová architektura.
Síla: Vysoká přesnost, "čistý" end-to-end design.
Slabina: Vyšší počet parametrů (nižší efektivita), méně vyspělý ekosystém než YOLO od Ultralytics.
YOLOv10
Charakteristika: Trénink bez NMS.
Síla: Velmi nízká latence díky odstranění post-processingu.
Slabina: Podobně jako YOLOv12, méně stabilní a podporovaný ekosystém.
Analýza Sledovacích Algoritmů (Trackerů)
Samotná detekce nestačí. Aby systém dokázal spolehlivě počítat osoby i v situacích, kdy se na chvíli ztratí z dohledu (např. za sloupem), je nutné implementovat sledovací algoritmus. Ten každé detekované osobě přiřadí unikátní ID a udržuje její stopu napříč snímky.
-
1
SORT (Simple Online and Realtime Tracking)
Základní a velmi rychlý algoritmus, který asociuje detekce pouze na základě jejich prostorového překryvu (IoU) mezi snímky. Selhává při delších překryvech.
-
2
DeepSORT
Vylepšení SORTu, které přidává druhý mechanismus: re-identifikaci (Re-ID) na základě vzhledu. Pokud se osoba ztratí a znovu objeví, DeepSORT je schopen ji znovu identifikovat podle jejích vizuálních rysů.
-
3
BoT-SORT
Moderní vylepšení, které sofistikovaněji kombinuje data o pohybu a vzhledu. Je robustnější vůči změnám rychlosti a směru pohybu, což z něj činí nejspolehlivější volbu pro komplexní scény.
Syntéza a Doporučení
Analýza ukazuje, že zatímco některé novější modely (YOLOv12, RT-DETR) nabízejí mírně vyšší přesnost, model YOLOv11 od Ultralytics má nejvyváženější profil. Jeho největší předností je mimořádně vyspělý ekosystém, který zaručuje stabilitu, předvídatelnost a snadnou integraci, což jsou pro vysoce rizikový systém klíčové atributy minimalizující projektová rizika.
V kombinaci se sledovacím algoritmem BoT-SORT, který je špičkou v robustním sledování osob, tvoří tato dvojice technologicky vyspělý a zároveň bezpečný základ pro tento projekt.
Architektura a Náklady
Tento návrh počítá s hybridní architekturou, která kombinuje výhody zpracování na okraji sítě (edge) pro nízkou latenci a soukromí, a cloudu pro centralizovanou správu a škálovatelnost.
Tok Dat v Hybridní Architektuře
(Existující infrastruktura)
(NVIDIA Jetson Orin)
- AI Inference v reálném čase
- Anonymizace obrazu
(Pouze anonymizovaná metadata)
(Dashboard & API)
Co je a proč potřebujeme Edge Zařízení (NVIDIA Jetson)?
NVIDIA Jetson funguje jako specializovaný, malý a úsporný počítač, jehož jediným úkolem je provádět výpočty umělé inteligence. Zatímco trénování modelu probíhá na velkých serverech v cloudu, výsledný "hotový" model se nahraje do Jetsonu. Ten pak tento model aplikuje na živé video z kamery, aby v reálném čase detekoval a sledoval osoby. Tento proces se nazývá inference. Díky specializovanému hardwaru (GPU) to zvládá mnohem rychleji a s nižší spotřebou než běžný počítač. Umožňuje tak analyzovat video přímo na místě, aniž by citlivá data opustila budovu.
Ilustrativní Analýza Celkových Nákladů (TCO)
Tato strategická analýza slouží k odůvodnění volby hybridní architektury. Nejedná se o rozpočet pro Fázi 1 (Bakalářskou práci), ale o strategický výhled, který demonstruje finanční výhodnost lokálního zpracování pro škálované, 24/7 nasazení.
Od lokálního testování k nákupu hardwaru
Je důležité zdůraznit, že před investicí do specializovaného edge hardwaru (NVIDIA Jetson) pro pilotní provoz proběhne prvotní testování funkčnosti na standardním vývojářském PC. Jako mezikrok lze také zvážit krátkodobé, časově omezené nasazení na pronajaté cloudové GPU instanci. Tímto způsobem lze ověřit celý systém v reálném prostředí s minimálními počátečními náklady před finálním nákupem hardwaru pro Fázi 2.
Scénář 1: Hybridní Architektura
Příklad: Pilotní projekt (20 kamer)
- Počáteční investice (CapEx): 20 ks Jetson @ €700 = €14,000
- 5letý provoz (OpEx): Elektřina + Cloud = ~ €7,200
- CELKEM (5 let): ~ €21,200
Příklad: Plné nasazení (100 kamer)
- Počáteční investice (CapEx): 100 ks Jetson @ €700 = €70,000
- 5letý provoz (OpEx): Elektřina + Cloud = ~ €36,000
- CELKEM (5 let): ~ €106,000
Scénář 2: Čistě Cloudová Architektura
Příklad: Pilotní projekt (20 kamer)
- Počáteční investice (CapEx): €0
- 5letý provoz (OpEx): 24/7 GPU instance v cloudu = ~ €3,500,000
- CELKEM (5 let): ~ €3,500,000
Příklad: Plné nasazení (100 kamer)
- Počáteční investice (CapEx): €0
- 5letý provoz (OpEx): 24/7 GPU instance v cloudu = ~ €17,500,000
- CELKEM (5 let): ~ €17,500,000
Výkon na Edge: Význam Optimalizace
Optimalizace pomocí NVIDIA TensorRT je nezbytná pro dosažení výkonu v reálném čase. Graf ukazuje očekávané zrychlení na zařízení Jetson Orin NX.
Implementační Plán (6 Měsíců)
Projekt je rozdělen na dvě hlavní etapy. První fáze představuje rámec bakalářské práce zaměřený na analýzu a návrh. Druhá fáze navazuje vývojem pro reálné pilotní nasazení.
Fáze 1: Rámec Bakalářské Práce
Cílem této fáze je vytvořit robustní teoretický a analytický základ pro systém. Důraz je kladen na analýzu, návrh a soulad s legislativou, nikoli na implementaci v reálném čase.
- Analýza: Hloubková rešerše a srovnání technologií (AI modely, trackery).
- Právní Rámec: Analýza AI Act a GDPR, vypracování návrhu DPIA.
- Návrh Architektury: Detailní návrh hybridní architektury a datového toku.
- Proof-of-Concept: Testování základní funkčnosti vybraného modelu na vzorkových datech (např. Google Colab), bez požadavku na real-time výkon.
Fáze 2: Vývoj a Pilotní Provoz
Tato fáze se zaměřuje na vývoj prototypu pro reálné nasazení, optimalizaci výkonu a přípravu na certifikaci.
- Sběr Dat a Trénink: Systematický sběr dat a trénink robustního modelu na dedikované GPU.
- Vývoj pro Edge: Nasazení modelu na NVIDIA Jetson, optimalizace pro real-time výkon pomocí TensorRT.
- Pilotní Instalace: Instalace prototypu v kontrolovaném prostředí pro testování a sběr dat.
- Dokumentace pro AI Act: Finalizace technické dokumentace pro budoucí posouzení shody.
Právní a Etický Rámec
Soulad s AI Act a GDPR není volitelný, ale je základním stavebním kamenem projektu. Přístup "Compliance by Design" je nezbytný pro minimalizaci rizik.
Klíčové Požadavky pro Soulad
1. Systém řízení rizik (AI Act, čl. 9)
▾2. Správa dat (AI Act, čl. 10)
▾3. Technická dokumentace a logování (AI Act, čl. 11, 12)
▾4. Lidský dohled a transparentnost (AI Act, čl. 13, 14)
▾5. Posouzení vlivu na ochranu osobních údajů (GDPR, čl. 35)
▾Analýza Rizikových Scénářů
Algoritmická nespravedlnost
Popis: Model systematicky selhává u určitých skupin osob (např. na invalidním vozíku) kvůli nereprezentativním trénovacím datům.
Dopad: Kriticky chybné počty, ohrožení záchranných operací.
Zmírnění: Aktivně spravovaná, diverzifikovaná trénovací data; nepřetržité monitorování výkonu; možnost lidské verifikace.
Narušení soukromí
Popis: Útočník získá přístup k edge zařízení a dokáže de-anonymizovat nebo zachytit nezabezpečené video.
Dopad: Závažné porušení GDPR, poškození reputace, právní postihy.
Zmírnění: Silné šifrování na zařízení; minimální retence dat; anonymizace v reálném čase; pravidelné penetrační testy.
Systémové selhání
Popis: Kybernetický útok vyřadí více zařízení najednou nebo jim podsune falešná data, čímž vytvoří zcela zkreslený obraz situace.
Dopad: Ztráta situačního povědomí, katastrofální rozhodnutí v krizi.
Zmírnění: Redundantní systémy (včetně nevizuálních senzorů, např. WiFi CSI); zabezpečené protokoly; detekce anomálií v cloudu.
Rozšíření Funkcionality: Rozpoznávání Pohlaví a Dopady na GDPR
Ačkoliv je technicky možné model naučit rozpoznávat i další atributy, jako je pohlaví, je nutné zvážit závažné právní a etické dopady.
Technická Implementace
Rozpoznávání pohlaví by nevyžadovalo nový model, ale přetrénování stávajícího modelu na detailnějším datasetu. Místo jedné třídy "osoba" by model měl dvě: "muž" a "žena". To by vyžadovalo rozsáhlou a pečlivou anotaci dat. Výpočetní náročnost na inference by se změnila jen minimálně.
Právní Analýza a Závažná Rizika
Tato funkcionalita výrazně zvyšuje rizika projektu a je v současném návrhu důrazně nedoporučena z následujících důvodů:
- Zpracování Osobních Údajů: I když je obraz anonymizován, systém by generoval a ukládal data o pohlaví, což jsou osobní údaje. Anonymizace obrazu neanonymizuje odvozená data.
- Chybějící Právní Základ: Původní právní základ ("veřejný zájem") se opírá o potřebu počítat osoby pro záchranu životů. Je velmi obtížné argumentovat, proč je pro tento účel nezbytné znát jejich pohlaví.
- Riziko Profilování: Systém by se z nástroje pro počítání stal nástrojem pro profilování, což je z pohledu GDPR a AI Act mnohem problematičtější.
Závěrečné Hodnocení Souladu s AI Act
Tento návrh byl vytvořen s explicitním ohledem na požadavky AI Act pro vysoce rizikové systémy. Následující body popisují, jak navržená architektura a procesy naplňují klíčové články nařízení.
- Nepřetržitý proces řízení rizik (čl. 9): Je plně reflektován v sekci Analýza rizikových scénářů a je základním kamenem fázovaného implementačního plánu.
- Správa dat a soukromí (čl. 10 a GDPR): Požadavek je řešen hybridní architekturou se zpracováním na okraji sítě (edge), která minimalizuje přenos citlivých dat, a implementací anonymizace v reálném čase.
- Technická dokumentace a logování (čl. 11–12): Je explicitní součástí Fáze 2 implementačního plánu, kde bude vytvořena komplexní dokumentace pro budoucí audit a certifikaci.
- Mechanismus lidského dohledu (čl. 14): Návrh toku dat počítá s API a dashboardem pro záchranné složky, což je platforma pro implementaci rozhraní pro lidskou verifikaci a případnou korekci.