Originálny jazyk, v ktorom táto práca bola napísaná je EN. Aktuálne máte nastavený jazyk zobrazenia SK, z toho vyplýva, že niektorý text bol preložený umelou inteligenciou - DeepL a pri preklade mohli vzniknúť chyby. Narábajte preto z obsahom opatrne! ...
Analýza zoznamu hovorov
Post vytvorený / editovaný : 2026-04-23 12:06:31 / 2026-04-23 12:06:31
Jazyk originálu : EN
Ako by ste sa chceli pozrieť na identifikáciu použitia telefónneho čísla v určitom časovom intervale?
1. Cieľ projektu
Tento projekt je nástrojom na analýzu údajov určeným na identifikáciu využívania telefónnych čísel v rámci vymedzeného časového obdobia, so zreteľom najmä na hovory uskutočnené mimo bežných pracovných hodín, cez víkendy a počas sviatkov. Jeho účelom nie je zistiť osobnú identitu volajúceho, ale skôr zaznamenať a analyzovať komunikačné udalosti na základe telefónnych čísel a časových údajov.
Riešenie pracuje s anonymizovanými údajmi z protokolov hovorov. Spracováva sa alebo prezentuje len veľmi obmedzená podmnožina celkových záznamov a dostupná vzorka nepredstavuje kompletnú databázu kontaktov. Projekt by sa preto mal chápať predovšetkým ako technický a analytický nástroj na štruktúrované spracovanie údajov, a nie ako systém na priamu identifikáciu osôb.
2. Technický prístup
Z technického hľadiska je projekt implementovaný v jazyku Python a vyvinutý v Jupyter Notebook. Notebook načíta záznamy o hovoroch z CSV súborov, konvertuje textové formáty dátumu — vrátane slovenských názvov mesiacov — na štandardné datetime objekty a následne aplikuje viacstupňový filtračný pracovný postup.
Analýza zahŕňa iba relevantné typy hovorov, a to prijaté, zmeškané a odmietnuté hovory. Každý záznam sa následne vyhodnotí s cieľom určiť, či sa uskutočnil mimo vopred definovaných pracovných hodín, počas víkendu alebo na sviatok. V aktuálnej verzii zošitu sú pracovné hodiny definované ako 08:30–12:00 a 13:00–16:30, zatiaľ čo sviatky sa načítajú z externého súboru, čím sú kritériá filtrovania flexibilné a ľahko prispôsobiteľné pre rôzne roky alebo jurisdikcie.
3. Spracovanie údajov a výsledky
Dôležitou súčasťou projektu je eliminácia duplicitných alebo takmer duplicitných udalostí. V druhej fáze spracovania notebook sleduje čas poslednej interakcie pre každé telefónne číslo a odstraňuje opakované pokusy o volanie, ktoré sa vyskytnú v päťminútovom intervale. Tým sa znižuje šum v dátovom súbore a vytvára sa čistejší výstup, ktorý lepšie odráža jedinečné komunikačné udalosti namiesto opakovaných technických pokusov o volanie.
Výstupy projektu zahŕňajú filtrované ročné zoznamy hovorov, samostatné dátové súbory hovorov mimo pracovnej doby, mesačné agregované štatistiky, rozdelenie podľa typu hovoru a exporty do formátu CSV na ďalšiu analýzu alebo prezentáciu.
Na základe vzorky z roku 2023 uvedenej v zošite obsahuje celkový súbor údajov 632 záznamov, z ktorých bolo 422 prijatých, zmeškaných a odmietnutých hovorov považovaných za relevantné pre analýzu. Po uplatnení časového filtra obsahovala prvá sada výsledkov 117 záznamov. Po odstránení opakovaných udalostí v päťminútovom okne poskytol upravený súbor údajov užšie a metodicky robustnejšie zobrazenie komunikačnej aktivity za vybrané obdobie.


