Duomenų reikalai

(duomenų analitikos žurnalas)

Kada pabunda dviračiai

  1. Pradiniai duomenys
  2. Klaidų aptikimas
  3. Dviračių srautas
  4. Pamėginkite patys

Vilniaus mieste yra trys vaizdo kameros, kurios nuo 2018-2019 metų fiksuoja dviračių srautą: Žvejų gatvėje, Upės gatvėje, Gedimino prospekte.

Šios kameros nėra paprastas judesio jutiklis: jos atpažįsta judančias transporto priemones su dviem dideliais ratais ant kurių sėdi asmuo (paspirtukai ar pėstieji neįtraukiami į dviračių apskaitą).

Mes išsirinkome vieną – Žvejų gatvės kamerą – ir gavome jos sugeneruotus duomenis. Atlikome visai nemenką jų validaciją (kokybės kontrolę ir reikšmių taisymą). Pirmasis postas šia tema apžvelgia validacijos metodus ir bendras pastebėtas tendencijas. Vėlesniuose postuose aprašysime, kaip naudojimąsi dviračiais veikia oro temperatūra ir krituliai.

Pradiniai duomenys

Žvejų gatvės kamera veikia jau penkerius metus: nuo 2019 metų sausio. Paskutiniai įtraukti duomenys yra iš 2023-04-24 dienos. Tačiau kaip mes galime žinoti, ar gauti duomenys yra teisingi? Visų pirma turime juos atvaizduoti. Taip pastebėsime klaidas ir tendencijas.

Iliustracijoje žemiau kiekvienas mėnuo yra pavaizduotas kaip stačiakampė dėžutė, vienodi mėnesiai yra išdėstyti vienas virš kito, vieneri metai yra išdėstyti vienoje eilutėje. Kiekviename stačiakampyje (mėnesyje) yra pavaizduotos visos jo valandos: eilutėse nuo viršaus į apačią yra išdėstytos mėnesio dienos, o stulpeliuose iš kairės į dešinę išdėstytos paros valandos (nuo vidurnakčio iki vidurnakčio). Pats smulkiausias iliustracijos langelis yra viena valanda.

Kiekvieną valandą nuspalvinome pagal tai, ar joje vaizdo kamera užfiksavo bent vieną dviratį. Natūralu, kad bus tokių valandų, kuomet pro kamera nepravažiuos nei vienas dviratis. Tokios valandos turėtų būti labai vėlai naktį ar labai anksti ryte. Taip pat jų tikimybė turėtų būti daug didesnė gruodžio-vasario mėnesiais kuomet yra šalta ir kelio danga yra nepalanki važiavimui. Kiti veiksniai gali būti, pvz., smarki liūtis.

Tačiau ar pastebite anomalijas? Kartais kamera neveikia daugelį valandų iš eilės! O kartais kamera tendencingai neveikia kelias konkrečias valandas vakare daug dienų iš eilės!

Kodėl taip yra? Abu šie reiškiniai turi savo paaiškinimus.

  1. Neveikimas “daug valandų iš eilės“ gali kilti dėl kameros gedimo ar jos padėties kelio atžvilgiu pakitimo, taip pat ilgalaiko ryšio su kamera praradimo.
  2. Įdomesnė situacija yra su pavyzdžiu “kamera nuolat neveikia vakare“. Šis neveikimas gali nutikti tuomet, jeigu kameros baterija yra įkraunama iš apšvietimo stulpo. Vasaros mėnesiais dienos ilgos ir apšvietimo stulpas ilgas valandas nėra įjungiamas. Jeigu kameros baterija nėra pakankamai talpi, joje sukauptos elektros energijos gali neužtekti visai dienai, dėl ko vakarais kamera išsijungia, o duomenis pradeda teikti tik tuomet, kuomet Įsijungia gatvės apšvietimas.
Klaidų aptikimas

Didžiausia problema su šiomis kameromis yra tai, kad jos neperduoda duomenų apie savo neveikimą (pvz., nuotolinis duomenų serveris iš kameros kas minutę galėtų gauti trumpą signalą “Aš gyva!“, ir šią informaciją įsirašyti į savo duomenų bazę). Kadangi tokia informacija nėra perduodama irba kaupiama, žiūrėdami į duomenis mes negalime atskirti: ar valandą X nepravažiavo nei vienas dviratis, ar tą valandą kamera tiesiog neveikė.

Mums belieka kemeros neveikimo periodus nustatyti vadovaujantis logika/statistika. Štai dvi paprastos taisyklės:

  1. Jeigu kamera nefiksavo nei vieno dviračio 10 ar daugiau valandų iš eilės (nesvarbu, ar tos valandos prasidėjo paros pradžioje ar pabaigoje), visos paros, į kurias dalinai ar pilnai pakliūna tas neveikimo intervalas, yra laikomos nepatikimomis, o duomenys yra laikomi negautais.
  2. Jeigu kamera šiltaisiais metų mėnesiais (balandis – rugsėjis) tarp 10 val. ryto ir 22 val. vakaro nefiksavo nei vieno dviračio 2 ar daugiau valandų iš eilės, tos valandos yra laikomos nepatikimomis, o duomenys yra laikomi negautais.

Pažiūrėkime, kaip atrodo duomenys pritaikius šį algoritmą:

Algoritmo nauda šiuo atveju yra ta, kad mums nereikėjo daugelio dešimčių akimi matomų periodų išrašinėti ranka, o užteko sukurti dvi taisykles, kuriomis vadovaudamasis algoritmas duomenyse dalį “0“ (nulių) pakeitė “NA“ (duomenų nėra).

Pastebėkite, kokie nesėkmingi buvo, pavyzdžiui, 2022 m. liepa – rugsėjis.

Dviračių srautas

Dabar jau galime atvaizduoti realius dviračių valandinio srauto skaičius:

Svarbiausias pastebėjimas yra tas, kad dar niekada Vilniaus istorijoje (tiksliau šių kamerų veikimo istorijoje) nebuvo tokio dviračių populiarumo. 2023 m. balandis buvo itin aktyvus: net tris kartus srautas viršijo 400 dviračių per valandą (pvz., 2023-04-20 19-20 val., 447 dviračiai). Šis aktyvumas lenkia net ankstesnių metų vasaros mėnesius. Tai sietina ir su šiltais orais, ir sąlygų dviračių naudojimui gerėjimu (kokybiškų dviračių takų gausėjimas).

Kiti pastebėjimai:

  1. Dviračių sezonas paprastai prasideda kovo mėnesį
  2. Dviračių sezonas paprastai baigiasi spalio mėnesį
  3. Nepalankiausi dviračiams mėnesiai yra gruodis ir sausis
  4. Pavasarį dviračių srautas krenta po 19 val. vakaro
  5. Vasarą dviračių srautas nenurimsta iki pat nakties (23 val.)
Pamėginkite patys

Šiuos duomenys tvarko Vilniaus m. savivaldybės įmonė “Susisiekimo paslaugos“(JUDU). Žvejų gatvės vaizdo kameros dviračių srauto atvirus duomenis galite atsisiųsti čia: nuoroda.