Duomenų reikalai

(duomenų analitikos žurnalas)

ŽAIBUM OPUS

Šiame tyrime mes bandėme aptikti statistiškai patikimai ryškiausias žaibotraukos vietas Lietuvoje.

Ištyrėme 1 milijoną žaibų, LHMT užfiksuotų Lietuvos teritorijoje dešimties metų laikotarpyje. Tam teritoriją suskirstėm į 400 tūkstančių nepersidengiančių vienodų gardelių (lygiašonių šešiakampių) ir su jomis atlikome daug fancy statistikos.

KONTEKSTAS: KAIP APTINKAMI ŽAIBAI

Trys detektoriai (ar daugiau), esantys skirtingose lokacijose nuolat “klausosi“ ir registruoja elektromagnetinius pliūpsnius, kuriuos sukelia žaibų išlydžiai. Pliūpsnis sklinda šviesos greičiu ir tris detektorius pasiekia skirtingu laiku, priklausomai nuo to, kaip toli yra nuo kiekvieno iš jų. Centrinis kompiuteris, lygindamas labai tikslius laikus, kuomet detektoriai “išgirdo“ pliūpsnį, ir naudodamasis time difference of arrival trianguliacija nustato, kur tiksliai pliūpsnis įvyko, t.y., kur trenkė žaibas.

ATRADIMŲ SANTRAUKA NEKANTRIEMS
SPOILER ALERT: išskleiskite, tik jei viską norite sužinoti iš karto
  1. Visoje Lietuvoje per 10 metų žaibai daugiausiai trenkė į Vilniaus TV bokštą.
  2. Ši istorija įspūdinga tuo, kad mes netikrinome hipotezės “ar žaibai dažnai trenkia į TV bokštą“. Mes be išankstinio nusistatymo (agnostiškai, be hipotezės) ištyrėme 400 tūkstančių Lietuvos lopinėlių ir, naudodamiesi statistiniais metodais, suradome ryškiausios žaibotraukos vietas. Ir pačioje pirmoje pozicijoje buvo… Vilniaus TV bokšto sklypas!
  3. Kitos statistiškai reikšmingos žaibų koncentracijos vietos sutampa su aukštomis vėjo jėgainėmis.
  4. Labai įdomu tai, kad žaibotrauka pasižymi šlapios vietovės ir vandens telkiniai, o ypač – tekantis vanduo (net 2 lokacijos iš 12 buvo skirtingos Nemuno kilpos, viena nuo kitos nutolusios 100 km atstumu).
  5. Vienas apytikslis geolokacinis sutapimas su žvyro karjeru, konsultuojamės su geologais.
  6. Keista, tačiau kiti aukščiausi Lietuvos statiniai (pvz., elektrinių kaminai, siekiantys 200–250 m. aukštį) nerodo statistiškai reikšmingų žaibotraukos požymių. Matyt aukštis – dar ne viskas.
LIETUVOS PADENGIMAS GARDELĖMIS

Taip atrodo gardelės, dengiančios Vilniaus centrą:

Kiekvienos plotas yra 16.2 hektaro, kraštinė – 250 metrų, ilgasis skersmuo – 500 metrų, trumpasis skersmuo – 433 metrai. Visai Lietuvos teritorijai padengti panaudojome net 405 388 tokių gardelių, iš jų 384 973 buvo tokios, kad 2 km. spindulio gardelės kontrolinė zona neišėjo iš Lietuvos teritorijos ribų.

Kontrolinė zona mums bus reikalinga tam, kad nustatytumėm, kokio žaibų skaičiaus toje lokacijoje turėtumėm tikėtis. Kadangi kiekvienos gardelės kontrolinė zona visada yra aplink gardelę (ir netoli jos) – ji turėtų neblogai atspindėti gardelės geografines, geologines, lokalaus klimato, antropogenines sąlygas.

Pasikartojam: gardelės nepersidengia, jų kontrolinės zonos – persidengia. Kadangi žaibų duomenys yra tik iš Lietuvos teritorijos, gardelės, kurių kontrolinė zona nors kiek kerta Lietuvos teritorijos sieną pašalintos.

PAPRASTI SKAIČIAVIMAI (BACK-OF-THE-ENVELOPE CALCULATION)

Jei Lietuvos teritorijoje dešimties metų laikotarpyje užfiksuotas ~1 milijonas žaibų, o ta teritorija yra suskirstyta į ~400 tūkstančių vienodų gardelių, tai vidutiniškai vienoje gardelėje tikėtumėmės aptikti 2–3 žaibus. Taip turėtų būti, jei žaibai trankytų į atsitiktines vietas, ignoruodami aukštus stulpus, medžius ar pastatus.

Tačiau realybėje (duomenyse) aptinkame gardelių, kuriose žaibų skaičius yra 20–30, tai yra dešimt kartų daugiau, nei tikėtasi. Galime pradėti įtarti, kad egzistuoja žaibotraukos vietos, sukoncentruojančios žaibus, ir kad žaibai teritorijoje pasiskirsto netolygiai.

RIMTESNĖ STATISTIKA

Tačiau kaip mums įrodyti, kad padidėjęs žaibų tankis yra pakankamai didelis, kad tai vienareikšmiškai negalėtų būti tik statistinė fliuktuacija?

Ir kaip mums atsižvelgti į akivaizdų faktą, kad net ir krituliai pasiskirsto netolygiai; kaip pašalinti vietovės lokalaus klimato įtaką skaičiavimams, kad aptiktumėm tik nuo lietaus/debesų tikimybės nepriklausomas žaibotraukos vietas?

Pasinaudokim rimtesne statistika.

  1. tikėtiną (expected) žaibų skaičių imkime ne iš Lietuvos vidurkio, o iš lokalios kaimynystės (kontrolinės zonos).
  2. kiekvienai gardelei raskime jos kontrolinę zoną ir tos zonos žaibų skaičių.
  3. Naudokimės Puasono skirstiniu ir jo savybėmis, kad įvertintume kiekvieną gardelę – kaip labai ji nukrypsta nuo lokaliai tikėtino žaibų skaičiaus. Šį įvertį išreikškim kaip tikimybę (p-value) tokį nuokrypį stebėti galiojant žaibotraukos neegzistavimo hipotezei.
  4. Atsižvelkime į tai, kad statistinį testą (3) kartojame pusę milijono kartų, dėl ko statistinį įvertį reikia koreguoti (Dunn–Šidák correction).
  5. Visas gardeles išrikiuokime nuo didžiausio statistinio reikšmingumo iki mažiausio. Pasilikime tik statistiškai reikšmingiausias gardeles, kurių p-value yra mažiau už 1-(1-0.05)^(1/384973), t.y. 1.33e-07.
  6. Tokiu būdu tampame užtikrinti, kad nei viena iš toliau aprašomų gardelių nėra išskirtinė tik dėl atsitiktinumo. Kitaip tariant – kad gardelėse vyksta žaibotrauka.

REZULTATAI

0. bendra APŽVALGA

Mūsų metodas išskyrė 12 gardelių. Kiekvieną jų patyrinėjome giliau.

1. TV Bokštas

Iš statistinio metodo atrinktų dvylikos gardelių dvi ryškiausios buvo Vilniaus Televizijos bokštas (dvi gretimos gardelės).

Pagalvokite apie tai! Mes nebandėme apsižvalgyti aplink TV bokštą ir paieškoti ten žaibų klasterio. Šį žaibų klasterį atrado automatizuotas aklas pusės milijono gardelių, dengiančių Lietuvą, skenavimas. Ir pirmasis žodis, kurį pasakė prakalbinti duomenys buvo: “TV bokštas!“.

Geltoni taškai – žaibai. Raudoni taškai – aukšti statiniai (tarp jų ir TV bokštas). Šešiakampis – TV bokšto gardelė. Raudonų apskritimų spinduliai – 1 ir 2 km.

Per tiriamąjį laikotarpį bokšto gardelėje užfiksuoti 35 žaibai. Svarbu, kad tai nebuvo vienos audros atsitiktinumas: šie žaibai įvyko per 11 skirtingų dienų. Kontrolinėje zonoje (tarp dviejų apskritimų) įvyko 176 žaibai. Atsižvelgus į skirtingą šių teritorijų plotą, gardelės žaibų tankis yra 216 žaibų per kvadratinį kilometrą, o kontrolinės zonos – 19 žaibų per kvadratinį kilometrą. Tad TV bokšto gardelėje žaibų tikimybė yra (219/19) = ~11 kartų didesnė nei kaimynystėje.

2. Vėjo jėgainėS

Tarp 12 gardelių, dviejų centre buvo vėjo jėgainės.

Pirmoji lokacija – netoli Ukmergės, LKS kordinatės: [560342, 6137123].

Mėlyni taškai – aukšti statiniai (šiuo atveju – vėjo jėgainės). Gardelėje užfiksuota 19 žaibų (trys skirtingos datos), kontrolinėje zonoje (tarp dviejų apskritimų) įvyko 121 žaibas. Normalizavus teritorijų plotui, gardelės žaibų tankis yra 117 žaibų/kv.km., o kontrolinės zonos – 13 žaibų/kv.km.

Antroji lokacija – netoli Pagėgių, LKS koordinatės [373436, 6121337].

Gardelėje užfiksuota 14 žaibų (devynios skirtingos datos), kontrolinėje zonoje (tarp dviejų apskritimų) įvyko 86 žaibai. Normalizavus teritorijų plotui, gardelės žaibų tankis yra 86 žaibų/kv.km., o kontrolinės zonos – 9 žaibų/kv.km.

3 NEMUNAS

Dar dvi gardelės buvo tiesiai ant Nemuno kranto. Tikimybė, kad iš 384 973 Lietuvos teritorijos gabalėlių atsitiktinai pasirinkus 12, du iš jų sutaps su Nemuno pakrante (skirtingose Nemuno vietose) – yra labai labai maža. Tačiau būtent tokia situacija susiklostė realybėje. Tad mes vėlgi atmetam atsitiktinio žaibų pasiskirstymo hipotezę ir teigiam, kad didele mase gausiai tekantis vanduo kažkokiu būdu yra palankus žaibodarai.

Pirmoji lokacija – prie Birštono, LKS koordinatės [501162, 6044999], 14 žaibų (6 datos), 86 žaibai/kv.km.; kontrolinėje zonoje – 142 žaibai, 15 žaibų/kv.km.;
Antroji lokacija – prie Veliuonos, LKS koordinatės [455840, 6104036], 17 žaibų (5 datos), 105 žaibai/kv.km.; kontrolinėje zonoje – 180 žaibų, 19 žaibų/kv.km..

4 KITI VANDENS TELKINIAI

Ežeras prie Aukštadvario, LKS koordinatės [533374, 6055379]. Netoli ežero – bokštas. Gardelėje 21 žaibas (6 datos), 130 žaibų/kv.km.; kontrolinėje zonoje – 197 žaibai, 21 žaibas/kv.km.:

Upelės ir melioracinių griovių santaka pre pamiškės, netoli Ukmergės. LKS koordinatės [539367, 6125878]:

Nors aukštų objektų nėra, mūsų supratimu drėgna ir elektrolitais (trąšomis) praturtinta melioracinė žemė bei jos nutekėjimai gali pasižymėti žaibotrauka. Gardelėje 14 žaibų (5 datos), 86 žaibai/kv.km.; kontrolinėje zonoje – 147 žaibai, 16 žaibų/kv.km.

Ežeringa vieta prie Rokiškio, LKS koordinatės [606414, 6187943], netoli aukštas statinys (mėlynas taškas). Itin šlapia žemė, gausiai ir nekokybiškai melioruota.

Gardelėje 12 žaibų (4 datos), 74 žaibai/kv.km.; kontrolinėje zonoje – 83 žaibai, 9 žaibai/kv.km.

Rukai prie Pagėgių, LKS koordinatės [360701, 6120039]; gausiai ir nekokybiškai melioruota žemė, taip pat nelabai toli 110 kV LITGRID linija.

Gardelėje 13 žaibų (9 datos), 80 žaibų/kv.km.; kontrolinėje zonoje – 113 žaibų, 12 žaibų/kv.km.

Mikalavas prie Ignalinos, LKS koordinatės [647990, 6137123]. Gardelėje upelė, aplinkui melioracija, gardelės viduje bokštas, netoli 110 kV LITGRID linija.

Gardelėje 13 žaibų (7 datos), 80 žaibų/kv.km.; kontrolinėje zonoje – 118 žaibų, 13 žaibų/kv.km.

5 ŽVYRO KARJERAS

Paslaptinga žaibotraukos vieta. LKS koordinatės [443854, 6034403]. Gardelė yra lygiame javų lauke, neturinčiame jokių medžių ar stulpų. Įdomu tai, kad vietovė yra pelkėta, šlapia, o 1 km. į pietvakarius yra žvyro karjeras (kalbiname geologus, dėl nuomonės apie galimą karjero įtaką žaibtraukai).

Gardelėje užfiksuota 18 žaibų (devynios skirtingos datos), kontrolinėje zonoje (tarp dviejų apskritimų) įvyko 214 žaibų. Normalizavus teritorijų plotui, gardelės žaibų tankis yra 111 žaibų/kv.km., o kontrolinės zonos – 23 žaibų/kv.km.

KO NEAPTIKOME

Keista, tačiau tarp 12 reikšmingiausių gardelių nepateko nei aukšti elektrinių bokštai, nei kitų miestų radio/TV bokštai ar stulpai.

DUOMENYS

Šiuos duomenis radome Lietuvos hidrometeorologijos tarnybos svetainėje: http://www.meteo.lt/lt/skn.