Prepletanje umetne inteligence in fizike pri napovedovanju obalnih poplav

Podnebne spremembe prek številnih mehanizmov povzročajo dvig srednje (časovno povprečene) gladine globalnih oceanov. Slovensko morje pri tem ni izjema. V zadnjih nekaj desetletjih na merilnih postajah v Kopru in Trstu opažamo rast srednje gladine morja, ki znaša preko 4 milimetre na leto. Modelske projekcije rasti globalne gladine morja predvidevajo, da bo do leta 2050 srednja gladina morja v Tržaškem zalivu najverjetneje narasla za 30 do 50 centimetrov, do konca stoletja pa za 40 do 100 cm. To se morda ne zdi veliko, ampak s temi številkami je povezana izjemno strma rast pogostosti poplav: do srede stoletja naj bi pogostost poplav narasla 10 do 20-krat, do konca stoletja pa naj bi bile poplave tudi do dvestokrat bolj pogoste. Povedano drugače: dvig srednje gladine morja za en meter v Piranu ob nespremenjeni konfiguraciji obale pomeni vsakodnevne poplave – in to tudi ob mirnem in sončnem vremenu. Poleg tega so te številke zgolj najverjetnejše ocene, ki ne izključujejo bistveno večje rasti srednje gladine morja – največje negotovosti so trenutno povezane z našim (ne)razumevanjem taljenja ledu na Antarktiki.

Lokalno resnost težave ilustrira informacija, da lahko ena sama obalna poplava v slovenskem Primorju povzroči več milijonov evrov škode ter ogrozi obalno prebivalstvo in gospodarstvo. Vprašanje »kdaj bo morje poplavilo?« je zato dobesedno vprašanje za milijon dolarjev. In čeprav posamezne obalne poplave ne moremo vzročno povezati s podnebnimi spremembami, slednje nedvomno vodijo v razmere, v katerih bodo pogoji za hude poplave pogosteje izpolnjeni. Na to moramo kot pomorska država računati. Obramba pred obalnimi poplavami je vedno povezana s pravočasno in ustrezno napovedjo poplave, ta pa temelji na dobrem razumevanju fizike morja v Jadranskem bazenu. A čeprav se sliši nekoliko protislovno, je fiziko gladine morja v Jadranu razmeroma enostavno razumeti, bistveno težje pa je gladino natančno napovedovati. Oglejmo si, zakaj je tako.

Mehanizem nastanka obalnih poplav in težavnost prognoze

Na dinamiko gladine morja v severnem Jadranu vplivata predvsem vreme in plimovanje – in ker je Jadransko morje na severu plitko in zaprto, na jugu pa globlje in odprto (prikazano na spodnji sliki), sta oba vpliva na severu izrazitejša, zato so poplave v Tržaškem zalivu intenzivnejše in pogostejše kot denimo v Splitu ali Dubrovniku. Kakorkoli že, vremenski vplivi so neodvisni od plimovanja, plimovanje pa je neodvisno od vremena. Na mestu je opozorilo, da s plimo v fizikalni oceanografiji ne označujemo katerekoli spremenljivosti gladine morja, temveč zgolj tisti (kvazi)periodični del celotnega signala gladine morja, ki ga povzročajo gravitacijski vplivi Lune in Sonca. Največjo amplitudo imajo tisti plimni valovi, ki nastajajo v globalnih oceanih ter se od tam širijo v obalna morja. Lokalno vzbujena plimovanja manjših regionalnih bazenov (Jadran, Baltik) in jezer so bistveno šibkejša. Ob normalnem zračnem pritisku in odsotnosti vetrov so plimni valovi tisti, ki narekujejo dinamiko gladine v Jadranu.

Oblika terena in morskega dna na področju Jadranskega bazena.

Ob prehodu vremenskih motenj (denimo ciklonov) čez Jadran se v gladini morja poleg plimovanja pojavijo dodatni, meteorološki prispevki. Naštejmo jih le nekaj. Ob prehodu ciklona zračni pritisk nad Jadranom pade, obenem pa krajevne razlike v zračnem pritisku nad Jadranom poganjajo močne vetrove, ki so pogosto jugovzhodnih smeri (jugo, it. scirocco) ter pihajo vzdolž osi Jadranskega bazena v zaprti severni konec bazena. Ravnovesni odziv oceana na spremembe zračnega pritiska je pričakovan: ko pritisk pade, se gladina morja tipično dvigne; ko pritisk naraste, se gladina niža. Odziv Jadrana na močan jugo pa je bolj zanimiv: jugo prek mehanskih napetosti, ki jih povzroča v površinski plasti oceana, nariva vodo proti Benetkam in Tržaškem zalivu. Nivo vode zato v severnem Jadranu zraste. Veter sicer lahko povzroči naklon gladine v Jadranskem bazenu, ne more pa tega naklona vzdrževati, zato Jadransko morje zaniha kot voda, ki jo razburkamo v kopalni kadi. Podobno kot je frekvenca najnižjega tona pri flavti določena z njeno efektivno dolžino, je tudi osnovna perioda tega t. i. lastnega nihanja določena z dolžino Jadranskega bazena in znaša 21,5 ur. Z obliko bazena je povezano tudi dejstvo, da so plime v Jadranu resonančno ojačane. V takih razmerah imamo torej na dani lokaciji v Jadranu opravka s seštevkom dveh nihanj, plime in vremensko vzbujenega lastnega nihanja. Vsota teh dveh nihanj, s tem pa polna višina gladine morja na dani lokaciji, je močno (nelinearno) odvisna od časovnega zamika (fazne razlike) med vrhovoma obeh signalov. Kadar vrh plime sovpade z vrhom vetrovno vzbujenega lastnega nihanja, je polna višina gladine bistveno višja kot v primeru, ko vrh plime sovpade z minimumom lastnega nihanja. Ker časovna razlika med plimo in oseko znaša zgolj šest ur, lahko nekajurni časovni zamik med obema signaloma pomeni razliko med katastrofalno poplavo ter odsotnostjo poplave. Z drugimi besedami: tudi če vremenski model zgreši prehod ciklona zgolj za nekaj ur, se lahko ta vremenska napoved – ki sama po sebi sploh ni slaba! – prevede v zelo napačno napoved gladine morja. Možen odgovor na tovrstne zagate ponuja t. i. ansambelsko modeliranje: namesto ene vremenske napovedi jih naredimo več (tipično nekaj deset), v vsako posamezno simulacijo pa umetno vnašamo različne majhne motnje (perturbacije) ter jim pustimo, da se razvijajo v prostoru in času simulacije. Na ta način dobimo več možnih scenarijev za prihodnji potek vremena, tj. ansambel vremenskih napovedi, obenem pa lahko ocenimo stabilnost vremenskih razmer na majhne motnje ter s tem obenem tudi verjetnost za različne (zlasti ekstremne) poteke vremena. Atmosferski ansambel nato uporabimo za napoved gladin morja ter z vsakim članom atmosferskega ansambla izračunamo ločeno dinamiko gladine morja. Tako dobimo več scenarijev za potek gladine morja v Jadranu in s tem ovojnico oziroma možen obseg anticipiranih višin gladine morja. Pri tem seveda stavimo na to, da bomo s perturbacijami povzročili v modelskih napovedih ravno dovolj raztrosa, da bo ta vključeval in kompenziral ostale modelske dinamične in informacijske pomanjkljivosti ter da bomo tako z ovojnico možnih scenarijev gladine zajeli tudi tistega, ki se bo dejansko odvil v morju. Težava ansambelskega pristopa pri simulacijah stanja morja z matematično-fizikalnimi numeričnimi modeli je kajpak na dlani: izračun ansambla je več desetkrat numerično in časovno zahtevnejši ter energijsko potratnejši od ene same izolirane simulacije. Porabe energije so pri tem dovolj visoke, da mora biti denimo superračunalnik na Agenciji RS za okolje vodno hlajen, segreta voda pa se uporablja za ogrevanje prostorov.

HIDRA: Nevronski odgovor z milijon parametri

Omenjenega problema časovne in energijske potratnosti smo se raziskovalci s Fakultete za računalništvo in informatiko UL, Agencije RS za okolje ter Nacionalnega inštituta za biologijo lotili z globokim učenjem. Moderne metode globokega učenja temeljijo na tako imenovanih umetnih nevronskih mrežah. Gre za v plasti urejene umetne nevrone, kjer so vhodi nevronov v plasti povezani z izhodi (nekaterih) nevronov zgodnejših plasti. Umetni nevron je matematična funkcija, ki uteženo sešteje vhodne vrednosti in vsoto nelinearno preslika. Kljub svoji preprostosti so v mrežo povezani nevroni skupaj sposobni modelirati izredno kompleksne preslikave. S povečevanjem števila plasti in s tem globine mreže pa se ta sposobnost še veča in s tem praviloma tudi uspešnost naloge mreže. Učenje globokih nevronskih mrež obsega postopno ocenjevanje uteži nevronov in drugih parametrov v posameznih plasteh tako, da napovedi mreže pri danem vhodu čim bolj ustrezajo predvidenemu izhodu v učnem podatku. Kljub temu, da en sam učni korak (katerega del je tudi napoved) ni računsko intenziven, pa to ne velja za celoten postopek učenja. Število parametrov globokih nevronskih mrež namreč štejemo v milijone, zato je potrebno mrežo učiti na zelo veliki podatkovni zbirki s številnimi prehodi skozi celotno zbirko. Tako velika računska kompleksnost presega sposobnost klasičnih procesorjev, zato uporabljamo grafične procesne enote (GPU), s katerimi učenje masovno paraleliziramo in močno pohitrimo. Zares sta k razmahu globokih nevronskih mrež v zadnjih petnajstih letih pripomogla predvsem dostopnost velikih podatkovnih zbirk (kar je posledica javnega deljenja slik v splet povezane digitalizirane družbe) in razvoj GPU-jev (rezultat razvoja zabavne industrije računalniških igric). Po letu 2012, ko je prva globoka mreža, učena z GPU na ogromni učni množici, dobesedno pometla s konkurenco na tekmovanju razpoznavanja slik ImageNet, nič ni bilo več enako kot prej. Silovit metodološki razvoj globokih nevronskih mrež je revolucioniral celotna raziskovalna področja in omogočil aplikacije, kot so avtonomna vozila, ki so bila do takrat zgolj znanstvena fantastika.

Na področju računalniškega vida, s katerim se ukvarjajo v laboratoriju ViCoS na FRI, je globoko učenje v zgolj nekaj letih postalo osrednja metodologija in enako velja za sorodna področja procesiranja govora in naravnega jezika ter širšega področja strojnega učenja. Kljub temu pa strojno učenje v geofizikalnih napovednih modelih šele danes, po dolgih letih, celo desetletjih naporov, začenja kazati svojo moč. Morda je razlog v izraziti interdisciplinarnosti problema, ki zahteva tako globoko poznavanje fizikalnega ozadja kot tudi modernih principov globokega učenja.

Lep primer prepletanja napovednih metod globokega učenja ter fizike morja je globoka nevronska mreža HIDRA (angl. High-performance Deep tidal Residual estimation method using Atmospheric data), ki smo jo razvili raziskovalci FRI, NIB in ARSO. HIDRA na podlagi preteklih gladin morja in atmosferske dinamike napoveduje časovni razvoj gladine v Kopru za naslednjih 72 ur. Pomemben izziv pri njenem razvoju je bila izdelava arhitekture, ki bi smiselno usmerjala podatkovni tok in mreži omogočala modeliranje kompleksnih interakcij med atmosfero in oceanom, ki se skrivajo v vhodnih podatkih. Globoke mreže so s svojimi milijoni parametrov namreč prekompleksne, da bi jih ljudje lahko razumeli na klasičen način, kot denimo razumemo fiziko. Prav tako je bilo potrebno posebno pozornost posvetiti izbiri in obliki vhodnih podatkov, ki v praksi pomembno vplivajo na kvaliteto prognoze. Za konkreten problem napovedovanja obalnih poplav so se kot relevantne atmosferske vhodne količine izkazali veter, zračni pritisk ter temperatura zraka nad Jadranskim bazenom. Te podatke pridobimo iz napovedi Evropskega centra za srednjeročno napovedovanje vremena (ECMWF), globoki mreži pa jih predstavimo v obliki dvodimenzionalnih slik (prikazano na spodnji sliki). Poleg atmosferskih podatkov potrebujemo tudi oceanske vhodne podatke. Uporabili smo pretekle meritve gladine morja na koprski mareografski postaji. Ker znamo plimovanje dokaj dobro napovedati za kako leto vnaprej, glavni napovedni problem predstavlja meteorološki signal v gladini morja, ki od plime ni odvisen. Izmerjene gladine zato razcepimo na plimne gladine in meteorološki prispevek, s čimer mreži omogočimo osredotočanje na meteorološki del dinamike gladine.

Primer atmosferskih količin, izračunanih v napovedi ECMWF.

Arhitektura HIDRA (spodnja slika) je zasnovana kot cevovod kodiranja in postopnega zlivanja prispevkov atmosferske dinamike in dinamike morskih gladin. Atmosferski kodirnik iz atmosferskih podatkov izračuna t. i. prostorske značilnice, tj. abstraktne količine, ki ob danem časovnem koraku optimalno povzemajo uporabne povezave med različnimi atmosferskimi količinami. Sledi prostorsko združevanje značilnic, ki ob fiksnem časovnem koraku usmeri pozornost mreže v tiste prostorske lokacije, ki so najpomembnejše za napovedovanje morske gladine v Kopru. S tem mreža atmosferske vhodne podatke preslika v novo, časovno odvisno visokodimenzionalno značilnico. To visokodimenzionalno strukturo nato uteženo sploščimo v času in zlijemo v končno atmosfersko značilnico. Namen tega modula je podoben kot zgoraj pri prostorskem delu problema: usmerjanje pozornosti mreže v tista časovna obdobja, ki maksimalno prispevajo k napovedni natančnosti. Sledi napovedni del mreže, ki na podlagi teh temeljito predelanih atmosferskih informacij in preteklih meritev gladine morja napove časovno vrsto meteoroloških prispevkov k morski gladini v Kopru za prihodnje tri dni. Polno višino morske gladine seveda dobimo s prištevanjem napovedi plime.

Arhitektura napovednega modela HIDRA

Temeljita analiza zgoraj opisane globoke mreže HIDRA je pokazala, da je pri napovedovanju gladin v Kopru vsaj toliko, pogosto pa še bolj natančna kot obstoječi fizikalni model. Spodnja slika prikazuje primer situacije, kjer je bila napoved fizikalnega modela precej slaba, napoved HIDRA pa bolj korektna. Sprotne dnevne napovedi HIDRA lahko spremljate po spletu.

Primer slabe napovedi gladine morja v Kopru s fizikalnim modelom (gornja slika, z modro modelska napoved, s črno meritve) ter – v tem primeru – boljše napovedi mreže HIDRA (spodnja slika, z oranžno HIDRA napoved, s črno meritve). Rdeča črtkana črta označuje nivo gladine, pri katerem Agencija RS za okolje izda rumeno opozorilo za obalne poplave.

Obenem ima HIDRA v primerjavi s fizikalnim oceanskim modelom nekaj drugih pomembnih prednosti. Izračun HIDRA denimo terja milijonkrat manj procesorskega časa in električne energije kot napoved z oceanskimi modeli. Razlog tiči v tem, da morajo oceanski modeli za izračun gladine morja v Kopru pač izračunati celotno dinamiko (tokove, gladino, ipd.) v vseh točkah in globinah Jadranskega bazena, HIDRA pa se osredotoča neposredno na predikcijo gladine na eni sami lokaciji – v Kopru. Oceanski modeli zato tečejo nekaj ur na več sto procesorskih jedrih, napoved HIDRA pa terja zgolj pol sekunde na enem samem jedru ali grafični kartici. Poleg tega so oceanski modeli na povsem drugačen način odvisni od atmosferskih podatkov: če atmosferski model konsistentno podcenjuje veter, bo tudi z atmosferskim modelom sklopljeni oceanski model konsistentno narobe napovedoval gladino. HIDRA pa zna tovrstne sistematične napake upoštevati in jih kompenzirati. Izkazalo se je tudi, da se je HIDRA naučila ustrezno vzbujati in tempirati lastna nihanja Jadranskega bazena, kar je pomembno pri napovedih posameznih obalnih poplav.

Kljub povedanemu bi bilo napak sklepati, da sta umetna inteligenca in fizikalno modeliranje konkurenčna pristopa k posameznemu problemu. Nasprotno, sta komplementarna in njuno prepletanje rojeva vedno več sinergij: dandanes se zato hitro razvija področje t. i. fizikalno-informirane umetne inteligence, ki jo pri iskanju optimalnih rešitev dodatno omejimo z eksplicitnimi fizikalnimi zakoni. S tem zavrnemo tiste rešitve globokih mrež, ki preveč odstopajo od dovoljene fizikalne dinamike, ter tako uspešneje iščemo preseke med globokim učenjem in dvatisočletno zgodovino človekovega pojmovnega razumevanja narave. V luči podnebnih sprememb in z njimi povezanega dviga morske gladine postaja vse bolj očitno, da bodo s poplavami povezane težave po svetu in pri nas neizogibno naraščale. Ustrezni znanstveni odgovor na napovedne izzive zato ni ena ali druga paradigma, temveč jasna identifikacija prednosti in slabosti vseh metod, ki jih imamo na voljo, ter njihova metodološka združitev v novih napovednih sistemih, ki bodo skupaj več kot zgolj vsota svojih sestavnih delov.