V datovém exportu jsou následující položky:
prj_id
: kód projektuop_id
: zkratka OPvalue
: kód obce nebo ZÚJ podle číselníku ČSÚobec_puvod
: typ dovození obce (chybějící místo; bez obce; zúžení)rozpad_typ
: způsob rozpadu/dovození (kód)rozpad_duvod
: bližší zdůvodnění) rozpadu/dovození obcelevel
: geografická úroveň idenfitikátoru (obec/zuj)radek
: pořadové číslo řádků v rámci projektulevel_orig
: nejjemnější geografická úroveň, na které byl projekt lokalizován v původních datechid_orig
: všechna území, která na této úrovni projekt lokalizovala (oddělená čárkou)chunk
: díl souboru (pro export do dílčích XLSX souborů)Výstup bude mít cca 20 excelových souborů po cca 20 MB. (Lze i větší soubory, ale je to pak pro uživatele dat nešikovné).
Zádrhele:
Pokud by se ukázalo, že toto je velký problém, je možné se u projektů s takto dovozenou obcí vrátit k původním údajům (viz popis položek výše).
Tj. odpovídají názvy územních jednotech v našich datech těm názvům, které pod stejným identifikátorem najdeme v číselnících ČSÚ?
Jen u několika desítek míst lehce neseděly názvy - velká a malá písmena, název Horní u Dolní vs. jen Horní atd. Pro lepší napojitelnost na další data ČSÚ jsem se rozhodl data upravit směrem ke konformitě s ČSÚ.
tj. jak časté jsou projekty, které se realizovaly např. zároveň v kraji X a obci O, která neleží v kraji X?
máme asi 500 projektů (tj. < 1 % z celku), u kterých jsou uvedena místa realizace na různé administrativní úrovni a zároveň tato místa neleží v jedné hierarachické lince. Nejčastější je to u OP VVV a OP ŽP, něco málo též u OP D a OP PIK.
Díky tomu ale máme nachystané datové struktury a algoritmy na libovolné porovnávání, rozpadání atd. míst realizace v různých kombinacích počtů a úrovní.
Další krok bude rozčlenit těch cca 500 komplikovaných projektů (nejspíš podle výzev) a udělat nějakou úvahu o tom, jak s nimi naložit při finální akokaci místa realizace.
Ale to je asi OK.
To by neměla vadit, pokud zrovna u těchto projektů nebudeme muset dovozovat místo realizace ze sídla.
Vadí, nevadí?
Část jsou velké plošné projekty AOPK, část lokální, které by šly alokovat podle příjemce.
Je to ale logické, je to projekt z výzvy na mobility.
tj. jestli místo s ID X má stejný název v datech a v ofiko číselnících
tj. jestli někde nejsou projekty rozpadnuty do území, které neodpovídají jejich (zadaným nebo intuitivně smysluplným) nadřazeným geografickým jednotkám.
Dominantní je to u OP PPR, relativně časté u IROPu, OP D a OP ŽP.
S těmi tedy budeme muset zacházet specificky - např. kontrolovat, jestli nižší a vyšší jednotky do sebe zapadají.