Skip to content

Strojově čitelný seznam všech českých obcí se základními metadaty

License

Notifications You must be signed in to change notification settings

cesko-digital/obce

Repository files navigation

České obce

Strojově čitelný seznam všech českých obcí se základními metadaty (IČO, název, zeměpisné souřadnice, …).

Základní data pochází ze seznamu orgánů veřejné moci od projektu Czech Point (jeho dokumentace). Dodatečná data:

  • ID elektronické úřední desky ze systému edesky.cz. Detekce je zatím velmi hloupá, potřebuje zlepšit (pull requesty vítány!).
  • Zeměpisné souřadnice z RÚIAN (načítáme přes api.store).
  • Erb obce načítaný velmi chabou heuristikou z Wikipedie, potřebuje zlepšit (viz #12).

Wishlist:

Příklad

{
  "erb": "https://commons.wikimedia.org/wiki/File:N%C3%A1chod_CoA_CZ.svg",
  "eDeskyID": "43",
  "souradnice": [
    50.41632706234231,
    16.163860651213163
  ],
  "zkratka": "NACHOD",
  "ICO": "00272868",
  "nazev": "MĚSTO NÁCHOD",
  "hezkyNazev": "Náchod",
  "datovaSchrankaID": "gmtbqhx",
  "pravniForma": {
    "type": 801,
    "label": "Obec"
  },
  "mail": [
    "[email protected]"
  ],
  "adresaUradu": {
    "ulice": "Masarykovo náměstí",
    "cisloDomovni": "40",
    "cisloOrientacni": null,
    "obec": "Náchod",
    "obecKod": "573868",
    "PSC": "54701",
    "castObce": "Náchod",
    "kraj": "Královéhradecký",
    "adresniBod": "7440171"
  }
}

Rádi bychom místo příkladu dodali dokumentované schéma, proti kterému bude výstup validovaný, viz #9.

Dost řečí, kde jsou data?

https://data.cesko.digital/obce/1/obce.json

Číslo 1 v URL značí hlavní komponentu verze, která se bude zvedat, pokud dojde ke zpětně nekompatibilním změnám (semver).

Aktualizace probíhá jednou týdně v noci ze soboty na neděli.

Hacking

  • Větev master je release větev, každá změna v ní vede k přegenerování celého datasetu. Což trvá dlouho a nechceme to dělat často.
  • Proto jde většina běžné práce do větve next a do master se merguje občas.
  • Pro lokální testování budete potřebovat API klíč od api.store.
  • Verzování releasů: x.y.z, kde x se mění při zpětně nekompatibilních změnách, y při zpětně kompatibilních změnách a z tam, kde jsme neměnili formát dat, jen kód pro jejich generování.
  • Kdybyste chtěli přispět (budeme moc rádi!), tak zdrojový kód a commity anglicky, všecko ostatní může být česky.
$ wget -O all.xml.gz 'https://www.czechpoint.cz/spravadat/ovm/datafile.do?format=xml&service=seznamovm'
$ gunzip all.xml.gz
$ yarn install
$ yarn test
$ RUIAN_API_KEY=… LIMIT=10 yarn start

Licencování

Kód je licencovaný pod MIT licencí, data zatím nevíme, viz #5.