D O K U M E N T U M A Z O N O S Í T Ó 
 F á j l n é v : banki_zsolt_foldrajzi_nevter.jpg
C Í M 
F ő c í m : Hiába Rázom, mégis Tiszalök
B e s o r o l á s i   c í m : Hiába Rázom, mégis Tiszalök
E G Y É B   C Í M 
E g y é b   c í m : A Magyar Nemzeti Levéltár komplex, heterogén forrásból épített, egységes földrajzi név authority állományának elkészítése
M i n ő s í t ő : alcím
A L K O T Ó 
S z e r e p : létrehozó
B e s o r o l á s i   n é v : Hegedűs
U t ó n é v : István
I n v e r t á l a n d ó   n é v : N
S z e r e p : létrehozó
B e s o r o l á s i   n é v : Bánki
U t ó n é v : Zsolt
I n v e r t á l a n d ó   n é v : N
K r o n o l o g i k u s   k i e g é s z í t ő : 1964-
V I A F I d : 12165322565816021060
D Á T U M 
E s e m é n y : felvéve
I d ő p o n t : 2022-06-03
E s e m é n y : elérhető
I d ő p o n t : 2022-04-22
D á t u m r a   v o n a t k o z ó   m e g j e g y z é s : Az előadás időpontja.
D O K U M E N T U M T Í P U S 
A   t í p u s   n e v e : prezentáció
A   t í p u s   n e v e : előadás
R É S Z G Y Ű J T E M É N Y 
M e g n e v e z é s : Prezentáció
M e g n e v e z é s : Könyvtártudomány - prezentáció
M e g n e v e z é s : Networkshop 2022
E R E D E T I   K I A D V Á N Y ,   O B J E K T U M 
S Z Á R M A Z Á S I   H E L Y  J O G K E Z E L É S 
A   j o g t u l a j d o n o s   n e v e : Hegedűs István, Bánki Zsolt
S z e r z ő i   j o g i   m e g j e g y z é s e k : Jogvédett
T É M A 
T é m a k ö r : Könyvtártan, információtudomány
A l t é m a k ö r : Könyvtárvezetés, könyvtárügy
T é m a k ö r : Katalógusok, bibliográfiák
A l t é m a k ö r : Adattárak
T é m a k ö r : Földtudományok, földrajz
A l t é m a k ö r : Térinformatika
T é m a k ö r : Szótárak, fogalomtárak
A l t é m a k ö r : Tezauruszok
T Á R G Y S Z Ó 
T á r g y s z ó : Magyar Nemzeti Levéltár (Budapest)
M i n ő s í t ő : intézmény
T á r g y s z ó : földrajzi név
M i n ő s í t ő : tárgyszó/kulcsszó
T á r g y s z ó : névtér
M i n ő s í t ő : tárgyszó/kulcsszó
T á r g y s z ó : adatbázis
M i n ő s í t ő : tárgyszó/kulcsszó
T á r g y s z ó : tezaurusz
M i n ő s í t ő : tárgyszó/kulcsszó
T á r g y s z ó : adatmodell
M i n ő s í t ő : tárgyszó/kulcsszó
T á r g y s z ó : földrajzi koordináta
M i n ő s í t ő : tárgyszó/kulcsszó
I D Ő - H E L Y   T Á R G Y S Z Ó 
T á r g y s z ó : 2022
M i n ő s í t ő : időszak
L E Í R Á S 
K é p a l á í r á s : Hiába Rázom, mégis Tiszalök
A Magyar Nemzeti Levéltár komplex, heterogén forrásból épített, egységes földrajzi név authority állományának elkészítése
N y e r s   v a g y   O C R - e s   s z ö v e g : Hiába Rázom, mégis Tiszalök A Magyar Nemzeti Levéltár komplex, heterogén forrásból épített, egységes földrajzi név authority állományának elkészítése Hegedűs István - Bánki Zsolt Magyar Nemzeti Levéltár Országos Levéltára Alapvetés I. A Magyar Nemzeti Levéltár (MNL) már rendelkezik földrajzi authority állománnyal, amely kiinduló forrásként kezelendő. Ezt az állományt földrajzi névtérként használják a levéltár egyes leíró adatbázisaihoz (segédletekhez). Az állomány Oracle adatbázisban található. A kiinduló földrajzi név állomány a geotaurusz 2011-es verziója, illetve a segédletekhez azóta felvett új entitások. Az MNL-es földrajzi névtérbe történt adatbevitel, adatgazdagítás. Getty adatmodell A földrajzi névtér adatmodellje az MNL Oracle adatbázisban a Getty adatmodellje (https://www.getty.edu/research/tools/vocabularies/obtain/download.html) Alapvetés II. Az MNL-es földrajzi névterének geokoordinátái nem pontosak. Ez a hiányosság az input állomány hiányosságából ered. A geokoordináták javítandók. A geotaurusznak létezik friss, jelentősen bővebb verziója. Az MNL és az aktuális geotaurusz eltér egymástól. Rendelkezésre áll az egykori Földmérési és Távérzékelési Intézet (FÖMI) adatbázisa, amely 78.798 földrajzi név koordinátáit tartalmazza. Rendelkezésre áll a Nemzeti Névtér földrajzi név állománya geokoordinátákkal. 101.992 név. Földrajzi névtér modellje Az MNL földrajzi névtere heterogén, redundáns állományokból épül, amelyekben szereplő földrajzi név entitásokat egy mesterID rekord azonosít és egységesít. Kiinduló állományokként a következőket jelöltük meg: jelenlegi MNL földrajzi névtér geotaurusz aktuális állománya 1913-as nomenklatúra (A magyar szent korona országainak helységnévtára) "Engel Pál" féle állomány (a középkori Magyarország digitális atlasza)* geonames teljes állománya *Az adatbázis a Magyar Királyság részletes térképét mutatja be a középkor végén, azaz az 1500-as évek körüli évtizedekben. Megtalálható rajta minden olyan település (város, mezőváros, falu, puszta, vár, kolostor - több mint 23 000), amely akkor létezett, és amelynek fekvése legalább hozzávetőlegesen megállapítható volt. A fontosabb vizeken és a megyehatárokon kívül feltünteti a jelentősebb királyi, egyházi és világi földbirtokok határait is (az 1498. évi állapot szerint). Földrajzi névtér modellje Földrajzi névtér projektszakaszok Input állományok (adatforrások) beszerzése Input állományok összevetése az MNL állománnyal Geokoordináták javítása, MNL állomány tisztítása Adatsémák megfeleltetése a getty-oracle adatsémának A getty-oracle adatséma felülvizsgálata, szükség esetén módosítása További adatforrások előkészítése betöltésre Adatforrások migrálása az oracle adatbázisba MesterID rekordok létrehozása, adatforrások entitásainak megfeleltetéseivel Földrajzi névtér projektszakaszok - elvégzett feladatok A létező MNL állomány koordinátáinak javítása elkészült a FÖMI, a geotaurusz és a nemzeti névtér koordinátáinak figyelembevételével. (A geotauruszban nincsenek ID-k, így a meglévő állománnyal és a FÖMI-vel, egységesített névalak és a geokoordináták meghatározott számú karakteregyezése alapján azonosítható.) Adatsémák megfeleltetése a getty-oracle adatsémának. A getty-oracle adatséma felülvizsgálata, szükség esetén módosítása. Úgy tűnik, hogy nem kell. Itt-ott nem evidens a mapping lehetősége, de megvalósítható. Viszonylag szegényes hierarchikus relációk: G=Genus/Species (generic), P=Whole/Part (partitive), I=Instance Gazdag asszociatív relációk: General, adjacent to, coextensive with, meaning/usage overlaps with, member of / member is, capital of / capital is, ally of, moved from / moved to, successor of / predecessor of, historical connection Általános, szomszédos, azonos kiterjedésű - eltérő típusú, jelentése / használat átfedésben (pl. Judea - Szentföld), tagja / tagja, főváros / főváros, szövetségese, átkerült / költözött, utódja / elődje, történelmi kapcsolat Elvégzett feladatok - koordináták javítása A geotauruszban nincsenek ID-k, így a meglévő állománnyal és a FÖMI-vel, egységesített névalak és a geokoordináták meghatározott számú karakteregyezése alapján azonosítható. Koordináta javítás összegzés: 70.854 Subject 75.276 Term 25.022 koordináta összesen 15.832 javított koordináta (63,58%) 9.190 javítatlan koordináta 45.832 koordináta nélküli subject Elvégzett feladatok - adatsémák megfeleltetése a getty-oracle adatsémának Geotaurusz - getty mapping Előttünk álló feladatok További adatforrások előkészítése betöltésre Adatforrások migrálása az oracle adatbázisba MesterID rekordok létrehozása, adatforrások entitásainak megfeleltetéseivel MNL-es URI (PID) kidolgozása, alkalmazása. További adatforrások előkészítése betöltésre I. Goeonames - cca 12 millió földrajzi név (betöltés vs. API) Engel - cca 23.000 földrajzi név 1913-as nomenklatúra adatgazdagított állománya Demeter Gábor, Németh Gábor 1912-es 1:144 000-es léptékű shape-file felkódolása (1910-es, 1780-as, Engel, KSH, LAU és névtér kódok) a file kiegészítése a külterületi lakott helyekkel 1780 körüli állapotokat ábrázoló 1:144 000-es léptékű shape-file felkódolása (1910-es, 1780-as, Engel, KSH, LAU és névtér kódok) Az Engel-féle pontok integrálása (MO. és Horváto.) a fenti shapek vetületeibe, geokoordináták kiolvasása További adatforrások előkészítése betöltésre II. Goeonames - cca 12 millió földrajzi név (betöltés vs. API) További adatforrások előkészítése betöltésre III. Engel - cca 23.000 földrajzi név További adatforrások előkészítése betöltésre IV. 1913-as nomenklatúra adatgazdagított állománya (Demeter Gábor, Németh Gábor) 1912-es 1:144 000-es léptékű shape-file felkódolása (1910-es, 1780-as, Engel, KSH, LAU és névtér kódok) a file kiegészítése a külterületi lakott helyekkel 1780 körüli állapotokat ábrázoló 1:144 000-es léptékű shape-file felkódolása (1910-es, 1780-as, Engel, KSH, LAU és névtér kódok) Az Engel-féle pontok integrálása (MO. és Horváto.) a fenti shapek vetületeibe, geokoordináták kiolvasása Projekt eredmény Az MNL földrajzi névtere heterogén, redundáns állományokból épül, amelyekben szereplő földrajzi név entitásokat egy mesterID rekord azonosít és egységesít. Az egyes földrajzi nevek (term), lehetnek preferred, vagy variant státuszúak. Egy földrajzi nevet egy preferred státuszú név és n számú variant státuszú rekord reprezentálhat egy adatforráson belül. Az egyes adatforrások önmagukban tartalmazhatnak entitásokként egy preferred státuszú földrajzi nevet (term), és n számú variant státuszú földrajzi nevet. Mivel egy entitás szerepelhet több adatforrásban, ezért annyi preferred státuszú term-je lesz, ahány adatforrásból származik. Elképzelhető, hogy egy földrajzi név az egyik adatforrásban preferred státuszú, míg egy másikban variant. Az azonosságot a mesterID rekordnak kell kimutatnia. A mesterID rekordok valójában "szuper preferred" státuszú rekordok. Lokális földrajzi név állománynak az MNL adatállományát tekintjük. Új földrajzi nevet csak az MNL állományba szabad felvenni. A többi adatállományban csak adatjavítás, illetve adatgazdagítás céljából szabad módosítást végrehajtani. Segédletbe a névtérben szereplő minden földrajzi nevet fel lehet használni, vagyis az összes névváltozatot (term). Ezért az összes névváltozatból (term) önálló rekord jön létre, amelyeket a mesterID köt össze. Résztvevő munkatársak Szatucsek Zoltán Hegedűs István Záros Zsolt Bánki Zsolt Partnerek: Stratis Vezetői és Informatikai Tanácsadó Kft. HELION Mérnöki Tanácsadó és Szolgáltató Kft. Köszönöm a figyelmet!
D o k u m e n t u m   n y e l v e : magyar
D o k u m e n t u m   n y e l v e : angol
K A P C S O L A T O K 
K a p c s o l ó d ó   d o k u m e n t u m   n e v e : Ungváry Rudolf: A földrajzi névtér típusai
F O R M Á T U M 
A   f o r m á t u m   n e v e : PowerPoint prezentáció
O l d a l a k   s z á m a : 19
T e c h n i k a i   m e g j e g y z é s : Microsoft Office PowerPoint 2016
M e t a a d a t   a   d o k u m e n t u m b a n : N
A   f o r m á t u m   n e v e : PDF dokumentum
O l d a l a k   s z á m a : 19
M e t a a d a t   a   d o k u m e n t u m b a n : N
A   f o r m á t u m   n e v e : HTML dokumentum
T e c h n i k a i   m e g j e g y z é s : HTML 5 verzió
M e t a a d a t   a   d o k u m e n t u m b a n : N
M I N Ő S É G 
L e g j o b b   f o r m á t u m : JPEG képállomány
L e g n a g y o b b   k é p m é r e t : 770x433 pixel
L e g j o b b   f e l b o n t á s : 96 DPI
S z í n : színes
T ö m ö r í t é s   m i n ő s é g e : közepesen tömörített
M E G J E G Y Z É S 
Á l t a l á n o s   m e g j e g y z é s : Networkshop 2022 konferencia
S T Á T U S Z 
A z   a d a t r e k o r d   s t á t u s z a : KÉSZ
F E L D O L G O Z Ó 
S z e r e p   /   m i n ő s é g : katalogizálás
A   f e l d o l g o z ó   n e v e : Nagy Zsuzsanna