DH nástroje
Nástroje AV ČR
- Node Goat
-
Nodegoat je relační databázová platforma určená pro vědce v humanitních a společenských vědách. Umožňuje modelování, správu a analýzu dat s důrazem na jejich vzájemné vztahy. Nabízí pokročilé vizualizační nástroje, včetně časových os, interaktivních map a síťových grafů, které usnadňují zkoumání komplexních historických, kulturních a sociálních jevů.
Webové prostředí je navrženo tak, aby podporovalo interdisciplinární spolupráci a umožňovalo uživatelům přizpůsobit datové modely bez nutnosti programování. Nodegoat je široce využíván pro práci s propojenými daty, analýzu časoprostorových vztahů a prezentaci výzkumných výsledků.
Výzkumné prostředí a databáze pro potřeby vědeckých pracovníků AV ČR je provozována na serveru Historického ústavu AV ČR. - ICONCLASS
-
ICONCLASS je mezinárodní klasifikační systém pro popis, vyhledávání a analýzu obrazového materiálu. Systém umožňuje strukturovaný hierarchický popis, který usnadňuje třídění a porovnávání vizuálních motivů napříč médii a historickými obdobími. Jednotlivá hesla obsahují odkazy na odbornou literaturu a systém nově umožňuje vyhledávání pomocí umělé inteligence. Díky tomu je klíčovým nástrojem digital humanities pro analýzu vizuálních motivů v širokém kulturním a historickém kontextu.
ICONCLASS je široce využíván ve výzkumu vizuální kultury, včetně knižní ilustrace a grafiky, a je součástí významných mezinárodních digitálních projektů, jako jsou RKD Explore, HAB, BSB a Virtuelles Kupferstichkabinett. V České republice byl užit pro klasifikaci obrazového materiálu z nejstarší tištěné produkce, který je nyní dostupný v databázi e-Ilustrace. - UDPipe
-
UDPipe je nástroj využívající neuronové sítě k tokenizaci, lemmatizaci a syntaktické analýze textových dat. Tokenizace rozděluje text na nejmenší jednotky (tokeny), obvykle jednotlivá slova. Lemmatizace pak přiřazuje tokenům jejich základní tvar (lemma), což usnadňuje jazykové zpracování. Během syntaktické analýzy se k těmto lemmám přidávají další lingvistické informace, včetně gramatických vztahů a struktury věty.
Nástroj vyvíjí Ústav formální a aplikované lingvistiky (ÚFAL) na Matematicko-fyzikální fakultě Univerzity Karlovy. Je dostupný pod licencí Mozilla Public License 2.0. UDPipe je jazykově univerzální a lze jej trénovat na anotovaných datech ve formátu CoNLL-U. Pro většinu jazyků, včetně češtiny, jsou k dispozici předpřipravené modely vycházející z datové sady Universal Dependencies. UDPipe lze používat i jako webovou službu v rámci digitální výzkumné infrastruktury LINDAT/CLARIAH-CZ. - VISE
-
VISE je volně dostupný softwarový nástroj pro vědeckou práci s knižní ilustrací, vyvinutý Visual Geometry Group (VGG) na univerzitě v Oxfordu. Využívá technologii počítačového vidění k prohledávání rozsáhlých souborů obrazového materiálu na základě vizuální podobnosti. Umožňuje vyhledávání ilustrací podle zadaného obrazového výřezu a nabízí řazení výsledků podle míry podobnosti, vizualizaci identifikovaných odlišností a automatické seskupování motivů s obdobnými vizuálními charakteristikami.
Nástroj je využíván v řadě mezinárodních projektů, jako jsou Bodleian Ballads, 15cILLUSTRATION, 1516 nebo Compositor. V České republice byl VISE nasazen v projektu e-ilustrace ke zkoumání vizuálních prvků v nejstarší knižní produkci z českých zemí, kde pomáhá sledovat opakované užití dřevořezových štočků, analyzovat jejich oběh mezi tiskaři a odhalovat nové souvislosti v raně novověké knižní kultuře. - Tableau Public
-
Tableau Public je bezplatný softwarový nástroj pro vizualizaci dat. Umožňuje vytváření široké škály vizualizací a jejich veřejné sdílení. Podporuje práci s rozsáhlými datovými soubory, včetně SQL operací (selekce, seskupování, filtrování) a tvorby interaktivních dashboardů, které propojují různé vizualizace do jednotného rozhraní. Dashboardy umožňují badatelům kombinovat různé typy vizualizací (mapy, časové osy, grafy) a přetvářet surová data do srozumitelných příběhů, které odhalují nové souvislosti a usnadňují interpretaci výzkumných výsledků.
Mezi příklady využití Tableau Public v humanitních vědách patří projekt zaměřený na rekonstrukci a analýzu geografické a administrativní struktury carského Ruska (https://imperiia.scalar.fas.harvard.edu/imperiia). Nástroj byl využit také při analýze a vizualizaci korespondence francouzského slavisty André Mazona (Cinková, S., Hladká, B., Mírovský, J., Archaimbault, S. (2024). Data Storytelling Around André Mazon’s Correspondence. Digital Studies of Culture in Central Europe 13. https://doi.org/10.11649/ch.3109). - NameTag
-
NameTag je open-source nástroj pro rozpoznávání pojmenovaných entit (NER), který podporuje jak ploché, tak vnořené entity. Dokáže identifikovat vlastní jména v textu a klasifikovat je do předem definovaných kategorií, jako jsou jména osob, míst, organizací a další. Dosahuje výborných výsledků na 21 testovacích sadách ve 15 jazycích, včetně češtiny, angličtiny, čínštiny, ruštiny a dalších.
NameTag je k dispozici pod licencí Mozilla Public License 2.0, přičemž jazykové modely jsou volně dostupné pro nekomerční použití pod licencí CC BY-NC-SA. Nástroj vyvíjí Ústav formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy a je k dispozici jako webová služba (včetně REST API) provozovaná v rámci infrastruktury LINDAT/CLARINCZ. Zdrojový kód nástroje a vydané verze jsou k dispozici ve volně dostupném repozitáři na platformě GitHub. - Google Charts
-
Google Charts je knihovna pro vizualizaci dat, která umožňuje vytvářet různé typy grafů – od jednoduchých diagramů až po složité hierarchické stromové mapy. Nabízí širokou škálu předpřipravených grafických typů, které lze snadno integrovat do webových stránek.
Grafy jsou implementovány jako JavaScriptové třídy. Díky interaktivním prvkům lze grafy propojit do složitějších dashboardů nebo jiných webových aplikací. Google Charts využívá HTML5/SVG technologii, což zajišťuje kompatibilitu napříč prohlížeči i zařízeními.
Zdrojová data mohou pocházet z webových stránek, databází nebo služeb podporujících protokol Chart Tools Datasource. Podporovány jsou například Google Spreadsheets, Google Fusion Tables i externí datové zdroje jako SalesForce.
- Gephi
- Gephi je interaktivní platforma pro vizualizaci a analýzu sítí a složitých systémů, včetně dynamických a hierarchických grafů. Řadí se mezi nástroje pro Exploratory Data Analysis (průzkumnou analýzu dat) a slouží zejména k prozkoumávání a porozumění grafovým strukturám. Gephi umožňuje uživatelům interaktivně pracovat s grafy – upravovat jejich strukturu, tvar a barvy, aby odhalili skryté vzorce a vlastnosti.
- R Studio
-
RStudio je integrované vývojové prostředí (IDE) pro programovací jazyky R a Python. Nabízí konzoli, editor s barevným zvýrazněním syntaxe a podporou přímého spouštění kódu, nástroje pro vizualizaci dat, správu historie, ladění kódu a organizaci pracovního prostoru.
RStudio je dostupné ve dvou edicích – open-source verzi zdarma a komerční verzi s rozšířenými funkcemi. Funguje na operačních systémech Windows, Mac a Linux a lze jej používat jak na lokálním počítači, tak v online prostředí.
- PERO-OCR
-
PERO-OCR je pokročilý OCR systém pro rozpoznávání textu v tištěných i rukopisných dokumentech, vyvíjený na VUT v Brně.
Nástroj umožňuje automatickou transkripci historických a nekvalitních tisků i rukopisů. Podporuje širokou škálu jazyků, včetně češtiny, němčiny (Fraktur) a dalších evropských písem. Výsledky lze exportovat do Page XML, ALTO XML a prostého textu.
PERO-OCR lze použít přes webové rozhraní, jako příkazovou řádku nebo integrovat do vlastních aplikací v Pythonu. Nabízí také Docker image pro snadné nasazení.