diff --git a/src/app/shared/shared.module.ts b/src/app/shared/shared.module.ts index 677b4febd3c..423c381023e 100644 --- a/src/app/shared/shared.module.ts +++ b/src/app/shared/shared.module.ts @@ -276,6 +276,7 @@ import { EpersonGroupListComponent } from './eperson-group-list/eperson-group-li import { EpersonSearchBoxComponent } from './eperson-group-list/eperson-search-box/eperson-search-box.component'; import { GroupSearchBoxComponent } from './eperson-group-list/group-search-box/group-search-box.component'; import { HtmlContentService } from './html-content.service'; +import { ClarinSafeHtmlPipe } from './utils/clarin-safehtml.pipe'; const MODULES = [ CommonModule, @@ -320,7 +321,8 @@ const PIPES = [ ClarinLicenseCheckedPipe, ClarinLicenseLabelRadioValuePipe, ClarinLicenseRequiredInfoPipe, - CharToEndPipe + CharToEndPipe, + ClarinSafeHtmlPipe ]; const COMPONENTS = [ diff --git a/src/app/shared/utils/clarin-safehtml.pipe.ts b/src/app/shared/utils/clarin-safehtml.pipe.ts new file mode 100644 index 00000000000..ebf2e21c8da --- /dev/null +++ b/src/app/shared/utils/clarin-safehtml.pipe.ts @@ -0,0 +1,15 @@ +import { Pipe, PipeTransform } from '@angular/core'; +import { DomSanitizer, SafeHtml } from '@angular/platform-browser'; + +/** + * Pipe to keep html tags e.g., `id` in the `innerHTML` attribute. + */ +@Pipe({ + name: 'dsSafeHtml' +}) +export class ClarinSafeHtmlPipe implements PipeTransform { + constructor(private sanitized: DomSanitizer) {} + transform(htmlString: string): SafeHtml { + return this.sanitized.bypassSecurityTrustHtml(htmlString); + } +} diff --git a/src/app/static-page/static-page.component.html b/src/app/static-page/static-page.component.html index 15c3ea6ef07..99b85f71fb9 100644 --- a/src/app/static-page/static-page.component.html +++ b/src/app/static-page/static-page.component.html @@ -1,3 +1,3 @@
+ The ultimate objective of CLARIN ERIC (which LINDAT/CLARIAH-CZ is part of) is to advance research in humanities + and social sciences by giving researchers unified single sign-on access to a platform which integrates language-based resources and advanced tools at a European level. This shall be implemented by the construction and operation of a shared distributed infrastructure that aims at making language resources, technology and expertise available to the humanities and social sciences (henceforth abbreviated HSS) research communities at large. + See more information about LINDAT/CLARIAH-CZ. +
++ To know more about CLARIN ERIC visit CLARIN-ShortGuide.pdf +
++ To achieve our mission statement,we set out some ground rules through the Terms of Service. By accessing or using any kind of data or services provided by the Repository, you agree to abide by the Terms contained in the above mentioned document. +
++ Data in LINDAT/CLARIAH-CZ repository are made available under the licence attached to the resources. In case there is no licence, data is made freely available for access, printing and download for the purposes of non-commercial research or private study. + + Users must acknowledge in any publication, the Deposited Work using a persistent identifier (see Citing Data), its original author(s)/creator(s), and any publisher where applicable. Full items must not be harvested by robots except transiently for full-text indexing or citation analysis. Full items must not be sold commercially unless explicitly granted by the attached licence without formal permission of the copyright holders. +
+It is like a library for linguistic data and tools.
++ The Institute of Formal and Applied Linguistics (UFAL) at the Computer Science School, Faculty of Mathematics and Physics, Charles University, Czech Republic was established in 1990 as a continuation of the research and teaching activities carried out by the former Laboratory of Algebraic Linguistics since the early 60s at the Faculty of Philosophy and later at the Faculty of Mathematics and Physics, Charles University in Prague, is a primarily research department working on many topics in the area of Computational Linguistics, and on many research projects both nationally and internationally. However, the Institute of Formal and Applied Linguistics is also a regular department in the sense that it carries a comprehensive teaching program both for the Master's degree (Mgr., or MSc.) as well as for a doctorate (Ph.D.) in Computational Linguistics. Both programs are taught in Czech and English. The Institute is also a member of the double-degree "Master's LCT programme" of the EU. Students also can take advantage of the Erasmus program for typically semester-long stays at partner Universities abroad. +
+At the moment, UFAL distinguishes three types of contracts.
+
+As mentioned in the section License Agreement and Contracts, we require the depositor of data or tools to sign a Distribution License Agreement, which specifies that they have the right to submit the data and gives us (the repository centre) right to distribute the data on their behalf. This means that depositors are solely responsible for taking care of IPR issues before publishing data or tools by submitting them to us.
+
+Should anyone have a suspicion that any of the datasets or tools in our repository violate Intellectual Property Rights, they should contact us immediately at our help desk.
+
Read our Privacy Policy in order to learn how we manage personal data collected by the LINDAT/CLARIAH-CZ repository and services. +
++ Deposited content must be accompanied by sufficient metadata describing its content, provenance and formats in order to support its preservation and dissemination. Metadata are freely accessible and are distributed in the public domain (under CC0). However, we reserve the right to be informed about commercial usage of metadata from LINDAT/CLARIAH-CZ repository including a description of your use case at Help Desk. +
++ LINDAT/CLARIAH-CZ is committed to the long-term care of items deposited in the repository, to preserve the + research and to help in keeping research replicable and strives to adopt the + current best practice in digital preservation. See the Mission Statement. + We follow best practice guidelines, standards and regulations set forth by CLARIN, OAIS and/or Charles + University. +
++ In order to stay a reliable and trustworthy repository, we undergo periodical assessments by CLARIN ERIC and + CTS (formerly DSA). +
++ To fulfill the commitments, the repository ensures that datasets are ingested and distributed in + accordance with their license (see agreements and contracts). Sometimes + (for licenses that do not permit public access) this means only authorized users can access the dataset. +
++ The submission workflow as described in deposit and the work of our editors ensures + discoverability (by requiring accurate metadata) via our search engine, + externally through OAI-PMH and in page metadata for certain web crawlers. Metadata are freely accessible. +
++ There are various automated procedures including fixity checks, to ensure integrity of the submitted + datasets and completeness of metadata. On the + system level we employ various on-site and off-site backup strategies and hardware monitoring. The + datasets are accessible online. +
++ We view data and tools as primary research outputs, each submission receives a Persistent IDentifier for reference and + the users are guided to use them. Changes in a dataset after it has been published are + not permitted, new submission is required instead. The old and new submissions are linked through their + metadata (see new version + guide for more details). +
++ Through regular participation in CLARIN activities, Open Repositories and various other meetings, schools + and conferences, the repository staff is informed of new developments in technologies and/or initiatives. +
++ The various export options offered by the repository system (DSpace) ensures that data and their metadata + are not locked in and can be moved to a different repository system. +
++ The repository encourages the usage of specific file formats as recommended by CLARIN. The preferred file + formats will change over time, in which case the repository will make every effort to migrate to other + formats, while keeping originals intact for reproducibility purposes (ie. migrated item will be a new + repository record linked to the old). The guiding principles for format selection are: open standards are + preferred over proprietary standards, formats should be well-documented, verifiable and proven, + text-based formats are preferred over binary formats where possible, in the case of digitalization of analogue signal lossless or no compression is recommended. +
++ In the case of a withdrawal of funding, the repositories content would be transferred to another CLARIN + centre. While the legal aspects of the process of relocating data to another institution are underway the + hosting institute (UFAL) offers a timeframe of at least 10 years, in which it will provide access to the + data. +
+We strongly feel that data should be cited properly. For that reason we are adopting various policies and creating UI elements (see RefBox below) to make the citation as easy and as consistent as possible.
+CLARIN endorses the Data Citation Principles and so do we. We ask Data users to acknowledge and cite data sources properly in all publications and outputs. We already implement the important recommendations of RDA's Data Citation Work Group. See the example of automatic citation text below.
+The Handle System provides unique and persistent identifiers of digital objects. We use it to provide your data with a permanent identifier in the form of an URL that will always point to the data, wherever it moves in the future. Thus you can safely use the Handle to point to data for instance in publications. The Handle is part of the RefBox together with other information such as authors, title and publisher. + +
+For convenience we've prepared export formats, that can easily be copied and pasted. An item can be exported in BibTeX format. A link to an export is provided in the citation box (see above image). + On clicking the link to "BibTeX", formatted BitbTeX entry will be displayed. + +
++ To make this site work properly, we sometimes place small data files called cookies on your device. Most big websites do this too. +
+ ++ The EU Directive 2009/136/EC states that we can store cookies on your machine, if they are essential to the operation of this site, but that for all others we need your permission to do so. +
+ ++ A cookie is a small piece of data that a website asks your browser to store on your computer or mobile device. + The cookie allows the website to "remember" your actions or preferences (such as login, language, font size and other display preferences) over time, + so you don’t have to keep re-entering them whenever you come back to the site or browse from one page to another. Most browsers support cookies, but users can set their browsers to decline them and can delete them whenever they like. +
+ +We use DiscoJuice and Shibboleth cookies for remembering the user IdP choice and login session id.
+Through this website, a cookie is sent to the American company Google, as part of the 'Analytics' service. We use this service to track how visitors use our website. Google can provide this information to third parties in case Google is legally obligated to do so, or if third parties process the information on behalf of Google. We can in no way influence these actions. We have not allowed Google to use the obtained Analytics information for other Google services.
+The information Google collects remains anonymous wherever possible. Your IP address is not explicitly given. The information is stored by Google on servers in the US. Google adheres to the Safe Harbor principles, and is affiliated with the Safe Harbor programme of the US Department of Commerce. This means there is an adequate level of protection for the processing of any personal data.
+This website uses Piwik, an open analytics platform to collect web statistics. Piwik will store cookies on your computer, but no personal data will be collected. An anonymous ID will enable piwik to identify your session, but this ID is meaningless to anybody else, and it cannot be used to identify an individual user.
+ +You can control and/or delete cookies as you wish – for details, see aboutcookies.org. You can delete all cookies that are already on your computer and you can set most browsers to prevent them from being placed. If you do this, however, you may have to manually adjust some preferences every time you visit a site and some services and functionalities may not work.
+ + ++ Konečným cílem projektu CLARIN ERIC je urychlit výzkum v humanitních a sociálních vědách zpřístupněním jednotné platformy, která na evropské úrovni integruje jazykové zdroje a pokročilé nástroje pro zpracování psaného i mluveného jazyka. Tento cíl je uskutečňován prostřednictvím nově vytvořené sdílené distribuované infrastruktury (s jednotným přístupem), která se zaměřuje na to, aby jazykové zdroje, technologie a odborné znalosti zpřístupnila nejen humanitním a společenským vědám (dále jen SHV), ale obecně všem výzkumným komunitám. +
++ Více o CLARIN ERIC na CLARIN-ShortGuide.pdf +
++ Pro dosažení našeho poslání jsme stanovili některá základní nařízení prostřednictvím Pravidel pro použití služeb. Používáním repozitáře LINDAT/CLARIAH-CZ nebo použitím jakýchkoliv dat nebo služeb poskytovaných prostřednictvím LINDAT/CLARIAH-CZ souhlasíte s tím, že budete dodržovat podmínky obsažené ve výše uvedeném dokumentu. +
++ Data v repozitáři LINDAT/CLARIAH-CZ jsou k dispozici na základě licence uvedené u jednotlivých zdrojů (položek). Pokud zde licence uvedena není, data jsou volně k dispozici, a to jak pro přístup a tisk, tak také ke stažení pro účely nekomerčního výzkumu nebo pro soukromé studium. + + Uživatel musí v každé své publikaci pomocí stálého ("perzistentního") identifikátoru (PID, viz Pravidla pro citace) uvést, jaká data použil, dále musí uvést jejich původního autora a v případě potřeby také jejich vydavatele. Žádné položky nesmí být využívány roboty, s výjimkou dočasného zpracování pro fulltextové indexování nebo analýzy citací. Žádné položky nesmí být bez formálního souhlasu majitele autorských práv komerčně prodávány, jedině pokud je to výslovně dovoleno na základě licence uvedené u dané položky v repozitáři. +
+Repozitář je knihovna pro jazyková data a nástroje na zpracování textu. Umožňuje
++ Ústav formální a aplikované lingvistiky (ÚFAL) na informatické sekci Matematicko-fyzikální fakulty Univerzity Karlovy v České republice byl založen v roce 1990 jako pokračovatel činnosti v oblasti výzkumu a výuky prováděné od počátku 60. let bývalou Laboratoří algebraické lingvistiky nejprve na Filozofické fakultě a později na Matematicko-fyzikální fakultě Univerzity Karlovy. ÚFAL je v prvé řadě výzkumné oddělení pracující na mnoha tématech z oblasti počítačové lingvistiky, a na mnoha národních i mezinárodních výzkumných projektech. Nicméně Ústav formální a aplikované lingvistiky je také "regulérní" katedrou v tom smyslu, že zajišťuje komplexní výukový program, a to jak pro magisterské (Mgr.), tak pro doktorské (Ph.D.) studium počítačové lingvistiky. Oba programy jsou vyučovány v českém a anglickém jazyce. Ústav je také členem "Master's LCT programme" realizovaného v rámci EU, který uděluje dva magisterské tituly na obou školách, na kterých je student zapsán. Studenti ÚFALu mohou rovněž využívat program Erasmus pro studijní pobyty na partnerských zahraničních univerzitách. + +
+V současné době se rozlišují tři typy smluv.
+
+Jak již bylo zmíněno v oddíle Licenční ujednání a smlouvy, požadujeme, aby vkladatel dat nebo nástrojů podepsal Licenční ujednání a smlouvu, v níž specifikujeme, že vkladatel má právo vložit data a dává nám (repozitáři) právo tato data jeho jménem distribuovat. To znamená, že vkladatelé vložením dat k nám do repozitáře nesou sami zodpovědnost za práva k duševnímu vlastnictví (IPR) ještě předtím, než v repozitáři jimi vložená data nebo nástroje dáme veřejně k dispozici (za jimi nastavených licenčních podmínek).
+
+Pokud by někdo měl podezření, že některý z datových souborů nebo některé nástroje v našem repozitáři porušují práva k duševnímu vlastnictví, měl by nás okamžitě kontaktovat na Lince podpory.
+
Přečtěte si prosím naše Pravidla uchovávání osobních údajů, kde popisujeme, jak chráníme nutné osobní údaje shromážděné v LINDAT/CLARIAH-CZ repozitáři. +
++ Aby byl ve vložených položkách dat a nástrojů "pořádek" a bylo je možné snadno najít, čímž chceme podpořit jejich distribuci, musí být doprovázeny dostatečným množstvím metadat popisujících obsah daných položek, jejich původ a formáty. Metadata jsou vždy volně přístupná a jsou distribuována ve veřejné doméně (jako CC0). Vyhrazujeme si však právo být informováni o komerčním využití metadat uložených v LINDAT/CLARIAH-CZ repozitáři, včetně popisu vašeho použití, a to na Lince podpory. +
++ LINDAT/CLARIAH-CZ se zavázal k dlouhodobé péči o data a nástroje uložené v repozitáři a snaží se používat + nejlepší stávající osvědčené postupy v oblasti uchovávání digitálních záznamů, jak je stanovuje CLARIN, + OAIS a/nebo Univerzita Karlova. Viz Naše poslání. +
++ Abychom zůstali spolehlivým a důvěryhodným úložištěm, podstupujeme pravidelná hodnocení ze strany CLARIN ERIC a + CTS (dříve DSA). +
++ Abychom mohli plnit naše závazky, repozitář zajišťuje, že přijatá data mají licenci a pod touto licencí + je dále poskytuje (viz Licenční ujednání a smlouvy). Někdy + (u licencí, které nepovolují volný přístup) to znamená, že k datům mají přístup pouze oprávnění + uživatelé. +
++ Proces nahrání dat popsaný v Jak ukládat vaše data a práce našich editorů + zajišťuje, že data budou k nalezení prostřednictvím našeho vyhledávače, + externě přes OAI-PMH a v různých dalších vyhledávačích. Proto vyžadujeme detailní metadata. + Metadata jsou volně přístupná. +
++ Integritu přijatých dat a úplnost metadat ověřuje řada automatizovaných procedur. Na úrovni systému + používáme různé zálohovací strategie (včetně zálohování do jiné lokality) a hardware monitorujeme. Data + jsou dostupná online. +
++ Data i nástroje vnímáme jako hlavní výstupy výzkumu. Ke každému záznamu v repozitáři je přidělen + perzistentní identifikátor, který slouží jako trvalý odkaz. Uživatelé jsou vedeni k + jejich používaní. + Jednou zveřejněná data není možné měnit, vždy je potřeba vytvořit nový záznam. Oba záznamy (starý a nový) + jsou provázány odkazy (PID) v metadatech (viz nová verze). +
++ Pracovníci repozitáře se pravidelně účastní aktivit v rámci CLARIN, konference Open Repositories a + různých dalších konferencí, setkání a tréninků. Udržují si tak přehled o nových technologiích a + iniciativách. +
++ Námi používaný systém (DSpace) nabízí různé možnosti exportu, což zajistí, že v případě potřeby bude + data i metadata možné přesunout do jiného systému. +
++ Nahraná data by ideálně měla být v jednom z formátů, které doporučuje CLARIN, pokud to není možné, jsou + hlavní zásady výběru formátu následující: + Otevřené standardy jsou preferovány před proprietárními, formáty by měly být dobře zdokumentovány, ověřitelné a ověřené praxí. + Pokud je to možné, upřednostňují se textové formáty před binárními a v případě digitalizace analogového + signálu se doporučuje bezeztrátová nebo žádná komprese. + Preferované formáty se budou časem měnit, v takovém případě vynaloží repozitář veškeré úsilí k převodu + dat na nový formát. Originály budou pro účely reprodukovatelnosti zachovány beze změn (tj. pro nový + formát bude vytvořen nový záznam, který propojíme se starým). +
++ V případě ukončení financování bude obsah repozitáře převeden na jiné CLARIN centrum. Zatímco se bude + jednat o detailech tohoto přesunu (právní aspekty apod.), nabízí ÚFAL (jakožto hostitelská instituce) + časový rámec 10 let, během kterých zajistí přístup k datům. +
+Jsme pevně přesvědčeni, že data by měla být za všech okolností řádně citována. Máme proto k dispozici různá pravidla a vytváříme specifické uživatelské rozhraní (viz obrázek s příkladem Referenčního pole níže) usnadňující co nejsnazší a konzistentní postup při citování.
+CLARIN a samozřejmě i LINDAT/CLARIAH-CZ podporují Pravidla pro citování dat. Žádáme tedy všechny uživatele, aby správně citovali zdroje dat ve všech svých publikacích a výstupech. Také už jsme realizovali důležitá doporučení Pracovní skupiny RDA pro citování dat. Viz níže příklad automatické citace.
+Systém Handle poskytuje jedinečné a stálé ("perzistentní") identifikátory digitálních objektů. Používáme ho, abychom všem datům v našem repozitáři poskytli perzistentní identifikátor v podobě adresy typu URL, která vždy povede ke správným datům, i kdyby se tato data v budoucnu přesunula kamkoli jinam. Takto můžete systém PID bezpečně využívat například při citaci dat v publikacích. Systém PID je spolu s dalšími informacemi, jako jsou autoři, název a vydavatel, součástí Referenčního pole. + +
+Pro větší pohodlí jsme připravili konverzi a export citace v několika formátech, které lze snadno zkopírovat a vložit. Položku lze exportovat i do BibTeX formátu. Odkaz na export je uveden v Referenčním poli (viz obrázek nahoře). + Kliknutím na odkaz "BibTeX" se zobrazí formátovaný záznam pro BibTeX. + +
++ Aby mohla tato stránka správně fungovat, občas ukládáme malé datové soubory, tzv. cookies, na vaše zařízení. Většina provozovatelů webových stránek to dělá také. +
+ ++ Evropská směrnice 2009/136/EC nám dovoluje ukládat cookies, které jsou nezbytné pro provoz těchto stránek. Pro ostatní cookies potřebujeme vaše svolení. +
+ ++ Cookie jsou data, která prohlížeč na žádost webové stránky uloží na vašem zařízení (např. počítači, telefonu nebo tabletu). + Cookie umožňuje webové stránce pamatovat si vaše akce (např. přihlášení) a předvolby (např. jazyk, velikost písma apod.). + Díky tomu je nemusíte při dalších návštěvách ani při přechodu ze stránky na stránku znovu zadávat. + Většína prohlížečů cookies podporuje, ale uživatelé mají možnost nastavit prohlížeč tak, aby je nepřijímal. Máte také možnost je kdykoliv smazat. +
+ +DiscoJuice a Shibboleth používají cookies pro zapamatování volby IDP a session id.
+Tyto stránky posílají cookie Americké společnosti Google, je to součást služby 'Analytics'. Tuto službu využíváme k analýze, jak návštěvníci naše stránky používají. Google tyto informace poskytuje třetím stranám, má-li zákonnou povinnost tak činit, nebo pokud třetí strany zpracovávají tyto informace jeho jménem. Tato činnost je mimo náš vliv. Takto získané informace by neměly být používány v žádných dalších službách Google.
+Takto sbírané informace zůstavají anonymní, kdekoliv je to možné. Vaše IP adresa není explicitně uváděna. Informace jsou uchovávány na serverech Google ve Spojených státech. Google dodržuje zásady Safe Harbor (bezpečného přístavu), programu Amerického ministerstva obchodu. To znamená vhodnou úroveň ochrany při zpracování jakýchkoli osobních údajů.
+Webová stránka používá Piwik, otevřenou platformu webové analytiky, k sbírání statistik. Piwik ukládá cookies na vaše zařízení, ale nesbírá žádná osobní data. Anonymní id umožní platformě identifikovat vaši session, toto id nelze použít k identifikaci jednotlivých uživatelů, má význam jen v rámci platformy.
+ +Cookies můžete kontrolovat a případně i smazat, pro detailnější informace navštivte aboutcookies.org. Můžete smazat všechny cookies, které byly uloženy na vašem zařízení a většinu prohlížečů můžěte nastavit tak, aby bránily ukládání cookies. Pokud to ale uděláte, budete muset neustále měnit některé předvolby a můžete příjít o některé funkce.
+ + +Chcete-li zahájit vložení nové datové položky, musíte se nejprve přihlásit. Klikněte na 'Přihlásit se' pod 'Můj účet' v menu na pravé straně.
+ +Nyní máte novou položku v menu 'Uložení dat' pod 'Můj účet'. Klikněte na 'Uložení dat' a přejděte na obrazovku pro uložení dat.
+ +Nyní byste měli být na hlavní stránce pro uložení dat, kde se můžete dívat na svá neúplná/archivní uložená data. Klikněte na odkaz 'Zahájit nové uložení dat' pro zahájení vkládání nové datové položky.
+ +Zahájili jste vkládání nové položky dat. V následujících několika krocích budete poskytovat podrobnosti o nové položce a nahrávat vaše soubory s daty. Nejprve vyberte druh dat, která chcete uložit.
+ +Klikněte na jedno z tlačítek, např. 'Korpus'. Pokračujte podáním základních informací, jako je název vkládané položky. Klikněte na 'Další' pro pokračování.
+V následujících dvou krocích poskytnete víc detailů o své položce. Nejprve popište osoby, organizaci a projekty spojené s vkládanou datovou položkou.
+ +Dále přidejte svůj popis, vyplňte jazyk atd.
+ +Po vyplnění potřebných informací klikněte na tlačítko 'Další' pro nahrání souborů.
+V tomto kroku budete nahrávat soubory, které jsou součástí vámi ukládaných dat. Pokud žádné soubory nemáte, můžete tento krok přeskočit kliknutím na 'Další'. Soubory lze přidat kliknutím na tlačítko 'Procházet' nebo můžete soubory přetahovat do šedé oblasti s textem 'Přetáhněte soubory sem'.
+ +Výběrem nahrávání souborů se otevře dialogové okno, v němž můžete zadat popis každého souboru. Chcete-li zahájit nahrávání souboru, klikněte na tlačítko 'Začít nahrávání'.
+Jakmile je nahrávání souboru(ů) ukončeno, zmáčkněte tlačítko 'OK' pro uzavření dialogového okna. Nyní můžete buď přidat další soubory nebo můžete smazat či upravit již ty nahrané. Jakmile práci s datovými soubory dokončíte, stiskněte tlačítko 'Další' a můžete pokračovat výběrem licence.
+Pokud nahrajete alespoň jeden soubor, musíte v tomto kroku vybrat licenci, pod kterou chcete, aby byla vaše data distribuována (data bez licence jsou nepoužitelná, protože uživatel by nevěděl, za jakých podmínek je může používat!) + Prosím přečtěte si pečlivě Smlouvu o distribuci dat a klikněte na červené políčko na znamení souhlasu se smlouvou (po kliknutí červené políčko zezelená). + + Jakmile se rozhodnete pro příslušnou licenci, vyberte ji z rozevíracího (dropdown) seznamu. + + nebo použijte OPEN License Selector, který vám pomůže vybrat licenci kladením otázek týkajících se vámi vkládaných datových položek. + + Pokud žádná z nabízených licencí nevyhovuje vašim potřebám, obraťte se prosím na naši + Linku podpory.
+ +Pro pokračování klikněte na 'Další'.
+V tomto kroku můžete zanechat poznámku pro "redaktory" repozitáře LINDAT/CLARIAH-CZ, kteří budou datovou položku definitivně schvalovat pro uveřejnění.
+V tomto kroku zkontrolujete uložení svých dat před jejich vložením. Kontrolní stránka obsahuje dílčí kontrolní postup pro každý z dříve vyplněných kroků. Pokud chcete změnit jakoukoli položku v příslušném kroku, klikněte na 'Opravit' u jakékoli z nich a dostanete se tak na příslušnou stránku daného kroku. Po ověření všech detailů lze provést uložení datové položky kliknutím na 'Dokončit uložení', nebo lze kliknout na 'Uložit & Konec' pro uložení dat, ke kterým se chcete ještě vrátit později.
+Jakmile v kontrolním kroku kliknete na 'Dokončit uložení datové položky', položka bude vložena a bude k dispozici redakční kontrole. Poté, co redaktoři LINDAT/CLARIAH-CZ položku schválí, objeví se v repozitáři a bude tak zpřístupněna veřejnosti za podmínek definovaných licencí, kterou jste pro tuto položku vybrali v průběhu vkládání. + V případě jakéhokoliv dotazu ohledně uložení dat vás bude redakce LINDAT/CLARIAH-CZ kontaktovat a vyžádá si další podrobnosti.
+Repozitář je knihovna pro jazyková data a nástroje na zpracování textu. Umožňuje
+Přijímáme jakákoli jazyková data a/nebo NLP data a nástroje: korpusy, anotované korpusy, slovníky, ale také natrénované jazykové modely, parsery, taggery, systémy strojového překladu, jazykové webové služby apod. +Přísně nevyžadujeme, abyste nahráli samotná data, i když je to vždy lepší udělat. V případě potřeby, si můžete uložit pouze samotná metadata. + Podporujeme také podpis licence on-line cestou pro okamžitou možnost získání zdrojů s omezenou dostupností.
++ Při nahrávání jazykových zdrojů zkuste prosím použít některý z doporučených formátů, uvedených v LRT Standardech. +
+Máte-li problém s přihlášením, dejte nám prosím vědět přes naši Linku podpory.
+Čas od času (obvykle jste-li první, kdo se přihlašuje přes svou domovskou instituci), můžete vidět následující chybu "Ověřování bylo úspěšné; nicméně váš poskytovatel identity neposkytl ani váš e-mail, eppn ani požadované id." To znamená, že vaše domovská instituce nám o vás neposlala dostatek údajů, na jejichž základě bychom pro vás mohli provozovat naše služby. Uvedené údaje žádáme proto, abychom vás chránili. Požadujeme pouze email a řídíme se Kodexem chování pro ochranu dat, který nám pomáhá přesvědčit vaši domovskou instituci. Vaše osobní údaje v žádném případě nejde zneužít.
+Máte-li účet u více poskytovatelů a přihlásíte-li se pokaždé s jiným, může se zobrazit následující chyba "Váš e-mail je již spojen s jiným uživatelem.". Prosím, zkuste používat vždy stejného poskytovatele, pokud to není možné, dejte nám vědět a my změníme jeho výchozí nastavení.
+Je to specifická permanentní adresa typu URL. Poskytuje stálý odkaz, který bude fungovat správně, i když budou data v nějaké vzdálené budoucnosti přesunuta. Z tohoto důvodu by se měla v citacích používat právě permanentní adresa typu URL.
+V průběhu ukládání digitálních jazykových zdrojů do repozitáře procházejí data kurátorským procesem s cílem zajistit jejich kvalitu a konzistenci. + Pomůžeme vám při plnění nezbytných požadavků na dlouhodobou archivaci zdrojů. Data musí být především opatřena metadaty ve standardních formátech + přijatých příslušnými komunitami; musí být opatřena perzistentními identifikátory (PID), musí u nich být vyřešeny otázky práv k duševnímu vlastnictví, musí být opatřena jasnými prohlášeními ohledně udělování licencí a také musí být správně ošetřeno, pokud jste vkládaná data vytvořili za použití dalších zdrojů. +Vkladatel musí elektronicky podepsat licenci (smlouvu) o ukládání dat, čímž potvrzuje, že je držitelem práv k datům, a že má právo udělovat práva uvedená v licenci přiřazené k těmto datům vkladatelem. + Jakmile jsou data po kontrole uložena v repozitáři, je jim přiřazen PID jako trvalý odkaz.
+Každá změna zdrojů a metadat by měla být uložena jako nová verze s novým PID. + Nicméně v případě, že změny jsou minimální (např. překlepy nebo jasné chyby), obraťte se na naši Linku podpory a uveďte PID daného uložení dat a změny, které chcete zanést. Je na redakci repozitáře rozhodnout, zda tyto vaše změny bude možno redakcí provést, nebo zda vás požádáme o vložení nové verze příspěvku jako nové položky.
+Ano, v tomto případě kontaktujte naši Linku podpory a uveďte PID příspěvku a důvod odstranění dat. + Referenci o tom, že data byla v našem repozitáři uložena (protože byl vydán trvalý identifikátor - PID), budeme ovšem archivovat; +administrativní metadata budou zachována a my tak budeme vědět, že vlastní data byla odstraněna.
+Můžeme vytvořit stínovou stránku přesunutých dat a můžeme na ni přidat upozornění o tom, že zdrojová data jsou nyní přesunuta na nové místo. + Data tak budou v našem repozitáři skryta a nepůjde v nich ani hledat, ani je nebude možné procházet a používat (např. přes OAI-PMH), jejich PID však stále existuje. + PID však po přesunu dat odkazuje jen na datovou položku v našem repozitáři (a metadata tam uložená), nikoli na skutečná data. + Pro více podrobností se prosím obraťte na Linku podpory.
+V souladu s ideou výzkumných infrastruktur a s obecným postojem k otevřenému přístupu (Open Access) důrazně vybízíme producenty dat, aby byli maximálně otevření. + + Za určitých okolností však můžeme přistoupit na vložení vašich dat, i když nebudou veřejně dostupná nebo nebudou dostupná hned. Pokud vkládáte taková data a nenajdete-li vhodnou licenci v našem seznamu, obraťte se prosím ještě před dokončením procesu ukládání dat na naši Linku podpory.
+Viz naše pravidla.
+Zcela bezpečná, pravděpodobně mnohem bezpečnější než ve vašem počítači. V našem repozitáři platí následující pravidla bezpečnosti dat:
+
+ Doporučujeme používat bezplatnou, otevřenou licenci. Reprezentativní výběr bezplatných
+licencí na sofwarové nástroje a CC licencí (vhodnějších pro data) je
+k dispozici přímo během ukládání dat. Máme k dispozici OPEN License Selector, který vás provede výběrem vhodných licencí.
+ Pokud potřebujete z určitých důvodů jinou licenci, kontaktujte nás.
+
+ Seznam licencí, které jsou v současné době podporovány, najdete zde. + Pokud potřebujete jinou licenci (např. s elektronickým podpisem apod.), neváhejte nás kontaktovat. + V případě odůvodněné potřeby jsme schopni přidat do seznamu licencí i takové licence, které jsou doprovázeny různými požadavky, např. omezení na přihlášené uživatele, plnění dalších podrobností (účel) apod. +
++ Není to o kontaktu, je to věc citací, kreditu a důvěry. Proto máme samostatná metadata pro autory a pro kontaktní osoby. +Kontakt na "institucionální" Linku podpory pro vaše data je skvělý, ale zároveň je nutné citovat autory dat a vědeckých prací. Náš repozitář dává přednost přímým citacím dat + (https://www.force11.org/datacitation). + Proto jim udělujeme PID identifikátory, vytváříme formátované citace atd. To je také důvod, proč chceme v metadatech mít přímo autory dat. Ti získají citace svých děl a ostatní vědci zas na oplátku budou vědět, na čí práce spoléhají. +
++ Na rozdíl od jiných vyhledávačů v metadatech ten náš používá OR coby defaultní operátor; viz příklady níže. Pokud nebudete spokojeni s výsledky svých vyhledávek, budete možná chtít jít nad rámec prostého textového vyhledávání stylem online vyhledávačů. + Můžete vyhledávat pouze v některých polích metadat, používat negaci a mnoho dalších možností. + V repozitáři používáme vyhledávač SOLR, takže pokud znáte jeho syntax, používejte ji, nebo si ji vyhledejte v dokumentaci. +
++
Jak se můžete dočíst v jiných částech nápovědy k repozitáři, neumožňujeme měnit zveřejněná data. Je + potřeba vytvořit nový záznam (verzi). +
+Jakmile příspěvek vložíte, je zařazen do kolekce všech vložených příspěvků. Příspěvek zatím není veřejně přístupný a čeká, až ho redaktor schválí (nebo zamítne). +
+Úkolem redaktora repozitáře je ověřit, zda příspěvek splňuje naše požadavky ohledně kvality a úplnosti metadat, konzistence souboru(ů) s daty a ohledně práv k duševnímu vlastnictví (IPR). Redaktor může příspěvek autorovi (vkladateli příspěvku) vrátit a popíše mu, jaké změny v příspěvku požaduje. Tento krok se opakuje, dokud redaktor příspěvek neschválí. Ze schváleného příspěvku se pak stane příspěvek publikovaný. +
+Publikovaný příspěvek získá PID (trvalý "perzistentní" identifikátor), který se používá pro reference a citace, např. + http://hdl.handle.net/11858/00-097C-0000-0022-F59C-8. LINDAT repozitář zajistí, že PID (přesněji řečeno, pro PID používáme http proxy) vždy povede na platnou webovou stránku (i v případě, že současná infrastruktura serveru bude změněna nebo přesunuta jinam). +
+ ++ +Publikované příspěvky jsou k dispozici v našem vyhledávacím rozhraní, v režimu prohlížení. Metadata všech datových položek jsou zpřístupněna obecným internetovým vyhledávačům a jsou také k dispozici prostřednictvím protokolu OAI-PMH (mnohé instituce využívají náš repozitář právě pro získání a agregaci uložených metadat), např. http://catalog.clarin.eu/vlo/). Prostřednictvím protokolu OAI-ORE jsou k dispozici rovněž datové soubory veřejných příspěvků (pro data s omezeným přístupem viz Příspěvky s omezeními). +
+O vymazání publikovaných příspěvků může požádat kdokoli; ale jednotlivé žádosti budou vyhodnocovány případ od případu. + Vyhrazujeme si právo ponechat metadata publikovaných příspěvků k dispozici v případě, že neexistuje žádný zvláštní důvod, proč je odstranit. Takový postup by byl proti pojetí persistentních identifikátorů - PID. + Všechny identifikátory PID zůstávají i po vymazání příspěvku k dispozici přes systémové rozhraní OAI-PMH, i když pak lze získat jen informaci o tom, že příspěvek byl vymazán. +
+ +Přes naši Linku podpory umožňujeme provést drobné změny v příspěvcích (např. opravu překlepů v dokumentaci). I zde záleží na konkrétním případu a rozsahu změny. + Pokud jde o větší změny, vkladatel příspěvku je obvykle vyzván, aby předložil + novou verzi + příspěvku. Zároveň zařídíme, aby z metadat původní položky vedl odkaz na novou verzi, a původní položka bude pak označena jako "zastaralá". + +
+Pokud není možné, obvykle z důvodu nejasného nebo omezeného právního statusu části dat, která ukládáte do repozitáře, přiřadit datům nebo nástroji otevřenou licenci, je možné dohodnout takovou restriktivní (omezenou) licenci, která bude vyžadovat explicitní souhlas uživatele s jejími podmínkami. Zdůrazňujeme, že toto nelze aplikovat na metadata položky - ta jsou vždy veřejně a otevřeně dostupná. + Podporujeme tedy i takové restriktivní licence pro balíčky souborů s daty, které vyžadují před stahováním "elektronický podpis." + Tyto elektronické podpisy uchováváme pro případy sporů o porušení práv k duševnímu vlastnictví.
+ +Podívejte se na licence, které jsou v současné době k dispozici, nebo nás kontaktujte, pokud budete chtít nějakou speciální licenci přidat. +
+ +Podporujeme také (dočasné) embargo na balíčky souborů s daty, což znamená, že je zpřístupňujeme veřejnosti až po určité době, kterou můžete při vkládání nastavit.
+Tato stránka poskytuje informace o tom, jaká metadata používáme (a tedy požadujeme po vkladatelích dat) a jak je zpřístupňujeme. Metadata jsou volně přístupná a jsou distribuována ve veřejné doméně pod CC0. Vyhrazujeme si ale právo být na naší Lince podpory informováni o komerčním využití všech metadat z LINDAT/CLARIAH-CZ repozitáře, včetně podrobného popisu jejich použití.
+ ++ Během procesu vkládání příspěvku musí vkladatelé vyplnit také metadata, která jsou nedílnou součástí vloženého příspěvku (dat, nástrojů nebo služeb). Jsme schopni šířit metadata v různých formátech, včetně (a nejenom) CMDI a oai_dc. Viz úplný seznam podporovaných formátů. Je třeba mít na paměti, že některé formáty nemusí být použitelné pro všechny položky. Různé formáty nám pomáhají zpřístupnit tato metadata (a tedy "zviditelnit" příslušné položky) ve velkém množství agregátorů, specializovaných portálů i běžných vyhledávačů. +
++ Podívejte se na úvod do CLARINovských komponent metadat, kde získáte více informací k tomuto tématu. +
++ Naše současné příspěvky dodržují clarin.eu:cr1:p_1403526079380 schéma. Část starších příspěvků (v podstatě všechny ty, které byly vloženy před zářím/říjnem 2014) používá jiné schéma clarin.eu:cr1:p_1349361150622. Nové schéma jsme vytvořili proto, abychom vkladatelům zjednodušili a zpřehlednili postup vyplňování metadat. Původní schéma kombinovalo složku OLAC a MetaShare. Toto schéma nás nutilo zvládat duplicity a také nás činilo závislými na cizím schématu matadat a jeho sémantice, které jsme nemohli ani ovlivnit, ani měnit. +
++ Obě schémata jsou poměrně dobře pokryta odkazy na registr konceptů (základních pojmů a definic). Nyní zastaralé odkazy ISOcat DCR byly přesměrovány na CCR a odkazy na schémata komponentů OLAC byly přesměrovány na DCMI terms schémata (např. odkaz na abstrakty je na http://purl.org/dc/terms/abstract). VLO nepoužívá tato specifická schémata při svých mapováních a spíše mapuje cesty uvnitř jednoho konkrétního schématu. Jen pro některé specifické položky bylo toto mapování cest rozšířeno, aby fungovalo také s komponentou tohoto schématu. Dalším důvodem pro vytvoření vlastního schématu byla skutečnost, že DC (Dublin Core) koncepty byly stále příliš široké. +
+Podporujeme příspěvky s libovolnými CMDI soubory metadat, které se používají v OAI-PMH, pokud je pro metadata požadováno schéma CMDI.
+Požadavky ve výše uvedených odstavcích by vás mohly odradit od opakovaného použití clarin.eu:cr1:p_1349361150622. Pro opakované použití jeho specifických komponent ale nezapomínejte, co již bylo o mapování VLO řečeno. clarin.eu:cr1:p_1403526079380 s mapováním VLO již počítal při svém vzniku (i když to se může změnit), ale dosud stále odráží náš pohled na svět (jazykových zdrojů) a konkrétní případy použití. Pokud nemáte specifické potřeby, může být toto schéma pro vás dostačující, nebo může být základem pro vaše vlastní schéma.
+oai_dc je formát, který je vyžadován schématy OAI-PMH. Mapování našich příspěvků na tento formát vysvětlujeme v sekci o mapování.
+Následující seznam je výčtem polí, která požadujeme v průběhu vkládání příspěvků (v seznamu může v budoucnu dojít ke sporadickým změnám). + Metadata jsou ukládána v angličtině. Existují jemné rozdíly v závislosti na typu zdroje, který je ukládán do repozitáře. Ne všechna pole se týkají všech formátů. Některá pole jsou generována automaticky (např. jména jazyků čitelná pro člověka obsahují ve skutečnosti iso kódy, jiné mohou obsahovat identifikátory a jiné údaje).
+Jméno pole | Popis | Status |
---|---|---|
Typ | +Typ zdroje: "Korpus" odkazuje k textovým, mluveným a multimodálním korpusům. + "Lexikální koncepční zdroj" zahrnuje lexikony, ontologie, slovníky, seznamy slov apod. + "Popis jazyka" pokrývá jazykové modely a gramatiky. + "Technologie / nástroje / služby" se používá pro nástroje, systémy, systémové komponenty atd. | +vyžadováno | +
Název | +Hlavní název položky. | +vyžadováno | +
URL projektu | +URL zdroje/projektu vztahující se ke vkládané položce (např. stránka projektu). Specifikováno reg. výrazy (začíná písmeny http/https) | +specifikováno reg. výrazy | +
URL demoverze | +Ukázky, vzorky nebo (v případě nástrojů) např. URL vzorku výstupu. Specifikováno reg. výrazy (začíná písmeny http/https) | +specifikováno reg. výrazy | +
Datum vydání | +Datum vydání příspěvku, pokud existuje, např. 2014-01-21 nebo alespoň rok. | +vyžadováno | +
Autor | +Jména autorů položky. U kolekcí (např. korpusů nebo jiných větších databází textu nebo u jiných velkých databází textu) obvykle chcete uvádět jména všech osob zapojených do sestavování kolekce, ne autory jednotlivých částí. Jméno osoby je uloženo jako příjmení, čárka, další jména nebo části jména (např. "Smith, John Jr."). | +vyžadováno opakovatelně | +
Vydavatel | +Název organizace/subjektu, která publikovala předchozí verzi(-e) dané položky, nebo název vaší domovské instituce. | +vyžadováno opakovatelně | +
Kontaktní osoba | +Osoba, kterou je možné kontaktovat v případě problémů s příspěvkem. Někdo, kdo je schopen podat informaci o zdroji, např. jeden z jeho autorů nebo "vkladatel" příspěvku. Tento údaj je uložen jako strukturovaný řetězec obsahující jméno, příjmení, e-mail a domácí organizaci. | +vyžadováno opakovatelně | +
Financování | +Sponzoři a financování podporující vkládaný příspěvek + Tento údaj je uložen jako strukturovaný řetězec obsahující jméno projektu, kód projektu, organizaci provádějící financování, typ financování (vlastní/národní/EU/...) a OpenAIRE identifikátor (který je uložen také v dc.relation) | +opakovatelně | +
Popis | +Textový popis příspěvku (celé položky). | +vyžadováno | +
Jazyk | +Jazyk(y) hlavního obsahu položky. Uloženo jako ISO 639-3 kód. Vyžadováno pro korpusy, lexikální koncepční zdroje a popisy jazyka. | +opakovatelně vyžadováno v závislosti na typu položky | +
Klíčová slova | +Klíčová slova nebo fráze týkající se předmětu položky. | +opakovatelně vyžadováno | +
Velikost | +Rozsah předložených údajů, např. počet tokenů, nebo počet souborů. | +opakovatelně | +
Typ média | +Typ média hlavního obsahu položky, např. text nebo zvuk. Rozevíratelý (dropdown) výběr, vyžadováno pro korpusy, lexikální koncepční zdroje a popisy jazyka. | +rozevíratelý (dropdown) výběr vyžadováno v závislosti na typu položky | +
Detailní typ | +Další klasifikace zdroje. Rozevíratelý (dropdown) výběr, vyžadováno pro korpusy, lexikální koncepční zdroje a popisy jazyka. | +rozevíratelý (dropdown) výběr vyžadováno v závislosti na typu položky | +
Jazykově závislé | +Logická hodnota indikující, zda popsané nástroje/služby jsou jazykově závislé nebo ne. Povinné pro nástroje. | +vyžadováno v závislosti na typu položky | +
Následující tabulky obsahují mapování příspěvků mezi oai_dc, a uvádějí také některé z důležitých automaticky generovaných polí.
+Pole příspěvku | Namapované pole |
---|---|
Typ | dc.type |
Název | dc.title |
URL projektu | dc.source |
URL demoverze | nemapováno |
Datum vydání | dc.date |
Autor | dc.creator |
Vydavatel | dc.publisher |
Kontaktní osoba | nemapováno |
Financování | nemapováno |
Popis | dc.description |
Jazyk | dc.language |
Klíčová slova | dc.subject |
Velikost | nemapováno |
Typ média | nemapováno |
Detailní typ | nemapováno |
Generované pole | Popis |
---|---|
dc.identifikátor | PID (v současnosti systém handle) zdroje. |
dc.práva | Opakovatelné pole může obsahovat název licence, pod kterou je zdroj distribuován, URL odkaz k plnému textu licence a takzvaný obecný licenční typ (PUB, ACA, RES) |
To start a new submission you have to login first. Click Login under My Account in the right menu panel.
+ +Now you have a new menu item 'Submissions' under My Account. Click on Submissions to go to the Submissions screen.
+ +Now you should be on the main Submission and Workflow tasks page where you can view your incomplete/archive submissions. Click on the 'Start another submission' link to start a new Submission.
+ +You have initiated a new workflow item. In the next few steps you will provide the details about the item and upload content files. First select the type of the resource you are about to submit.
+ +Click on one of the type buttons e.g. Corpus. Proceed with filling the basic information such as the title. Click Next to continue the following step.
+In the following two steps you will provide more details for your item. First describe the people, organization and projects involved with the item.
+ +Next add your description, fill the language, etc.
+ +Once you filled the necessary information, click Next to upload the content files.
+In this step you will upload the content files of your submission. If there are no files, you can skip this step by clicking + Next. The files can be added by clicking the browse button or you can drag and drop files in the gray area with text 'Drag and Drop file(s) here'.
+ +Selecting files will open a dialog box, where you can enter the description of each file. To begin the file upload +click 'Start Upload'.
+Once the file(s) upload is done, press OK to close the dialog box. You can add more files or delete/modify the already uploaded ones, + after you finish press Next to continue with the License selection.
+If you uploaded at least one file, you must select + a license under which you want your resources to be distributed in this step (data without + license is unusable because a user does not know how can he/she use it!). + Please read the Distribution agreement carefully + and click the red box to indicate your agreement (it will turn green). + + Select the appropriate license from the dropdown list, if you already have decided on the license; + + or use the OPEN License Selector, which will help you choose by asking few questions about the submission and your requirements + + If none of the licenses suits your needs contact our + Help Desk.
+ +Click Next to continue.
+You can leave a note for the reviewer in this step.
+In this step you will review your submission before submitting it. Review page contains a sub-review panel for each of the + step you have filled in before. If you want to change any field in a particular step just click Correct one of these and it will + take you directly to the particular step page. Once you verify all the detail, submission can be made by clicking Complete Submission + or you can click Save & Exit to save the submission for continue working on it later.
+Once you click the Complete Submission in the review step, item will be submitted for the reviewing by the editors. Once + the editors approve the item it will appear in the repository. In case of any query regarding the submission, editors will contact + you for the further detail.
+It is like a library for linguistic data and tools.
+We accept any linguistic and/or NLP data and tools: corpora, + treebanks, lexica, but also trained language models, parsers, taggers, + MT systems, linguistic web services, etc. We do not strictly require + you to upload the data itself, although it is always better to do it. + Still, you can make a metadata-only record, if required. We also + support online license-signing for immediate availability of + restricted resources.
++ When uploading language resources, please try to use one of the recommended formats + mentioned in LRT Standards. +
+Please let us know through our Help Desk, if you have any trouble logging in.
+Occasionally (usually when you are the first one logging in using your home institution) you might see an error stating "The authentication was successful; however, your identity provider did provide neither your email, eppn nor targeted id." This means your home institution did not send us enough data about you to operate our service; the institution is doing so to protect your personal data. We only require an email and we are following Data Protection Code of Conduct, which helps us convince the institution we won't abuse data about you.
+If you have an account with multiple providers and you login with different one each time, you might see error stating "Your email is already associated with a different user.". Please try to use the same provider each time, if that is not possible, let us know and we'll change the default one.
+It is a special permanent URL. It provides a permanent link that + will resolve correctly even if in some distant future the data is + moved. Thus it should be used as URL in citations.
+During the submission of digital language resources to the repository, the data undergo a curation + process in order to ensure quality and consistency. We assist you in meeting necessary requirements + for sustainable resource archiving. Data have to be provided with metadata in standard formats + accepted/adopted in the respective communities, persistent identifiers (PIDs) have to be assigned, IPR + issues have to be resolved and clear statements with regard to licensing and possible use of the + resources are to be made. + + The depositor is also required to electronically sign a deposition agreement acknowledging the + (s)he is the holder of rights to the data and that (s)he has the right to grant the + rights contained in this licence. + + Once the data is indeed deposited in the repository it is assigned a PID for stable reference.
+Every change to the resources and metadata should be stored as a new version with a new PID. + However if the changes are minimal (e.g., typos or clear mistakes) then contact our Help Desk with + the submission PID and the changes which should be made. It is up to the reviewer to decide whether these changes + should result in a new version or not.
+Yes, in this case contact our Help Desk with the submission PID and the reason. + However, we need to keep a reference that the data was in our repository (because a persistent identifier was issued), so the + administrative metadata will be retained indicating that the data itself were removed.
+We can create a tombstone page for the moved record and we can add a notice to that page saying the resource is now at a new location. + The submission is effectively hidden from search, browse and harvesting (oai-pmh), but the PID still resolves. + Thus instead of the actual data, we show a link to the item in your repository. + Please contact the Help Desk for more details.
+In accordance with the advocacy of the research infrastructures and the general development + with respect to Open Access, we strongly encourage the data producers to be as open as possible. + + However, in other circumstances we will archive your data even if they will not be publicly available. Please, contact + our Help Desk prior to completing the submission.
+See our policies.
+Quite safe, probably much more than in your computer. Our + storage plan:
+
+ We encourage using a free license. A representative selection of free
+ licenses as well as CC licenses (more appropriate for data) is
+ available directly during submission. There is a great OPEN License Selector which can guide you through the selection of appropriate license.
+ If for some reason you need a different license, Contact Us.
+
+ The list of licenses currently supported is here. + However, do not hesitate to Contact Us + in case you need your specific license. The licenses can be accompanied by various requirements; eg. limiting to logged in users, filling additional details (purpose) etc. +
++ It is not about contact, it is about citations, credit and trust. That is why we have separate metadata + fields for authors and for contact person. Contact to a helpdesk is perfect, not acknowledging the + authors of a scholarly work is not. We support the direct citation of data + (https://www.force11.org/datacitation). + That is why we also give them PIDs, create formatted citations, etc. That is the reason we really want proper + authors, so that they get citations and other scientists know whose work they rely on. +
++ In contrast to other search engines this one uses OR as a default operator; see examples below that clarify this. If you are not satisfied with the results of your searches, you might wish to go beyond plain text searches. + You may search only in certain fields, use negation, add score (emphasis) to some parts of the query and match + more. The search engine is SOLR so use it's syntax if you know it or check it in the documentation. +
++
As you may have read elsewhere in the repository help, we do not allow changes in the data after a + submission was published. You need to create a new one by creating a new version. +
+After you deposit a submission it will be inserted into a + pool of submitted items. The item is not publicly available and waits for an editor + to approve (or reject) it. +
+The task of the editor is to verify whether the submission meets our requirements in respect to + metadata quality and completeness, bitstream consistency and IPR. The editor can return the submission to the data depositor + describing the needed changes. This step is repeated until the editor approves the item. The approved item becomes a + published item. +
+A published item obtains a PID (persistent identifier) which should be used for referencing and citing e.g., + http://hdl.handle.net/11858/00-097C-0000-0022-F59C-8. The LINDAT repository will ensure that + the PID (more precisely, we use http handle proxy of the PID) will be resolved into a working web page (even if the current + server infrastructure changes or is moved) + describing your resource. +
+ ++ Published items are available through our search interface, browsing mode. Metadata of all items are submitted to + search engines and are available through OAI-PMH protocol (several institutes harvest our repository for item's metadata + e.g., http://catalog.clarin.eu/vlo/). Bitstreams of public submissions + (see Restricted Submissions) are also available through OAI-ORE protocol. +
+Anybody can request deletion of published items; however, these will be evaluated on case-by-case basis. + Furthermore, we reserve the right to keep the metadata of published submissions available + in case there is no specific reason why to delete the metadata. The reason is that it is against + the concept of PIDs (persistent identifiers). + All PIDs are available through OAI-PMH interface even if only to inform that the item + has been deleted. +
+ +We allow for minor edits of the submission (e.g., typos) through our Help Desk. These are also + evaluated on case-by-case basis. For major changes, the user is requested to submit a + new version + of that item and we will indicate in the metadata that it is replaced by a newer version. +
+First of all, all metadata are always publicly available. We + support open access submissions; however, we also support + restrictive licences for bitstreams which require e-signing before downloading the bitstreams. + We keep track of these e-signatures in case there are IPR infringements.
+ +See currently available licenses or ask us + to add a specific one.
+ +We also support putting embargo on bitstreams which means that the bitstreams become publicly available + after specific dates.
+This page provides information about what metadata we require and how we disseminate it. Metadata are freely accessible and are distributed in the public domain (under CC0). However, we reserve the right to be informed about commercial usage of metadata from LINDAT/CLARIAH-CZ repository including a description of your use case at Help Desk.
+ ++ During the submission process, users fill out metadata fields which are stored as a part of the record. We are able to disseminate the submission metadata in various formats including but not limited to CMDI and oai_dc. See the full list of supported formats but note that some of the formats might not be applicable to all items. The various formats help us promote the submitted content in number of aggregators (and/or search engines). +
++ See the CLARIN introduction to component metadata in order to get more information about this topic. +
++ Our current submissions are adhering to the clarin.eu:cr1:p_1403526079380 profile/schema. Portion of older submissions (basically those submitted before Sep/Oct 2014) is using different profile clarin.eu:cr1:p_1349361150622. We decided to create the new profile to better reflect the submission process the user goes through. The former one was a combination of OLAC and MetaShare components, which forced us to handle duplicities in various places. It also bounded us to someone else's metadata schema and it's semantics, which we could neither influence nor change. +
++ Both profiles are fairly covered with links to a concept registry. The links going to now retired ISOcat DCR were redirected to CCR and the OLAC component's concept links are linking to the DCMI terms concepts (eg. the concept link for abstract is http://purl.org/dc/terms/abstract). VLO is using concept links, mainly/preferably from the CCR, and in some cases explicit XPaths to discover field values. Our older profile was such an explicit case. The XPaths in the vlo mappings were matching only one particular profile. The mappings were later extended (for some facets) so that the xpaths work also with the component derived from that particular profile. This special treatment was one reason for creating a different profile. Another reason for creating our own profile was the fact that DC concepts were still too broad. +
+However, we are supporting submissions with arbitrary CMDI metadata files that are used in OAI-PMH when the CMDI metadata profile is requested.
+Various points in the above paragraphs should discourage you from reusing clarin.eu:cr1:p_1349361150622. For reusing it's specific components, keep in mind what was said above about the VLO mapping. clarin.eu:cr1:p_1403526079380 was created with VLO mapping in mind (though this can change), but still reflects our view of the world and our use cases. If you don't gather much more information than is described below, you might find this profile suitable for your needs or as a base for your own one.
+oai_dc is the format required by OAI-PMH. See the mapping section in order to understand how we map our submission to this format.
+Following list enumerates the fields we ask in the submission workflow (the list is subject to sporadic changes). The metadata are submitted in English. There are subtle differences depending on the type of the resource being submitted. Not all the fields are present in all the formats. There are fields that are automatically generated (eg. human readable language names acompanying the iso codes, identifiers, other dates).
+Field name | Description | Status |
---|---|---|
Type | +Type of the resource: "Corpus" refers to text, speech and multimodal corpora. + "Lexical Conceptual Resource" includes lexica, ontologies, dictionaries, word lists etc. + "language Description" covers language models and grammars. + "Technology / Tool / Service" is used for tools, systems, system components etc. | +required | +
Title | +The main title of the item. | +required | +
Project URL | +URL of resource/project related to the submitted item (eg. project webpage). Regexp controlled (starts with http/https) | +regexp controlled | +
Demo URL | +Demonstration, samples or in case of tools sample output URL. Regexp controlled (starts with http/https) | +regexp controlled | +
Date issued | +The date when the submission data were issued if any e.g., 2014-01-21 or at least the year. | +required | +
Author | +Names of authors of the item. In case of collections (eg. corpora or other large database of text) you usually want to provide the name of people involved in compiling the collection, not the authors of individual pieces. A person name is stored as surname comma any other name (eg. "Smith, John Jr."). | +requiredrepeatable | +
Publisher | +Name of the organization/entity which published any previous instance of the item, or your home institution. | +requiredrepeatable | +
Contact person | +Person to contact in case of issues with the submission. Someone able to provide information about the resource, eg. one of the authors, or the submitter. Stored as structured string containing given name, surname, email and home organization. | +requiredrepeatable | +
Funding | +Sponsors and funding that supported work described by the submission. Stored as structured string containing project name, project code, the funding organization, the type of funds (own/national/eu) and OpenAIRE identifier (which is also stored in dc.relation) | +repeatable | +
Description | +Textual description of the submission. | +required | +
Language | +The language(s) of the main contenten of the item. Stored as ISO 639-3 code. Required for corpora, lexical conceptual resources and language descriptions. | +repeatabletype-bind required | +
Subject Keywords | +Keywords or phrases related to the subject of the item. | +repeatablerequired | +
Size | +Extent of the submitted data, eg. the number of token, or number of files. | +repeatable | +
Media type | +Media type of the main content of the item, eg. text or audio. Dropdown selection, required for corpora, language descriptions and lexical conceptual resources. | +dropdown selectiontype-bind required | +
Detailed type | +Further classification of the resource type. Dropdown selection, required for tools, language descriptions and lexical conceptual resources. | +dropdown selectiontype-bind required | +
Language Dependent | +Boolean value indicating whether the described tool/service is language dependent or not. Required for tools | +type-bind required | +
The following tables contains the submission - oai_dc mapping, it also lists some of the important automatically generated fields.
+Submission field | Mapped field |
---|---|
Type | dc.type |
Title | dc.title |
Project URL | dc.source |
Demo URL | not mapped |
Date Issued | dc.date |
Author | dc.creator |
Publisher | dc.publisher |
Contact person | not mapped |
Funding | not mapped |
Description | dc.description |
Language | dc.language |
Subject Keywords | dc.subject |
Size | not mapped |
Media Type | not mapped |
Detailed Type | not mapped |
Generated field | Description |
---|---|
dc.identifier | PID (currently handle) of the resource. |
dc.rights | Repeatable field can contain the name of the license under which the resource is distributed, the URL to the full text of the license and so called label (PUB, ACA, RES) |
+
+ Description of search features.
+ Filters.
+ etc
+
+
Welcome to ${dspace.name}. This repository service is provided to you by ${lr.description.institution}, located at ${lr.description.location}, hereinafter referred to as CLARIN Centre. The mission of CLARIN is to provide as wide access as possible to language research materials and tools around Europe. To archive this goal, we set some ground rules in this document. By accessing or using, and in consideration of the CLARIN Services provided to you, you agree to abide by the Terms of Use below, which can be updated or modified according to article 9.
+ ++ 1.1 The access to and use of CLARIN Services are governed by this Agreement and by its terms and conditions, which are hereby incorporated into its End-User License Agreements. The User's attention is drawn to the provisions limiting access to certain classes of resources. +
+ ++ 1.2 Any use of the CLARIN Services by means of the User Identity granted by the local identity provider also signifies the User's acceptance of the Terms of Service and the User's agreement to be bound by them. +
+ ++ 2.1 All terms used in this Agreement, unless specifically defined herein, will have the meanings attributed to them in this Agreement. The following terms shall have the following meaning: +
+ +
+ "Authorised Use" means use by a User who is accessing the CLARIN Services via the identity provided by a national identity provider.
+
+ "Academic Use" means use by a User who fulfils the criteria set by the national identity providers for Academic users and defined by CLARIN ERIC.
+
+ "Non-Commercial Use" refers to any use that does not generate income or is not used to promote the generation of income.
+
+ "User Identity" refers to the identity granted by a local identity provider or a CLARIN Centre of type A or B.
+
+ 3.1 CLARIN hereby grants the User a limited non-exclusive non-transferable licence to access and use CLARIN resources under the terms of this Agreement and via the chosen User Identity. +
+ ++ 3.2 Access to certain Features and Databases may be restricted by CLARIN. +
+ ++ 3.3 The User will be responsible for all access to CLARIN by means of the chosen User Identity whether or not the User has knowledge of such access and use. CLARIN reserves the right to cancel any User Identity without notice. +
+ ++ 3.4 The User understands and acknowledges that the User Identity is for his or her use only and that the User is prohibited from permitting any third party from accessing CLARIN by means of the User Identity. +
+ ++ 3.5 Content Categories +
+ +
+ CLARIN offers content in three different main categories:
+
+ Public Content (PUB)
+
+ Academic Content (ACA)
+
+ Restricted Content (RES)
+
+ The User understands and acknowledges that depending on the content the access may be limited based on this categorization and the User Identity. CLARIN may also require acceptance of additional licensing or usage terms for Academic and Restricted Content. The User agrees to use the content according to the conditions.
+
+ 3.6 Sub-categories +
+ +
+ The offered content may belong to certain sub-categories:
+
+
+ 3.7 Content-Specific Licenses + In addition to the aforementioned categories, some content has its own license (for example a Creative Commons license), which may set additional limitations and requirements. The User agrees to follow these limitations and requirements. +
+ ++ The User agrees to observe best practices regarding research ethics. This includes treating colleagues, stakeholders, customers, suppliers and the public respectfully and professionally, taking into account confidentiality when appropriate, respecting cultural differences and having an open and explicit relationship with government, the public, the private sector and other funders. +
+ ++ CLARIN disclaims all responsibility and liability for the availability, timeliness, security or reliability of the services, software or other content provided through the CLARIN Services. CLARIN reserves the right to modify, suspend, or discontinue the services or access to the services without any notice at any time and without any liability to you. +
+ ++ These Terms are governed by the laws of ${lr.description.country} without regard to the rules of conflict of law that may cause the laws of another jurisdiction to apply. The User agrees to the sole and exclusive jurisdiction and venue of the ${lr.description.city} District Court of Law in the event of any dispute of any kind arising from or relating to the CLARIN Services, or the User’s use or review of it. However, CLARIN has the right to use the laws of another jurisdiction to get injunctive measures against the misuse of the CLARIN Service. +
+ ++ The Terms of Service constitute the entire agreement between the parties with respect to the subject matter hereof and supersedes and replaces all prior or contemporaneous understandings or agreements, written or oral, regarding such subject matter. If for any reason a court of competent jurisdiction finds any provision or portion of these Terms to be unenforceable, the remainder of the Terms will continue in full force and effect. +
+ ++ The User agrees to follow the data protection policy of the CLARIN Services. +
+ ++ CLARIN maintains usage statistics as a measure of readership and other use of the CLARIN Services by authors and researchers. It is a violation of CLARIN policy for a party to directly or indirectly use CLARIN with a view to affecting download and other usage statistics, or to encourage others to do so. As part of its general right to refuse or terminate service and remove or edit the content of the CLARIN Services, CLARIN reserves the right in its sole discretion to limit access, remove content, and adjust usage statistics to respond to any activity that appears likely to have such an effect. +
+ ++ 9.1 If these Terms of Service are modified for legal, administrative or any other reasons, the CLARIN Centre shall notify the users about these amendments by publishing the relevant information on the CLARIN Centre website without unreasonable delay. +
+ ++ 9.2 If the User continues to use the services after being properly notified about the amendment of the Terms of Service, it implies his consent to the new Terms of Service. +
+ ++ If the User violates the letter or spirit of this agreement, or otherwise creates a risk or possible legal exposure for CLARIN, CLARIN can stop providing all or part of CLARIN Services. CLARIN will notify the User at the next time he or she attempts to access the CLARIN Services. +
+ +