diff --git a/src/app/shared/shared.module.ts b/src/app/shared/shared.module.ts index 677b4febd3c..423c381023e 100644 --- a/src/app/shared/shared.module.ts +++ b/src/app/shared/shared.module.ts @@ -276,6 +276,7 @@ import { EpersonGroupListComponent } from './eperson-group-list/eperson-group-li import { EpersonSearchBoxComponent } from './eperson-group-list/eperson-search-box/eperson-search-box.component'; import { GroupSearchBoxComponent } from './eperson-group-list/group-search-box/group-search-box.component'; import { HtmlContentService } from './html-content.service'; +import { ClarinSafeHtmlPipe } from './utils/clarin-safehtml.pipe'; const MODULES = [ CommonModule, @@ -320,7 +321,8 @@ const PIPES = [ ClarinLicenseCheckedPipe, ClarinLicenseLabelRadioValuePipe, ClarinLicenseRequiredInfoPipe, - CharToEndPipe + CharToEndPipe, + ClarinSafeHtmlPipe ]; const COMPONENTS = [ diff --git a/src/app/shared/utils/clarin-safehtml.pipe.ts b/src/app/shared/utils/clarin-safehtml.pipe.ts new file mode 100644 index 00000000000..ebf2e21c8da --- /dev/null +++ b/src/app/shared/utils/clarin-safehtml.pipe.ts @@ -0,0 +1,15 @@ +import { Pipe, PipeTransform } from '@angular/core'; +import { DomSanitizer, SafeHtml } from '@angular/platform-browser'; + +/** + * Pipe to keep html tags e.g., `id` in the `innerHTML` attribute. + */ +@Pipe({ + name: 'dsSafeHtml' +}) +export class ClarinSafeHtmlPipe implements PipeTransform { + constructor(private sanitized: DomSanitizer) {} + transform(htmlString: string): SafeHtml { + return this.sanitized.bypassSecurityTrustHtml(htmlString); + } +} diff --git a/src/app/static-page/static-page.component.html b/src/app/static-page/static-page.component.html index 15c3ea6ef07..99b85f71fb9 100644 --- a/src/app/static-page/static-page.component.html +++ b/src/app/static-page/static-page.component.html @@ -1,3 +1,3 @@
-
+
diff --git a/src/app/static-page/static-page.component.spec.ts b/src/app/static-page/static-page.component.spec.ts index c3a0b9c6d21..97df3c3d420 100644 --- a/src/app/static-page/static-page.component.spec.ts +++ b/src/app/static-page/static-page.component.spec.ts @@ -7,6 +7,9 @@ import { RouterMock } from '../shared/mocks/router.mock'; import { LocaleService } from '../core/locale/locale.service'; import { TranslateModule } from '@ngx-translate/core'; import { of } from 'rxjs'; +import { APP_CONFIG } from '../../config/app-config.interface'; +import { environment } from '../../environments/environment'; +import { ClarinSafeHtmlPipe } from '../shared/utils/clarin-safehtml.pipe'; describe('StaticPageComponent', () => { let component: StaticPageComponent; @@ -14,24 +17,32 @@ describe('StaticPageComponent', () => { let htmlContentService: HtmlContentService; let localeService: any; + let appConfig: any; beforeEach(async () => { htmlContentService = jasmine.createSpyObj('htmlContentService', { - fetchHtmlContent: of('
TEST MESSAGE
') + fetchHtmlContent: of('
TEST MESSAGE
') }); localeService = jasmine.createSpyObj('LocaleService', { getCurrentLanguageCode: jasmine.createSpy('getCurrentLanguageCode'), }); + appConfig = Object.assign(environment, { + ui: { + namespace: 'testNamespace' + } + }); + TestBed.configureTestingModule({ - declarations: [ StaticPageComponent ], + declarations: [ StaticPageComponent, ClarinSafeHtmlPipe ], imports: [ TranslateModule.forRoot() ], providers: [ { provide: HtmlContentService, useValue: htmlContentService }, { provide: Router, useValue: new RouterMock() }, - { provide: LocaleService, useValue: localeService } + { provide: LocaleService, useValue: localeService }, + { provide: APP_CONFIG, useValue: appConfig } ] }); @@ -51,6 +62,6 @@ describe('StaticPageComponent', () => { // Load `TEST MESSAGE` it('should load html file content', async () => { await component.ngOnInit(); - expect(component.htmlContent.value).toBe('
TEST MESSAGE
'); + expect(component.htmlContent.value).toBe('
TEST MESSAGE
'); }); }); diff --git a/src/app/static-page/static-page.component.ts b/src/app/static-page/static-page.component.ts index bd06f96f103..63aac66bc3a 100644 --- a/src/app/static-page/static-page.component.ts +++ b/src/app/static-page/static-page.component.ts @@ -1,10 +1,11 @@ -import { Component, OnInit } from '@angular/core'; +import { Component, Inject, OnInit } from '@angular/core'; import { HtmlContentService } from '../shared/html-content.service'; import { BehaviorSubject, firstValueFrom } from 'rxjs'; import { Router } from '@angular/router'; import { isEmpty, isNotEmpty } from '../shared/empty.util'; import { LocaleService } from '../core/locale/locale.service'; import { STATIC_FILES_DEFAULT_ERROR_PAGE_PATH, STATIC_FILES_PROJECT_PATH } from './static-page-routing-paths'; +import { APP_CONFIG, AppConfig } from '../../config/app-config.interface'; /** * Component which load and show static files from the `static-files` folder. @@ -17,15 +18,17 @@ import { STATIC_FILES_DEFAULT_ERROR_PAGE_PATH, STATIC_FILES_PROJECT_PATH } from }) export class StaticPageComponent implements OnInit { htmlContent: BehaviorSubject = new BehaviorSubject(''); + htmlFileName: string; constructor(private htmlContentService: HtmlContentService, private router: Router, - private localeService: LocaleService) { } + private localeService: LocaleService, + @Inject(APP_CONFIG) protected appConfig?: AppConfig) { } async ngOnInit(): Promise { let url = ''; // Fetch html file name from the url path. `static/some_file.html` - let htmlFileName = this.getHtmlFileName(); + this.htmlFileName = this.getHtmlFileName(); // Get current language let language = this.localeService.getCurrentLanguageCode(); @@ -35,7 +38,7 @@ export class StaticPageComponent implements OnInit { // Try to find the html file in the translated package. `static-files/language_code/some_file.html` // Compose url url = STATIC_FILES_PROJECT_PATH; - url += isEmpty(language) ? '/' + htmlFileName : '/' + language + '/' + htmlFileName; + url += isEmpty(language) ? '/' + this.htmlFileName : '/' + language + '/' + this.htmlFileName; let potentialContent = await firstValueFrom(this.htmlContentService.fetchHtmlContent(url)); if (isNotEmpty(potentialContent)) { this.htmlContent.next(potentialContent); @@ -43,7 +46,7 @@ export class StaticPageComponent implements OnInit { } // If the file wasn't find, get the non-translated file from the default package. - url = STATIC_FILES_PROJECT_PATH + '/' + htmlFileName; + url = STATIC_FILES_PROJECT_PATH + '/' + this.htmlFileName; potentialContent = await firstValueFrom(this.htmlContentService.fetchHtmlContent(url)); if (isNotEmpty(potentialContent)) { this.htmlContent.next(potentialContent); @@ -54,6 +57,27 @@ export class StaticPageComponent implements OnInit { await this.loadErrorPage(); } + processLinks(e) { + const element: HTMLElement = e.target; + if (element.nodeName === 'A') { + e.preventDefault(); + const href = element.getAttribute('href')?.replace('/', ''); + let redirectUrl = window.location.origin + this.appConfig.ui.nameSpace + '/static/'; + // Start with `#` - redirect to the fragment + if (href.startsWith('#')) { + redirectUrl += this.htmlFileName + href; + } else if (href.startsWith('.')) { + // Redirect using namespace e.g. `./test.html` -> `/namespace/static/test.html` + redirectUrl += href.replace('.', '') + '.html'; + } else { + // Redirect without using namespace e.g. `/test.html` -> `/test.html` + redirectUrl = redirectUrl.replace(this.appConfig.ui.nameSpace, '') + href; + } + // Call redirect + window.location.href = redirectUrl; + } + } + /** * Load file name from the URL - `static/FILE_NAME.html` * @private @@ -69,7 +93,7 @@ export class StaticPageComponent implements OnInit { } // If the url is too long take just the first string after `/static` prefix. - return urlInList[1]; + return urlInList[1]?.split('#')?.[0]; } /** diff --git a/src/app/static-page/static-page.module.ts b/src/app/static-page/static-page.module.ts index cb7e2397488..7ed011ead4a 100644 --- a/src/app/static-page/static-page.module.ts +++ b/src/app/static-page/static-page.module.ts @@ -3,15 +3,17 @@ import { CommonModule } from '@angular/common'; import { StaticPageRoutingModule } from './static-page-routing.module'; import { StaticPageComponent } from './static-page.component'; +import { SharedModule } from '../shared/shared.module'; @NgModule({ declarations: [ StaticPageComponent ], - imports: [ - CommonModule, - StaticPageRoutingModule, - ] + imports: [ + CommonModule, + StaticPageRoutingModule, + SharedModule, + ] }) export class StaticPageModule { } diff --git a/src/assets/images/static-pages/bibtex.png b/src/assets/images/static-pages/bibtex.png new file mode 100644 index 00000000000..986520b7d1e Binary files /dev/null and b/src/assets/images/static-pages/bibtex.png differ diff --git a/src/assets/images/static-pages/refbox.png b/src/assets/images/static-pages/refbox.png new file mode 100644 index 00000000000..a99b6ee3a2d Binary files /dev/null and b/src/assets/images/static-pages/refbox.png differ diff --git a/src/assets/images/static-pages/step1.png b/src/assets/images/static-pages/step1.png new file mode 100644 index 00000000000..ab38212f37a Binary files /dev/null and b/src/assets/images/static-pages/step1.png differ diff --git a/src/assets/images/static-pages/step2.png b/src/assets/images/static-pages/step2.png new file mode 100644 index 00000000000..9c0c1a25a16 Binary files /dev/null and b/src/assets/images/static-pages/step2.png differ diff --git a/src/assets/images/static-pages/step2_1.png b/src/assets/images/static-pages/step2_1.png new file mode 100644 index 00000000000..8cb0ed2d2bd Binary files /dev/null and b/src/assets/images/static-pages/step2_1.png differ diff --git a/src/assets/images/static-pages/step3.png b/src/assets/images/static-pages/step3.png new file mode 100644 index 00000000000..9609e2e88ed Binary files /dev/null and b/src/assets/images/static-pages/step3.png differ diff --git a/src/assets/images/static-pages/step4.png b/src/assets/images/static-pages/step4.png new file mode 100644 index 00000000000..f4ed932a9cc Binary files /dev/null and b/src/assets/images/static-pages/step4.png differ diff --git a/src/assets/images/static-pages/step4_1.png b/src/assets/images/static-pages/step4_1.png new file mode 100644 index 00000000000..a03a79bfaaa Binary files /dev/null and b/src/assets/images/static-pages/step4_1.png differ diff --git a/src/assets/images/static-pages/step5.png b/src/assets/images/static-pages/step5.png new file mode 100644 index 00000000000..c2c362ec948 Binary files /dev/null and b/src/assets/images/static-pages/step5.png differ diff --git a/src/assets/images/static-pages/step6_1.png b/src/assets/images/static-pages/step6_1.png new file mode 100644 index 00000000000..e09784d4b9b Binary files /dev/null and b/src/assets/images/static-pages/step6_1.png differ diff --git a/src/assets/images/static-pages/step6_2.png b/src/assets/images/static-pages/step6_2.png new file mode 100644 index 00000000000..17069b385f0 Binary files /dev/null and b/src/assets/images/static-pages/step6_2.png differ diff --git a/src/assets/images/static-pages/step6_3.png b/src/assets/images/static-pages/step6_3.png new file mode 100644 index 00000000000..4c1e40c3232 Binary files /dev/null and b/src/assets/images/static-pages/step6_3.png differ diff --git a/src/static-files/about.html b/src/static-files/about.html new file mode 100644 index 00000000000..75bb6bd713f --- /dev/null +++ b/src/static-files/about.html @@ -0,0 +1,160 @@ +
+ +

LINDAT/CLARIAH-CZ repository About and Policies

+ + +
+ +
+
+

Mission Statement

+
+

+ The ultimate objective of CLARIN ERIC (which LINDAT/CLARIAH-CZ is part of) is to advance research in humanities + and social sciences by giving researchers unified single sign-on access to a platform which integrates language-based resources and advanced tools at a European level. This shall be implemented by the construction and operation of a shared distributed infrastructure that aims at making language resources, technology and expertise available to the humanities and social sciences (henceforth abbreviated HSS) research communities at large. + See more information about LINDAT/CLARIAH-CZ. +

+

+ To know more about CLARIN ERIC visit CLARIN-ShortGuide.pdf +

+
+
+
+

Terms of Service

+

+ To achieve our mission statement,we set out some ground rules through the Terms of Service. By accessing or using any kind of data or services provided by the Repository, you agree to abide by the Terms contained in the above mentioned document. +

+

+ Data in LINDAT/CLARIAH-CZ repository are made available under the licence attached to the resources. In case there is no licence, data is made freely available for access, printing and download for the purposes of non-commercial research or private study. + + Users must acknowledge in any publication, the Deposited Work using a persistent identifier (see Citing Data), its original author(s)/creator(s), and any publisher where applicable. Full items must not be harvested by robots except transiently for full-text indexing or citation analysis. Full items must not be sold commercially unless explicitly granted by the attached licence without formal permission of the copyright holders. +

+
+ +
+
+

About Repository

+

It is like a library for linguistic data and tools.

+
    +
  • Search for data and tools and easily download them.
  • +
  • Deposit the data and be sure it is safely stored, everyone + can find it, use it, and correctly cite it (giving you credit)
  • +
+
+
+
+

About UFAL

+

+ The Institute of Formal and Applied Linguistics (UFAL) at the Computer Science School, Faculty of Mathematics and Physics, Charles University, Czech Republic was established in 1990 as a continuation of the research and teaching activities carried out by the former Laboratory of Algebraic Linguistics since the early 60s at the Faculty of Philosophy and later at the Faculty of Mathematics and Physics, Charles University in Prague, is a primarily research department working on many topics in the area of Computational Linguistics, and on many research projects both nationally and internationally. However, the Institute of Formal and Applied Linguistics is also a regular department in the sense that it carries a comprehensive teaching program both for the Master's degree (Mgr., or MSc.) as well as for a doctorate (Ph.D.) in Computational Linguistics. Both programs are taught in Czech and English. The Institute is also a member of the double-degree "Master's LCT programme" of the EU. Students also can take advantage of the Erasmus program for typically semester-long stays at partner Universities abroad. +

+
+
+
+

License Agreement and Contracts

+

At the moment, UFAL distinguishes three types of contracts.

+
    +
  • For every deposit, we enter into a standard contract with the submitter, the so-called "Distribution License Agreement", in which we describe our rights and duties and the submitter acknowledges that they have the right to submit the data and gives us (the repository centre) right to distribute the data on their behalf.
  • +
  • Everyone who downloads data is bound by the licence assigned to the item - in order to download protected data, one has to be authenticated and needs to electronically sign the licence. A list of available licenses in our repository can be found here.
  • +
  • For submitters, there is a possibility for setting custom licences to items during the submission workflow.
  • +
+
+
+
+

Intellectual Property Rights

+

+As mentioned in the section License Agreement and Contracts, we require the depositor of data or tools to sign a Distribution License Agreement, which specifies that they have the right to submit the data and gives us (the repository centre) right to distribute the data on their behalf. This means that depositors are solely responsible for taking care of IPR issues before publishing data or tools by submitting them to us. +
+Should anyone have a suspicion that any of the datasets or tools in our repository violate Intellectual Property Rights, they should contact us immediately at our help desk. +

+
+
+ +
+

Privacy Policy

+

Read our Privacy Policy in order to learn how we manage personal data collected by the LINDAT/CLARIAH-CZ repository and services. +

+
+
+ +
+

Metadata Policy

+

+ Deposited content must be accompanied by sufficient metadata describing its content, provenance and formats in order to support its preservation and dissemination. Metadata are freely accessible and are distributed in the public domain (under CC0). However, we reserve the right to be informed about commercial usage of metadata from LINDAT/CLARIAH-CZ repository including a description of your use case at Help Desk. +

+
+
+ +
+

Preservation Policy

+

+ LINDAT/CLARIAH-CZ is committed to the long-term care of items deposited in the repository, to preserve the + research and to help in keeping research replicable and strives to adopt the + current best practice in digital preservation. See the Mission Statement. + We follow best practice guidelines, standards and regulations set forth by CLARIN, OAIS and/or Charles + University. +

+

+ In order to stay a reliable and trustworthy repository, we undergo periodical assessments by CLARIN ERIC and + CTS (formerly DSA). +

+

+ To fulfill the commitments, the repository ensures that datasets are ingested and distributed in + accordance with their license (see agreements and contracts). Sometimes + (for licenses that do not permit public access) this means only authorized users can access the dataset. +

+

+ The submission workflow as described in deposit and the work of our editors ensures + discoverability (by requiring accurate metadata) via our search engine, + externally through OAI-PMH and in page metadata for certain web crawlers. Metadata are freely accessible. +

+

+ There are various automated procedures including fixity checks, to ensure integrity of the submitted + datasets and completeness of metadata. On the + system level we employ various on-site and off-site backup strategies and hardware monitoring. The + datasets are accessible online. +

+

+ We view data and tools as primary research outputs, each submission receives a Persistent IDentifier for reference and + the users are guided to use them. Changes in a dataset after it has been published are + not permitted, new submission is required instead. The old and new submissions are linked through their + metadata (see new version + guide for more details). +

+

+ Through regular participation in CLARIN activities, Open Repositories and various other meetings, schools + and conferences, the repository staff is informed of new developments in technologies and/or initiatives. +

+

+ The various export options offered by the repository system (DSpace) ensures that data and their metadata + are not locked in and can be moved to a different repository system. +

+

+ The repository encourages the usage of specific file formats as recommended by CLARIN. The preferred file + formats will change over time, in which case the repository will make every effort to migrate to other + formats, while keeping originals intact for reproducibility purposes (ie. migrated item will be a new + repository record linked to the old). The guiding principles for format selection are: open standards are + preferred over proprietary standards, formats should be well-documented, verifiable and proven, + text-based formats are preferred over binary formats where possible, in the case of digitalization of analogue signal lossless or no compression is recommended. +

+

+ In the case of a withdrawal of funding, the repositories content would be transferred to another CLARIN + centre. While the legal aspects of the process of relocating data to another institution are underway the + hosting institute (UFAL) offers a timeframe of at least 10 years, in which it will provide access to the + data. +

+
+
+ + +
diff --git a/src/static-files/cite.html b/src/static-files/cite.html new file mode 100644 index 00000000000..600f73d171f --- /dev/null +++ b/src/static-files/cite.html @@ -0,0 +1,41 @@ +
+ +

About Citations

+

We strongly feel that data should be cited properly. For that reason we are adopting various policies and creating UI elements (see RefBox below) to make the citation as easy and as consistent as possible.

+

Citing data policy

+

CLARIN endorses the Data Citation Principles and so do we. We ask Data users to acknowledge and cite data sources properly in all publications and outputs. We already implement the important recommendations of RDA's Data Citation Work Group. See the example of automatic citation text below.

+

Citation Handle - a Persistent Identifier

+

The Handle System provides unique and persistent identifiers of digital objects. We use it to provide your data with a permanent identifier in the form of an URL that will always point to the data, wherever it moves in the future. Thus you can safely use the Handle to point to data for instance in publications. The Handle is part of the RefBox together with other information such as authors, title and publisher. +

+

+

Export Formats

+

For convenience we've prepared export formats, that can easily be copied and pasted. An item can be exported in BibTeX format. A link to an export is provided in the citation box (see above image). + On clicking the link to "BibTeX", formatted BitbTeX entry will be displayed. +

+

+
diff --git a/src/static-files/cookies.html b/src/static-files/cookies.html new file mode 100644 index 00000000000..b442e18f99e --- /dev/null +++ b/src/static-files/cookies.html @@ -0,0 +1,32 @@ +
+ +

Cookies

+

+ To make this site work properly, we sometimes place small data files called cookies on your device. Most big websites do this too. +

+ +

+ The EU Directive 2009/136/EC states that we can store cookies on your machine, if they are essential to the operation of this site, but that for all others we need your permission to do so. +

+ +

What are cookies?

+

+ A cookie is a small piece of data that a website asks your browser to store on your computer or mobile device. + The cookie allows the website to "remember" your actions or preferences (such as login, language, font size and other display preferences) over time, + so you don’t have to keep re-entering them whenever you come back to the site or browse from one page to another. Most browsers support cookies, but users can set their browsers to decline them and can delete them whenever they like. +

+ +

How we use cookies?

+

Strictly Necessary cookies

+

We use DiscoJuice and Shibboleth cookies for remembering the user IdP choice and login session id.

+

Google Analytics

+

Through this website, a cookie is sent to the American company Google, as part of the 'Analytics' service. We use this service to track how visitors use our website. Google can provide this information to third parties in case Google is legally obligated to do so, or if third parties process the information on behalf of Google. We can in no way influence these actions. We have not allowed Google to use the obtained Analytics information for other Google services.

+

The information Google collects remains anonymous wherever possible. Your IP address is not explicitly given. The information is stored by Google on servers in the US. Google adheres to the Safe Harbor principles, and is affiliated with the Safe Harbor programme of the US Department of Commerce. This means there is an adequate level of protection for the processing of any personal data.

+

Piwik

+

This website uses Piwik, an open analytics platform to collect web statistics. Piwik will store cookies on your computer, but no personal data will be collected. An anonymous ID will enable piwik to identify your session, but this ID is meaningless to anybody else, and it cannot be used to identify an individual user.

+ +

How to control cookies

+

You can control and/or delete cookies as you wish – for details, see aboutcookies.org. You can delete all cookies that are already on your computer and you can set most browsers to prevent them from being placed. If you do this, however, you may have to manually adjust some preferences every time you visit a site and some services and functionalities may not work.

+ + +
diff --git a/src/static-files/cs/about.html b/src/static-files/cs/about.html new file mode 100644 index 00000000000..13a7d688e7b --- /dev/null +++ b/src/static-files/cs/about.html @@ -0,0 +1,160 @@ +
+ +

Repozitář LINDAT/CLARIAH-CZ - O nás a naše pravidla

+ + +
+ +
+
+

Naše poslání

+
+

+ Konečným cílem projektu CLARIN ERIC je urychlit výzkum v humanitních a sociálních vědách zpřístupněním jednotné platformy, která na evropské úrovni integruje jazykové zdroje a pokročilé nástroje pro zpracování psaného i mluveného jazyka. Tento cíl je uskutečňován prostřednictvím nově vytvořené sdílené distribuované infrastruktury (s jednotným přístupem), která se zaměřuje na to, aby jazykové zdroje, technologie a odborné znalosti zpřístupnila nejen humanitním a společenským vědám (dále jen SHV), ale obecně všem výzkumným komunitám. +

+

+ Více o CLARIN ERIC na CLARIN-ShortGuide.pdf +

+
+
+
+

Pravidla použití služeb

+

+ Pro dosažení našeho poslání jsme stanovili některá základní nařízení prostřednictvím Pravidel pro použití služeb. Používáním repozitáře LINDAT/CLARIAH-CZ nebo použitím jakýchkoliv dat nebo služeb poskytovaných prostřednictvím LINDAT/CLARIAH-CZ souhlasíte s tím, že budete dodržovat podmínky obsažené ve výše uvedeném dokumentu. +

+

+ Data v repozitáři LINDAT/CLARIAH-CZ jsou k dispozici na základě licence uvedené u jednotlivých zdrojů (položek). Pokud zde licence uvedena není, data jsou volně k dispozici, a to jak pro přístup a tisk, tak také ke stažení pro účely nekomerčního výzkumu nebo pro soukromé studium. + + Uživatel musí v každé své publikaci pomocí stálého ("perzistentního") identifikátoru (PID, viz Pravidla pro citace) uvést, jaká data použil, dále musí uvést jejich původního autora a v případě potřeby také jejich vydavatele. Žádné položky nesmí být využívány roboty, s výjimkou dočasného zpracování pro fulltextové indexování nebo analýzy citací. Žádné položky nesmí být bez formálního souhlasu majitele autorských práv komerčně prodávány, jedině pokud je to výslovně dovoleno na základě licence uvedené u dané položky v repozitáři. +

+
+ +
+
+

O repozitáři

+

Repozitář je knihovna pro jazyková data a nástroje na zpracování textu. Umožňuje

+
    +
  • vyhledávání dat a nástrojů a jejich snadné stažení a
  • +
  • ukládání dat uživatelem s jistotou bezpečného uložení - všichni + je mohou najít, používat i správně citovat (čímž uživatel získá příslušný kredit).
  • +
+
+
+
+

O ÚFALu

+

+ Ústav formální a aplikované lingvistiky (ÚFAL) na informatické sekci Matematicko-fyzikální fakulty Univerzity Karlovy v České republice byl založen v roce 1990 jako pokračovatel činnosti v oblasti výzkumu a výuky prováděné od počátku 60. let bývalou Laboratoří algebraické lingvistiky nejprve na Filozofické fakultě a později na Matematicko-fyzikální fakultě Univerzity Karlovy. ÚFAL je v prvé řadě výzkumné oddělení pracující na mnoha tématech z oblasti počítačové lingvistiky, a na mnoha národních i mezinárodních výzkumných projektech. Nicméně Ústav formální a aplikované lingvistiky je také "regulérní" katedrou v tom smyslu, že zajišťuje komplexní výukový program, a to jak pro magisterské (Mgr.), tak pro doktorské (Ph.D.) studium počítačové lingvistiky. Oba programy jsou vyučovány v českém a anglickém jazyce. Ústav je také členem "Master's LCT programme" realizovaného v rámci EU, který uděluje dva magisterské tituly na obou školách, na kterých je student zapsán. Studenti ÚFALu mohou rovněž využívat program Erasmus pro studijní pobyty na partnerských zahraničních univerzitách. + +

+
+
+
+

Licenční ujednání a smlouvy

+

V současné době se rozlišují tři typy smluv.

+
    +
  • Při každém vložení dat vstupujeme s tím, kdo data vkládá ("vkladatelem") do standardního smluvního vztahu - jde o tzv. "Licenční ujednání", ve kterém popisujeme naše práva a povinnosti a vkladatel stvrzuje, že má právo svá data vložit. Zároveň nám dává právo tato data jeho jménem distribuovat prostřednictvím repozitáře LINDAT/CLARIAH-CZ.
  • +
  • Každý, kdo si data stáhne, je vázán licencí, která je k nim přiřazena. Pro stažení chráněných dat musí být uživatel identifikován jedním z ověřených způsobů a musí licenci elektronicky podepsat. Seznam všech licencí používaných v našem repozitáři lze nalézt zde.
  • +
  • Vkladatel má rovněž možnost zavést a následně nastavit pro vkládanou položku dat vlastní licenci, která bude po schválení administrátorem přidána do seznamu použitých licencí.
  • +
+
+
+
+

Práva k duševnímu vlastnictví

+

+Jak již bylo zmíněno v oddíle Licenční ujednání a smlouvy, požadujeme, aby vkladatel dat nebo nástrojů podepsal Licenční ujednání a smlouvu, v níž specifikujeme, že vkladatel má právo vložit data a dává nám (repozitáři) právo tato data jeho jménem distribuovat. To znamená, že vkladatelé vložením dat k nám do repozitáře nesou sami zodpovědnost za práva k duševnímu vlastnictví (IPR) ještě předtím, než v repozitáři jimi vložená data nebo nástroje dáme veřejně k dispozici (za jimi nastavených licenčních podmínek). +
+Pokud by někdo měl podezření, že některý z datových souborů nebo některé nástroje v našem repozitáři porušují práva k duševnímu vlastnictví, měl by nás okamžitě kontaktovat na Lince podpory. +

+
+
+ +
+

Pravidla uchovávání osobních údajů

+

Přečtěte si prosím naše Pravidla uchovávání osobních údajů, kde popisujeme, jak chráníme nutné osobní údaje shromážděné v LINDAT/CLARIAH-CZ repozitáři. +

+
+
+ +
+

Pravidla pro metadata

+

+ Aby byl ve vložených položkách dat a nástrojů "pořádek" a bylo je možné snadno najít, čímž chceme podpořit jejich distribuci, musí být doprovázeny dostatečným množstvím metadat popisujících obsah daných položek, jejich původ a formáty. Metadata jsou vždy volně přístupná a jsou distribuována ve veřejné doméně (jako CC0). Vyhrazujeme si však právo být informováni o komerčním využití metadat uložených v LINDAT/CLARIAH-CZ repozitáři, včetně popisu vašeho použití, a to na Lince podpory. +

+
+
+ +
+

Pravidla pro uchovávání dat

+

+ LINDAT/CLARIAH-CZ se zavázal k dlouhodobé péči o data a nástroje uložené v repozitáři a snaží se používat + nejlepší stávající osvědčené postupy v oblasti uchovávání digitálních záznamů, jak je stanovuje CLARIN, + OAIS a/nebo Univerzita Karlova. Viz Naše poslání. +

+

+ Abychom zůstali spolehlivým a důvěryhodným úložištěm, podstupujeme pravidelná hodnocení ze strany CLARIN ERIC a + CTS (dříve DSA). +

+

+ Abychom mohli plnit naše závazky, repozitář zajišťuje, že přijatá data mají licenci a pod touto licencí + je dále poskytuje (viz Licenční ujednání a smlouvy). Někdy + (u licencí, které nepovolují volný přístup) to znamená, že k datům mají přístup pouze oprávnění + uživatelé. +

+

+ Proces nahrání dat popsaný v Jak ukládat vaše data a práce našich editorů + zajišťuje, že data budou k nalezení prostřednictvím našeho vyhledávače, + externě přes OAI-PMH a v různých dalších vyhledávačích. Proto vyžadujeme detailní metadata. + Metadata jsou volně přístupná. +

+

+ Integritu přijatých dat a úplnost metadat ověřuje řada automatizovaných procedur. Na úrovni systému + používáme různé zálohovací strategie (včetně zálohování do jiné lokality) a hardware monitorujeme. Data + jsou dostupná online. +

+

+ Data i nástroje vnímáme jako hlavní výstupy výzkumu. Ke každému záznamu v repozitáři je přidělen + perzistentní identifikátor, který slouží jako trvalý odkaz. Uživatelé jsou vedeni k + jejich používaní. + Jednou zveřejněná data není možné měnit, vždy je potřeba vytvořit nový záznam. Oba záznamy (starý a nový) + jsou provázány odkazy (PID) v metadatech (viz nová verze). +

+

+ Pracovníci repozitáře se pravidelně účastní aktivit v rámci CLARIN, konference Open Repositories a + různých dalších konferencí, setkání a tréninků. Udržují si tak přehled o nových technologiích a + iniciativách. +

+

+ Námi používaný systém (DSpace) nabízí různé možnosti exportu, což zajistí, že v případě potřeby bude + data i metadata možné přesunout do jiného systému. +

+

+ Nahraná data by ideálně měla být v jednom z formátů, které doporučuje CLARIN, pokud to není možné, jsou + hlavní zásady výběru formátu následující: + Otevřené standardy jsou preferovány před proprietárními, formáty by měly být dobře zdokumentovány, ověřitelné a ověřené praxí. + Pokud je to možné, upřednostňují se textové formáty před binárními a v případě digitalizace analogového + signálu se doporučuje bezeztrátová nebo žádná komprese. + Preferované formáty se budou časem měnit, v takovém případě vynaloží repozitář veškeré úsilí k převodu + dat na nový formát. Originály budou pro účely reprodukovatelnosti zachovány beze změn (tj. pro nový + formát bude vytvořen nový záznam, který propojíme se starým). +

+

+ V případě ukončení financování bude obsah repozitáře převeden na jiné CLARIN centrum. Zatímco se bude + jednat o detailech tohoto přesunu (právní aspekty apod.), nabízí ÚFAL (jakožto hostitelská instituce) + časový rámec 10 let, během kterých zajistí přístup k datům. +

+
+
+ + +
diff --git a/src/static-files/cs/cite.html b/src/static-files/cs/cite.html new file mode 100644 index 00000000000..782e74bbdcf --- /dev/null +++ b/src/static-files/cs/cite.html @@ -0,0 +1,41 @@ +
+ +

Citace

+

Jsme pevně přesvědčeni, že data by měla být za všech okolností řádně citována. Máme proto k dispozici různá pravidla a vytváříme specifické uživatelské rozhraní (viz obrázek s příkladem Referenčního pole níže) usnadňující co nejsnazší a konzistentní postup při citování.

+

Zásady pro citování dat

+

CLARIN a samozřejmě i LINDAT/CLARIAH-CZ podporují Pravidla pro citování dat. Žádáme tedy všechny uživatele, aby správně citovali zdroje dat ve všech svých publikacích a výstupech. Také už jsme realizovali důležitá doporučení Pracovní skupiny RDA pro citování dat. Viz níže příklad automatické citace.

+

Citování pomocí systému Handle - systému stálých ("perzistentních") identifikátorů (PID)

+

Systém Handle poskytuje jedinečné a stálé ("perzistentní") identifikátory digitálních objektů. Používáme ho, abychom všem datům v našem repozitáři poskytli perzistentní identifikátor v podobě adresy typu URL, která vždy povede ke správným datům, i kdyby se tato data v budoucnu přesunula kamkoli jinam. Takto můžete systém PID bezpečně využívat například při citaci dat v publikacích. Systém PID je spolu s dalšími informacemi, jako jsou autoři, název a vydavatel, součástí Referenčního pole. +

+

+

Formáty exportovaných dat

+

Pro větší pohodlí jsme připravili konverzi a export citace v několika formátech, které lze snadno zkopírovat a vložit. Položku lze exportovat i do BibTeX formátu. Odkaz na export je uveden v Referenčním poli (viz obrázek nahoře). + Kliknutím na odkaz "BibTeX" se zobrazí formátovaný záznam pro BibTeX. +

+

+
diff --git a/src/static-files/cs/cookies.html b/src/static-files/cs/cookies.html new file mode 100644 index 00000000000..ccf747ad956 --- /dev/null +++ b/src/static-files/cs/cookies.html @@ -0,0 +1,33 @@ +
+ +

Cookies

+

+ Aby mohla tato stránka správně fungovat, občas ukládáme malé datové soubory, tzv. cookies, na vaše zařízení. Většina provozovatelů webových stránek to dělá také. +

+ +

+ Evropská směrnice 2009/136/EC nám dovoluje ukládat cookies, které jsou nezbytné pro provoz těchto stránek. Pro ostatní cookies potřebujeme vaše svolení. +

+ +

Co jsou cookies?

+

+ Cookie jsou data, která prohlížeč na žádost webové stránky uloží na vašem zařízení (např. počítači, telefonu nebo tabletu). + Cookie umožňuje webové stránce pamatovat si vaše akce (např. přihlášení) a předvolby (např. jazyk, velikost písma apod.). + Díky tomu je nemusíte při dalších návštěvách ani při přechodu ze stránky na stránku znovu zadávat. + Většína prohlížečů cookies podporuje, ale uživatelé mají možnost nastavit prohlížeč tak, aby je nepřijímal. Máte také možnost je kdykoliv smazat. +

+ +

Jak cookies používáme?

+

Cookies nezbytné pro provoz

+

DiscoJuice a Shibboleth používají cookies pro zapamatování volby IDP a session id.

+

Google Analytics

+

Tyto stránky posílají cookie Americké společnosti Google, je to součást služby 'Analytics'. Tuto službu využíváme k analýze, jak návštěvníci naše stránky používají. Google tyto informace poskytuje třetím stranám, má-li zákonnou povinnost tak činit, nebo pokud třetí strany zpracovávají tyto informace jeho jménem. Tato činnost je mimo náš vliv. Takto získané informace by neměly být používány v žádných dalších službách Google.

+

Takto sbírané informace zůstavají anonymní, kdekoliv je to možné. Vaše IP adresa není explicitně uváděna. Informace jsou uchovávány na serverech Google ve Spojených státech. Google dodržuje zásady Safe Harbor (bezpečného přístavu), programu Amerického ministerstva obchodu. To znamená vhodnou úroveň ochrany při zpracování jakýchkoli osobních údajů.

+

Piwik

+

Webová stránka používá Piwik, otevřenou platformu webové analytiky, k sbírání statistik. Piwik ukládá cookies na vaše zařízení, ale nesbírá žádná osobní data. Anonymní id umožní platformě identifikovat vaši session, toto id nelze použít k identifikaci jednotlivých uživatelů, má význam jen v rámci platformy.

+ +

Kontrola cookies

+

Cookies můžete kontrolovat a případně i smazat, pro detailnější informace navštivte aboutcookies.org. Můžete smazat všechny cookies, které byly uloženy na vašem zařízení a většinu prohlížečů můžěte nastavit tak, aby bránily ukládání cookies. Pokud to ale uděláte, budete muset neustále měnit některé předvolby a můžete příjít o některé funkce.

+ + +
diff --git a/src/static-files/cs/deposit.html b/src/static-files/cs/deposit.html new file mode 100644 index 00000000000..c071f07853e --- /dev/null +++ b/src/static-files/cs/deposit.html @@ -0,0 +1,136 @@ +
+ + +

Jak ukládat vaše data

+
Ukládat data mohou jen ověření uživatelé. Pokud nemůžete najít svou domovskou organizaci + v dialogovém okně 'Přihlásit se' - 'Seznam organizací', pak se zaregistrujte na clarin.eu + a za pomoci "clarin.eu website account" se autentizujte (nalogujte). Pokud nemůžete použít žádnou z uvedených autentizačních metod nebo pokud narazíte na problém, neváhejte nás kontaktovat na + Lince podpory a my pro vás vytvoříme místní účet.
+
+ Návod níže popisuje přidání nového záznamu, pokud nahráváte novou verzi záznamu dostupného v repozitáři, jsou + k dispozici + detailnější instrukce. +
+
+

Krok 1: Přihlášení

+

Chcete-li zahájit vložení nové datové položky, musíte se nejprve přihlásit. Klikněte na 'Přihlásit se' pod 'Můj účet' v menu na pravé straně.

+ +
+ +
+

Krok 2: Zahájení vkládání nové položky dat

+

Nyní máte novou položku v menu 'Uložení dat' pod 'Můj účet'. Klikněte na 'Uložení dat' a přejděte na obrazovku pro uložení dat.

+ +

Nyní byste měli být na hlavní stránce pro uložení dat, kde se můžete dívat na svá neúplná/archivní uložená data. Klikněte na odkaz 'Zahájit nové uložení dat' pro zahájení vkládání nové datové položky.

+ +
+ +
+

Krok 3: Vyberte druh dat

+

Zahájili jste vkládání nové položky dat. V následujících několika krocích budete poskytovat podrobnosti o nové položce a nahrávat vaše soubory s daty. Nejprve vyberte druh dat, která chcete uložit.

+ +

Klikněte na jedno z tlačítek, např. 'Korpus'. Pokračujte podáním základních informací, jako je název vkládané položky. Klikněte na 'Další' pro pokračování.

+
+ +
+

Krok 4: Popište svou vkládanou položku

+

V následujících dvou krocích poskytnete víc detailů o své položce. Nejprve popište osoby, organizaci a projekty spojené s vkládanou datovou položkou.

+ +

Dále přidejte svůj popis, vyplňte jazyk atd.

+ +

Po vyplnění potřebných informací klikněte na tlačítko 'Další' pro nahrání souborů.

+
+ +
+

Krok 5: Nahrávání souborů

+

V tomto kroku budete nahrávat soubory, které jsou součástí vámi ukládaných dat. Pokud žádné soubory nemáte, můžete tento krok přeskočit kliknutím na 'Další'. Soubory lze přidat kliknutím na tlačítko 'Procházet' nebo můžete soubory přetahovat do šedé oblasti s textem 'Přetáhněte soubory sem'.

+ +

Výběrem nahrávání souborů se otevře dialogové okno, v němž můžete zadat popis každého souboru. Chcete-li zahájit nahrávání souboru, klikněte na tlačítko 'Začít nahrávání'.

+

Jakmile je nahrávání souboru(ů) ukončeno, zmáčkněte tlačítko 'OK' pro uzavření dialogového okna. Nyní můžete buď přidat další soubory nebo můžete smazat či upravit již ty nahrané. Jakmile práci s datovými soubory dokončíte, stiskněte tlačítko 'Další' a můžete pokračovat výběrem licence.

+
+ +
+

Krok 6: Výběr licence

+

Pokud nahrajete alespoň jeden soubor, musíte v tomto kroku vybrat licenci, pod kterou chcete, aby byla vaše data distribuována (data bez licence jsou nepoužitelná, protože uživatel by nevěděl, za jakých podmínek je může používat!) + Prosím přečtěte si pečlivě Smlouvu o distribuci dat a klikněte na červené políčko na znamení souhlasu se smlouvou (po kliknutí červené políčko zezelená). +

+ Jakmile se rozhodnete pro příslušnou licenci, vyberte ji z rozevíracího (dropdown) seznamu. + + nebo použijte OPEN License Selector, který vám pomůže vybrat licenci kladením otázek týkajících se vámi vkládaných datových položek. + + Pokud žádná z nabízených licencí nevyhovuje vašim potřebám, obraťte se prosím na naši + Linku podpory.

+ +
+

Pro sady dat, které vyžadují podpis licence

+ + I když upřednostňujeme otevřený přístup k datům a otevřený (open source) software, jsme si vědomi toho, že takový přístup není vždy reálný. + Můžeme zaručit, že uživatelé musí pro stahování vašich dat podepsat licenci. + (viz Vkládání dat s omezeními). + Pokud o uživatelích potřebujete více informací než to, že jsou ověřeni univerzitou (nebo podobnou institucí), můžeme požádat o některá další specifická ověření podobná standardním webovým formulářům. To dává smysl hlavně pro data s licencí, která obsahuje podmínku "nemožnosti další distribuce". +
+ +

Pro pokračování klikněte na 'Další'.

+
+ +
+

Krok 7: Zanechte poznámku

+

V tomto kroku můžete zanechat poznámku pro "redaktory" repozitáře LINDAT/CLARIAH-CZ, kteří budou datovou položku definitivně schvalovat pro uveřejnění.

+
+ +
+

Krok 8: Zkontrolujte uložení svých dat

+

V tomto kroku zkontrolujete uložení svých dat před jejich vložením. Kontrolní stránka obsahuje dílčí kontrolní postup pro každý z dříve vyplněných kroků. Pokud chcete změnit jakoukoli položku v příslušném kroku, klikněte na 'Opravit' u jakékoli z nich a dostanete se tak na příslušnou stránku daného kroku. Po ověření všech detailů lze provést uložení datové položky kliknutím na 'Dokončit uložení', nebo lze kliknout na 'Uložit & Konec' pro uložení dat, ke kterým se chcete ještě vrátit později.

+
+ +
+

Krok 9: Odeslání dat ke kontrole

+

Jakmile v kontrolním kroku kliknete na 'Dokončit uložení datové položky', položka bude vložena a bude k dispozici redakční kontrole. Poté, co redaktoři LINDAT/CLARIAH-CZ položku schválí, objeví se v repozitáři a bude tak zpřístupněna veřejnosti za podmínek definovaných licencí, kterou jste pro tuto položku vybrali v průběhu vkládání. + V případě jakéhokoliv dotazu ohledně uložení dat vás bude redakce LINDAT/CLARIAH-CZ kontaktovat a vyžádá si další podrobnosti.

+
+
diff --git a/src/static-files/cs/error.html b/src/static-files/cs/error.html new file mode 100644 index 00000000000..a2c52cd62eb --- /dev/null +++ b/src/static-files/cs/error.html @@ -0,0 +1,39 @@ +
+ + +
+
+

+   Error +

+
+
+
+ + Nahrávám detaily chyby... +
+
+
+
+
+ + + + + +
diff --git a/src/static-files/cs/faq.html b/src/static-files/cs/faq.html new file mode 100644 index 00000000000..1849ae6332a --- /dev/null +++ b/src/static-files/cs/faq.html @@ -0,0 +1,220 @@ +
+ +

Často kladené dotazy

+ +
+ +
+ +
+

Co je repozitář?

+

Repozitář je knihovna pro jazyková data a nástroje na zpracování textu. Umožňuje

+
    +
  • vyhledávání dat a nástrojů a jejich snadné stažení a
  • +
  • ukládání dat uživatelem s jistotou bezpečného uložení - všichni je mohou najít, používat i správně citovat (čímž uživatel získá příslušný kredit).
  • +
+
+ +
+

Jaké příspěvky přijímáme?

+

Přijímáme jakákoli jazyková data a/nebo NLP data a nástroje: korpusy, anotované korpusy, slovníky, ale také natrénované jazykové modely, parsery, taggery, systémy strojového překladu, jazykové webové služby apod. +Přísně nevyžadujeme, abyste nahráli samotná data, i když je to vždy lepší udělat. V případě potřeby, si můžete uložit pouze samotná metadata. + Podporujeme také podpis licence on-line cestou pro okamžitou možnost získání zdrojů s omezenou dostupností.

+

+ Při nahrávání jazykových zdrojů zkuste prosím použít některý z doporučených formátů, uvedených v LRT Standardech. +

+
+ +
+

Musím si vytvořit účet, abych mohl stahovat nebo ukládat data?

+
    +
  • Bez jakýchkoli problémů si můžete stáhnout data a nástroje s licencí, která umožňuje bezplatné a volné sdílení. Pouze si přečtěte licenci a stahujte. To se týká všech dat s licencí Creative Commons a dat s lincencí s otevřeným přístupem. + +
  • +
  • +Pro stahování dat a nástrojů, které vyžadují podepsání licence, se musíte přihlásit. Přihlásit se musíte také v případě, že chcete vložit příspěvek (datovou položku). Pokud jste z akademického prostředí, pravděpodobně nebudete ani potřebovat nový účet.
  • +
  • Klikněte na "Přihlásit se" a vyhledejte + svou akademickou instituci. Pro přihlášení můžete použít libovolný účet s poskytovatelem identity, který je členem EduGAIN federace a je v našem seznamu.
  • +
  • Dejte nám vědět, pokud nemáte akceptovaný nebo platný akademický účet.
  • +
+
+ +
+

Ukáže se mi chyba při přihlašování

+

Máte-li problém s přihlášením, dejte nám prosím vědět přes naši Linku podpory.

+

Čas od času (obvykle jste-li první, kdo se přihlašuje přes svou domovskou instituci), můžete vidět následující chybu "Ověřování bylo úspěšné; nicméně váš poskytovatel identity neposkytl ani váš e-mail, eppn ani požadované id." To znamená, že vaše domovská instituce nám o vás neposlala dostatek údajů, na jejichž základě bychom pro vás mohli provozovat naše služby. Uvedené údaje žádáme proto, abychom vás chránili. Požadujeme pouze email a řídíme se Kodexem chování pro ochranu dat, který nám pomáhá přesvědčit vaši domovskou instituci. Vaše osobní údaje v žádném případě nejde zneužít.

+

Máte-li účet u více poskytovatelů a přihlásíte-li se pokaždé s jiným, může se zobrazit následující chyba "Váš e-mail je již spojen s jiným uživatelem.". Prosím, zkuste používat vždy stejného poskytovatele, pokud to není možné, dejte nám vědět a my změníme jeho výchozí nastavení.

+
+ +
+

Proč bych měl ukládat data do repozitáře?

+
    +
  • Je to zadarmo a vysoce bezpečné.
  • +
  • Respektujeme vaše licence. Podporujeme myšlenku "data zdarma" (Open Access) a věříme, že je prospěšná nejen uživatelům dat, ale i jejich poskytovatelům. Nicméně pracujeme také s více či méně uzavřenými daty - repozitář poskytuje mechamismus podepisování licencí jako podmínku +stahování dat; pokud takový mechanismus nutně potřebujete, je možné jej použít.
  • +
  • Data jsou široce dostupná a indexovaná, takže dostanete maximální kredit za vaši práci s přípravou dat + (google, VLO, DataCite, OLAC, Data Citation Index, arXive).
  • +
  • Data lze snadno citovat. Poskytujeme ready-to-use + citace na jeden klik v BibTex formátu, v RIS formátu a dalších populárních citačních formátech. + Všechny citace obsahují stálý odkaz vytvořený z trvalých ("perzistentních") identifikátorů (pro PID používáme systém Handle). + Tyto PID identifikátory jsou i z hlediska budoucnosti bezpečné.
  • +
  • Pro některá data, např. text, korpusy nebo anotované korpusy, nabízíme dodatečné služby, jako fultextové textové hledání nebo vyhledávání ve stromových strukturách (treebancích) pomocí speciálních dotazů.
  • +
+
+ +
+

Proč bych měl ukládat nástroje do repozitáře?

+
    +
  • Viz "Proč bych měl ukládat data do repozitáře?" Vše, co se vztahuje na data, platí i pro nástroje.
  • +
  • Stačí, když s naším repozitářem propojíte (jednodychým URL odkazem) svůj systém pro kontrolu verzí (svn, git), + je-li veřejně přístupný. Můžete také odkazovat na svou stránku projektu nebo stránku, na níž máte demo. +
  • +
+
+ +
+

K čemu je dobrý systém Handle (PID)?

+

Je to specifická permanentní adresa typu URL. Poskytuje stálý odkaz, který bude fungovat správně, i když budou data v nějaké vzdálené budoucnosti přesunuta. Z tohoto důvodu by se měla v citacích používat právě permanentní adresa typu URL.

+
+ +
+

Jaký je vlastní postup ukládání dat a jejich archivace?

+

V průběhu ukládání digitálních jazykových zdrojů do repozitáře procházejí data kurátorským procesem s cílem zajistit jejich kvalitu a konzistenci. + Pomůžeme vám při plnění nezbytných požadavků na dlouhodobou archivaci zdrojů. Data musí být především opatřena metadaty ve standardních formátech + přijatých příslušnými komunitami; musí být opatřena perzistentními identifikátory (PID), musí u nich být vyřešeny otázky práv k duševnímu vlastnictví, musí být opatřena jasnými prohlášeními ohledně udělování licencí a také musí být správně ošetřeno, pokud jste vkládaná data vytvořili za použití dalších zdrojů. +Vkladatel musí elektronicky podepsat licenci (smlouvu) o ukládání dat, čímž potvrzuje, že je držitelem práv k datům, a že má právo udělovat práva uvedená v licenci přiřazené k těmto datům vkladatelem. + Jakmile jsou data po kontrole uložena v repozitáři, je jim přiřazen PID jako trvalý odkaz.

+
+ +
+

Co když chci/potřebuji aktualizovat archivovaná data?

+

Každá změna zdrojů a metadat by měla být uložena jako nová verze s novým PID. + Nicméně v případě, že změny jsou minimální (např. překlepy nebo jasné chyby), obraťte se na naši Linku podpory a uveďte PID daného uložení dat a změny, které chcete zanést. Je na redakci repozitáře rozhodnout, zda tyto vaše změny bude možno redakcí provést, nebo zda vás požádáme o vložení nové verze příspěvku jako nové položky.

+
+ +
+

Co když chci v budoucnu svá data odstranit? Mohu je smazat?

+

Ano, v tomto případě kontaktujte naši Linku podpory a uveďte PID příspěvku a důvod odstranění dat. + Referenci o tom, že data byla v našem repozitáři uložena (protože byl vydán trvalý identifikátor - PID), budeme ovšem archivovat; +administrativní metadata budou zachována a my tak budeme vědět, že vlastní data byla odstraněna.

+
+ +
+

Začali jsme budovat náš vlastní repozitář, můžeme nějak přesunout data uložená v LRT kolekci?

+

Můžeme vytvořit stínovou stránku přesunutých dat a můžeme na ni přidat upozornění o tom, že zdrojová data jsou nyní přesunuta na nové místo. + Data tak budou v našem repozitáři skryta a nepůjde v nich ani hledat, ani je nebude možné procházet a používat (např. přes OAI-PMH), jejich PID však stále existuje. + PID však po přesunu dat odkazuje jen na datovou položku v našem repozitáři (a metadata tam uložená), nikoli na skutečná data. + Pro více podrobností se prosím obraťte na Linku podpory.

+
+ +
+

Nechci/nemohu mít data veřejně dostupná, anebo je nemohu uveřejnit po určitou dobu. Budete je moci archivovat i za těchto podmínek?

+

V souladu s ideou výzkumných infrastruktur a s obecným postojem k otevřenému přístupu (Open Access) důrazně vybízíme producenty dat, aby byli maximálně otevření. + + Za určitých okolností však můžeme přistoupit na vložení vašich dat, i když nebudou veřejně dostupná nebo nebudou dostupná hned. Pokud vkládáte taková data a nenajdete-li vhodnou licenci v našem seznamu, obraťte se prosím ještě před dokončením procesu ukládání dat na naši Linku podpory.

+
+ + +
+

Jak citovat příspěvek?

+

Viz naše pravidla.

+
+ +
+

Pokud uložím data v repozitáři, jak jsou zabezpečena?

+

Zcela bezpečná, pravděpodobně mnohem bezpečnější než ve vašem počítači. V našem repozitáři platí následující pravidla bezpečnosti dat:

+
    +
  • Všechna data v repozitáři mají ještě lokální záložní kopii.
  • +
  • Existuje ještě další kopie, která je mimo repozitář, takže i úplné zničení naší budovy nezničí data.
  • +
  • Pravidelně kontrolujeme všechny kopie, a pokud u kterékoli z nich dojde k poškození, smažeme ji a vytvoříme novou.
  • +
  • Uchováváme nejméně tři kopie, přičemž jedna z nich je za všech okolností uchovávána mimo fyzické umístění repozitáře.
  • +
+
+ +
+

Jakou licenci si mám pro svá data/nástroje vybrat?

+

+ Doporučujeme používat bezplatnou, otevřenou licenci. Reprezentativní výběr bezplatných +licencí na sofwarové nástroje a CC licencí (vhodnějších pro data) je +k dispozici přímo během ukládání dat. Máme k dispozici OPEN License Selector, který vás provede výběrem vhodných licencí.
+ Pokud potřebujete z určitých důvodů jinou licenci, kontaktujte nás. +

+
+ +
+

Kde najdu více informací o podporovaných licencích?

+

+ Seznam licencí, které jsou v současné době podporovány, najdete zde. + Pokud potřebujete jinou licenci (např. s elektronickým podpisem apod.), neváhejte nás kontaktovat. + V případě odůvodněné potřeby jsme schopni přidat do seznamu licencí i takové licence, které jsou doprovázeny různými požadavky, např. omezení na přihlášené uživatele, plnění dalších podrobností (účel) apod. +

+
+ +
+

Proč upřednostňujeme skutečné autory před institucemi?

+

+ Není to o kontaktu, je to věc citací, kreditu a důvěry. Proto máme samostatná metadata pro autory a pro kontaktní osoby. +Kontakt na "institucionální" Linku podpory pro vaše data je skvělý, ale zároveň je nutné citovat autory dat a vědeckých prací. Náš repozitář dává přednost přímým citacím dat + (https://www.force11.org/datacitation). + Proto jim udělujeme PID identifikátory, vytváříme formátované citace atd. To je také důvod, proč chceme v metadatech mít přímo autory dat. Ti získají citace svých děl a ostatní vědci zas na oplátku budou vědět, na čí práce spoléhají. +

+
+ +
+

Jak získám co nejvíce vyhledávek?

+

+ Na rozdíl od jiných vyhledávačů v metadatech ten náš používá OR coby defaultní operátor; viz příklady níže. Pokud nebudete spokojeni s výsledky svých vyhledávek, budete možná chtít jít nad rámec prostého textového vyhledávání stylem online vyhledávačů. + Můžete vyhledávat pouze v některých polích metadat, používat negaci a mnoho dalších možností. + V repozitáři používáme vyhledávač SOLR, takže pokud znáte jeho syntax, používejte ji, nebo si ji vyhledejte v dokumentaci. +

+

Příklady

+

+

+ +
PDT wordnet vs PDT AND wordnet
+
Defaultním operátorem je OR; tj. první příklad hledá PDT OR wordnet ve všech textových polích.
+
dc.title:P?T && -dc.title:WordNet
+
Vrátí všechny položky, které mají P?T v názvu - ? zastupuje jakýkoli znak (např. PDT) - a nemají v názvu WordNet
+
dc.title:"Czech WordNet"
+
Použijte uvozovky (") pro přesné shody nebo pro víceslovné výrazy
+
autor:(Bojar && -Tamchyna) && (dc.language.iso:(ces AND eng) OR language:(czech AND english))
+
Hledejte položky od jednoho autora a ne od jiného; zajímavé jsou jen ty položky, které jsou v českém a zároveň anglickém jazyce (např. paralelní korpus).
+
+

+
+
+

Nová verze/změny v datech

+

Jak se můžete dočíst v jiných částech nápovědy k repozitáři, neumožňujeme měnit zveřejněná data. Je + potřeba vytvořit nový záznam (verzi). +

+
+
+ diff --git a/src/static-files/cs/item-lifecycle.html b/src/static-files/cs/item-lifecycle.html new file mode 100644 index 00000000000..69f28a76c02 --- /dev/null +++ b/src/static-files/cs/item-lifecycle.html @@ -0,0 +1,68 @@ +
+ +

Životní cyklus položek v repozitáři

+ +
+ +
+ +
+

Nově vložené příspěvky

+

Jakmile příspěvek vložíte, je zařazen do kolekce všech vložených příspěvků. Příspěvek zatím není veřejně přístupný a čeká, až ho redaktor schválí (nebo zamítne). +

+
+ +
+

Příspěvky procházející kontrolou

+

Úkolem redaktora repozitáře je ověřit, zda příspěvek splňuje naše požadavky ohledně kvality a úplnosti metadat, konzistence souboru(ů) s daty a ohledně práv k duševnímu vlastnictví (IPR). Redaktor může příspěvek autorovi (vkladateli příspěvku) vrátit a popíše mu, jaké změny v příspěvku požaduje. Tento krok se opakuje, dokud redaktor příspěvek neschválí. Ze schváleného příspěvku se pak stane příspěvek publikovaný. +

+
+ +
+

Publikované příspěvky

+

Publikovaný příspěvek získá PID (trvalý "perzistentní" identifikátor), který se používá pro reference a citace, např. + http://hdl.handle.net/11858/00-097C-0000-0022-F59C-8. LINDAT repozitář zajistí, že PID (přesněji řečeno, pro PID používáme http proxy) vždy povede na platnou webovou stránku (i v případě, že současná infrastruktura serveru bude změněna nebo přesunuta jinam). +

+ +

+ +Publikované příspěvky jsou k dispozici v našem vyhledávacím rozhraní, v režimu prohlížení. Metadata všech datových položek jsou zpřístupněna obecným internetovým vyhledávačům a jsou také k dispozici prostřednictvím protokolu OAI-PMH (mnohé instituce využívají náš repozitář právě pro získání a agregaci uložených metadat), např. http://catalog.clarin.eu/vlo/). Prostřednictvím protokolu OAI-ORE jsou k dispozici rovněž datové soubory veřejných příspěvků (pro data s omezeným přístupem viz Příspěvky s omezeními). +

+
+ + +
+

Mazání a úprava publikovaných příspěvků

+

O vymazání publikovaných příspěvků může požádat kdokoli; ale jednotlivé žádosti budou vyhodnocovány případ od případu. + Vyhrazujeme si právo ponechat metadata publikovaných příspěvků k dispozici v případě, že neexistuje žádný zvláštní důvod, proč je odstranit. Takový postup by byl proti pojetí persistentních identifikátorů - PID. + Všechny identifikátory PID zůstávají i po vymazání příspěvku k dispozici přes systémové rozhraní OAI-PMH, i když pak lze získat jen informaci o tom, že příspěvek byl vymazán. +

+ +

Přes naši Linku podpory umožňujeme provést drobné změny v příspěvcích (např. opravu překlepů v dokumentaci). I zde záleží na konkrétním případu a rozsahu změny. + Pokud jde o větší změny, vkladatel příspěvku je obvykle vyzván, aby předložil + novou verzi + příspěvku. Zároveň zařídíme, aby z metadat původní položky vedl odkaz na novou verzi, a původní položka bude pak označena jako "zastaralá". +       +

+
+ +
+

Příspěvky s omezeními

+

Pokud není možné, obvykle z důvodu nejasného nebo omezeného právního statusu části dat, která ukládáte do repozitáře, přiřadit datům nebo nástroji otevřenou licenci, je možné dohodnout takovou restriktivní (omezenou) licenci, která bude vyžadovat explicitní souhlas uživatele s jejími podmínkami. Zdůrazňujeme, že toto nelze aplikovat na metadata položky - ta jsou vždy veřejně a otevřeně dostupná. + Podporujeme tedy i takové restriktivní licence pro balíčky souborů s daty, které vyžadují před stahováním "elektronický podpis." + Tyto elektronické podpisy uchováváme pro případy sporů o porušení práv k duševnímu vlastnictví.

+ +

Podívejte se na licence, které jsou v současné době k dispozici, nebo nás kontaktujte, pokud budete chtít nějakou speciální licenci přidat. +

+ +

Podporujeme také (dočasné) embargo na balíčky souborů s daty, což znamená, že je zpřístupňujeme veřejnosti až po určité době, kterou můžete při vkládání nastavit.

+
+ +
+ diff --git a/src/static-files/cs/metadata.html b/src/static-files/cs/metadata.html new file mode 100644 index 00000000000..18d425c1503 --- /dev/null +++ b/src/static-files/cs/metadata.html @@ -0,0 +1,166 @@ +
+ +

O metadatech

+

Tato stránka poskytuje informace o tom, jaká metadata používáme (a tedy požadujeme po vkladatelích dat) a jak je zpřístupňujeme. Metadata jsou volně přístupná a jsou distribuována ve veřejné doméně pod CC0. Vyhrazujeme si ale právo být na naší Lince podpory informováni o komerčním využití všech metadat z LINDAT/CLARIAH-CZ repozitáře, včetně podrobného popisu jejich použití.

+ +
+ +
+
+

Formáty metadat

+

+ Během procesu vkládání příspěvku musí vkladatelé vyplnit také metadata, která jsou nedílnou součástí vloženého příspěvku (dat, nástrojů nebo služeb). Jsme schopni šířit metadata v různých formátech, včetně (a nejenom) CMDI a oai_dc. Viz úplný seznam podporovaných formátů. Je třeba mít na paměti, že některé formáty nemusí být použitelné pro všechny položky. Různé formáty nám pomáhají zpřístupnit tato metadata (a tedy "zviditelnit" příslušné položky) ve velkém množství agregátorů, specializovaných portálů i běžných vyhledávačů. +

+

CMDI

+

+ Podívejte se na úvod do CLARINovských komponent metadat, kde získáte více informací k tomuto tématu. +

+

+ Naše současné příspěvky dodržují clarin.eu:cr1:p_1403526079380 schéma. Část starších příspěvků (v podstatě všechny ty, které byly vloženy před zářím/říjnem 2014) používá jiné schéma clarin.eu:cr1:p_1349361150622. Nové schéma jsme vytvořili proto, abychom vkladatelům zjednodušili a zpřehlednili postup vyplňování metadat. Původní schéma kombinovalo složku OLAC a MetaShare. Toto schéma nás nutilo zvládat duplicity a také nás činilo závislými na cizím schématu matadat a jeho sémantice, které jsme nemohli ani ovlivnit, ani měnit. +

+

+ Obě schémata jsou poměrně dobře pokryta odkazy na registr konceptů (základních pojmů a definic). Nyní zastaralé odkazy ISOcat DCR byly přesměrovány na CCR a odkazy na schémata komponentů OLAC byly přesměrovány na DCMI terms schémata (např. odkaz na abstrakty je na http://purl.org/dc/terms/abstract). VLO nepoužívá tato specifická schémata při svých mapováních a spíše mapuje cesty uvnitř jednoho konkrétního schématu. Jen pro některé specifické položky bylo toto mapování cest rozšířeno, aby fungovalo také s komponentou tohoto schématu. Dalším důvodem pro vytvoření vlastního schématu byla skutečnost, že DC (Dublin Core) koncepty byly stále příliš široké. +

+

Podporujeme příspěvky s libovolnými CMDI soubory metadat, které se používají v OAI-PMH, pokud je pro metadata požadováno schéma CMDI.

+

Požadavky ve výše uvedených odstavcích by vás mohly odradit od opakovaného použití clarin.eu:cr1:p_1349361150622. Pro opakované použití jeho specifických komponent ale nezapomínejte, co již bylo o mapování VLO řečeno. clarin.eu:cr1:p_1403526079380 s mapováním VLO již počítal při svém vzniku (i když to se může změnit), ale dosud stále odráží náš pohled na svět (jazykových zdrojů) a konkrétní případy použití. Pokud nemáte specifické potřeby, může být toto schéma pro vás dostačující, nebo může být základem pro vaše vlastní schéma.

+

oai_dc

+

oai_dc je formát, který je vyžadován schématy OAI-PMH. Mapování našich příspěvků na tento formát vysvětlujeme v sekci o mapování.

+
+
+
+

Vložená metadata

+

Následující seznam je výčtem polí, která požadujeme v průběhu vkládání příspěvků (v seznamu může v budoucnu dojít ke sporadickým změnám). + Metadata jsou ukládána v angličtině. Existují jemné rozdíly v závislosti na typu zdroje, který je ukládán do repozitáře. Ne všechna pole se týkají všech formátů. Některá pole jsou generována automaticky (např. jména jazyků čitelná pro člověka obsahují ve skutečnosti iso kódy, jiné mohou obsahovat identifikátory a jiné údaje).

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
Jméno polePopisStatus
TypTyp zdroje: "Korpus" odkazuje k textovým, mluveným a multimodálním korpusům. + "Lexikální koncepční zdroj" zahrnuje lexikony, ontologie, slovníky, seznamy slov apod. + "Popis jazyka" pokrývá jazykové modely a gramatiky. + "Technologie / nástroje / služby" se používá pro nástroje, systémy, systémové komponenty atd.vyžadováno
NázevHlavní název položky.vyžadováno
URL projektuURL zdroje/projektu vztahující se ke vkládané položce (např. stránka projektu). Specifikováno reg. výrazy (začíná písmeny http/https)specifikováno reg. výrazy
URL demoverzeUkázky, vzorky nebo (v případě nástrojů) např. URL vzorku výstupu. Specifikováno reg. výrazy (začíná písmeny http/https)specifikováno reg. výrazy
Datum vydáníDatum vydání příspěvku, pokud existuje, např. 2014-01-21 nebo alespoň rok.vyžadováno
AutorJména autorů položky. U kolekcí (např. korpusů nebo jiných větších databází textu nebo u jiných velkých databází textu) obvykle chcete uvádět jména všech osob zapojených do sestavování kolekce, ne autory jednotlivých částí. Jméno osoby je uloženo jako příjmení, čárka, další jména nebo části jména (např. "Smith, John Jr.").vyžadováno opakovatelně
VydavatelNázev organizace/subjektu, která publikovala předchozí verzi(-e) dané položky, nebo název vaší domovské instituce.vyžadováno opakovatelně
Kontaktní osobaOsoba, kterou je možné kontaktovat v případě problémů s příspěvkem. Někdo, kdo je schopen podat informaci o zdroji, např. jeden z jeho autorů nebo "vkladatel" příspěvku. Tento údaj je uložen jako strukturovaný řetězec obsahující jméno, příjmení, e-mail a domácí organizaci.vyžadováno opakovatelně
FinancováníSponzoři a financování podporující vkládaný příspěvek + Tento údaj je uložen jako strukturovaný řetězec obsahující jméno projektu, kód projektu, organizaci provádějící financování, typ financování (vlastní/národní/EU/...) a OpenAIRE identifikátor (který je uložen také v dc.relation)opakovatelně
PopisTextový popis příspěvku (celé položky).vyžadováno
JazykJazyk(y) hlavního obsahu položky. Uloženo jako ISO 639-3 kód. Vyžadováno pro korpusy, lexikální koncepční zdroje a popisy jazyka.opakovatelně vyžadováno v závislosti na typu položky
Klíčová slovaKlíčová slova nebo fráze týkající se předmětu položky.opakovatelně vyžadováno
VelikostRozsah předložených údajů, např. počet tokenů, nebo počet souborů.opakovatelně
Typ médiaTyp média hlavního obsahu položky, např. text nebo zvuk. Rozevíratelý (dropdown) výběr, vyžadováno pro korpusy, lexikální koncepční zdroje a popisy jazyka.rozevíratelý (dropdown) výběr vyžadováno v závislosti na typu položky
Detailní typDalší klasifikace zdroje. Rozevíratelý (dropdown) výběr, vyžadováno pro korpusy, lexikální koncepční zdroje a popisy jazyka.rozevíratelý (dropdown) výběr vyžadováno v závislosti na typu položky
Jazykově závisléLogická hodnota indikující, zda popsané nástroje/služby jsou jazykově závislé nebo ne. Povinné pro nástroje. vyžadováno v závislosti na typu položky
+
+
+
+

Mapování metadat

+

Následující tabulky obsahují mapování příspěvků mezi oai_dc, a uvádějí také některé z důležitých automaticky generovaných polí.

+ + + + + + + + + + + + + + + + + + + + + +
Pole příspěvkuNamapované pole
Typdc.type
Názevdc.title
URL projektudc.source
URL demoverzenemapováno
Datum vydánídc.date
Autordc.creator
Vydavateldc.publisher
Kontaktní osobanemapováno
Financovánínemapováno
Popisdc.description
Jazykdc.language
Klíčová slovadc.subject
Velikostnemapováno
Typ médianemapováno
Detailní typnemapováno
+ + + + + + + + +
Generované polePopis
dc.identifikátorPID (v současnosti systém handle) zdroje.
dc.právaOpakovatelné pole může obsahovat název licence, pod kterou je zdroj distribuován, URL odkaz k plnému textu licence a takzvaný obecný licenční typ (PUB, ACA, RES)
+
+
diff --git a/src/static-files/deposit.html b/src/static-files/deposit.html new file mode 100644 index 00000000000..e11af3c4f20 --- /dev/null +++ b/src/static-files/deposit.html @@ -0,0 +1,150 @@ +
+ + +

How to Deposit

+
Only authenticated users can deposit items. If you cannot find your home organisation in the + Login dialog list of organisations then register at clarin.eu + and authenticate using "clarin.eu website account". In case you cannot use any authentication method above or + if you encounter a problem, do not hesitate to + contact our Help Desk and we can create a local account for you. +
+
+ The guide below describes new submissions, if what you plan to submit is a new version of a resource + already available in the repository see the + new version guide. +
+
+

Step 1: Login

+

To start a new submission you have to login first. Click Login under My Account in the right menu panel.

+ +
+ +
+

Step 2: Starting a new submission

+

Now you have a new menu item 'Submissions' under My Account. Click on Submissions to go to the Submissions screen.

+ +

Now you should be on the main Submission and Workflow tasks page where you can view your incomplete/archive submissions. Click on the 'Start another submission' link to start a new Submission.

+ +
+ +
+

Step 3: Select type of your submission

+

You have initiated a new workflow item. In the next few steps you will provide the details about the item and upload content files. First select the type of the resource you are about to submit.

+ +

Click on one of the type buttons e.g. Corpus. Proceed with filling the basic information such as the title. Click Next to continue the following step.

+
+ +
+

Step 4: Describe your item

+

In the following two steps you will provide more details for your item. First describe the people, organization and projects involved with the item.

+ +

Next add your description, fill the language, etc.

+ +

Once you filled the necessary information, click Next to upload the content files.

+
+ +
+

Step 5: Upload files

+

In this step you will upload the content files of your submission. If there are no files, you can skip this step by clicking + Next. The files can be added by clicking the browse button or you can drag and drop files in the gray area with text 'Drag and Drop file(s) here'.

+ +

Selecting files will open a dialog box, where you can enter the description of each file. To begin the file upload +click 'Start Upload'.

+

Once the file(s) upload is done, press OK to close the dialog box. You can add more files or delete/modify the already uploaded ones, + after you finish press Next to continue with the License selection.

+
+ +
+

Step 6: Select Licenses

+

If you uploaded at least one file, you must select + a license under which you want your resources to be distributed in this step (data without + license is unusable because a user does not know how can he/she use it!). + Please read the Distribution agreement carefully + and click the red box to indicate your agreement (it will turn green). +

+ Select the appropriate license from the dropdown list, if you already have decided on the license; + + or use the OPEN License Selector, which will help you choose by asking few questions about the submission and your requirements + + If none of the licenses suits your needs contact our + Help Desk.

+ +
+

For datasets that require license signing

+ + While we prefer open data and open source software, we understand it is not always possible. + We can ensure that users must authenticate and sign a license in order to download your data + (see Restricted Submissions). + If you need more information about the users than the fact that they authenticated via a + university (or similar), we can ask for some specific attributes similar to standard + web forms. This makes sense mostly for data with "no redistribution" clause in their license. +
+ +

Click Next to continue.

+
+ +
+

Step 7: Leave a note

+

You can leave a note for the reviewer in this step.

+
+ +
+

Step 8: Review your submission

+

In this step you will review your submission before submitting it. Review page contains a sub-review panel for each of the + step you have filled in before. If you want to change any field in a particular step just click Correct one of these and it will + take you directly to the particular step page. Once you verify all the detail, submission can be made by clicking Complete Submission + or you can click Save & Exit to save the submission for continue working on it later.

+
+ +
+

Step 9: Submit

+

Once you click the Complete Submission in the review step, item will be submitted for the reviewing by the editors. Once + the editors approve the item it will appear in the repository. In case of any query regarding the submission, editors will contact + you for the further detail.

+
+
diff --git a/src/static-files/disco-juice.html b/src/static-files/disco-juice.html new file mode 100644 index 00000000000..2ec1484fb3d --- /dev/null +++ b/src/static-files/disco-juice.html @@ -0,0 +1,76 @@ + + + + + + + IdP Discovery Response Receiver + + + + + + + + diff --git a/src/static-files/faq.html b/src/static-files/faq.html new file mode 100644 index 00000000000..03b84df5ab1 --- /dev/null +++ b/src/static-files/faq.html @@ -0,0 +1,263 @@ +
+ +

Frequently Asked Questions

+ +
+ +
+ +
+

What is the repository?

+

It is like a library for linguistic data and tools.

+
    +
  • Search for data and tools and easily download them.
  • +
  • Deposit the data and be sure it is safely stored, everyone + can find it, use it, and correctly cite it (giving you credit)
  • +
+
+ +
+

What submissions do we + accept?

+

We accept any linguistic and/or NLP data and tools: corpora, + treebanks, lexica, but also trained language models, parsers, taggers, + MT systems, linguistic web services, etc. We do not strictly require + you to upload the data itself, although it is always better to do it. + Still, you can make a metadata-only record, if required. We also + support online license-signing for immediate availability of + restricted resources.

+

+ When uploading language resources, please try to use one of the recommended formats + mentioned in LRT Standards. +

+
+ +
+

Do + I need to create an account to download and/or make a submission?

+
    +
  • You can download data and tools with a + license that allows free sharing without any obstacles. Just read + the license and download. This applies to all data with Creative Commons and + tools with open source + licenses. +
  • +
  • To download data and tools that require you to sign a + license, you need to log in. To make a submission, you also need to + log in. However, if you are from the academic world, you probably don't + need any new account.
  • +
  • Just click "Login" and search for + your academic institution. To sign in, you can use any account with + an Identity Provider that is a member of EduGAIN federation.
  • +
  • If you don't have an academic account that works with us, let + us know. We will make you a local account.
  • +
+
+ +
+

I see an error logging in

+

Please let us know through our Help Desk, if you have any trouble logging in.

+

Occasionally (usually when you are the first one logging in using your home institution) you might see an error stating "The authentication was successful; however, your identity provider did provide neither your email, eppn nor targeted id." This means your home institution did not send us enough data about you to operate our service; the institution is doing so to protect your personal data. We only require an email and we are following Data Protection Code of Conduct, which helps us convince the institution we won't abuse data about you.

+

If you have an account with multiple providers and you login with different one each time, you might see error stating "Your email is already associated with a different user.". Please try to use the same provider each time, if that is not possible, let us know and we'll change the default one.

+
+ +
+

Why + should I submit my data into your repository?

+
    +
  • It is free and safe.
  • +
  • We respect your license. We encourage Free Data and believe + it benefits not only users, but also the data providers. However we + accept also more closed data and we can make users sign a license + before downloading your data, if that is what you need.
  • +
  • The data is visible, giving you maximal credit for your work + (google, VLO, DataCite, OLAC, Data Citation Index, arXive).
  • +
  • The data is easy to cite. We provide ready-to-use + one-click citations in BibTex, RIS, and other popular reference + formats. All the citations include permanent links created from persistent identifiers (we use handles for PIDs). + These PIDs are future-proof. +
  • +
  • For some data, like text corpora or treebanks, we can provide + additional services, like full-text or even tree-query search.
  • +
+
+ +
+

Why should I submit my + tools?

+
    +
  • See "Why should I submit my data into your + repository?". Everything applies to software tools too.
  • +
  • You can just link your version control system (svn, git), + if it is publicly accessible. You can also link your project + page, or demo site.
  • +
+
+ +
+

What is the PID (handle) good for?

+

It is a special permanent URL. It provides a permanent link that + will resolve correctly even if in some distant future the data is + moved. Thus it should be used as URL in citations.

+
+ +
+

What is the actual depositing/archiving procedure?

+

During the submission of digital language resources to the repository, the data undergo a curation + process in order to ensure quality and consistency. We assist you in meeting necessary requirements + for sustainable resource archiving. Data have to be provided with metadata in standard formats + accepted/adopted in the respective communities, persistent identifiers (PIDs) have to be assigned, IPR + issues have to be resolved and clear statements with regard to licensing and possible use of the + resources are to be made. + + The depositor is also required to electronically sign a deposition agreement acknowledging the + (s)he is the holder of rights to the data and that (s)he has the right to grant the + rights contained in this licence. + + Once the data is indeed deposited in the repository it is assigned a PID for stable reference.

+
+ +
+

What if I want/need to update the archived data?

+

Every change to the resources and metadata should be stored as a new version with a new PID. + However if the changes are minimal (e.g., typos or clear mistakes) then contact our Help Desk with + the submission PID and the changes which should be made. It is up to the reviewer to decide whether these changes + should result in a new version or not.

+
+ +
+

What if I want to withdraw the resources in the future? Can I delete the data?

+

Yes, in this case contact our Help Desk with the submission PID and the reason. + However, we need to keep a reference that the data was in our repository (because a persistent identifier was issued), so the + administrative metadata will be retained indicating that the data itself were removed.

+
+ +
+

We have started our own repository, can we somehow move records submitted to the LRT collection?

+

We can create a tombstone page for the moved record and we can add a notice to that page saying the resource is now at a new location. + The submission is effectively hidden from search, browse and harvesting (oai-pmh), but the PID still resolves. + Thus instead of the actual data, we show a link to the item in your repository. + Please contact the Help Desk for more details.

+
+ +
+

I don't want / cannot make the data publicly available or make + them available after a specific date. Would you still archive them for me?

+

In accordance with the advocacy of the research infrastructures and the general development + with respect to Open Access, we strongly encourage the data producers to be as open as possible. + + However, in other circumstances we will archive your data even if they will not be publicly available. Please, contact + our Help Desk prior to completing the submission.

+
+ + +
+

How to cite a submissions?

+

See our policies.

+
+ +
+

How safe is my + data, if I store it with you?

+

Quite safe, probably much more than in your computer. Our + storage plan:

+
    +
  • All the data in the repository have an on-site backup copy.
  • +
  • There is another off-site copy, so even complete destruction + of our building does not destroy your data.
  • +
  • We check all the copies regularly and should any of them + become corrupted we delete it and make a new one.
  • +
  • We keep at least three copies, one of them off-site, at all + times
  • +
+
+ +
+

What license + should I pick for my data/tool?

+

+ We encourage using a free license. A representative selection of free + licenses as well as CC licenses (more appropriate for data) is + available directly during submission. There is a great OPEN License Selector which can guide you through the selection of appropriate license.
+ If for some reason you need a different license, Contact Us. +

+
+ +
+

Where can I find more information about supported licenses?

+

+ The list of licenses currently supported is here. + However, do not hesitate to Contact Us + in case you need your specific license. The licenses can be accompanied by various requirements; eg. limiting to logged in users, filling additional details (purpose) etc. +

+
+ +
+

Why do we strongly prefer real authors to institutions?

+

+ It is not about contact, it is about citations, credit and trust. That is why we have separate metadata + fields for authors and for contact person. Contact to a helpdesk is perfect, not acknowledging the + authors of a scholarly work is not. We support the direct citation of data + (https://www.force11.org/datacitation). + That is why we also give them PIDs, create formatted citations, etc. That is the reason we really want proper + authors, so that they get citations and other scientists know whose work they rely on. +

+
+ +
+

How do I get the most of my searches?

+

+ In contrast to other search engines this one uses OR as a default operator; see examples below that clarify this. If you are not satisfied with the results of your searches, you might wish to go beyond plain text searches. + You may search only in certain fields, use negation, add score (emphasis) to some parts of the query and match + more. The search engine is SOLR so use it's syntax if you know it or check it in the documentation. +

+

Examples

+

+

+ +
PDT wordnet vs PDT AND wordnet
+
The default operator is OR; ie. the first example searches for PDT OR WordNet in all text fields.
+
dc.title:P?T && -dc.title:WordNet
+
Returns all items having P?T in title - ? stands for any character (eg. PDT) - and not having WordNet in the title
+
dc.title:"Czech WordNet"
+
Use double quotes (") for exact matches and multiword expressions
+
author:(Bojar && -Tamchyna) && (dc.language.iso:(ces AND eng) OR language:(czech AND english))
+
Search for items by one author and not the other; interesting are only items about both czech and english languages.
+
+

+
+
+

New versions/updating submitted data

+

As you may have read elsewhere in the repository help, we do not allow changes in the data after a + submission was published. You need to create a new one by creating a new version. +

+
+
+ diff --git a/src/static-files/item-lifecycle.html b/src/static-files/item-lifecycle.html new file mode 100644 index 00000000000..297953b8961 --- /dev/null +++ b/src/static-files/item-lifecycle.html @@ -0,0 +1,82 @@ +
+ +

Deposited Item Lifecycle

+ +
+ +
+ +
+

Submitted Item

+

After you deposit a submission it will be inserted into a + pool of submitted items. The item is not publicly available and waits for an editor + to approve (or reject) it. +

+
+ +
+

Edited Item

+

The task of the editor is to verify whether the submission meets our requirements in respect to + metadata quality and completeness, bitstream consistency and IPR. The editor can return the submission to the data depositor + describing the needed changes. This step is repeated until the editor approves the item. The approved item becomes a + published item. +

+
+ +
+

Published Item

+

A published item obtains a PID (persistent identifier) which should be used for referencing and citing e.g., + http://hdl.handle.net/11858/00-097C-0000-0022-F59C-8. The LINDAT repository will ensure that + the PID (more precisely, we use http handle proxy of the PID) will be resolved into a working web page (even if the current + server infrastructure changes or is moved) + describing your resource. +

+ +

+ Published items are available through our search interface, browsing mode. Metadata of all items are submitted to + search engines and are available through OAI-PMH protocol (several institutes harvest our repository for item's metadata + e.g., http://catalog.clarin.eu/vlo/). Bitstreams of public submissions + (see Restricted Submissions) are also available through OAI-ORE protocol. +

+
+ + +
+

Deleting and Modifying of Published Item

+

Anybody can request deletion of published items; however, these will be evaluated on case-by-case basis. + Furthermore, we reserve the right to keep the metadata of published submissions available + in case there is no specific reason why to delete the metadata. The reason is that it is against + the concept of PIDs (persistent identifiers). + All PIDs are available through OAI-PMH interface even if only to inform that the item + has been deleted. +

+ +

We allow for minor edits of the submission (e.g., typos) through our Help Desk. These are also + evaluated on case-by-case basis. For major changes, the user is requested to submit a + new version + of that item and we will indicate in the metadata that it is replaced by a newer version. +

+
+ +
+

Restricted Submissions

+

First of all, all metadata are always publicly available. We + support open access submissions; however, we also support + restrictive licences for bitstreams which require e-signing before downloading the bitstreams. + We keep track of these e-signatures in case there are IPR infringements.

+ +

See currently available licenses or ask us + to add a specific one.

+ +

We also support putting embargo on bitstreams which means that the bitstreams become publicly available + after specific dates.

+
+ +
+ diff --git a/src/static-files/metadata.html b/src/static-files/metadata.html new file mode 100644 index 00000000000..ecab35dc3d0 --- /dev/null +++ b/src/static-files/metadata.html @@ -0,0 +1,164 @@ +
+ +

About metadata

+

This page provides information about what metadata we require and how we disseminate it. Metadata are freely accessible and are distributed in the public domain (under CC0). However, we reserve the right to be informed about commercial usage of metadata from LINDAT/CLARIAH-CZ repository including a description of your use case at Help Desk.

+ +
+ +
+
+

Metadata formats

+

+ During the submission process, users fill out metadata fields which are stored as a part of the record. We are able to disseminate the submission metadata in various formats including but not limited to CMDI and oai_dc. See the full list of supported formats but note that some of the formats might not be applicable to all items. The various formats help us promote the submitted content in number of aggregators (and/or search engines). +

+

CMDI

+

+ See the CLARIN introduction to component metadata in order to get more information about this topic. +

+

+ Our current submissions are adhering to the clarin.eu:cr1:p_1403526079380 profile/schema. Portion of older submissions (basically those submitted before Sep/Oct 2014) is using different profile clarin.eu:cr1:p_1349361150622. We decided to create the new profile to better reflect the submission process the user goes through. The former one was a combination of OLAC and MetaShare components, which forced us to handle duplicities in various places. It also bounded us to someone else's metadata schema and it's semantics, which we could neither influence nor change. +

+

+ Both profiles are fairly covered with links to a concept registry. The links going to now retired ISOcat DCR were redirected to CCR and the OLAC component's concept links are linking to the DCMI terms concepts (eg. the concept link for abstract is http://purl.org/dc/terms/abstract). VLO is using concept links, mainly/preferably from the CCR, and in some cases explicit XPaths to discover field values. Our older profile was such an explicit case. The XPaths in the vlo mappings were matching only one particular profile. The mappings were later extended (for some facets) so that the xpaths work also with the component derived from that particular profile. This special treatment was one reason for creating a different profile. Another reason for creating our own profile was the fact that DC concepts were still too broad. +

+

However, we are supporting submissions with arbitrary CMDI metadata files that are used in OAI-PMH when the CMDI metadata profile is requested.

+

Various points in the above paragraphs should discourage you from reusing clarin.eu:cr1:p_1349361150622. For reusing it's specific components, keep in mind what was said above about the VLO mapping. clarin.eu:cr1:p_1403526079380 was created with VLO mapping in mind (though this can change), but still reflects our view of the world and our use cases. If you don't gather much more information than is described below, you might find this profile suitable for your needs or as a base for your own one.

+

oai_dc

+

oai_dc is the format required by OAI-PMH. See the mapping section in order to understand how we map our submission to this format.

+
+
+
+

Submitted metadata

+

Following list enumerates the fields we ask in the submission workflow (the list is subject to sporadic changes). The metadata are submitted in English. There are subtle differences depending on the type of the resource being submitted. Not all the fields are present in all the formats. There are fields that are automatically generated (eg. human readable language names acompanying the iso codes, identifiers, other dates).

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
Field nameDescriptionStatus
TypeType of the resource: "Corpus" refers to text, speech and multimodal corpora. + "Lexical Conceptual Resource" includes lexica, ontologies, dictionaries, word lists etc. + "language Description" covers language models and grammars. + "Technology / Tool / Service" is used for tools, systems, system components etc.required
TitleThe main title of the item.required
Project URLURL of resource/project related to the submitted item (eg. project webpage). Regexp controlled (starts with http/https)regexp controlled
Demo URLDemonstration, samples or in case of tools sample output URL. Regexp controlled (starts with http/https)regexp controlled
Date issuedThe date when the submission data were issued if any e.g., 2014-01-21 or at least the year.required
AuthorNames of authors of the item. In case of collections (eg. corpora or other large database of text) you usually want to provide the name of people involved in compiling the collection, not the authors of individual pieces. A person name is stored as surname comma any other name (eg. "Smith, John Jr.").requiredrepeatable
PublisherName of the organization/entity which published any previous instance of the item, or your home institution.requiredrepeatable
Contact personPerson to contact in case of issues with the submission. Someone able to provide information about the resource, eg. one of the authors, or the submitter. Stored as structured string containing given name, surname, email and home organization.requiredrepeatable
FundingSponsors and funding that supported work described by the submission. Stored as structured string containing project name, project code, the funding organization, the type of funds (own/national/eu) and OpenAIRE identifier (which is also stored in dc.relation)repeatable
DescriptionTextual description of the submission.required
LanguageThe language(s) of the main contenten of the item. Stored as ISO 639-3 code. Required for corpora, lexical conceptual resources and language descriptions.repeatabletype-bind required
Subject KeywordsKeywords or phrases related to the subject of the item.repeatablerequired
SizeExtent of the submitted data, eg. the number of token, or number of files.repeatable
Media typeMedia type of the main content of the item, eg. text or audio. Dropdown selection, required for corpora, language descriptions and lexical conceptual resources.dropdown selectiontype-bind required
Detailed typeFurther classification of the resource type. Dropdown selection, required for tools, language descriptions and lexical conceptual resources.dropdown selectiontype-bind required
Language DependentBoolean value indicating whether the described tool/service is language dependent or not. Required for toolstype-bind required
+
+
+
+

Metadata mapping

+

The following tables contains the submission - oai_dc mapping, it also lists some of the important automatically generated fields.

+ + + + + + + + + + + + + + + + + + + + + +
Submission fieldMapped field
Typedc.type
Titledc.title
Project URLdc.source
Demo URLnot mapped
Date Issueddc.date
Authordc.creator
Publisherdc.publisher
Contact personnot mapped
Fundingnot mapped
Descriptiondc.description
Languagedc.language
Subject Keywordsdc.subject
Sizenot mapped
Media Typenot mapped
Detailed Typenot mapped
+ + + + + + + + +
Generated fieldDescription
dc.identifierPID (currently handle) of the resource.
dc.rightsRepeatable field can contain the name of the license under which the resource is distributed, the URL to the full text of the license and so called label (PUB, ACA, RES)
+
+
diff --git a/src/static-files/search.html b/src/static-files/search.html new file mode 100644 index 00000000000..294f665226a --- /dev/null +++ b/src/static-files/search.html @@ -0,0 +1,12 @@ +
+ +

About Search

+

+ + Description of search features.
+ Filters.
+ etc + +

+ +
diff --git a/src/static-files/terms-of-service.html b/src/static-files/terms-of-service.html new file mode 100644 index 00000000000..dd699238b15 --- /dev/null +++ b/src/static-files/terms-of-service.html @@ -0,0 +1,174 @@ +
+ +

CLARIN Terms of Service (v1.0)

+ +
+
+ +

Preamble

+ +

Welcome to ${dspace.name}. This repository service is provided to you by ${lr.description.institution}, located at ${lr.description.location}, hereinafter referred to as CLARIN Centre. The mission of CLARIN is to provide as wide access as possible to language research materials and tools around Europe. To archive this goal, we set some ground rules in this document. By accessing or using, and in consideration of the CLARIN Services provided to you, you agree to abide by the Terms of Use below, which can be updated or modified according to article 9.

+ +

1. Governing Terms

+ +

+ 1.1 The access to and use of CLARIN Services are governed by this Agreement and by its terms and conditions, which are hereby incorporated into its End-User License Agreements. The User's attention is drawn to the provisions limiting access to certain classes of resources. +

+ +

+ 1.2 Any use of the CLARIN Services by means of the User Identity granted by the local identity provider also signifies the User's acceptance of the Terms of Service and the User's agreement to be bound by them. +

+ +

2. Definitions

+ +

+ 2.1 All terms used in this Agreement, unless specifically defined herein, will have the meanings attributed to them in this Agreement. The following terms shall have the following meaning: +

+ +

+ "Authorised Use" means use by a User who is accessing the CLARIN Services via the identity provided by a national identity provider. +
+ "Academic Use" means use by a User who fulfils the criteria set by the national identity providers for Academic users and defined by CLARIN ERIC. +
+ "Non-Commercial Use" refers to any use that does not generate income or is not used to promote the generation of income. +
+ "User Identity" refers to the identity granted by a local identity provider or a CLARIN Centre of type A or B. +

+ +

3. Access to CLARIN Services

+ +

+ 3.1 CLARIN hereby grants the User a limited non-exclusive non-transferable licence to access and use CLARIN resources under the terms of this Agreement and via the chosen User Identity. +

+ +

+ 3.2 Access to certain Features and Databases may be restricted by CLARIN. +

+ +

+ 3.3 The User will be responsible for all access to CLARIN by means of the chosen User Identity whether or not the User has knowledge of such access and use. CLARIN reserves the right to cancel any User Identity without notice. +

+ +

+ 3.4 The User understands and acknowledges that the User Identity is for his or her use only and that the User is prohibited from permitting any third party from accessing CLARIN by means of the User Identity. +

+ +

+ 3.5 Content Categories +

+ +

+ CLARIN offers content in three different main categories: +
+ Public Content (PUB) +
+ Academic Content (ACA) +
+ Restricted Content (RES) +
+ The User understands and acknowledges that depending on the content the access may be limited based on this categorization and the User Identity. CLARIN may also require acceptance of additional licensing or usage terms for Academic and Restricted Content. The User agrees to use the content according to the conditions. +

+ +

+ 3.6 Sub-categories +

+ +

+ The offered content may belong to certain sub-categories: +
+

    +
  • Identification and Access conditions +
      +
    • ID: The user needs to be authenticated or identified
    • +
    • AFFIL=x: The user needs to be affiliated with some community, e.g. a community of academic researchers (x=EDU) or a community of language research and technology researchers more generally (x=META)
    • +
    • PERM: The user can only be given permission to use the resource on a case-by-case basis, such as a mandatory fee or a research plan
    • +
    • FF: A fee is required to get access to the resource
    • +
    • PLAN: The right holder requires a research plan for granting access
    • +
    +
  • +
  • General Use conditions +
      +
    • BY: Attribution, i.e. acknowledgement of authorship, is required
    • +
    • NC: The content is available only for non-commercial purposes
    • +
    • INF: Informing the rights holder about the use of the resource is required
    • +
    • LOC: The content is available only at a single location, center, or site?
    • +
    • LRT: The content is available only for language research and technology development
    • +
    • PRIV: There are personal data in the resource
    • +
    +
  • +
  • Distribution conditions +
      +
    • NORED: The user is not permitted to redistribute the resource
    • +
    • DEP: The user is not permitted to redistribute the resource but as an exception to this rule, the user may still distribute modified versions via CLARIN
    • +
    • SA: The resource can be redistributed under similar conditions, i.e. is the license reciprocal
    • +
    • ND: The user is not permitted to make derivate works, i.e. works containing copyrighted parts of the original
    • +
    +
  • +
  • Other conditions +
      +
    • *: There are other non-standard conditions in the license that the user should pay attention to
    • +
    +
  • +
+
+ The User agrees to adhere to these requirements. +

+ +

+ 3.7 Content-Specific Licenses + In addition to the aforementioned categories, some content has its own license (for example a Creative Commons license), which may set additional limitations and requirements. The User agrees to follow these limitations and requirements. +

+ +

4. Research Ethics

+ +

+ The User agrees to observe best practices regarding research ethics. This includes treating colleagues, stakeholders, customers, suppliers and the public respectfully and professionally, taking into account confidentiality when appropriate, respecting cultural differences and having an open and explicit relationship with government, the public, the private sector and other funders. +

+ +

5. Availability of Services

+ +

+ CLARIN disclaims all responsibility and liability for the availability, timeliness, security or reliability of the services, software or other content provided through the CLARIN Services. CLARIN reserves the right to modify, suspend, or discontinue the services or access to the services without any notice at any time and without any liability to you. +

+ +

6. Governing Law and Entire Agreement

+ +

+ These Terms are governed by the laws of ${lr.description.country} without regard to the rules of conflict of law that may cause the laws of another jurisdiction to apply. The User agrees to the sole and exclusive jurisdiction and venue of the ${lr.description.city} District Court of Law in the event of any dispute of any kind arising from or relating to the CLARIN Services, or the User’s use or review of it. However, CLARIN has the right to use the laws of another jurisdiction to get injunctive measures against the misuse of the CLARIN Service. +

+ +

+ The Terms of Service constitute the entire agreement between the parties with respect to the subject matter hereof and supersedes and replaces all prior or contemporaneous understandings or agreements, written or oral, regarding such subject matter. If for any reason a court of competent jurisdiction finds any provision or portion of these Terms to be unenforceable, the remainder of the Terms will continue in full force and effect. +

+ +

7. Data Protection and Privacy

+ +

+ The User agrees to follow the data protection policy of the CLARIN Services. +

+ +

8. Usage Statistics and Automated Querying

+ +

+ CLARIN maintains usage statistics as a measure of readership and other use of the CLARIN Services by authors and researchers. It is a violation of CLARIN policy for a party to directly or indirectly use CLARIN with a view to affecting download and other usage statistics, or to encourage others to do so. As part of its general right to refuse or terminate service and remove or edit the content of the CLARIN Services, CLARIN reserves the right in its sole discretion to limit access, remove content, and adjust usage statistics to respond to any activity that appears likely to have such an effect. +

+ +

9. Amendments

+ +

+ 9.1 If these Terms of Service are modified for legal, administrative or any other reasons, the CLARIN Centre shall notify the users about these amendments by publishing the relevant information on the CLARIN Centre website without unreasonable delay. +

+ +

+ 9.2 If the User continues to use the services after being properly notified about the amendment of the Terms of Service, it implies his consent to the new Terms of Service. +

+ +

10. Termination

+ +

+ If the User violates the letter or spirit of this agreement, or otherwise creates a risk or possible legal exposure for CLARIN, CLARIN can stop providing all or part of CLARIN Services. CLARIN will notify the User at the next time he or she attempts to access the CLARIN Services. +

+ +
+ +