Databáze mluvených projevů v češtině jako cizím jazyce (trvalý pobyt v ČR)
-TODO: popis
-- -
diff --git a/data_preparation/70.releasing/html/cqptext-cs.html b/data_preparation/70.releasing/html/cqptext-cs.html index de63d32..e0f69e9 100644 --- a/data_preparation/70.releasing/html/cqptext-cs.html +++ b/data_preparation/70.releasing/html/cqptext-cs.html @@ -150,8 +150,11 @@
Zadejte vyhledávací dotaz ve formátu CQL (Corpus WorkBench Query Language) do textového pole výše pro prohledání korpusu. Syntax CQL využívá intuitivní systém pro definování vlastností hledaných slov, například:
-[upos="NUM.*"] [lemma="otázka"]
+[upos = "NUM.*"] [lemma = "otázka"]
Tímto způsobem vyhledáte tvary slova otázka, jimž předchází číslovka. Další informace o jazyce CQL naleznete zde.
+V základním nastavení TEITOK provádí vyhledávání v celém korpusu, který může obsahovat k jedné nahrávce více přepisů. Pokud chcete vyhledávat pouze v té části korpusu, v níž je ke každé nahrávce přiřazený jen jediný přepis, je nutné omezit hledání na tzv. kanonické přepisy. Např.
+[lemma = "situace"] :: match.text_canonical = "1"
vyhledává lemma situace jenom v kanonických přepisech.
Pro usnadnění vyhledávání rozhraní nabízí nástroj pro sestavování dotazů (query builder), který umožňuje snadno definovat jednoduché dotazy v CQL. Stačí kliknout na ikonu pro sestavování dotazů, otevřít nástroj, definovat svůj dotaz a kliknout na tlačítko „Vytvořit dotaz“, čímž se dotaz vloží do textového pole CQL, které můžete případně ručně upravit, nebo jednoduše stisknout tlačítko pro vyhledávání.
Type in a search query in the CQL (Corpus WorkBench Query Language) format in the text box above to search in the corpus. The CQL syntax uses an intuitive system of defining properties of words you are looking for, as in for instance:
will search for any form of the word otázka preceded by a numeral. More information about the CQL language can be found here
+will search for any form of the word otázka preceded by a numeral. More information about the CQL language can be found here.
+By default, TEITOK searches the entire corpus, which may contain multiple transcripts for a single recording. If you want to search only in the part of the corpus where each recording has only a single associated transcript, you must restrict the search to so-called canonical transcripts. For example:
+[lemma = "situace"] :: match.text_canonical = "1"
searches for the lemma situace only in canonical transcripts.
To facilitate searching, the interface provides a query builder which provides an easy way to define simple queries in CQL. Just click on the query builder icon to open the query builder, define your query, and click on the button to insert that query in the CQL query box, after which you can modify it by hand if needed, or simply hit search.
You can use to Query Builder to just search for documents – you do this by not providing any token restrictions, which will make the system interpret the query as a search for document.
TODO: popis
-- -