GB/T 40035-2021.Basic requirements for bilingual parallel corpus processing service.
1范圍
GB/T 40035規(guī)定了雙語平行語料加工服務(wù)的基本要求、加工流程、服務(wù)內(nèi)容和數(shù)據(jù)安全等內(nèi)容。
GB/T 40035適用于以原文和譯文為對象的、以文字為表達(dá)形式的數(shù)字化雙語語料加工服務(wù),其他數(shù)字化文本的語料加工也可參照使用,也適用于對語料對齊工具的評價(jià)。
2規(guī)范性引用文件
本文件沒有規(guī)范性引用文件。
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
文本 text
以字符、符號、詞、短語、段落、句子、表格或其他字符排列形成的數(shù)據(jù),用于表達(dá)意義,其解釋基本上取決于讀者對于某種自然語言或人工語言的知識。
[來源:GB/T 4894-2009.4.1.1.2.4]
3.2
語料 corpus
語言材料或資料。
3.3
雙語平行語料 bilingual parallel corpus
由兩種語言構(gòu)成,并在篇章、段落、句子或其他級別平行對齊的語料(3.2)。
3.4
原文 source language text
源語言文本(3.1)。
[來源:GB/T 19363.1-2008,3.4, 有修改]
3.5
譯文 target language text
目標(biāo)語言文本(3.1)。
[來源:GB/T 19363.1-2008,3.5, 有修改]
檢測流程步驟
溫馨提示:以上內(nèi)容僅供參考使用,更多檢測需求請咨詢客服。