国产露脸精品国产沙发|极品妇被弄得99久九精品亚洲|亚洲va成精品在线播放人|日韩精品久久久免费观看

    
    

        <delect id="w59je"></delect>

            當(dāng)前位置:首頁(yè) > 網(wǎng)球資訊 > 正文內(nèi)容

            語(yǔ)料庫(kù)-北大計(jì)算機(jī)輔助翻譯原理與實(shí)踐摘記

            杏彩體育2年前 (2022-12-12)網(wǎng)球資訊46

            文章完成中.

            語(yǔ)料庫(kù)地址: 經(jīng)典的是 COCA等, 美國(guó)楊百翰大學(xué)語(yǔ)料庫(kù)列表

            重要章節(jié):

            - 08. 語(yǔ)料庫(kù)檢索工具 Corpus Searching Tools (06:46)09.

            01. 語(yǔ)料庫(kù)與翻譯研究導(dǎo)言 Introduction to Corpus and Translation Research (05:20)

            本節(jié)內(nèi)容:

            # 如何翻譯"制定政策" 1. google 方法: 搜索關(guān)鍵字: "the government * a policy" 2. 語(yǔ)料庫(kù) kwic 方法(Key Word in Context) 示例楊百翰大學(xué)語(yǔ)料庫(kù)以及英國(guó) https://www.english-corpora.org/iweb/

            02. 語(yǔ)料庫(kù)產(chǎn)生的背景 Emerging Backgroud of Corpus (15:01

            語(yǔ)料庫(kù)這種想法,可以說(shuō)產(chǎn)生的 很早,因?yàn)槿魏稳藢?duì) 認(rèn)知總是從觀察開(kāi)始的,當(dāng)他對(duì)現(xiàn)象 有了一個(gè)積累之后才能升華成理性。 如果想研究語(yǔ)言的話,顯然要對(duì)語(yǔ)言進(jìn)行觀察。

            那么在具體討論 語(yǔ)料庫(kù)之前,我給出語(yǔ)料庫(kù)的定義,請(qǐng)各位仔細(xì)閱讀。

            那么特別要注意其中畫紅色字體的部分,

            What is a corpus?

            A collection of machine-readable, authentic texts (including transcripts of spoken data) which is sampled to be representative of a particular language or language variety.

            第一個(gè),語(yǔ)料庫(kù)一定是機(jī)讀的,不是為人準(zhǔn)備的,剛才我也說(shuō)過(guò)了,因?yàn)樗y(tǒng)計(jì)非常地繁雜,分析非常地繁雜,

            第二個(gè) 語(yǔ)料庫(kù)是一個(gè)有限集合特別強(qiáng)調(diào)的就是語(yǔ)料庫(kù)語(yǔ)言學(xué)一定是依據(jù)的是語(yǔ)料庫(kù)的分析結(jié)果,而不是其它.

            03. 語(yǔ)料庫(kù)的發(fā)展歷史 Development History of Corpus (12:33)

            柯林斯詞頻

            BNC 同時(shí)提供了搜索引擎. xaira 在網(wǎng)上可以獲得

            美國(guó)國(guó)家語(yǔ)料庫(kù):

            http://www.americannationalcorpus.orghttp://en.wikipedia.ora/wiki/American National Corpus

            中文語(yǔ)料庫(kù)

            計(jì)算機(jī)發(fā)展滯后

            04. 語(yǔ)料庫(kù)的概念方法及問(wèn)題思考 Concepts and Methods of Corpus and Thoughts on Problems (10:18)

            注意成本

            語(yǔ)料庫(kù)建設(shè)如果全憑計(jì)算機(jī), 帶來(lái)的后果就是錯(cuò)誤很多;全靠人成本太高。那么這個(gè) 像楊百翰大學(xué)的語(yǔ)料庫(kù), 就做得挺好的,諸位可以去看看。 如果對(duì)于一個(gè)研究機(jī)構(gòu)來(lái)說(shuō), 一個(gè)網(wǎng)站式的這樣的管理系統(tǒng)可能就要復(fù)雜的 更多一些。 比如說(shuō)諸位可以看看schedule engine,它的對(duì)語(yǔ)料庫(kù)的選擇方式。

            北大的中文語(yǔ)料庫(kù)是做的最好的.

            05. 語(yǔ)料庫(kù)的優(yōu)缺點(diǎn) Advantages and Disadvantages of Courpus (05:58)

            可以解決諸如不符合語(yǔ)法規(guī)則的句子, 被不同的人使用多少次后可以作為正常的使用?

            所以在語(yǔ)料庫(kù)研究,有了這樣的一個(gè)支撐工具之后,有了計(jì)算機(jī),現(xiàn)代計(jì)算機(jī)的強(qiáng)大計(jì)算能- 力之后, 我們對(duì)語(yǔ)言的發(fā)生發(fā)展這樣的一個(gè)規(guī)律性 會(huì)有了更好的掌握。 而語(yǔ)料庫(kù)研究天生所具有的 定量的這種特性,它 必然帶來(lái)科學(xué)研究的科學(xué)性。 通用性就不說(shuō)了, 因?yàn)樗钦Z(yǔ)料庫(kù)本身是一種方法。 那么語(yǔ)料庫(kù)可以對(duì)任何一種子語(yǔ)言,比如說(shuō):某一個(gè)領(lǐng)域的某一 個(gè)人的同一個(gè)時(shí)期所有人的,或者說(shuō)特定人的,那么這一些特定的人在所有歷史時(shí)期的 各種各樣的抽樣方法。 那么抽樣決定了我們研究的目的,研究 決定了抽樣,而抽樣之后,它的統(tǒng)計(jì)處理的方法卻大致可以是相同的。 帶來(lái)了這種研究方法的通用性。

            前面我們討論了語(yǔ)料庫(kù)建設(shè)所面臨的一些困難,那么這些建設(shè)中的困難直接就是,也可以 就認(rèn)為是語(yǔ)料庫(kù)使用上面的一些麻煩,或者說(shuō)不好的地方。

            06. 語(yǔ)料庫(kù)的類型及用途 Types of Corpus and Their Uses (13:02)

            語(yǔ)言研究必然是倒金字塔結(jié)構(gòu), 需要統(tǒng)計(jì)方法的支持

            抽象的這種自然元處理,那么在北大的課程中呢 ,是在長(zhǎng)虹???老師的自然語(yǔ)言處理

            計(jì)算機(jī)輔助翻譯,原理與技術(shù),這個(gè)課程中呢去討論的

            在除了這個(gè) 語(yǔ)料庫(kù),因?yàn)樗焐氖菫?,是由?jì)算機(jī)

            來(lái)處理的,那么自然呢我首先講了用語(yǔ)料庫(kù)方法來(lái)處理 自然語(yǔ)言處理問(wèn)題,那么事實(shí)上呢語(yǔ)言學(xué)才是我們今天討論的重點(diǎn),那么在語(yǔ)言學(xué)領(lǐng)域 語(yǔ)料庫(kù)能做什么事呢?主要是幫助我們、 支撐我們 進(jìn)行語(yǔ)言學(xué)研究,發(fā)現(xiàn)、 驗(yàn)證語(yǔ)言學(xué)的規(guī)律、 規(guī)則。 語(yǔ)言規(guī)則的發(fā)現(xiàn)和驗(yàn)證,這里我 不多討論,那么其中這個(gè)語(yǔ)體的語(yǔ)體 風(fēng)格的研究,是最近大概十多年以來(lái)在很多跟我們翻譯有關(guān)的一些語(yǔ)料庫(kù)研究中 間呢最重要的一個(gè)門類。

            07. 語(yǔ)料庫(kù)支持的翻譯研究和實(shí)踐 Corpus-based Translation Research and Translation Practice (10:31)

            句對(duì)齊的語(yǔ)料庫(kù)事實(shí)上也可以直接作為翻譯記憶庫(kù)

            概念: 可比語(yǔ)料庫(kù)對(duì)比.

            如果我們把兩種 文字或者收集來(lái)的語(yǔ)料,都是討論 同一個(gè)領(lǐng)域的事情的話,或者同一個(gè)問(wèn)題的事情的話,這樣的語(yǔ)料庫(kù), 雙語(yǔ)料庫(kù),我們認(rèn)為它就是一種可比語(yǔ)料庫(kù)。

            例子: 比如說(shuō)有一個(gè)前輩學(xué)者, 他提出來(lái),說(shuō)他在做奧運(yùn)會(huì)翻譯的時(shí)候,要翻譯一個(gè)排球的文件。 那么他本人對(duì)排球這件事情 并不是很在行,他不是體育愛(ài)好者。 那么就算打排球,也沒(méi)有。 雖然他是一個(gè)非常有成就的翻譯家, 但他也沒(méi)有想過(guò)用英語(yǔ)怎么去說(shuō)排球。 他接到這個(gè)翻譯任務(wù)之后,他首先去,在世界范圍內(nèi) 去找排球的規(guī)則,排球的網(wǎng)站,討論排球規(guī)則的網(wǎng)站,討論排球戰(zhàn)術(shù)的 網(wǎng)站,然后把這里面的文章全部收集了下來(lái)。 然后又去了中國(guó)的體育網(wǎng)站, 把討論中文的,中國(guó)的這個(gè)排球的術(shù)語(yǔ),規(guī)則 的文章都收集下來(lái)。 然后他建立了一個(gè)小型的,自己的 可比,排球運(yùn)動(dòng)的可比語(yǔ)料庫(kù)。 于是他開(kāi)始進(jìn)行這個(gè)翻譯。 那么他翻譯墊球,扣球,知道這個(gè)意思,先在 中文中找到這個(gè)詞匯,這些詞匯的意義,明白它是什么事情之后, 再去閱讀相關(guān)的英語(yǔ)文本。 雖然這兩種文本不是對(duì)應(yīng)翻譯過(guò)來(lái)的, 但他依然很準(zhǔn)確的找到了所有詞匯的答案。 他不需要去借助于所謂的什么 體育詞典,因?yàn)樗X(jué)得這些體育詞典也是人編纂出來(lái)的,那么一旦出了錯(cuò), 他連驗(yàn)證的余地都沒(méi)有。 而從真正的 排球網(wǎng)站上面找來(lái)的語(yǔ)料,找來(lái)的 這些規(guī)則才是真正合理,真正最 恰當(dāng)?shù)?,最反?yīng)西方人是怎么使用語(yǔ)言 來(lái)描述排球運(yùn)動(dòng)的這樣的事情。 所以他,那么這位,我相信啊, 這位很有成就的翻譯家,他為什么,之所以 別人公認(rèn)他是有成就的翻譯家,和他這種工作方法 也是完全分不開(kāi)的。

            建立一個(gè)可比語(yǔ)料庫(kù), 這個(gè)可以是對(duì)應(yīng)的這個(gè)文本。 那么如果是對(duì)應(yīng)的文本,或者叫對(duì)齊的文本的話, 我們管它叫做平行語(yǔ)料庫(kù),雙語(yǔ)平行語(yǔ)料庫(kù)。

            1. 也就是說(shuō)如果我們是篇章對(duì)齊的,就這篇文章是 翻譯到這篇文章,我們叫篇章對(duì)齊;

            2. 如果是這個(gè)自然段對(duì)應(yīng)于這個(gè)自然段 是翻譯過(guò)來(lái)的,那么叫段落對(duì)齊;

            3. 如果要是這個(gè)句子和這個(gè)句子 是對(duì)應(yīng)上的,我們管它叫做句對(duì)齊的;

            4. 如果要是亞句集 對(duì)齊,詞匯對(duì)齊,當(dāng)然就做的更深入一些。

            那么對(duì)我們翻譯說(shuō)來(lái),句對(duì)齊的 是一個(gè)比較重要的一個(gè) 語(yǔ)料庫(kù),因?yàn)檫@個(gè)句對(duì)齊的語(yǔ)料庫(kù)事實(shí)上也可以直接作為翻譯記憶庫(kù)存在。

            對(duì)翻譯過(guò)程最有用的是 單語(yǔ)語(yǔ)料庫(kù)

            很多同學(xué)可能直覺(jué)的就認(rèn)為 只有雙語(yǔ)的才能對(duì)翻譯有幫助,否則我怎么去找到翻譯呀? 實(shí)際上不是。

            基于做翻譯的絕大多數(shù)都是單母語(yǔ)的, 外語(yǔ)想達(dá)到跟母語(yǔ)一樣的表達(dá)能力, 這個(gè)路還真的是很長(zhǎng)。

            那么怎么解決這個(gè)問(wèn)題呢? 單語(yǔ)語(yǔ)料庫(kù),更嚴(yán)格的說(shuō),就是諸位所不擅長(zhǎng)的外語(yǔ)單語(yǔ)語(yǔ)料庫(kù)。 對(duì)翻譯研究,或者說(shuō)對(duì)翻譯過(guò)程幫助 是最大的,外語(yǔ)的單語(yǔ)語(yǔ)料庫(kù)是相當(dāng)重要的一個(gè)資源。

            原因: 這個(gè)外語(yǔ)單語(yǔ)語(yǔ)料庫(kù)之重要,與語(yǔ)料庫(kù)研究方法本身的重要性 是緊密聯(lián)系在一起。 我們一直在討論,整個(gè)兒一節(jié)課 都在跟大家反復(fù)的說(shuō),語(yǔ)料庫(kù)是語(yǔ)言的一個(gè)抽樣。 那么語(yǔ)料庫(kù)統(tǒng)計(jì)出來(lái)的結(jié)果可以用來(lái)表達(dá)這個(gè)語(yǔ)言, 它使用的一些狀況,一些規(guī)則,規(guī)律。 那個(gè)語(yǔ)料庫(kù)為我們翻譯工作者提供 了觀察這種語(yǔ)言,一種特定的,比如說(shuō)詞匯, 某一種搭配,某一種句型規(guī)則,使用的最鮮活的這些例子。 那么這些語(yǔ)用知識(shí)的獲取,有的時(shí)候是從任何一本語(yǔ)法書,詞典中 所難以取得的。 那么,諸位 可能不相信這一點(diǎn),那么我們會(huì)用實(shí)例來(lái)向大家證明。 如果有了語(yǔ)料庫(kù),所謂的一些辨析詞典, 所謂的一些語(yǔ)法規(guī)則書,其實(shí)都不是那么的重要了。我們可以靠自己的分析,對(duì)用語(yǔ)料庫(kù)方法的這種統(tǒng)計(jì)來(lái)進(jìn)行, 找到答案,自行找到答案,而且速度并不慢, 而且最準(zhǔn)確,最可靠.

            08. 語(yǔ)料庫(kù)檢索工具 Corpus Searching Tools (06:46)

            Paraconc 對(duì)分析平行語(yǔ)料特別有幫助

            那么Corpus Workbench是發(fā)展歷史比較長(zhǎng), 使用也有點(diǎn)復(fù)雜,因?yàn)樗嵌喾N語(yǔ)言混合編寫而成的, 法國(guó)的一個(gè)教育機(jī)構(gòu), 把CWB進(jìn)行了一個(gè)包裝,然后推出了一個(gè)新版本,諸位也可以去搜索下,那個(gè)封裝之后的版本用起來(lái)就感覺(jué)容易多了,而且很容易的就能把從一個(gè)單機(jī)版變成一個(gè)在線的版本.

            國(guó)內(nèi)外語(yǔ)料庫(kù)研究學(xué)者概覽:

            John Sinclair, Geoffrey Leech, Douglas Biber, Mona Baker Lancaster university

            Lynne Bowker, Sylviane Granger, Michael Barlow, Mike Scott

            北京大學(xué)計(jì)算語(yǔ)言所俞士汶、詹衛(wèi)東、常寶寶等上海交通大學(xué)楊惠中等

            北京外國(guó)大學(xué)顧日國(guó)、王克非等.

            建議大家實(shí)際去使用下語(yǔ)料庫(kù)

            09. 語(yǔ)料庫(kù)在翻譯中的作用之一 Role of Corpus in Translation-Part1 (13:56)

            那么這一小節(jié)呢我想著重把它放在語(yǔ)料庫(kù)的作用和功能上面。

            語(yǔ)料庫(kù)的檢索,或者說(shuō)語(yǔ)料庫(kù)的對(duì)于語(yǔ)言學(xué)研究的這個(gè)幫助,

            那么主要是在這個(gè),體現(xiàn)在它的檢索功能和頻率統(tǒng)計(jì),和一些 這個(gè)相關(guān)性的這些計(jì)算上面。

            作用:

            舉例: 這個(gè)有人 這個(gè)被委托,這個(gè)翻譯盲人的這個(gè)指引, 他們是把中國(guó)這個(gè)盲人這個(gè)協(xié)助的工作交給了 這個(gè)譯員,然后用在一個(gè)國(guó)際化的這個(gè)活動(dòng)中間。 而這個(gè)譯員呢沒(méi)有盲目的按照中國(guó)的這個(gè)盲人這個(gè)生活指引 來(lái)翻譯,而是去找了這個(gè)西方的盲人協(xié)會(huì)出版的一些刊物, 把他們這個(gè)西方的這個(gè)做法, 這個(gè)直接拷貝,改寫 過(guò)來(lái),然后提交了一份新的中文版的, 這個(gè)中文的盲人工作指引,交給了這個(gè)活動(dòng)的組織方,告訴他們說(shuō), 這些做法才是真正可靠的。這個(gè)尊重這個(gè)文化,有文化差異的時(shí)候, 如何尊重對(duì)方的這個(gè)生活習(xí)慣的。 那么像這樣子的譯員, 在我看來(lái)就屬于最高階,最有成就的這個(gè)譯員了。

            翻譯實(shí)踐可用語(yǔ)料庫(kù)類型- 最相關(guān)的是雙語(yǔ)對(duì)齊

            1,雙語(yǔ)對(duì)齊語(yǔ)料庫(kù)

            對(duì)齊層級(jí):篇率、段落、句子、詞組/語(yǔ)塊、詞匯句對(duì)齊話料庫(kù)-翻譯記憶庫(kù)的主要形式

            2.可比語(yǔ)料庫(kù)

            3.單語(yǔ)語(yǔ)料庫(kù)

            - 從更多的句子、語(yǔ)境中理解待翻譯原文

            - 從更多句子、語(yǔ)境及統(tǒng)計(jì)分析結(jié)果中選擇合適的譯文單語(yǔ)語(yǔ)料庫(kù)是現(xiàn)實(shí)翻譯中實(shí)踐性最強(qiáng)的語(yǔ)料庫(kù), 自己需求的雙語(yǔ)語(yǔ)料庫(kù)幾乎找不到.

            單語(yǔ)語(yǔ)料庫(kù)在翻譯實(shí)踐中的使用

            英語(yǔ)單語(yǔ)語(yǔ)料庫(kù)特點(diǎn):

            免費(fèi)、量大、質(zhì)高、檢索方便,對(duì)翻譯實(shí)務(wù)可用性較強(qiáng)

            關(guān)健點(diǎn):掌握語(yǔ)料庫(kù)的檢索表達(dá)式、顯示、統(tǒng)計(jì)功能

            1, 檢索表達(dá)式、檢索功能的運(yùn)用,從翻譯的需求, 轉(zhuǎn)變成檢索的需要,丹約束為形式化的表達(dá)

            2, 顯示模式的靈活運(yùn)用(如果有的話) ,便于快建有效的分析和理解, 統(tǒng)計(jì)功能: 進(jìn)階使用,基礎(chǔ)的數(shù)學(xué)知識(shí)+對(duì)比分析

            4, 語(yǔ)言學(xué)家+計(jì)算語(yǔ)言理論+程序員》更深人的,更自動(dòng)化的加工分析過(guò)程

            Sketch Engine http://www.sketchengine.co.uk/

            BYU語(yǔ)料庫(kù)檢索系統(tǒng)http://corpus.byu.edu

            美國(guó)英語(yǔ): COCA. COHA. TIME, google book corpus.

            英國(guó)英語(yǔ)語(yǔ)料庫(kù): BYU-BNC the British National Corpus

            10. 語(yǔ)料庫(kù)在翻譯中的作用之二 Role of Corpus in Translation-Part2

            本節(jié)分享語(yǔ)料庫(kù)的核心概念, 所有語(yǔ)料庫(kù)必須擁有的功能, 也是諸位必然用到的核心的關(guān)鍵點(diǎn)檢索范圍(原數(shù)據(jù)來(lái)源的時(shí)間,地點(diǎn),文章, 雜志,書籍)詞頻 (涉及統(tǒng)計(jì)學(xué)的規(guī)劃問(wèn)題)下一個(gè)概念是所謂的共現(xiàn)檢索表達(dá)式的構(gòu)建

            示例楊百翰以及 sketch engineer 的一些截圖.

            11.

            http://corpus.byu.edu 會(huì)自動(dòng)跳轉(zhuǎn)到楊百翰大學(xué)擴(kuò)展語(yǔ)料庫(kù),

            選擇 Browse:

            輸入 fight, 點(diǎn)擊回車即可.

            點(diǎn)擊動(dòng)詞的 fight, 或者 名詞的 fight, 得到 kwic 顯示的方式:

            12. 專題1:在檢索中使用高級(jí)檢索式 Special Topic1: Advanced Search Formula

            語(yǔ)料庫(kù)查詢語(yǔ)法查詢頁(yè)面-CQP syntax鏈接為語(yǔ)法 pdf 文檔

            可以使用 ? 和 *號(hào)等通配符

            比如 c?t, su星號(hào) t.

            fight against星號(hào), 能看到這個(gè)詞組后面長(zhǎng)跟的是哪些變化.例如查詢以 .And 開(kāi)頭的

            3. 輸入 [fight] 可以查詢到所在的動(dòng)詞形態(tài)

            4. 查詢近義詞 [=fight], 當(dāng)時(shí)出現(xiàn)共 29 個(gè)結(jié)果, 只取頻率大于五萬(wàn)的詞匯.

            需要注意的是, 這里的單詞并不能完全取代, 比如 box 是因?yàn)槿∪瓝舻囊馑妓猿霈F(xiàn)在這里.

            5. 從 fight 的近義詞 box 中篩選 verb, 應(yīng)該是付費(fèi)用戶可以查詢

            在查詢頁(yè)面左側(cè)選擇 動(dòng)詞這個(gè)選項(xiàng)即可.查看它的使用語(yǔ)境,發(fā)現(xiàn) quick 區(qū)給出的語(yǔ)句其實(shí) 是 box 的全部詞義,大量的結(jié)果是 box "盒子"相關(guān)的意思 如果我們只想查看 box 做動(dòng)詞的意思,應(yīng)該怎么做呢?這就涉及到左側(cè)檢索區(qū)選擇詞性的功能 單擊 part of speech list 本身,顯示出一個(gè)下拉菜單, 再次單擊可以將它隱藏起來(lái),這個(gè)菜單的內(nèi)容是各種各樣的詞性 單擊它右側(cè)的問(wèn)號(hào),右下區(qū)域顯示出幫助信息, 單擊這里的超鏈接,在新頁(yè)面中就可以查看全部的標(biāo)簽集, 例如我們看到 ing 分詞的標(biāo)簽是 vvg 現(xiàn)在我們回到檢索界面,我們來(lái)搜索方括號(hào) vvg, 單擊 search,看到的結(jié)果都是動(dòng)詞的現(xiàn)在分詞 英語(yǔ)中最常用的現(xiàn)在分詞是 going,注意一點(diǎn)通配符星號(hào) 也可以使用在這里,例如我們把檢索表達(dá)式換成了方括號(hào) v 星號(hào), 這就可以代表標(biāo)簽集頁(yè)面下面所有 v 開(kāi)頭的標(biāo)簽, 也就是說(shuō)檢索所有的動(dòng)詞 然后回到 檢索界面,單擊 search,看到搜索結(jié)果是各種形態(tài)下的動(dòng)詞

            變通的方法: 在 search 界面, 選擇 brows 選項(xiàng)查詢單詞, 然后可以看到 box 查詢出的詞性 verb

            6. 查看詞性縮寫列表:

            語(yǔ)料庫(kù)標(biāo)簽集鏈接

            7. 搜索所有 ing 的動(dòng)詞, 標(biāo)簽使用 vvg

            在搜索框 list 中輸入 [vvg]

            8. 查詢 box 的所有動(dòng)詞形態(tài)

            # 在搜索框中輸入 box.[v*] ## 把所有的動(dòng)詞形式都包含在內(nèi).

            9. 如果想形容一個(gè)人的眼睛, 看看有哪些形容詞

            1. 先查詢縮略語(yǔ)表, 發(fā)現(xiàn)所有的形容詞都是以 j 開(kāi)頭的 2. 因此輸入以 j 開(kāi)頭的所有詞性 [j*] eyes

            9.1 選中部分形容詞 blue, brown, dark 觀看語(yǔ)境

            只需要玄宗多項(xiàng), 點(diǎn)擊 context 按鈕即可.

            9.1.2 使用命令行與查詢, 效果與 9.1 中的鼠標(biāo)選中效果相等

            black|blue|green eyes

            9.1.3 使用命令行 非 查詢

            pretty -[nn*] ## 查詢所有 pretty 修飾的詞匯, 排除所有的名詞. 可以看到結(jié)果為 pretty much, pretty well 等.

            13. 專題1:BYU中的COLLACATES Special Topic1: Introduction to COLLOCATES in BYU Corpus (09:20)

            BYU 中的 Collacates 如何選擇-官方視頻鏈接

            概念: 語(yǔ)料庫(kù)中的collocates

            在語(yǔ)料庫(kù)語(yǔ)言學(xué)中 collocation 是指兩個(gè)單詞以高于偶然的概率共同出現(xiàn),通俗地講我們可以理解為所謂的搭配.

            本節(jié)將略過(guò), 因和主題相關(guān)度不大.

            幾個(gè)點(diǎn):

            collocates 的選項(xiàng)是在 browse 選項(xiàng)后的加號(hào)+ , 點(diǎn)擊之后才會(huì)出現(xiàn).

            Collocates 查詢示例 1

            1. 本次搜索的目的是找出 into v.ing 的所有搭配.

            2. [v?g*]表示所有的 ing 動(dòng)詞形態(tài)

            3. 數(shù)字表示在 into[]這個(gè)選項(xiàng)之前的所有 4 個(gè)單詞范圍之內(nèi). 后面的 0 表示只查看出現(xiàn)在它之前的詞.

            4. relevance 表示相關(guān)度排序. 大意應(yīng)該是和 into v..ing 可以組成固定搭配的所有選項(xiàng).

            5. 沒(méi)有標(biāo)記出來(lái)的 Minimum 排序默認(rèn)會(huì)選擇 MI 大于 3 的值.

            6. 上圖中 sorting 的選項(xiàng) Relevance 非常重要, 大致示意是決定詞語(yǔ)搭配是偶然出現(xiàn), 還是屬于英語(yǔ)的固定搭配的標(biāo)準(zhǔn).

            Collocates 查詢示例 2

            01234 表示只查詢 figh + [] 之后的詞Sorting 的 Alphabetical 表示按照字母排序Minimum 選擇 Frekquency,并且值為 10. 表示選擇最小選擇詞頻為 10 的單詞.

            14. 專題1:Compare視圖 Special Topic1: Display format COMPARE and the Comparative Function (09:10)

            查詢界面中, 淺灰色的 POS 是詞性, 選中以后會(huì)自動(dòng)標(biāo)記詞性. POS意思是 postion list.

            如何查詢一個(gè)單詞的單獨(dú)詞性

            方法: 關(guān)閉附加選項(xiàng)中的 Group BY. 選擇 NONE

            結(jié)果共 43 個(gè)詞性, 見(jiàn)下圖. 通過(guò)英國(guó)蘭卡斯大學(xué)詞性對(duì)照表 對(duì)照查看所需的詞性.

            Grouped By 選擇 Lehmans 按照詞目分類.出現(xiàn)所有詞性的用法

            示例使用 動(dòng)詞 swim.

            數(shù)據(jù)統(tǒng)計(jì)的呈現(xiàn)結(jié)果

            Raw Freq 是在語(yǔ)料庫(kù)中出現(xiàn)的頻數(shù)

            PER MIL 是每百萬(wàn)字出現(xiàn)的頻數(shù)

            帶加號(hào) + 的選項(xiàng)都表示兩個(gè)全部顯示, 不過(guò)是哪個(gè)那一項(xiàng)在前面顯示不同而已.

            #### kwic 模式下顏色區(qū)分單詞詞性

            在KWIC 查詢結(jié)果頁(yè)面右上角的 RE-SORT后的問(wèn)號(hào), 點(diǎn)擊可以查詢?cè)~性.

            #### 查詢結(jié)果前后單詞的次第排序

            查詢 kwic 模式的 fight

            查詢結(jié)果是以上面為準(zhǔn), 顯示為 fight 右邊的第一個(gè)單詞為第一排序, 第二個(gè)單詞為第二排序,

            第三個(gè)單詞為第三排序.

            查詢次數(shù)到了, 明天截圖. 按照左邊還是右邊排序, 如何排序, 結(jié)果是可以更改的.

            Video: Lecture15. 專題1:BYU語(yǔ)料庫(kù)中的高級(jí)設(shè)置 Special Topic1: Advanced Settings in BYU Corpus (05:16) [ac]

            對(duì)比 fast 和 quick 兩個(gè)單詞的區(qū)別

            圖片中的選項(xiàng):

            1. 在 fast 和 quick 后跟一個(gè)名詞.

            2. 盡量選擇 relevance 選項(xiàng), 這個(gè)是最常用的單詞排序

            查詢結(jié)果示意

            表頭出現(xiàn)的 FAST 數(shù)值 1.28 和 Quick 數(shù)值 0.78, 表示它們各自在語(yǔ)料庫(kù)出現(xiàn)的頻率數(shù)量比值

            也就是說(shuō) fast 是 quick 的 1.21 倍, 反過(guò)來(lái), quick 是 fast 的 0.78.第一列 W1 是 word 搭配單詞出現(xiàn)的頻率, 比如 fast food 出現(xiàn)了 3454 次. W2是 quick 搭配出現(xiàn)的頻次, 可見(jiàn) quick food 幾乎沒(méi)人用.第三列 w1/w2 是 w1 除以 w2, 表示word 1 比 word 2 的使用頻率高低比, 越大說(shuō)明用的越多第四列 Score 分值是第三列 w1/w2 的值除以 1.28(或者 0.78), 表示一個(gè)單詞超出平均差距的程度. 越大說(shuō)明這個(gè)單詞更加傾向于被 fast 修飾.搜索結(jié)果通過(guò)顏色來(lái)區(qū)別使用傾向, 比如綠色表示強(qiáng)勢(shì), 接近白色表示二者半斤八兩

            示例 hard 在Magazine 和 Academic 中,傾向于形容什么單詞

            注意: section 不要打鉤

            搜索結(jié)果如下:

            Green 修飾的名詞, 在 1990-1999 和 2000-2009 這兩個(gè)十年間發(fā)生了什么變化

            結(jié)果如下:

            Video: Lecture16. 專題1:若干范例作回顧 Special Topic1: Some Examples as Review (04:58) [se]

            # 作業(yè)1: 檢索 strike 作動(dòng)詞出現(xiàn)的情況 strike.[v*] # 作業(yè)2: 檢索 strike 所有動(dòng)詞形態(tài)的情況 [strike].[v*] # 作業(yè)3: 檢索 beat 動(dòng)詞的近義詞的情況 [=beat].[v*] ## output: 1 HIT [S] 150948 2 BREAK [S] 73025 3 BEAT [S] 61601 4 OVERCOME [S] 20061 5 STRIKE [S]

            作業(yè)查看publish的近義詞的真實(shí)使用語(yǔ)境,

            這里 之所以強(qiáng)調(diào)真實(shí), 是希望結(jié)果不僅要檢索動(dòng)詞原形, 而且也要包括publish的近義詞的各種形態(tài)。

            我們?cè)谳斎肟蛑休斎敕嚼ㄌ?hào)、 等號(hào)、 publish, 然后在最外面再加一個(gè)方括號(hào), 我們看到結(jié)果有announce、 publish、 issue等等.

            [[=publish]]

            查看dis開(kāi)頭的動(dòng)詞的過(guò)去式

            dis*.[vvd]

            查看fast、 quick、 rapid的使用語(yǔ)境和修飾的名詞

            fast|quick|rapid [nn*]

            查看however出現(xiàn)在句首的使用語(yǔ)境

            .|,|; however

            查看break作 動(dòng)詞,去break某個(gè)事物時(shí)的使用語(yǔ)境

            [break] the [nn*] 1 BREAKING THE LAW 1208 2 BREAK THE LAW 1069 3 BROKE THE LAW 661

            查看gorgeous 的近義詞和這些近義詞修飾的名詞

            [=gorgeous] [nn*] 8 BEAUTIFUL PEOPLE 694 9 BEAUTIFUL WIFE 596 10 ATTRACTIVE WOMAN 591 11 BEAUTIFUL BABY 482 12 LOVELY DAY 480

            #### 查看thick,包括最高級(jí)比較級(jí)等等, thick的各種形態(tài)

            查看laugh作名詞時(shí),它前后五個(gè)單詞內(nèi)可能出現(xiàn)的形容詞

            1 GOOD 50 2 FUNNY 36 3 LITTLE 30 4 OTHER 30 5 BIG 29

            切換到對(duì)比界面,hot 和 warm 分別最常形容什么單詞呢

            結(jié)果是 hot dogs 排名第一

            那么boy和girl分別最常被什么單詞修飾呢

            結(jié)果明顯女孩子的形容詞更多

            Video: Lecture17. 專題1:BYU語(yǔ)料庫(kù)與翻譯案例 Special Topic1: BYU Corpus and Translation Cases (07:16)

            通過(guò)幾個(gè)實(shí)際的案例,向大家展示如何在翻譯實(shí)踐中合理地使用 byu 語(yǔ)料庫(kù)的各類檢索,從而盡量 提高譯文的精準(zhǔn)度

            這個(gè)案例來(lái)自新概念第四冊(cè)第十五課,現(xiàn)有漢語(yǔ)文本如下。

            有兩個(gè)因素嚴(yán)重地妨礙著工業(yè)中科學(xué)研究的效率:一是科研 工作中普遍存在的保密氣氛;二是研究人員缺乏個(gè)人自由。

            查詢方法, 先確認(rèn)用哪個(gè).

            第一步: 通過(guò)中文翻譯找到英文單詞, 然后使用近義詞

            第二步: 通過(guò)第一次的粗查結(jié)果, 發(fā)現(xiàn)詞頻太低.更改選項(xiàng)

            第三部: sorting 改為 Relevance, Minimum 改為 Frequency, 去掉次數(shù)限制, 因?yàn)榇植橹挥袀€(gè)位數(shù).

            可以看到 Hinder, impede 以及 Obstruct 三個(gè)詞, MI值都超過(guò) 3.

            誤差超出范圍可能影響測(cè)試精度

            我們把重點(diǎn)放在超出這個(gè)詞的翻譯上。 我們隨便以其中兩個(gè)為例,比如 surpass, exceed.

            查詢方法非視頻所示.

            通過(guò)增大 Frency 的數(shù)字過(guò)濾使用少的用法

            可以看到結(jié)果中 exceed 對(duì)標(biāo)的是 value 以及 limit 這些詞.

            進(jìn)一步使用 exceed 以及 scope 來(lái)看下搭配

            查詢得知 capacity 以及 range 常用.

            capacity 最多,然后是 reach,range 等等。 單擊其中的某個(gè)詞,參考它的使用語(yǔ)境, 我們就可以用這種方式來(lái)尋找跟待翻譯文本最為接近的例句,從而確定到底是用其中的哪- 一個(gè)詞。

            中國(guó)龍走向世界

            Video: Lecture18. 專題2:翻譯案例之"挫傷積極性" Special Topic2: Translation case--"挫傷積極性" (05:44) [tc]

            本節(jié)幾乎相當(dāng)于全章的總結(jié). 要看第二遍

            如上是更改過(guò) Sorting 的選項(xiàng), mutinfo

            發(fā)布時(shí)間: 2020 年 4 月 4 日.

            掃描二維碼推送至手機(jī)訪問(wèn)。

            版權(quán)聲明:本文由財(cái)神資訊-領(lǐng)先的體育資訊互動(dòng)媒體轉(zhuǎn)載發(fā)布,如需刪除請(qǐng)聯(lián)系。

            本文鏈接:http://www.thecityplacetownhomes.com/?id=14893

            “語(yǔ)料庫(kù)-北大計(jì)算機(jī)輔助翻譯原理與實(shí)踐摘記” 的相關(guān)文章

            盤點(diǎn)ATP年終總決賽四:從澳網(wǎng)突破到替補(bǔ)晉級(jí),弗里茨書寫華章

            盤點(diǎn)ATP年終總決賽四:從澳網(wǎng)突破到替補(bǔ)晉級(jí),弗里茨書寫華章

            當(dāng)我們把時(shí)針倒拔回2022年年初的時(shí)候,其時(shí)美國(guó)男網(wǎng)已經(jīng)是一地廢墟。桑普拉斯、阿加西、張德培等選手的名字仍在很多網(wǎng)球迷心中閃耀。然而,現(xiàn)實(shí)卻是,在伊斯內(nèi)爾2018年獲得邁阿密大師賽冠軍以后,三年時(shí)間里,再也沒(méi)有任何一個(gè)美國(guó)男子選手能夠獲得大師賽冠軍,也沒(méi)有任何一個(gè)美國(guó)男子選手能夠進(jìn)入世界排...

            2022中國(guó)網(wǎng)球巡回賽安寧站落幕

              新華社昆明11月26日電 2022中國(guó)網(wǎng)球巡回賽“魅力安寧”昆明網(wǎng)球公開(kāi)賽26日在昆明落幕,山東選手李澤楷收獲男子單打和雙打兩項(xiàng)冠軍。   在當(dāng)日進(jìn)行的男單決賽中,以“黑馬”之姿一路戰(zhàn)勝多位種子選手闖入決賽的李澤楷以6:2、7:6(6)擊敗賽事3號(hào)種子柏衍。而在前一天結(jié)束的男雙...

            為什么說(shuō)“父子不同桌,叔侄不對(duì)飲”?老祖宗的話,其實(shí)很有道理

            為什么說(shuō)“父子不同桌,叔侄不對(duì)飲”?老祖宗的話,其實(shí)很有道理

              中國(guó)古代歷史悠久,文化源遠(yuǎn)流長(zhǎng),在漫長(zhǎng)的歲月中,古人為了讓后世的我們過(guò)上更順利的生活,少走一點(diǎn)彎路,用自己的人生經(jīng)歷,為后世的我們留下了不少寶貴經(jīng)驗(yàn),并以俗語(yǔ)亦或者是諺語(yǔ)的形式表現(xiàn)出來(lái),比如根據(jù)《禮記·曲禮》“父子不同席”改編的“父子不同桌,叔侄不對(duì)飲”便是其中之一。那么問(wèn)題來(lái)了,這句...

            不……不好了,《網(wǎng)球王子》又被真人版盯上了

            不……不好了,《網(wǎng)球王子》又被真人版盯上了

            記 得 “ 關(guān) 注 我 們 ” 在2017騰訊影業(yè)年度發(fā)布會(huì)上,曝光了43個(gè)影視項(xiàng)目。其實(shí)不乏重磅IP如《上海堡壘》、《黃金瞳》、《斗破蒼穹》等等。 然而在這一長(zhǎng)串的影視項(xiàng)目里竟然出現(xiàn)了一個(gè)久違了的名字—《網(wǎng)球王子》!...

            網(wǎng)球王子真人版定妝照:彭昱暢演技一流,這位白月光卻出乎意料!

            網(wǎng)球王子真人版定妝照:彭昱暢演技一流,這位白月光卻出乎意料!

            網(wǎng)球王子真人版定妝照:彭昱暢演技一流,這位白月光卻出乎意料! 隨著一代人的漸漸成長(zhǎng),那些新鮮的事物也變成了經(jīng)典,甚至被人前赴后繼地演繹。最近,翻拍舊劇的潮流還是沒(méi)有消亡,甚至連已經(jīng)拍過(guò)一次真人版的《網(wǎng)球王子》也再度翻拍了。接下來(lái),小編就和大家一起看看新版《網(wǎng)球王子》的定妝照吧。...

            于正出任總監(jiān)制?《網(wǎng)球王子》國(guó)產(chǎn)真人版即將開(kāi)拍

            于正出任總監(jiān)制?《網(wǎng)球王子》國(guó)產(chǎn)真人版即將開(kāi)拍

            近日,日本漫畫IP《網(wǎng)球王子》全新真人版劇集被曝即將開(kāi)拍,總監(jiān)制將有于正出任。有媒體了解到本劇現(xiàn)正處于選角階段。其實(shí),早在2008年就已經(jīng)翻拍過(guò),由傅東育執(zhí)導(dǎo),秦俊杰、&nbsp;柏栩栩、張超、王傳君...

            ?