語料庫

Corpus
美國當代英語語料庫(單語)

美國當代英語語料庫(單語)

美國當代英語語料庫(Corpus of Contemporary American English◕•✘▩,簡稱COCA)是目前最大的免費英語語料庫◕•✘▩,它由包含5.2億詞的文字構成◕•✘▩,這些文字由口語│╃╃··、小說│╃╃··、流行雜誌│╃╃··、報紙以及學術文章五種不同的文體構成•╃•。
美國楊百翰大學BNC語料庫(單語)

美國楊百翰大學BNC語料庫
(單語)

由美國楊百翰大學語言學教授創立◕•✘▩,下設多個字型檔◕•✘▩,語料極其豐富•╃•。
美國國家語料庫(單語)

美國國家語料庫(單語)

最大的關於美語使用現狀的語料庫◕•✘▩,記錄了自1990年起美語口頭和書面語◕•✘▩,詞量達2200萬•╃•。
BNC (British National Corpus) (單語)

BNC (British National Corpus)
(單語)

英國國家語料庫由牛津出版社│╃╃··、朗文出版公司和大英圖書館等機構共同建立•╃•。其中包括廣泛的書面語和口語◕•✘▩,書面語90%◕•✘▩,口語10%◕•✘▩,總詞量超過1億•╃•。
Web Concordance English (單語)

Web Concordance English
(單語)

綜合多個語料庫◕•✘▩,內容包括歷屆美國總統演講及電視節目│╃╃··、學術│╃╃··、法律等◕•✘▩,有口語和書面語兩種形式◕•✘▩,詞量達數千萬•╃•。
Michigan Corpus of Academic Spoken English (單語)

Michigan Corpus of Academic Spoken English(單語)

密歇根大學英語語言所建立◕•✘▩,內容主要為學術英語口語◕•✘▩,詞量達184萬•╃•。
Linggle

Linggle
(單語)

臺灣“清華大學”Linggle 系統是少數由學界開發且規模逼近業界搜尋引擎的特例•╃•。Linggle檢索引擎是一個可用於英語翻譯的語法工具和句子工具◕•✘▩,可幫助譯者根據詞性來檢索搭配◕•✘▩,提高譯文的豐富度和準確度•╃•。
Sketch Engine(單語)

Sketch Engine(單語)

語料庫檢索工具Sketch Engine支援單詞概覽│╃╃··、單詞辨析│╃╃··、單詞搭配│╃╃··、同義詞查詢│╃╃··、語料索引│╃╃··、建立語料庫等豐富的核心功能◕•✘▩,被應用於詞典編撰│╃╃··、語言教育和翻譯研究等多領域•╃•。另外◕•✘▩,該工具也能基於網路資源或本地文件◕•✘▩,自建特色語料庫◕•✘▩,提取單詞表•╃•。
Online BLCKWIC Concordancer(雙語◕•✘▩,英語│╃╃··、日語)

Online KWIC Concordancer
(雙語│╃╃··、英語│╃╃··、日語)

商業信函及其他信函類語料庫◕•✘▩,由日本人建立◕•✘▩,包括商業信函│╃╃··、名人信函│╃╃··、美國總統國情諮文部分名著等•╃•。
BOE——柯林斯英語語料庫(the Bank of English)

BOE——柯林斯英語語料庫
(the Bank of English)

為目前世界三大著名語料庫之一◕•✘▩,該語料庫(The Bank of English)為英國伯明翰大學與Harper Collins出版社合作建立的COBUILD語料庫的一部分◕•✘▩,目前固定在4.5億詞的規模◕•✘▩,可以線上檢索•╃•。
WebCorp

WebCorp

由伯明翰城市大學英語學院英語研究小組開發的網路語料庫WebCorp 除了具有傳統語料庫檢索軟體的詞表(wordlist)│╃╃··、語篇統計(token與type數目統計)│╃╃··、KWIC索引(語境共現)│╃╃··、搭配統計(Key phrases)│╃╃··、詞語型式(pattern)統計等功能以外◕•✘▩,還具有網路語料庫特有的功能•╃•。它能夠設定常見詞(stop words)排除◕•✘▩,將the│╃╃··、a等常見詞從搭配中自動去除掉◕•✘▩,這樣檢索出來的詞語搭配更加精煉準確;能夠設定搜尋的域名範圍│╃╃··、時間範圍◕•✘▩,可以提供不同地區│╃╃··、不同時期的語料資源•╃•。
現代漢語平衡語料庫(單語)

現代漢語平衡語料庫(單語)

現代漢語平衡語料庫的通用性和平衡性透過語料樣本的分佈廣度和比例控制實現•╃•。語料輸出可選生語料與標註語料•╃•。該語料庫共有三種檢索模式◕•✘▩,分別是☁•:整詞匹配│╃╃··、模糊匹配│╃╃··、全文檢索•╃•。
清華大學中英平行語料庫

清華大學中英平行語料庫

清華大學中英平行語料庫由清華大學自然語言處理與社會人文計算實驗室在國家“863 計劃” 專案“ 網際網路語言翻譯系統研製” 的支援下◕•✘▩,利用自身研發的網際網路平行網頁獲取軟體和雙語句子自動對齊軟體獲取並處理得到的◕•✘▩,共包含285萬中英平行句對•╃•。
北京語言大學語料庫中心BCC語料庫”

北京語言大學語料庫中心
Bcc語料庫

BCC語料庫是以漢語為主◕•✘▩,兼有英語│╃╃··、西班牙語│╃╃··、法語│╃╃··、德語│╃╃··、土耳其語等語言的語料庫◕•✘▩,其中漢語語料規模約150億字◕•✘▩,涵蓋了報刊│╃╃··、文學│╃╃··、微博│╃╃··、科技│╃╃··、綜合和古漢語等多領域語料•╃•。Bcc語料庫包括了生語料│╃╃··、分詞語料│╃╃··、詞性標註語料和句法樹◕•✘▩,目前已對現代漢語│╃╃··、英語│╃╃··、法語的語料進行詞性標註•╃•。
中文語言資源聯盟

中文語言資源聯盟

中文語言資源聯盟是由中國中文資訊學會語言資源建設和管理工作委員會發起◕•✘▩,由中文語言(包括文字│╃╃··、語音│╃╃··、文字等)資源建設和管理領域的科技工作者自願組成的學術性│╃╃··、公益性│╃╃··、非盈利性的社會團體◕•✘▩,具有完整性│╃╃··、權威性│╃╃··、系統性和開放性的特點◕•✘▩,涵蓋中文資訊處理各個層面上所需要的語言語音資源◕•✘▩,包括詞典│╃╃··、各種語音語言語料庫│╃╃··、工具等•╃•。
香港教育學院“LIVAC漢語共時語料庫”

香港教育學院
“LiVaC漢語共時語料庫”

LIVAC漢語共時語料庫以嚴謹│╃╃··、恆常與「共時」方式◕•✘▩,搜尋和處理了超常的大量具代表性漢語平面媒體語料◕•✘▩,並透過精密的技術◕•✘▩,累積了泛華語地區眾多精確的語言和語用統計資料•╃•。本語料庫最大特點是採用「共時性」視窗模式◕•✘▩,剖析來自香港◕•✘▩,北京◕•✘▩,上海◕•✘▩,臺灣◕•✘▩,澳門◕•✘▩,新加坡等多地有代表性的定量華語媒體語料•╃•。直至2016年◕•✘▩,LiVaC已累計過濾25億漢字語料◕•✘▩,並已處理逾6億字◕•✘▩,累積並持續提煉出2百多萬詞條•╃•。
漢語中介語語料庫”

漢語中介語語料庫

漢語中介語語料庫由北京語言大學於1992年開始建設•╃•。該語料庫立足於漢語教學已收錄1635位外國學生共5774篇成篇成段的漢語作文或練習材料◕•✘▩,總字數約353萬◕•✘▩,其中1731 篇約104萬字的語料經過斷句│╃╃··、分詞和詞性標註等加工處理•╃•。目前該漢語中介語料庫仍處於努力建設過程中◕•✘▩,北京語言大學仍然努力於建設全球漢語中介語語料庫◕•✘▩,其規模預計達5000萬字◕•✘▩,包括筆語語料│╃╃··、口語語料和多模態子庫•╃•。筆語語料規模預計達4500萬字◕•✘▩,其中2000萬字將加工成為熟語料;口語語料450小時◕•✘▩,約合400萬字;多模態語料110小時◕•✘▩,約合100萬字•╃•。
北大法律英文網

北大法律英文網

北大法律英文網並非嚴格意義上的語料庫◕•✘▩,但是它可以檢索法律新聞│╃╃··、法律法規│╃╃··、司法判例│╃╃··、法律期刊│╃╃··、國際條約│╃╃··、白皮書│╃╃··、政府公報與法律術語◕•✘▩,支援中英文雙語對照檢視◕•✘▩,方便譯者研究│╃╃··、理解和提高用詞準確度◕•✘▩,進一步提升法律翻譯能力◕•✘▩,所以一定程度上可以作為語料庫使用•╃•。
知網翻譯助手

知網翻譯助手

知網翻譯助手是以知網總庫所有文獻資料為依據◕•✘▩,不僅提供英漢詞語│╃╃··、短語的翻譯檢索◕•✘▩,還可以提供句子的翻譯檢索•╃•。不但對翻譯需求中的每個詞給出準確翻譯和解釋◕•✘▩,還給出大量與翻譯請求在結構上相似│╃╃··、內容上相關的例句◕•✘▩,方便譯者得到恰當的翻譯結果•╃•。
句酷

句酷

句酷致力於幫助非英語母語者尋找地道表達◕•✘▩,提高譯文準確性•╃•。句酷的雙語例句庫語料量大│╃╃··、覆蓋面廣│╃╃··、真實地道◕•✘▩,目前支援中英│╃╃··、中日│╃╃··、日英三種語言對的檢索•╃•。不僅可以查詢雙語例句◕•✘▩,同時具備詞典功能◕•✘▩,提供高頻搭配供譯者選擇•╃•。
通譯典

通譯典

通譯典的翻譯句庫是目前國內最大的翻譯例句庫◕•✘▩,通譯典開發小組編撰句庫的目的是為廣大翻譯工作者提供翻譯參考•╃•。

其他單語語料庫

其他雙語/多語語料庫

蜜月无码av在线,成人无码亚洲精品无码,好大好硬好深好爽gif动态图,亚洲老熟女与小伙bbwtv