漢語中介語語料庫
漢語中介語語料庫由北京語言大學於1992年開始建設•╃•。該語料庫立足於漢語教學已收錄1635位外國學生共5774篇成篇成段的漢語作文或練習材料◕•✘▩,總字數約353萬◕•✘▩,其中1731 篇約104萬字的語料經過斷句│╃╃··、分詞和詞性標註等加工處理•╃•。目前該漢語中介語料庫仍處於努力建設過程中◕•✘▩,北京語言大學仍然努力於建設全球漢語中介語語料庫◕•✘▩,其規模預計達5000萬字◕•✘▩,包括筆語語料│╃╃··、口語語料和多模態子庫•╃•。筆語語料規模預計達4500萬字◕•✘▩,其中2000萬字將加工成為熟語料;口語語料450小時◕•✘▩,約合400萬字;多模態語料110小時◕•✘▩,約合100萬字•╃•。