第三節 語言學和信息處理
一、語言學和語言信息處理研究
1.人類的語言叫自然語言,用計算機處理語言或達成人和計算機之間的“語言”溝通叫做語言信息處理。語言的信息處理跟語言學的研究有密切關系,是語言學的應用或現代意義上的應用語言學的重要內容。
2.如何利用預先的研究成果進行信息處理有不同看法,主要圍繞兩個問題:
(1)哪些語言學的知識可以用于信息處理技術。因認識的不同而產生兩種研究方向:一種是基于的信息處理研究,相關的語言學叫語料庫語言學或工程語言學;另一種是基于規則的信息處理研究,相關的語言學叫做理論語言學或科學語言學。
(2)語言學知識可以用于哪些信息處理技術。
3.不同的住處處理技術需要不同的語言學知識。有的只需要或主要依賴語料統計知識,如文本檢索、語句統計、詞語頻率、詞語搭配、圖書查詢等;有的住處處理工作必須部分或全部依靠語言規則知識,如文字編碼、語音識別、自動校對、詞語分類、言語生成、語義分析等;還有的信息處理工作只靠現有的語言學知識遠遠不夠,如機器翻譯等。
二、語言學和已實現的語言信息處理技術
1.漢字編碼和漢字處理。2.文本檢索和數據統計。3.語料庫和語料分析。
4.語音實驗和語音的識別與合成。5.文本的自動校對和摘要。
三、語言學在信息處理中的應用前景
1.機器翻譯:通過計算機把一種語言自動翻譯成另外的一種或多種語言的語言信息處理技術。
2.人機對話:較低級目標是通過預先編制的程序來控制計算機跟人“對話”;更高級的目標是使“人”和“機”真正做到像“人”和“人”那樣對話。
3.人工智能:能自動翻譯、回答問題、執行人的語言指令,還能根據現實情況隨時進行判斷和推理,并做出文字形式或語音形式的報告。
聲明:
(一)由于考試政策等各方面情況的不斷調整與變化,本網站所提供的考試信息僅供參考,請以權威部門公布的正式信息為準。
(二)本網站在文章內容來源出處標注為其他平臺的稿件均為轉載稿,免費轉載出于非商業性學習目的,版權歸原作者所有。如您對內容、版權等問題存在異議請與本站聯系,我們會及時進行處理解決。
相關推薦
2022年浙江自考心理學復習重點(七)
08-062023年10月浙江自考傳播學概論復習資料:反饋
08-292022年浙江《組織與管理概論》復習資料
09-222023年4月浙江自考知識產權法復習資料:馳名商標的特別保護
04-142023年4月浙江自考環境心理學復習重點三
11-182022年浙江自考市政學復習筆記第四章
09-142023年10月浙江自考傳播學概論復習資料:有限效果論
08-302023年4月浙江自考英美文學選讀復習筆記:Jane Austen
12-092023年浙江自考勞動就業概論復習資料:勞動概述
02-222022年浙江自考外國文學史復習筆記(1)
10-26