跳去內容
主目錄
主目錄
移去側欄
收埋
導覽
頭版
目錄
正嘢
時人時事
是但一版
關於維基百科
聯絡處
交流
說明書
城市論壇
社區大堂
最近修改
查嘢
搵嘢
閱讀設定
捐畀維基百科
開戶口
簽到
個人架生
捐畀維基百科
開戶口
簽到
目錄
移去側欄
收埋
文頭
1
睇埋
開/收內容一覽
資訊抽取
18種語言
العربية
Azərbaycanca
Català
Čeština
Deutsch
Ελληνικά
English
Español
Euskara
فارسی
日本語
한국어
Русский
Српски / srpski
Svenska
Українська
Tiếng Việt
中文
改拎
文章
討論
粵語
閱
改
睇返紀錄
架撐
架撐
移去側欄
收埋
動作
閱
改
睇返紀錄
基本
有乜連過嚟
連結頁嘅更改
上載檔案
專門版
固定連結
此版明細
引用呢篇文
攞短網址
下載QR code
打印/匯出
下載PDF
印得嘅版本
閱讀設定
移去側欄
收埋
出自維基百科,自由嘅百科全書
Dr. Greywolf
(
討論
|
貢獻
)
喺2024年2月11號 (日) 06:41嘅修訂。
【
改動
】
←之前嘅修訂
|最新嘅修訂版本【改動】|新啲嘅修訂→【改動】
提示:
呢篇文講嘅唔係
資訊提取
。
資訊抽取
(
英文
:
information extraction,IE
)係指由一份可以由
電腦
自動讀取嘅
文件
度攞出有用嘅
資訊
,例如想像一個
人工智能程式
學識睇一段字嚟學知識。
睇埋
[
編輯
]
資訊系統
語義
睇
傾
改
自然語言處理
(NLP)
教
AI
處理
自然語言
嘅技術
語言
數據
語言資源
語料庫
(
口語語料庫
·
Treebank
·
PropBank
(
英文
:
PropBank
)
)
詞庫資源
機械可讀字典
受控詞表
索引典
語言模型
(
大型語言模型
)
語義網絡
(
WordNet
·
BabelNet
·
語義相似度網絡
)
對等字詞
普世依賴項
字
句
層次
文字分割
字切割
句子切割
記號化
詞法分析
淺度解析
同
分析樹
N-gram
(
2-gram
·
3-gram
)
詞形還原
同
詞幹提取
命名實體識別
合成詞處理
語言辨認
停用詞
詞性標注
字袋模型
搭配詞抽取
Regex
解析
Tf-idf
Truecasing
語義
層次
詞義消歧
同
詞義歸納
語義角色標籤
指代解決
情感分析
自然語言理解
本體學習
自動總結
(
句子提取
·
文字簡化
·
多文件總結
)
主題模型
(
文檔分類
)
概念探勘
文本蘊涵
分佈語義
語義距離
文件詞彙矩陣
外顯
同
潛在
語義分析
字嵌入
Word2vec
機械翻譯
翻譯器
例子為本
、
規則為本
同
統計
轉移為本
神經為本
用家介面
聲用家介面
傾偈機械人
問答系統
虛擬助理
互動式小說
第啲應用
資訊
提取
同
抽取
(
詞彙抽取
)
電腦輔助評閱
(
拼寫檢查
·
文法檢查
·
自動評分
)
反垃圾電郵技術
網頁刮料
自動資料收集
(語音
識別
同
分割
·
光學字符識別
)
語音合成
自然語言生成
文本探勘
同
遙距閱讀
提示工程
相關技術
自然語言工具箱
spaCy
DBpedia
ROUGE
語義網
機械學習
同
AI 完全
字串搜尋
困惑度
ChatGPT
速記
相關領域
語言學
(
語料庫語言學
同
運算語言學
)
圖書館學
同
資訊科學
數碼人文學
文獻計量學
市場學
心理測量學
NLP 類
資訊抽取
係
電算
楔位文
,你可以
編輯佢
充實內容。
屬於3類
:
電算楔類
資訊科學
自然語言處理
屬於1隱類:
有英文嘅文章