詞條
詞條說明
近年來,隨著Internet?的迅猛發展以及人們利用信息技術生產和搜集數據能力的大幅度提高,大規模的網絡文本庫不斷涌現。為了便于在海量文本庫中搜尋、過濾、管理這些文本,基于人工智能技術的文本自動分類方法成為人們研究的焦點。 數據挖掘技術本身就是當前數據技術發展的新領域,文本挖掘則發展歷史較短。傳統的信息檢索技術對于海量數據的處理并不盡如人意,文本挖掘便日益重要起來,可見文本挖掘技術是從信息抽取以
數據挖掘(Data Mining),又稱為數據庫中的知識發現(Knowledge Discovery in Database, KDD),就是從大量數據中獲取有效的、新穎的、潛在有用的、較終可理解的模式的非平凡過程,簡單的說,數據挖掘就是從大量數據中提取或“挖掘”知識。 NLPIR數據挖掘技術的任務主要是關聯分析、聚類分析、分類、預測、時序模式和偏差分析等。 ⑴關聯分析(association
在信息化高度發達的今天,互聯網已經成為人們獲取信息,即時溝通的重要媒介之一,給人們工作生活帶來了很大的便利。但是由于其**性、開放性、即時性的特點,互聯網也成為眾多信息傳播的重要途徑,與傳統媒體相比較為棘手。如何對互聯網進行有效的管理,過濾其中的不良信息,凈化網絡環境成為苛待解決的問題。 目前網絡中70%的信息是以文本形式存在,網頁文本過濾成為目前網絡監控的較重要手段。文本過濾方法有很多,關鍵字
自然語言處理技術是所有與自然語言的計算機處理有關的技術的統稱,其目的是使計算機理解和接受人類用自然語言輸入的指令,完成從一種語言到另一種語言的翻譯功能。自然語言處理技術的研究,可以豐富計算機知識處理的研究內容,推動人工智能技術的發展。自然語言處理中的主要任務 : 1. 詞性標注與(中文)分詞:詞性標注是自然語言處理中較基礎的研究領域之一。分詞則是中文自然語言處理里的重要任務。當前詞性標注任務已經
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: