pk10计划软件免费版 北京pk10怎么追车 北京pk10彩票店有售吗 北京赛车信誉平台推荐 北京pk10冠军追冷号 福彩北京赛车走势图表 pk10彩票是不是人为控制 韩国音速pk10 北京pk10杀两码方法 北京赛车杀码计划 几千个PK10在线计划 pk10计划软件冠军五码 北京pk10有规律的吗 北京赛车pk开奖苹果网 北京赛车冠亚大小漏洞
千人智庫官方二維碼

首頁  >   千人智庫 > 學術進展 > 信息科學
數據挖掘技術的應用探討
時間:2019-10-22 09:14:00來源:漢斯出版社
提交需求
提要:數據挖掘是一種能從海量的、隨機的、不完整的、復雜的數據中提取出對人們可能潛在有用的信息和知識的過程。

隨著信息時代的到來,在享受信息技術所帶來的便利的同時,人們也面臨著信息時代所導致的信息爆炸問題,面對著越來越多的信息數據,從中獲得有價值的知識變得越來越困難,而從上世紀80年代開始,伴隨著數據庫技術的發展和新應用的提出,數據挖掘技術應運而生。數據挖掘是一種能從海量的、隨機的、不完整的、復雜的數據中提取出對人們可能潛在有用的信息和知識的過程,其中涉及到多種技術的內容,包括計算機技術、數據庫技術、數據統計技術等。

(圖片來源于網絡,侵刪)

通過數據挖掘技術來處理大量的數據內容極大地提高人們處理信息的效率,從中可以獲取大量有價值的信息和知識來幫助人們進行決策工作。在漢斯出版社《數據挖掘》期刊中,有論文學者簡述了數據挖掘技術產生的背景及其概念,并進一步詳細描述了數據挖掘的七個過程,最后詳細闡述了數據挖掘技術的主要數據挖掘方法及其適用領域。

數據挖掘是從海量數據中提取隱含在其中的有用信息和知識的過程,一般來說,我們將數據挖掘過程概括為以下7個部分定義挖掘目標數據取樣數據探索數據預處理模式發現模型構建模型評價。數據挖掘的方法也有五種:分類和回歸技術聚類分析關聯規則時序模式異常檢測

分類和回歸技術是數據挖掘中使用最多最頻繁的兩種方法。簡單地說,分類是將由一系列變量組成數據集合映射到預先定義好的群組或類。分類的前提是這組數據已經有確定了的類別,所以分類又被稱為有監督的學習。回歸分析是用屬性的歷史數據預測未來趨勢,找出各個數據之間的相關關系。回歸分析通過假設存在可以擬合目標屬性的函數,然后利用樣本數據進行誤差分析,確定最能體現目標屬性的函數。簡言之,回歸分析是處理變量間(包括一對一和一對多)相關關系的一種統計方法。

聚類分析是根據數據之間的相似度進行數據分類的一種方法,它是在沒有劃分數據類的前提下進行的。所以,聚類又被稱為無指導的學習。聚類的輸入對象是一組事先未被分類的數據,通過確定數據之間在原本的屬性上的相似性來完成聚類任務。不管研究對象中是否真的有不同的類別,運用聚類分析都能將樣本數據分成若干個類別,但其結果并不是唯一的,選擇哪一個分類結果最終是由研究者的主觀判斷和分析總結決定的。

數據挖掘技術從概念的提出到理論的完善、算法的成熟一步步成為了一套完整的體系,并成功應用在許多領域,例如金融、電子商務、醫療、機械工業、網絡等領域,這也表明了數據挖掘技術有著廣泛的應用前景和研究價值。面對信息時代所產生的大量數據,根據實際的業務需求我們可以按照本文介紹的數據挖掘過程一步步分析研究,并結合適當的數據挖掘方法提取出所需要的信息和知識,挖掘出潛在的模式關系。

文章來源:https://www.hanspub.org/journal/PaperInformation.aspx?paperID=32592

標簽
數據 挖掘 技術 應用 探討

版權聲明:千人智庫網系千人智庫唯一官方網站,凡轉載本網內容請注明來源與作者。

作者系郭珊珊

評論詳情

   暫無相關評論!
北京pk10赢了五万块
pk10计划软件免费版 北京pk10怎么追车 北京pk10彩票店有售吗 北京赛车信誉平台推荐 北京pk10冠军追冷号 福彩北京赛车走势图表 pk10彩票是不是人为控制 韩国音速pk10 北京pk10杀两码方法 北京赛车杀码计划 几千个PK10在线计划 pk10计划软件冠军五码 北京pk10有规律的吗 北京赛车pk开奖苹果网 北京赛车冠亚大小漏洞
湖北11选5最大遗漏号码 什么广告软件不用买就能赚钱的 时时彩直选稳赚技巧 网络暴利赚钱项目培训 极速赛车两面计划软件 有什么腾讯手游可以赚钱 全天时时彩最准计划557799 天津快乐10分开奖前三组 吉祥三公下载