青海省住房和城鄉(xiāng)建設(shè)廳門戶網(wǎng)站深圳做網(wǎng)站
機(jī)器學(xué)習(xí)是人工智能的核心研究領(lǐng)域之一,其研究動(dòng)機(jī)是為了讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。
目前被廣泛采用的機(jī)器學(xué)習(xí)的定義是“利用經(jīng)驗(yàn)來(lái)改善計(jì)算機(jī)系統(tǒng)自身的性能”。由于“經(jīng)驗(yàn)在計(jì)算機(jī)系統(tǒng)中主要是以數(shù)據(jù)的形式存在的,因此機(jī)器學(xué)習(xí)需要運(yùn)用機(jī)器學(xué)習(xí)技術(shù)對(duì)數(shù)據(jù)進(jìn)行分析,這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之一,并且為此而受到越來(lái)越多的關(guān)注。

與數(shù)據(jù)挖掘的區(qū)別與聯(lián)系
所謂數(shù)據(jù)挖掘就是:“識(shí)別出巨量數(shù)據(jù)中有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過(guò)程”。顧名思義,數(shù)據(jù)挖掘就是試圖從海量數(shù)據(jù)中找出有用的知識(shí)。
可見(jiàn),數(shù)據(jù)挖掘的教材和課程主要講解各種不同的數(shù)據(jù)挖掘任務(wù)。比如:分類、回歸、聚類、關(guān)聯(lián)分析、異常分析、演變分析等等。
數(shù)據(jù)挖掘可以視為機(jī)器學(xué)習(xí)和數(shù)據(jù)庫(kù)的交叉,它主要利用機(jī)器學(xué)習(xí)界提供的技術(shù)來(lái)分析海量數(shù)據(jù),利用數(shù)據(jù)庫(kù)界提供的技術(shù)來(lái)管理海量數(shù)據(jù)。
二者既有區(qū)別又有聯(lián)系,整體來(lái)說(shuō),機(jī)器學(xué)習(xí)偏理論,數(shù)據(jù)挖掘偏應(yīng)用。

現(xiàn)在我們來(lái)看看分類的定義。分類就是構(gòu)建一個(gè)分類模型,即分類器,然后通過(guò)分類器將數(shù)據(jù)對(duì)象映射到某個(gè)給定的類別中的過(guò)程。分類過(guò)程可以分為兩步:
使用已知類標(biāo)記的訓(xùn)練數(shù)據(jù)集學(xué)習(xí)分類模型。這一步稱為分類器的訓(xùn)練階段。
應(yīng)用分類模型對(duì)未知類標(biāo)記的對(duì)象進(jìn)行分類。這一步稱為分類器的工作階段。實(shí)際上,在工作之前還又學(xué)到的模型進(jìn)行性能測(cè)試評(píng)估(這一步稱為分類器的測(cè)試階段),如果模型的性能可以接受,才可以用它來(lái)對(duì)未知類標(biāo)記的對(duì)象進(jìn)行分類。
可見(jiàn)分類是一個(gè)三步走的過(guò)程:訓(xùn)練--測(cè)試--工作

分類的基本過(guò)程


分類:定義與過(guò)程

