AI預測,為何更智能?

發(fā)布時(shí)間:2019-03-06 瀏覽次數:5512

  1 、趨勢

  當下,人工智能已成為科技領(lǐng)域最熱門(mén)的技術(shù)。機器學(xué)習、深度學(xué)習、人臉識別、無(wú)人駕駛、NLP,各種名詞不絕于耳。人工智能的應用一方面在不斷改變我們每個(gè)人的生活方式,另一方面也在逐漸改變著(zhù)企業(yè)的經(jīng)營(yíng)模式、決策方式。越來(lái)越多的企業(yè)經(jīng)營(yíng)者、高級管理人員、決策者都在這場(chǎng)了解人工智能的競賽中感到焦慮,他們意識到,人工智能即將從根本上改變他們的行業(yè)。

  在這場(chǎng)轟轟烈烈的人工智能浪潮中,我們發(fā)現,對于商業(yè)企業(yè)來(lái)說(shuō),人工智能并沒(méi)有給他們帶來(lái)太多所謂的智能,它帶來(lái)的是智能的一個(gè)關(guān)鍵組成部分——AI預測。

  預測是根據事物以往和現今的數據,通過(guò)一定的科學(xué)方法和邏輯推理,對事物未來(lái)發(fā)展的趨勢作出預計、推測和判斷,尋求事物的未來(lái)發(fā)展規律。預測不僅研究事物的本身,而且還要研究它和環(huán)境之間的相互作用、相互影響。預測的過(guò)程就是在調查研究或科學(xué)試驗的基礎上的分析過(guò)程,簡(jiǎn)稱(chēng)為預測分析。

  預測實(shí)際上是一種填補缺失信息的過(guò)程。比如將非常規的信用卡交易歸類(lèi)為盜刷,將醫學(xué)影像中的腫瘤分類(lèi)為惡性,或是判斷當前拿著(zhù)手機的人是否是真正的機主,即運用你現在掌握的信息(通常稱(chēng)為數據),生成你尚未掌握的信息。這既包含了對于未來(lái)數據的時(shí)序預測,也包含了對當前與歷史數據的分析判斷,是更廣義的預測。

  在人工智能技術(shù)介入前,預測早已隨處可見(jiàn),小到個(gè)人股票投資,大到企業(yè)經(jīng)營(yíng)決策、國家制訂國民經(jīng)濟發(fā)展規劃,社會(huì )的方方面面無(wú)不體現著(zhù)預測的重要性。而人工智能的飛速發(fā)展,將為預測技術(shù)提供了更多可行的思路和方案,使得預測的準確度能夠得到有效提升,為各行各業(yè)提供超越傳統統計學(xué)分析的決策支持能力。

  這當中,更為重要的是,AI預測更廉價(jià)?!叭绻硺訓|西的價(jià)格下降,那么我們會(huì )更多地使用它?!薄@是最簡(jiǎn)單的經(jīng)濟學(xué),如今這種情況正出現在預測領(lǐng)域。運算的成本變得足夠低,繼而幫助我們快速找到成千上萬(wàn)種應用方式。預測成本的下降也將影響其他東西的價(jià)值:比如提高互補品(數據、判斷和行動(dòng))的價(jià)值,以及降低替代品(人類(lèi)預測)的價(jià)值。

  2 、智能

  那么,預測技術(shù)發(fā)展到如今,何以稱(chēng)得上智能呢?回過(guò)頭來(lái)看,應該歸功于更好的數據、模型和計算能力,它們促使預測技術(shù)飛速發(fā)展,從而走上“智能”之路。機器學(xué)習便是功臣之一。

  歷史上,預測的主流分析方法是使用數據挖掘的一系列技術(shù),而這其中被經(jīng)常使用的是一種被稱(chēng)為“回歸”的統計技術(shù)?;貧w做的是什么?它主要是根據過(guò)去發(fā)生時(shí)間的“平均值”來(lái)尋找一種預測。當然,回歸也有很多種實(shí)現方式,有簡(jiǎn)單的線(xiàn)性回歸,多項式回歸,也有多因素的Logistic回歸,本質(zhì)上都是一種曲線(xiàn)的擬合,是不同模型的“條件均值”預測。

  在機器學(xué)習之前,多元回歸分析提供了一種處理多樣條件的有效方法,可以嘗試找到一個(gè)預測數據失誤最小化,“擬合優(yōu)度”最大化的結果。但是,回歸分析中,對于歷史數據的無(wú)偏差預測的渴求,并不能保證未來(lái)預測數據的準確度,這就是所謂的“過(guò)渡擬合”。

  與回歸分析不同,機器學(xué)習的預測不追求平均值的準確性,允許偏差,但求減少方差。過(guò)去,由于數據和計算能力的匱乏,機器學(xué)習的表現不如回歸分析來(lái)得好。但如今,一切都不一樣了,隨著(zhù)數據體量的不斷增長(cháng),計算能力的不斷提升,使用機器學(xué)習和(神經(jīng)網(wǎng)絡(luò ))深度學(xué)習來(lái)做預測效果比其他所有方法表現得都要更好,這使得我們利用統計學(xué)進(jìn)行預測的方法發(fā)生了徹底的轉變。把人工智能與機器學(xué)習的最新發(fā)展作為傳統統計學(xué)的延伸與加強這是非常誘人的想法!你會(huì )發(fā)現,這其實(shí)跟觀(guān)遠數據AI+BI核心戰略是一致的。

  

觀(guān)遠數據AI+BI服務(wù)模式


  那么,如果僅僅是預測,為什么能稱(chēng)得上“智能”呢?這是因為,某些情況下,我們預測的效果已經(jīng)好到我們可以直接用來(lái)做決策,而無(wú)需再應用基于規則的邏輯。這其實(shí)也在改變著(zhù)計算機編程的方式。

  想象一下,原先復雜的業(yè)務(wù)場(chǎng)景下,基于“if...then...”以及傳統的統計學(xué)方法來(lái)實(shí)現的代碼邏輯,總是無(wú)法覆蓋所有的條件組合。而近年來(lái),支撐預測方法進(jìn)步的一種黑科技叫做“深度學(xué)習”,它與人類(lèi)大腦有著(zhù)類(lèi)似的工作方式,利用“反向傳播”的方法從數據中不斷訓練、反饋、學(xué)習,獲取“知識”。就預測而言,隨著(zhù)不斷的訓練、自我學(xué)習,預測模型會(huì )得到不斷優(yōu)化,預測準確性也在隨著(zhù)學(xué)習而改進(jìn),而越來(lái)越高的預測準確性為商業(yè)決策提供了可信賴(lài)的基礎。

  3、預測支持決策

  一個(gè)完整的預測支持決策的回路包括下圖所示8個(gè)組成部分。這中間,數據在整個(gè)歷史數據輸入、模型訓練、數據預測、決策、執行、結果收集、數據反饋的完整回路中流轉。

  

預測支持決策回路.jpg


  ? 數據清洗與特征工程是有效輸入的核心。實(shí)際情況中,由于預測項目開(kāi)始前對數據的統一管理不夠重視,對歷史數據進(jìn)行清洗整理會(huì )占掉整個(gè)預測項目的近一半時(shí)間。數據質(zhì)量的優(yōu)劣,其實(shí)是預測項目成敗極其重要因素。而有了優(yōu)質(zhì)的數據,提取恰當的特征也是預測成功與否的重中之重。

  ?足夠豐富的帶特征數據是預測模型得以訓練的基礎。

  ?預測是決策的核心輸入。依賴(lài)訓練得到的模型與未來(lái)有限的確定因素,來(lái)為決策提供數據預測支持。

  ?而決策執行的結果又將反饋到訓練模型,優(yōu)化預測。