人工智能的發展已經有幾十年的過程。但是隨著“大數據”的出現,人工智能越來越受到關注。
“在計算機科學領域,人工智能研究將自己定義為”智能代理人工智能和大數據:完美匹配“的研究:任何能夠感知其環境并采取行動最大化其成功機會的設備。”
大數據定義如下:
“大數據是一個術語,因為傳統的數據處理應用軟件不足以處理它們,所以這些術語太大或太復雜。”
計算機已經變得如此強大,以至于我們現在能夠每秒存儲數百萬條記錄。不幸的是,我們分析數據的能力可能是一個瓶頸。繼續使用傳統方法很具挑戰性。
AI大數據完美結合
那么為什么大數據會引起人們對AI的關注?答案很簡單,人工智能化可以用傳統數據處理或人類無法處理的大型復雜數據集。
我們以銀行應用程為例。應用程序每秒流入數百萬記錄,并且我們希望他在發生異常活動時發生警報,如欺詐狀況和盜竊,在這種情況下,人們不可能逐步處理或分析這部分數據一小部分,以防止或制止犯罪。即使有數百人負責分析可能的欺詐情況,大量的數據也會壓倒人類的決策能力。
人工智能技術被用于大數據
外推法(Extrapolation)
外推法是在原始觀察范圍之外,根據與其他變量的關系估計變量值的過程。作為一個例子,我們假設一些數據呈現出一種趨勢。公司的高管們想知道:如果這種趨勢持續下去,公司將在三個月內發生什么?推斷可以確定這一點。請記住,并非所有的趨勢都是線性的。線性趨勢很簡單;一個簡單的折線圖就足夠了。非線性趨勢涉及更多,這就是外推函數可以幫助的地方。這些算法基于多項式,圓錐曲線或曲線方程。
異常檢測(Anomaly Detection)
異常檢測也稱為異常值檢測。它由識別不符合預期模式的項目,事件或觀察結果或數據集中的其他項目組成。異常檢測可以識別銀行欺詐等事件(前面提到的AI的應用)。它也適用于其他幾個領域,包括(但不限于):故障檢測,系統健康監測,傳感器網絡和生態系統干擾。
貝葉斯定理(Bayes Theorem)
在概率論和統計學中,貝葉斯定理基于事先了解可能與事件相關的條件來描述事件的概率。這是根據以前的事件預測未來的一種方法。作為一個例子,我們假設一家公司希望知道哪些客戶有丟失(流失)的風險。使用貝葉斯,可以收集不滿意客戶的歷史數據,并用它來預測未來可能會丟失的客戶。這對于大數據來說非常合適,因為隨著更多的歷史數據輸入到貝葉斯算法中,其預測結果變得越準確。
自動化計算密集型人類行為
在某些情況下,人類可能會分析大量的數據,但是隨著時間的推移它會被耗盡。AI可以提供幫助,基于規則的系統可用于提取,存儲和處理來自人類的知識,以便以有用的方式解釋數據。在實踐中,規則是從人類經驗中衍生出來的,并被表示為一組使用一組斷言的“"if-then”語句,在這些斷言上創建了關于如何處理這些斷言的規則。基于規則的系統可以用來創建軟件來代替人類專家提供問題的答案。這些系統也可能被稱為專家系統。考慮一家公司擁有一位能夠為特定目標分析數據的人類專家。然而,這項任務是單調而乏味的。基于規則的系統可以捕獲并自動化這些專業知識。
圖論(Graph Theory)
在數學中,圖論是研究用于模擬物體間成對關系的數學結構。在這種情況下,圖形由頂點,節點或由邊,弧或線連接的點組成,并且可能非常復雜和龐大。借助圖論,可以輕松獲得對數據之間關系的深入了解。例如,考慮一個復雜的計算機網絡。圖論可以提供有關網絡瓶頸如何導致其他問題以及特定瓶頸的根本原因的見解。
模式識別(Pattern Recognition)
顧名思義,模式識別就是用來檢測數據中的模式和規律,是機器學習的一種形式。模式識別系統與訓練數據一起教授,這個過程被稱為監督學習。他們也可以用來發現以前未知的數據模式與一個稱為無監督學習的過程。與基于單一類型數據篩選潛在異常的異常檢測不同,模式識別可以發現多個數據中以前未知的模式,并考慮數據之間的模式(或關系)。一家公司(任何行業)可能有興趣知道什么時候會發生一些不尋常的事情,比如消費者突然開始購買一件商品去購買另一件商品。這種模式可能會對企業感興趣。
