近日,麥肯錫發(fā)布《技術(shù)熱門趨勢報告(The top trends in tech)》,對世界科學技術(shù)發(fā)展趨勢進行了研究。報告認為,更高水平的流程自動化、可視化,分布式基礎設施、下一代計算平臺、AI應用等已經(jīng)成為各行各業(yè)的發(fā)展趨勢。同時,報告還對其中具有重要影響科學技術(shù)進行了深入洞察,具體包括:數(shù)字孿生、3-D/4-D打印技術(shù)、應用AI技術(shù)、云計算、邊緣計算、區(qū)塊鏈等等。此前,我們分享了其中關于“數(shù)字孿生”的技術(shù)洞察,本期將繼續(xù)解讀麥肯錫《技術(shù)熱門趨勢報告》,聚焦“應用AI技術(shù)”。
應用AI技術(shù)
報告中的應用AI技術(shù)包括計算機視覺、自然語言處理和語音技術(shù)三種。計算機視覺、自然語言處理、語音技術(shù)利用人工智能算法來幫助計算機理解現(xiàn)實世界的數(shù)據(jù),包括利用計算機視覺技術(shù)來理解視頻和圖像,利用自然語言處理技術(shù)來理解文本,和利用語音技術(shù)來理解音頻。
這些技術(shù)能夠促進人機交互和自然環(huán)境的數(shù)字化。在利用樣本數(shù)據(jù)訓練算法后,機器可以識別范式,并對其進行解釋和操作。
技術(shù)成熟情況
應用AI正在從基礎研究向大規(guī)模應用過渡,現(xiàn)在處于過渡的后期,已經(jīng)成為了大規(guī)模落地的成熟技術(shù)。
到2024年,超過50%的用戶觸點(user touches)將被人工智能驅(qū)動的語音、文字或計算機視覺算法所增強。到2021年,10億臺聯(lián)網(wǎng)的監(jiān)控攝像頭將收集和共享視覺數(shù)據(jù)。
行業(yè)適用情況
應用AI經(jīng)歷了從被特定行業(yè)采納向被多個行業(yè)采納的過渡,現(xiàn)在過渡已經(jīng)結(jié)束。該技術(shù)已經(jīng)成為了在多個行業(yè)廣泛落地的成熟技術(shù)。
應用AI對企業(yè)的價值
無縫人機交互:通過將人工輸出轉(zhuǎn)換為機器閱讀指令,簡化應用程序的使用或與機器的交互。
擴展或創(chuàng)造新產(chǎn)品和服務以覆蓋端到端:利用基于AI的數(shù)據(jù)分析特征(例如,監(jiān)測癌癥就是醫(yī)學成像設備的一個特征)。
更高水平的數(shù)字化和自動化:機器的視聽理解水平很高,能夠幫助公司實現(xiàn)全自動化,或是通過機器完成部分工作來減輕人類勞動者的負擔。
更多客戶界面:提供不同的互動方法,通過文本、語音或圖像(例如,亞馬遜基于照片搜索產(chǎn)品的功能)與客戶互動。
應用示例
01
擴展或創(chuàng)造新產(chǎn)品和服務
以覆蓋端到端
利用基于AI的數(shù)據(jù)分析特征(例如,監(jiān)測癌癥就是醫(yī)學成像設備的一個特征)來擴展或創(chuàng)造新產(chǎn)品和服務。
如:作物保護生產(chǎn)商希望優(yōu)化產(chǎn)品用途,以預防植物病害。目前,針對通常無法監(jiān)測到病害的問題,可以把計算機視覺與衛(wèi)星遙感技術(shù)相結(jié)合進行農(nóng)田監(jiān)測,監(jiān)測到病害風險后觸發(fā)警報。而使用計算機視覺算法技術(shù)后,可在發(fā)現(xiàn)植物病害之前就監(jiān)測到這些問題,在實際感染病害14天前觸發(fā)警報,從而使農(nóng)民減少使用殺蟲劑。
02
(人力)資源生產(chǎn)力更高
人機交互變得更高效,即計算機視覺、自然語言處理算法會推進流程并為決策的制定提供依據(jù)(例如,通過搜索合同獲得特定信息),這樣員工就能將時間花在能夠增值的任務上。
如:英國的欺詐重案辦公室(Serious Fraud Office)保存著超過三千萬份文件,該辦公室利用計算機視覺對文檔進行了分類,并通過數(shù)據(jù)處理來查找貪污腐敗的卷宗。在2017年,該辦公室利用計算機視覺算法發(fā)現(xiàn)了勞斯萊斯欺詐案,并對該公司處以6.71億英鎊的罰款。使用計算機視覺算法每天能夠處理60萬份文件,節(jié)省了80%的文件處理時間,使得工作人員能夠把重心重新轉(zhuǎn)移到起訴上。
03
任務的全自動化
減少了運營開支
AI控制的機器人能夠高效完成重復性的后臺和前臺任務(例如,自助服務雜貨店利用計算機視覺結(jié)賬)。
此外,數(shù)字孿生還能減少資本密集型投資,使得管理者能夠根據(jù)模擬結(jié)果做出投資決策,從而降低冗余或替換的風險(因為產(chǎn)品是定制的)。同時,數(shù)字孿生還可以增加項目確定性,通過模擬可能路徑、追蹤績效并對標里程碑,在偏離項目計劃的情況下及時糾正(如把數(shù)字孿生運用到建設中的復雜項目)。
04
客戶滿意度更高
提供各種自然的互動方式,并保持始終如一的服務水平(如聊天或語音機器人)。
發(fā)展前景
未來五年計算機視覺、自然語言處理、語音技術(shù)的發(fā)展前景如下:
階段一:神經(jīng)網(wǎng)絡的發(fā)展進入停滯期;攻克復雜應用的技術(shù)難關
現(xiàn)有神經(jīng)網(wǎng)絡仍然存在一些缺陷(如缺乏上下文),限制了解釋力和采取行動或進一步累積洞見的能力。我們需要優(yōu)化和運用現(xiàn)有解決方案(如Facebook利用卷積神經(jīng)網(wǎng)絡開發(fā)了面部識別功能,準確率達到了97.5%)。在攻克技術(shù)難關后,復雜應用準備進入市場(如5級自動駕駛)。
階段二:計算機視覺和自然語言處理模型的普及
得益于已建立的數(shù)據(jù)標準和可調(diào)整的預定義模型,計算機視覺和自然語言處理在相對不太復雜的虛擬任務中得到廣泛應用。機器通過不會編碼的專家的培訓,簡化人機交互(例如,護士指導機器人處理患者樣本)而被加速應用。利用基于認知AI 的加工來根據(jù)非結(jié)構(gòu)化數(shù)據(jù)自動做出判斷和決策,從而實現(xiàn)智能流程自動化。
階段三:生成式預訓練模型
在一組不同的未標記數(shù)據(jù)上預訓練語言或視覺模型,從而自動生成感知上下文的內(nèi)容,這些內(nèi)容很難同人類創(chuàng)作的內(nèi)容區(qū)分開來。無需人工監(jiān)督或手動標記輸入數(shù)據(jù),模型會遵循自己的邏輯而不是遵循所學習的范式,機器可以獨立“思考”和創(chuàng)造高精度內(nèi)容,從而實現(xiàn)真實的人機交互。AI研究實驗室OpenAI的生成式預訓練模型(GPT-3)學會了僅根據(jù)一個提示來執(zhí)行任務(例如,通過給模型展示一個完整的句子和一個不完整句子來教會模型如何造句)。
發(fā)展動力
可用于訓練和解釋的機器和人類生成的數(shù)據(jù)呈現(xiàn)爆發(fā)式增長(例如,裝有傳感器和攝像頭的消費或者工業(yè)設備的數(shù)量大幅增長)。
深度神經(jīng)網(wǎng)絡和深度學習方法的出現(xiàn)(例如,卷積神經(jīng)網(wǎng)絡降低了錯誤率,使計算機在語音和圖像識別方面與人類不相上下)。
AI驅(qū)動的應用程序成本不斷下降,處理能力和算法的可用性不斷提高,因此該類應用程序正在普及。
不斷提高數(shù)據(jù)(圖像、音頻)的質(zhì)量,提高分析的準確性。