還原真實視界|探析圖像技術演進之路

來源:CPS 更新日期:2023-12-21 作者:羅超

    科技大時代,引人入勝。視界千變萬化,視界之大,盡收眼底;貧w安防的本初,對圖像無止境的追求與打磨,才形成了現(xiàn)今以智能視頻為核的安防應用大生態(tài)。

    有偏差的世界與視界

    百態(tài)安防,各色精彩!之于2023歲末之際,之于圖像,回首初心、細看當下、瞭望未來。

    人眼看到的世界與機器讀出來得視界,有所異同。

    世界即視界,人眼看視界,或許都一樣。

    人眼有著很強觀察能力,能夠在復雜及變化的環(huán)境中識別目標,同時由大腦賦予了最高級的智能分析能力,可以運用邏輯分析和推理能力去識別變化目標。

    為此,長久以來,在監(jiān)控室里死盯屏幕,成了監(jiān)控人員的日常,這也是視頻監(jiān)控時代最為傳統(tǒng)與普遍的工作方式。但,人眼看到的視界,就是真實視界嗎?

    人眼看視界,或許真不一樣。

    人非機器,先天性有所短板,帶有主觀性,容易心里誤導,產(chǎn)生誤判。

    與文字、聲音相比,視頻承載了更多信息量,而要從大量豐富信息當中去讀取有用數(shù)據(jù),這是非常繁瑣復雜的工作,這種被動應對方式,并不能主動預防,并受制于人員數(shù)量和能力,比如:長時間易疲勞、錯看漏看、看得不及時。此外,在顯示終端方面也因各種原因受制,你看到的視界,不一定為實。

    故而,有偏差的世界與視界,就需要圖像處理、優(yōu)化、調教,甚至是多維度的時空融合,來讓圖像盡可能的全域性無所不在與無所不能。

    機器視覺的“技術雛形”

    既然回首過去,對于圖像,行業(yè)最開始做法是不斷為圖像做加法,一堆的后處理技術進行科研突破,最為明顯體現(xiàn)在視頻圖像處理技術,簡而言之就是用計算機對視頻數(shù)字圖像進行處理,其本質是一種信號處理過程,而且是離散信號處理。

    這其實就是機器視覺的最初技術形態(tài),雖功能有限,但底子還在。看圖像處理技術應用價值,有幾個方面:

    其一,提高圖像的視感質量,如進行圖像的亮度、彩色變換,增強、抑制某些成分,對圖像進行幾何變換等,以改善視頻圖像的質量。

    其二,提取視頻圖像中所包含的某些特征或特殊信息,這些被提取的特征或信息往往為計算機分析圖像提供便利。

    其三,視頻圖像增強與復原。圖像增強的目的是將圖像轉換為更適合人和機器的分析的形式。

    其四,圖像的分析。從圖像中抽取某些有用的度量、數(shù)據(jù)和信息,以的到某種數(shù)值結果。

    其五,能使圖像再現(xiàn)性。圖像在數(shù)字化時準確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。

    其六,靈活多變的處理功能。把監(jiān)控畫面分割為任意大小的二維數(shù)組,這意味著圖像的數(shù)字化精度可以達到滿足任一應用需求。

    其七,適用面寬。不論是來自哪個行業(yè)的信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成。

    其八,靈活性高。即凡是可以用數(shù)學公式或邏輯關系來表達的一切運算均可用數(shù)字圖像處理實現(xiàn)。

    依據(jù)八大特性,圖像處理研究內容就分三大板塊:圖像壓縮;增強和復原;匹配、描述和識別。

    機器讀懂視界的行業(yè)邏輯

    時代在變革,技術在演進,與之相悖的,終將漸趨式微,這同樣適用于圖像處理技術。如樓宇對講到智能家居,防盜報警到AIOT一樣,圖像處理到機器視覺,也只是時代產(chǎn)物,底色未變。

    過去圖像處理在“后側”,而機器視覺更多“向前”。

    在當下,智能攝像機本身作為前端產(chǎn)品,芯片、鏡頭、焦距、補光、外殼等一系列硬件工程是基礎。能將智能算法跟場景關聯(lián)后,根據(jù)算法需求界定一個范圍,盡量做到場景變化,但硬件減少變化,用軟件來做調節(jié)。

    全天候的多維融合全域感知,這是智能攝像機對于圖像追求的另一個技術維度,視頻、音頻、氣味、生物特征等技術的發(fā)展和成熟,全面掌控防控場景和目標的完整信息成為可能,在安防應用中越來越多的部署更多類別的感知設備,用于從更多維度采集目標信息,包括目標的各種要素、活動軌跡以及關聯(lián)信息等,從而形成一個動態(tài)感知體系,實現(xiàn)防控工作的“無所不在、無所不知”目標。這一點從最近幾年的聲光劃界攝像機、光譜水質攝像機、雷視合一攝像機、氣象觀測攝像機、環(huán)保攝像機等一些列場景定義類產(chǎn)品,無一不在說明,圖像處理的多面與多角度,來適配多場景的深度。

    當然,攝像機一個單品,不可能一肩挑起這時代與這視界,形成成熟與高價值的解決方案閉環(huán),是必然。

    在追求極致更好圖像的行業(yè)進程中,圖像的廣度在縮小,更多的是在深度的追求。通用型、一招鮮吃遍天的攝像機已經(jīng)不復存在,這還是源于用戶需求驅動。

    在2023深圳安博會參觀走訪期間,記者了解到很多底層用戶或中間生態(tài)位集成商大多表示,現(xiàn)有智能視頻方案過于通用,不夠適配行業(yè)具體場景。為此,此屆安博會最大不同之一就是硬件展示減少,方案展示居多的原因。

    機器視覺解決方案需要與行業(yè)自身長期運轉而沉淀下來的商業(yè)邏輯與行業(yè)經(jīng)驗相融合。除了成熟的技術能力外,該解決方案對行業(yè)具體場景的全方位適配必不可少。同樣,機器視覺解決方案應用門檻高,企業(yè)IT架構/基礎設施適配難度高。對于很多企業(yè)來說,算法訓練相對容易實現(xiàn),但如何與實時推理結合起來部署到實際應用場景,卻是一個難題。為此,大模型的出現(xiàn),或者類似算法商城、算法工廠、AI自動工具等,就開辟了另一個戰(zhàn)場,另一個對圖像追求無休止的行業(yè)邏輯。

    圖像的未來之愿

    對于圖像創(chuàng)新,行業(yè)心之所向。沉于過去,不能打破現(xiàn)狀,之于圖像的未來,本當歸于平靜,來看未來之愿與應用模樣。

    其一,大視界時代,未來數(shù)據(jù)圖像技術強調高清晰度、高速傳輸、實時圖像處理、三維成像或多維成像、智能化、自動化等方向發(fā)展。

    其二,智能化方面,力爭使計算機識別和理解能夠按照人的認識和思維方式工作,能夠考慮到主觀概率和非邏輯思維。這里有一點需要指出,AI在智能化方面可以做圖像數(shù)據(jù)與內容的提取與分析,但是并不能在視頻圖像處理方面做文章。

    其三,未來圖像技術強調操作、運用的方便性,圖像處理功能的集中化趨勢是必然會存在的。所以,最近幾年硬件芯片廠家不斷將諸多AI功能固化在芯片上,形成一個SOC級的獨立小系統(tǒng)。

    有偏差的視界,在以智能路為路徑,盡可能形成你是我的眼,你見如我見;不止所見,還能關聯(lián)其他,以圖像為圓點,來畫視界。

廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網(wǎng) 版權所有 關于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁 網(wǎng)友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論