方案(àn)一(次推薦):目標追蹤 + 時序去重(不改(gǎi)采集,隻改後處理)
適合不能修改取圖間隔(gé)的已有係統。利用連續幀中同一物體被多次部分拍到,通過追蹤去重。
做法:
-
對每(měi)一幀2048×500做目標檢測,得到所有邊界框(kuàng)(即便是不完整物體)。
-
使用目標跟蹤(如BoTSORT、ByteTrack)為每個檢測到的物(wù)體分配唯一ID。
-
核心(xīn)規則:隻有當某個物體的中(zhōng)心點穿過圖像中的某條“計數線(xiàn)”,且(qiě)方向是從進入區域到離開區域,才累加計數一次。
-
例如:在圖像垂直方向1/4處設置計數線。物體首次出現時是未計數(shù)狀態,當其中心越過計數(shù)線(xiàn)後,狀態變為已計數,後續再出現不(bú)再累加。
-
-
用規則過濾掉“隻(zhī)出現一半就消失”的物體(例如物體(tǐ)剛進入(rù)視野一(yī)半就退(tuì)出,未越過(guò)計數線(xiàn))。
優點:不改采集硬件,適合連續運動物體(傳送帶、流水線)。
缺點:如果物體運動方向不固定、速度(dù)變化大,或物體(tǐ)密集,追蹤容易丟ID或重複計數。
方案二:基於完整性的(de)過濾規(guī)則(zé)(最簡單,但提升有限)
不改變采(cǎi)集和檢測流程,隻是後處理目標(biāo)檢測結果:
-
規則1:隻計數那些邊(biān)界框(kuàng)距離圖像邊緣(上下左(zuǒ)右)超過一定像素(比如30px)的檢測結果。認為靠近邊緣的是“半個物體”,丟棄。
-
規則2:根據物體的寬高比、麵(miàn)積等先驗知識,過濾掉明顯不完整的框(例如(rú)正常物體500×200,而檢測框隻(zhī)有250×100)。
-
規則3:如果物體尺寸相對固(gù)定,可(kě)以隻接受檢測框麵積在正常(cháng)麵積70%~100%之間的結果。
優點:實現最簡單,計算快。
缺點:會(huì)漏掉視野邊(biān)緣的完整(zhěng)物體(如果物體本(běn)來就小或靠近邊緣),也會把半物體誤判為完整;精度提升有限。
方案三(深度學習(xí)端到端):訓練一個“局部物體計數”模型(適(shì)合定(dìng)製場景)
不依賴物體完整性,直接訓練網絡回歸當前幀中完整物體的近似數量。
做法:
-
采集大量2048×500的圖像,人工標注每幀中完整物體的數量(注意:是數量,不標(biāo)框)。
-
訓(xùn)練一個計數回歸網絡(如CSRNet、Cranet)直接輸出(chū)數量。
-
對於跨幀的同一物體重複計數(shù)問題,再疊加一個簡單的幀(zhēn)間數量平滑或最小幀計數。
優點:避開(kāi)檢測(cè)框(kuàng)完整性(xìng)判斷,對遮擋、部分(fèn)物體也(yě)較魯棒。
缺點(diǎn):需要重新標注大量(liàng)數(shù)據;無(wú)法給出每個物體(tǐ)的位置,隻輸出數量。





機-2.png&w=689&h=388&a=&zc=1)

數包裝(zhuāng)機-3.png&w=689&h=388&a=&zc=1)


.png&w=689&h=388&a=&zc=1)


評論