日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種足球比賽目標檢測方法

文檔序號:39722832發(fā)布日期:2024-10-22 13:17閱讀:2來源:國知局
一種足球比賽目標檢測方法

本發(fā)明涉及足球比賽目標檢測方法領(lǐng)域。


背景技術(shù):

1、數(shù)據(jù)分析,戰(zhàn)術(shù)研究,賽事直播是職業(yè)足球項目重要的組成部分。對足球比賽進行目標檢測可以幫助球隊進行球員數(shù)據(jù)分析,戰(zhàn)術(shù)追蹤,提高觀眾觀賽體驗,而足球比賽中檢測球是一個極具挑戰(zhàn)性的問題。首先,相較于足球比賽場景內(nèi)其他物體,足球的尺寸顯得尤為小巧,并且還會根據(jù)位置發(fā)生大幅度的變化:當球處在遠端邊線時,其尺寸可能僅有幾個像素大??;相反靠近近端邊線時,尺寸可能膨脹到20多個像素。此外球的形狀也會發(fā)生變化,例如球在快速移動時會變得模糊,形狀呈現(xiàn)非標準的圓形。并且還伴隨著與球員身體遮擋的問題,這進一步增加了檢測的難度。

2、現(xiàn)有技術(shù)中,jacek?komorowski等人提出footandball探測器進行足球比賽檢測,但該網(wǎng)絡(luò)特征融合能力不足,并且其數(shù)據(jù)集大小有限,導(dǎo)致檢測準確率不佳,之后提出的deepball探測器,準確率雖有所提高,但在足球類別的小目標檢測的準確率仍有進步空間,konstantinos?moutselos等人最近提出的數(shù)據(jù)集soccernet_v3_h250是使用了yolov8n模型進行檢測,其全部類檢測準確度map50達到70.2%,map50-90達到46.6%,其球類檢測準確度map50達到42.6%,map50-90達到17.9%,目前基于深度學(xué)習(xí)的目標檢測算法則主要分為單階段和雙階段目標檢測兩類方法。雙階段目標檢測算法的主要代表是r-cnn系列模型,包括r-cnn、fast?r-cnn、faster?r-cnn、mask?r-cnn等,這類算法的劣勢是速度較慢,對小目標與遮擋嚴重的目標檢測效果不佳。而單階段目標檢測算法不需要進行候選區(qū)域的生成和分類,而是直接從輸入圖像或視頻中預(yù)測物體邊界框,因此通常具有更快的檢測速度和較高的準確率。而隨著目標檢測算法的發(fā)展,yolo系列成為單階段目標檢測的經(jīng)典模型,基于此,為了更準確得進行足球比賽目標檢測,本發(fā)明提出了一種足球比賽目標檢測方法。


技術(shù)實現(xiàn)思路

1、本發(fā)明的目的在于提供一種足球比賽目標檢測方法,以解決上述背景技術(shù)中提出的問題。

2、為實現(xiàn)上述目的,足球比賽目標檢測方法,所述方法通過yolov5n_3att_bifpn模型實現(xiàn),包括如下步驟:

3、步驟s1,將原始輸入圖像轉(zhuǎn)化為多層特征圖,通過所述模型的主干網(wǎng)絡(luò)backbone進行特征提取,且在主干網(wǎng)絡(luò)backbone中引入三重注意力機制;

4、步驟s2,通過所述模型的特征增強網(wǎng)絡(luò)基于bifpn來融合步驟s1獲取的多尺度特征;

5、步驟s3,通過所述模型的檢測頭head整合步驟s2提取的特征,并輸出最終的檢測信息。

6、優(yōu)選的:所述步驟s1主干網(wǎng)絡(luò)backbone通過卷積層和c3模塊減小特征圖的尺寸并增加通道數(shù),且采用sppf模塊捕捉不同尺度的特征并應(yīng)用于同一張圖像。

7、優(yōu)選的:所述步驟s1主干網(wǎng)絡(luò)backbone將三重注意力機制加入到空間金字塔池化sppf模塊之前,且三重注意力機制由三個分支構(gòu)成。

8、優(yōu)選的:所述三重注意力機制每個分支的具體過程為,在第一個分支中,輸入張量x∈rc×h×w,建立維度h與維度c間的交互,首先將張量x沿h軸逆時針旋轉(zhuǎn)90°,得到形狀為(w×h×c)的旋轉(zhuǎn)張量,隨后,經(jīng)過z-pool處理,張量形狀轉(zhuǎn)變?yōu)?2×h×c),標記為接著,該張量通過一個內(nèi)核大小為k×k的標準卷積層進行特征提取,并通過批處理歸一化層進行規(guī)范化,得到形狀為(1×h×c)的中間輸出,接著該中間輸出通過sigmoid激活層(σ)以生成注意力權(quán)值,最終沿h軸順時針旋轉(zhuǎn)90°,得到輸出。

9、優(yōu)選的:所述三重注意力機制的第二個分支中,輸入張量x∈rc×h×w,建立c維度與w維度之間的交互,首先沿w軸逆時針旋轉(zhuǎn)輸入張量x,得到形狀為(h×c×w)的旋轉(zhuǎn)張量隨后通過z-pool操作,張量形狀轉(zhuǎn)變?yōu)?2×c×w),標記為接著該張量經(jīng)過內(nèi)核大小為k×k的標準卷積層進行特征提取,并通過批處理歸一化層進行規(guī)范化,得到形狀為(1×c×w)的中間輸出,接著將該中間輸出傳遞至sigmoid激活層(σ),生成注意力權(quán)值,最后沿w軸順時針旋轉(zhuǎn)張量90°,得到輸出。

10、優(yōu)選的:所述三重注意力機制的在第三個分支中,輸入張量x∈rc×h×w,建立h維度與w維度之間的交互,首先通過z-pool對輸入張量x的通道進行簡化,得到形狀為(2×h×w)的簡化張量,接著該簡化張量經(jīng)過一個核大小為k×k的標準卷積層進行特征提取,隨后將卷積后的張量通過sigmoid激活層(σ),生成形狀為(1×h×w)的注意力權(quán)值,最后將這些注意力權(quán)值應(yīng)用于原始輸入張量x,從而得到結(jié)果張量最終將上述三個分支的輸出取平均值,得到張量c×h×w。

11、優(yōu)選的:所述步驟s2的bifpn采用快速歸一化融合方法,快速歸一化如下式所示:

12、

13、上式中,ωi表示可學(xué)習(xí)的權(quán)重,使用激活函數(shù)relu來確保每個ωi的值非負,計算流程如下:首先,計算所有ωi的權(quán)重之和;接著,添加一個微小常數(shù)ε=0.0001,來避免數(shù)值不穩(wěn)定;然后,對這些權(quán)重進行歸一化處理;最后,利用歸一化后的權(quán)重對輸入特征ii進行加權(quán),從而得到輸出特征o。

14、優(yōu)選的:所述步驟s2特征融合,以p6層為例,特征融合的計算公式為:

15、

16、公式(8)(9)中,conv為卷積操作,resize為上采樣或下采樣操作,piin為第i級的輸入特征,pimid為第i級的中間特征,piout為第i級的輸出特征。

17、本發(fā)明相較于現(xiàn)有技術(shù),其有益效果為:

18、本發(fā)明通過將yolov5n融合三重注意力機制,顯著增強了其對局部細節(jié)的表征能力,使得檢測的精度得到明顯提高,特別是在小目標如足球的識別方面。此外,提出的加權(quán)雙向特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)有效地融合了不同尺度和深度的特征信息,進一步豐富了模型的特征表示能力,使其能夠更準確地捕捉目標在不同尺度下的特征,在與現(xiàn)有的yolov8n模型的對比中,yolov5n_3att_bifpn的全部分類的精確度提升5.3%,“球”分類的精確度提升7.8%。



技術(shù)特征:

1.一種足球比賽目標檢測方法,所述方法通過yolov5n_3att_bifpn模型實現(xiàn),其特征在于,包括如下步驟:

2.根據(jù)權(quán)利要求1所述的足球比賽目標檢測方法,其特征在于:所述步驟s1主干網(wǎng)絡(luò)backbone通過卷積層和c3模塊減小特征圖的尺寸并增加通道數(shù),且采用sppf模塊捕捉不同尺度的特征并應(yīng)用于同一張圖像。

3.根據(jù)權(quán)利要求1所述的足球比賽目標檢測方法,其特征在于:所述步驟s1主干網(wǎng)絡(luò)backbone將三重注意力機制加入到空間金字塔池化sppf模塊之前,且三重注意力機制由三個分支構(gòu)成。

4.根據(jù)權(quán)利要求3所述的足球比賽目標檢測方法,其特征在于:所述三重注意力機制每個分支的具體過程為,在第一個分支中,輸入張量x∈rc×h×w,建立維度h與維度c間的交互,首先將張量x沿h軸逆時針旋轉(zhuǎn)90°,得到形狀為(w×h×c)的旋轉(zhuǎn)張量隨后,經(jīng)過z-pool處理,張量形狀轉(zhuǎn)變?yōu)?2×h×c),標記為接著,該張量通過一個內(nèi)核大小為k×k的標準卷積層進行特征提取,并通過批處理歸一化層進行規(guī)范化,得到形狀為(1×h×c)的中間輸出,接著該中間輸出通過sigmoid激活層(σ)以生成注意力權(quán)值,最終沿h軸順時針旋轉(zhuǎn)90°,得到輸出。

5.根據(jù)權(quán)利要求4所述的足球比賽目標檢測方法,其特征在于:所述三重注意力機制的第二個分支中,輸入張量x∈rc×h×w,建立c維度與w維度之間的交互,首先沿w軸逆時針旋轉(zhuǎn)輸入張量x,得到形狀為(h×c×w)的旋轉(zhuǎn)張量隨后通過z-pool操作,張量形狀轉(zhuǎn)變?yōu)?2×c×w),標記為接著該張量經(jīng)過內(nèi)核大小為k×k的標準卷積層進行特征提取,并通過批處理歸一化層進行規(guī)范化,得到形狀為(1×c×w)的中間輸出,接著將該中間輸出傳遞至sigmoid激活層(σ),生成注意力權(quán)值,最后沿w軸順時針旋轉(zhuǎn)張量90°,得到輸出。

6.根據(jù)權(quán)利要求5所述的足球比賽目標檢測方法,其特征在于:所述三重注意力機制的在第三個分支中,輸入張量x∈rc×h×w,建立h維度與w維度之間的交互,首先通過z-pool對輸入張量x的通道進行簡化,得到形狀為(2×h×w)的簡化張量,接著該簡化張量經(jīng)過一個核大小為k×k的標準卷積層進行特征提取,隨后將卷積后的張量通過sigmoid激活層(σ),生成形狀為(1×h×w)的注意力權(quán)值,最后將這些注意力權(quán)值應(yīng)用于原始輸入張量x,從而得到結(jié)果張量最終將上述三個分支的輸出取平均值,得到張量c×h×w。

7.根據(jù)權(quán)利要求1所述的足球比賽目標檢測方法,其特征在于:所述步驟s2的bifpn采用快速歸一化融合方法,快速歸一化如下式所示:

8.根據(jù)權(quán)利要求1所述的足球比賽目標檢測方法,其特征在于:所述步驟s2特征融合,以p6層為例,特征融合的計算公式為:


技術(shù)總結(jié)
本發(fā)明涉及足球比賽目標檢測方法領(lǐng)域,所述方法提出了一種YOLOv5n_3Att_BiFPN模型,通過將YOLOv5n融合三重注意力機制,顯著增強了其對局部細節(jié)的表征能力,使得檢測的精度得到明顯提高,特別是在小目標如足球的識別方面,此外,提出的加權(quán)雙向特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)有效地融合了不同尺度和深度的特征信息,進一步豐富了模型的特征表示能力,使其能夠更準確地捕捉目標在不同尺度下的特征。

技術(shù)研發(fā)人員:楊建柏,于兆廷
受保護的技術(shù)使用者:哈爾濱師范大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1