본문으로 바로가기

ICASSP 2023 Accepted Paper

Link: https://ieeexplore.ieee.org/document/10095341

 

Summary

  • an end-to-end framework for oriented object detection, which simplifies the model pipeline and obtains superior performance.
  • box regression head replaced with a points prediction head.
  • decouple the query features into classi- fication and regression features, which significantly improves the model precision.
  • dynamic query design, which reduces the number of object queries in stacked decoder layers with- out sacrificing model performance.

Introduction or Motivation

  • Classification Header와 Box Regression Header를 분리시킴으로써 DETR-series의 성능 향상
  • 하지만 decoder layer에서 decoupling을 고려하고 있지는 않다
  • To our knowledge, we are the first to consider query feature decoupling at the decoder layer for DETR-like detectors.
  • propose a label re-assignment strategy, which is used after bipartite matching to filter out low quality queries and effectively improves the model performance.

Method

Points Prediction Head

  • angle issue를 피하기 위해서 angle regression 자체를 포기
  • 대신, point 9개를 예측하는 문제로 변경

 

Query Label Re-Assignment

$$ y^*{\hat{\sigma}(i)} = \begin{cases} y{\hat{\sigma}(i)} & \text{if } \frac{|\Gamma(C_i) \cap \Gamma(B_{\hat{\sigma}(i)})|}{|\Gamma(C_i) \cup \Gamma(B_{\hat{\sigma}(i)})|} > \tau \\ \emptyset & \text{otherwise} \end{cases} $$

  • $y^*_{\hat{\sigma}(i)}$: 재할당된 레이블
  • $y_{\hat{\sigma}(i)}$: 기존에 할당된 레이블
  • $C_i$: 는 i번째 쿼리의 예측 박스
  • $B_{\hat{\sigma}(i)}$: i번째 쿼리와 매칭된 타겟 박스
  • $\Gamma(C_i)~\text{\&}~ \Gamma(B_{\hat{\sigma}(i)})$: 쿼리 예측 박스와 타겟 박스의 Convex-Hull
  • $\tau$: threshold, 0.5
  • 쿼리와 타겟 박스 간의 IoU를 기준으로 저품질 쿼리를 필터링합니다.
  • IoU가 낮으면 해당 쿼리의 레이블을 배경으로 재할당하여 학습 과정에서 저품질 쿼리가 학습에 미치는 부정적인 영향을 줄입니다.
  • 임계값(0.5) 이하의 쿼리는 배경(없음)으로 재할당됩니다.

Experiment

 

 

  • 의도는 이해했으니 어쩔 수 없는 4page의 한계로 많은 것들을 보여주지 못해 아쉽다.
  • dota series말고도 DIOR-R을 해봤다면 어땠을까?

MisoYuri's Deck
블로그 이미지 MisoYuri 님의 블로그
VISITOR 오늘 / 전체