TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Visual Object Tracking	GOT-10k	SwinTrack-B	Average Overlap	69.4	# 18
Visual Object Tracking	GOT-10k	SwinTrack-B	Success Rate 0.5	78	# 15
Visual Object Tracking	GOT-10k	SwinTrack-B	Success Rate 0.75	64.3	# 13
Visual Object Tracking	LaSOT	SwinTrack-B-384	AUC	70.2	# 17
Visual Object Tracking	LaSOT	SwinTrack-B-384	Normalized Precision	78.4	# 16
Visual Object Tracking	LaSOT	SwinTrack-B-384	Precision	75.3	# 15
Visual Object Tracking	TrackingNet	SwinTrack-B-384	Precision	83.2	# 9
Visual Object Tracking	TrackingNet	SwinTrack-B-384	Normalized Precision	88.2	# 13
Visual Object Tracking	TrackingNet	SwinTrack-B-384	Accuracy	84	# 10

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/swintrack-a-simple-and-strong-baseline-for/visual-object-tracking-on-trackingnet)](https://paperswithcode.com/sota/visual-object-tracking-on-trackingnet?p=swintrack-a-simple-and-strong-baseline-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/swintrack-a-simple-and-strong-baseline-for/visual-object-tracking-on-lasot)](https://paperswithcode.com/sota/visual-object-tracking-on-lasot?p=swintrack-a-simple-and-strong-baseline-for)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/swintrack-a-simple-and-strong-baseline-for/visual-object-tracking-on-got-10k)](https://paperswithcode.com/sota/visual-object-tracking-on-got-10k?p=swintrack-a-simple-and-strong-baseline-for)`

SwinTrack: A Simple and Strong Baseline for Transformer Tracking

2 Dec 2021 · Liting Lin, Heng Fan, Zhipeng Zhang, Yong Xu, Haibin Ling ·

Recently Transformer has been largely explored in tracking and shown state-of-the-art (SOTA) performance. However, existing efforts mainly focus on fusing and enhancing features generated by convolutional neural networks (CNNs). The potential of Transformer in representation learning remains under-explored. In this paper, we aim to further unleash the power of Transformer by proposing a simple yet efficient fully-attentional tracker, dubbed SwinTrack, within classic Siamese framework. In particular, both representation learning and feature fusion in SwinTrack leverage the Transformer architecture, enabling better feature interactions for tracking than pure CNN or hybrid CNN-Transformer frameworks. Besides, to further enhance robustness, we present a novel motion token that embeds historical target trajectory to improve tracking by providing temporal context. Our motion token is lightweight with negligible computation but brings clear gains. In our thorough experiments, SwinTrack exceeds existing approaches on multiple benchmarks. Particularly, on the challenging LaSOT, SwinTrack sets a new record with 0.713 SUC score. It also achieves SOTA results on other benchmarks. We expect SwinTrack to serve as a solid baseline for Transformer tracking and facilitate future research. Our codes and results are released at https://github.com/LitingLin/SwinTrack.

PDF Abstract

Code

Add Remove Mark official

litinglin/swintrack official

233

Tasks

Add Remove

Representation Learning

Visual Object Tracking

Visual Tracking

Datasets

LaSOT

GOT-10k

TrackingNet

TNL2K

Results from the Paper

Edit

Ranked #10 on Visual Object Tracking on TrackingNet

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Visual Object Tracking	GOT-10k	SwinTrack-B	Average Overlap	69.4	# 18	Compare
			Success Rate 0.5	78	# 15	Compare
			Success Rate 0.75	64.3	# 13	Compare
Visual Object Tracking	LaSOT	SwinTrack-B-384	AUC	70.2	# 17	Compare
			Normalized Precision	78.4	# 16	Compare
			Precision	75.3	# 15	Compare
Visual Object Tracking	TrackingNet	SwinTrack-B-384	Precision	83.2	# 9	Compare
			Normalized Precision	88.2	# 13	Compare
			Accuracy	84	# 10	Compare

Methods

Add Remove

Absolute Position Encodings • Adam • BPE • Dense Connections • Dropout • Label Smoothing • Layer Normalization • Linear Layer • Multi-Head Attention • Position-Wise Feed-Forward Layer • Residual Connection • Scaled Dot-Product Attention • Softmax • Transformer

Edit Social Preview

SwinTrack: A Simple and Strong Baseline for Transformer Tracking

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove