GUE (Genome Understanding Evaluation)

Introduced by Zhou et al. in DNABERT-2: Efficient Foundation Model and Benchmark For Multi-Species Genome

A collection of $28$ datasets across $7$ tasks constructed for genome language model evaluation. Contains seven tasks: promoter prediction. core promoter prediction, splice site prediction, covid variant classification, epigenetic marks prediction, and transcription factor binding sites prediction on human and mouse.

Homepage

Benchmarks

Add a new result Link an existing benchmark

Task	Dataset Variant	Best Model
Promoter Detection	GUE	DNABERT-2-117M
Core Promoter Detection	GUE	DNABERT-2-117M
Splice Site Prediction	GUE	DNABERT-2-117M
Epigenetic Marks Prediction	GUE	DNABERT-2-117M
Covid Variant Prediction	GUE	DNABERT-2-117M
Transcription Factor Binding Site Prediction (Human)	GUE	DNABERT-2-117M
Transcription Factor Binding Site Prediction (Mouse)	GUE	DNABERT-2-117M