benchmark_reproducibility

Figure A: For each task (i.e. cell type), we examine how the motifs discovered on the peaks by MEME, HOMER, and DiChIPMunk are recovered by TF-MoDISco. After merging the motifs discovered by TF-MoDISco on the count and profile heads, we compute the maximum similarity of each motif discovered by MEME/HOMER/DiChIPMunk with a TF-MoDISco motif, and the maximum similarity to a JASPAR motif. We find that many motifs found by MEME/HOMER/DiChIPMunk are recovered by TF-MoDISco.

Figure B: For each task, we plot all motifs discovered by MEME/HOMER/DiChIPMunk and order them by the ratio of TF-MoDISco similarity to JASPAR similarity. Motifs with a high ratio are estimated to have been recovered by TF-MoDISco, but are not in JASPAR. These motifs tend to be low-complexity. Motifs with a low ratio are estimated to correspond to a known motif, yet was not discovered by TF-MoDISco. These motifs tend to spurious and bear no relevance to the biological system at hand.

Task 0

Motif	Key	Similarity	Motif	Key	Similarity	Motif
MEMEChIP	TF-MoDISco			Database
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	T0:C0_1:P0_1	7.880		E2F6	5.572
	T0:C0_0:P0_0	6.573		Npas2	7.815
	T0:C0_3:P0_3	5.700		CTCF	6.812
	T0:C0_1:P0_1	3.569		ZKSCAN5	4.376
	T0:C0_1:P0_1	3.309		ZNF384	4.702
	N/A	0.000	N/A	KLF15	6.382
	N/A	0.000	N/A	KLF9	3.494
	N/A	0.000	N/A	Wt1	5.627

Motif	Key	Similarity	Motif	Key	Similarity	Motif
HOMER	TF-MoDISco			Database
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	T0:C0_1:P0_1	3.413		N/A	0.000	N/A
	T0:C0_6	2.123		N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	T0:P0_9	4.628		FOS	4.731
	T0:C0_0:P0_0	6.046		MYC	6.533
	T0:C0_1:P0_1	5.446		E2F6	7.038
	T0:C0_3:P0_3	5.395		CTCF	8.826
	T0:C0_2:P0_2	2.895		NRF1	7.249
	T0:C0_1:P0_1	2.267		ELF1	5.694
	T0:P0_9	2.433		THAP11	8.021
	T0:C0_3:P0_3	2.284		YY1	7.921
	N/A	0.000	N/A	MYOG	4.688
	N/A	0.000	N/A	YY2	3.355
	N/A	0.000	N/A	NFYC	9.868
	N/A	0.000	N/A	KLF9	3.552

Motif	Key	Similarity	Motif	Key	Similarity	Motif
DiChIPMunk	TF-MoDISco			Database
	T0:C0_4	2.399		N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	T0:C0_2:P0_2	5.711		MYC	5.344
	T0:P0_9	2.849		LBX1	3.035
	T0:C0_1:P0_1	5.718		E2F6	8.525
	T0:P0_7	1.587		Zfx	5.973

Task 1

Motif	Key	Similarity	Motif	Key	Similarity	Motif
MEMEChIP	TF-MoDISco			Database
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	T1:P0_8	10.619		ZNF384	3.967
	T1:P0_8	10.481		SPI1	5.327
	T1:C0_1:P0_1	5.865		E2F6	4.883
	T1:C0_0:P0_0	3.761		MAX::MYC	5.990
	N/A	0.000	N/A	ZNF740	3.561
	N/A	0.000	N/A	ZNF148	4.195
	N/A	0.000	N/A	THAP11	4.200
	N/A	0.000	N/A	NFYB	4.827

Motif	Key	Similarity	Motif	Key	Similarity	Motif
HOMER	TF-MoDISco			Database
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	T1:P0_8	14.160		ZNF384	5.156
	T1:P0_8	9.067		SPI1	4.341
	T1:C0_1:P0_1	10.372		E2F6	6.755
	T1:C0_0:P0_0	10.575		MYCN	6.980
	T1:C0_7:P0_11	8.115		Bach1::Mafk	6.501
	T1:C0_4:P0_5	6.902		CTCF	11.379
	T1:C0_7:P0_11	3.775		ZNF24	9.499
	T1:C0_6:P0_2	2.044		NRF1	6.779
	T1:C0_5	1.301		YY1	9.535
	N/A	0.000	N/A	TCF12(var.2)	3.684
	N/A	0.000	N/A	NFYC	6.816
	N/A	0.000	N/A	THAP11	7.024
	N/A	0.000	N/A	CREB3L4(var.2)	7.106
	N/A	0.000	N/A	ZBTB33	5.586
	N/A	0.000	N/A	Tcf12	4.635
	N/A	0.000	N/A	ZNF460	4.310
	N/A	0.000	N/A	ZNF449	4.328

Motif	Key	Similarity	Motif	Key	Similarity	Motif
DiChIPMunk	TF-MoDISco			Database
	N/A	0.000	N/A	N/A	0.000	N/A
	T1:P0_8	1.910		N/A	0.000	N/A
	T1:C0_1:P0_1	2.229		N/A	0.000	N/A
	T1:P0_8	3.151		N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	N/A	0.000	N/A	N/A	0.000	N/A
	T1:C0_1:P0_1	3.737		E2F6	6.713
	T1:C0_1:P0_1	1.982		IRF7	3.567
	T1:C0_0:P0_0	5.404		MYC	9.961

Task 0

Most reproducible motifs

TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key
MEMEChIP		HOMER		DiChIPMunk
7.880	T0:C0_1:P0_1	6.046	T0:C0_0:P0_0	5.718	T0:C0_1:P0_1
6.573	T0:C0_0:P0_0	5.446	T0:C0_1:P0_1	5.711	T0:C0_2:P0_2
5.700	T0:C0_3:P0_3	5.395	T0:C0_3:P0_3	2.849	T0:P0_9
3.569	T0:C0_1:P0_1	4.628	T0:P0_9	2.399	T0:C0_4
3.309	T0:C0_1:P0_1	3.413	T0:C0_1:P0_1	1.587	T0:P0_7

Least reproducible motifs

TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key
MEMEChIP		HOMER		DiChIPMunk
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	0.000	N/A

Task 1

Most reproducible motifs

TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key
MEMEChIP		HOMER		DiChIPMunk
10.619	T1:P0_8	14.160	T1:P0_8	5.404	T1:C0_0:P0_0
10.481	T1:P0_8	10.575	T1:C0_0:P0_0	3.737	T1:C0_1:P0_1
5.865	T1:C0_1:P0_1	10.372	T1:C0_1:P0_1	3.151	T1:P0_8
3.761	T1:C0_0:P0_0	9.067	T1:P0_8	2.229	T1:C0_1:P0_1
0.000	N/A	8.115	T1:C0_7:P0_11	1.982	T1:C0_1:P0_1

Least reproducible motifs

TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key	TF-MoDISco similarity	TF-MoDISco key
MEMEChIP		HOMER		DiChIPMunk
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	0.000	N/A
0.000	N/A	0.000	N/A	1.910	T1:P0_8

Task 0

Task 1

Construct plots of benchmark motif rank and TF-MoDISco similarity ¶

Task 0

Most reproducible motifs

Least reproducible motifs

Task 1

Most reproducible motifs

Least reproducible motifs