You are here: Home / Help Desk / ENCODE-picks interpretation

palline2

Navigation

#8 — ENCODE-picks interpretation

State Resolved
Area Database and Browsers
Issue type Fast question
Severity Medium
Submitted by Valeria Zazzu
Submitted on May 20, 2014
Responsible Enza Colonna
Ciao,
qualcuno potrebbe aiutarmi con l'interpretazione dei picchi corrispondenti ai risultati di ChIP seq presenti in ENCODE? Ovvero esiste una corrispondenza numerica (immagino di si ma ahimè non sono riuscita a trovarla) ai diversi livelli di colore (scala del grigio) attribuiti ai picchi?
Per darvi un'idea eccovi link di un esempio:
http://genome-euro.ucsc.edu[…]HWTSaaFQsZntTIrmAQGw810o8yg



Grazie.
Ciao,
Valeria
Added by Enza Colonna on May 21, 2014 08:33 AM
Issue state: UnconfirmedResolved
Responsible manager: (UNASSIGNED)enza.colonna
Valeria,

nella traccia:

"Transcription Factor Binding Sites by ChIP-seq from ENCODE/HAIB"

di fatto esiste una corrispondenza numerica ai colori. Per trovare "il numero" per ogni picco devi fare riferimento a due cose:

1) lo score contenuto nel file in formato bed che sottende la traccia. Per recuperare il file usa: Tools>TableBrowser; quando sei qui cerca la tua traccia, seleziona la regione genomica di interesse e scarica il file. Per sapere cosa contengono le colonna del file apri "Table Scheme" in Tools>TableBrowser. Ad esempio nell'esempio che hai mandato se faccio questa operazione (su una regione piu piccola per brevità) trovo:

#bin chrom chromStart chromEnd name score expCount expNums expScores
2006 chr3 186329840 186330160 MAFK 1000 5 394,437,438,464,510 390,1000,1000,1000,748
2006 chr3 186329844 186330124 MAFF 1000 2 436,509 1000,621

e se apro Table Scheme trovo:

field example SQL type description
bin 585 smallint(5) unsigned Indexing field to speed chromosome range queries.
chrom chr1 varchar(255) Reference sequence chromosome or scaffold
chromStart 10073 int(10) unsigned Start position in chromosome
chromEnd 10329 int(10) unsigned End position in chromosome
name ZBTB33 varchar(255) Name of item
score 354 int(10) unsigned Score from 0-1000
expCount 2 int(10) unsigned Number of experiment values
expNums 204,246 longblob Comma separated list of experiment numbers
expScores 354,138 longblob Comma separated list of experiment scores

le gradazioni di grigio sono proporzionali a expScores, Comma separated list of experiment scores


2) il metodo utilizzato ti spiega come sono statte ottenute "expScores" ed è descritto nella pagina "Configure HAIB TFBS trackset" nella sezione "Methods". Nel tuo esempio:

To identify likely transcription factor occupancy sites, peak calling was applied to the aligned sequence data sets using MACS (Zhang et al., 2008). The MACS method models the shift size of ChIP-seq tags empirically, and uses the shift to improve the spatial resolution of predicted binding sites. The MACS method also uses a dynamic Poisson distribution to capture local biases in the genome, allowing for more robust predictions (Zhang et al., 2008).


Spero sia utile!
Enza
Added by Valeria Zazzu on Jun 16, 2014 07:49 PM
Ciao Enza,
ci ho provato ma mi manca ancora qualche dettaglio per risalire alle informazioni che cercavo. Appena possibile magari lo vediamo insieme oppure dovresti dirmi cosa fare "Per recuperare il file usa: Tools>TableBrowser; quando sei qui cerca la tua traccia, seleziona la regione genomica di interesse e scarica il file." Ovvero una volta entrata in Table Browser e incollato la mia regione d'interesse cosa clicco? Poi ho capito che la corrispondenza numerica sta nel expScores…ma non riesco a rintracciarlo.
Grazie ancora.
Ciao,
Valeria
Added by Enza Colonna on Jun 18, 2014 01:51 AM
Valeria,

grazie per aver chiesto chiarimenti. In effetti non avevo specificato che devi cercare la tua traccia di interesse guardando in "group", "track" e "table": questi sono tre livelli di organizzazione dei dati e devi cercare qui la tua traccia di interesse.

Qando hai selezionato la traccia puoi applicare

identifiers (names/accessions): --> analogo a scegliere una regione, ma funziona con "identifiers

filter: --> applicare dei filtri
intersection: --> fare intersezione con altre traccie
correlation: --> calcolare delle correlazioni
output format: --> scegliere l'output
output file: --> dare un nome

quando hai fatto questo cliccando su "get output" potrai scaricare il file che ti interessa.

Spero questo sia di aiuto.
Enza

No responses can be added.