problem with getBM biomaRt - error message asks to post to mail list (sorry for repost)
1
0
Entering edit mode
efoss ▴ 10
@efoss-8908
Last seen 2.7 years ago
United States

I used the following "getBM" command to retrieve mouse genomic data and received an error message that asked that I post it to the mailing list. I would appreciate any suggestions for how to fix this. 

Thanks. 

Eric

> mart.mm <- useDataset("mmusculus_gene_ensembl", mart = mart.mm)

> exons13 <- getBM(attributes = c("gene_exon", "cdna", "coding", "gene_exon_intron"), filters = "chromosome_name", values = "X", mart = mart.mm)
                  V1                 V2 V3        V4        V5 V6 V7
1 ENSMUSG00000000003 ENSMUST00000000003  X  77853409  77853623 -1  2
2 ENSMUSG00000000037 ENSMUST00000074802  X 161162750 161163248  1  7
3 ENSMUSG00000000134 ENSMUST00000144715  X   7762560   7762630  1 14
4 ENSMUSG00000000223 ENSMUST00000113228  X 134404551 134404687  1  6
5 ENSMUSG00000000266 ENSMUST00000112990  X 140664956 140665278  1  5
6 ENSMUSG00000000355 ENSMUST00000000365  X  38600655  38600778  1  5
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   V8
1                                                                                                                                                                                                                                                                                             GTCAGTGCACAACTGCCAACTGGGATGCAGAACACTGCTCACGCCAACCATCCTGAAAGCCAACTATAAAAAGCAGAGAGATACTCTGCACCTTTTCAGTGAGGTCCAGATACCCACAGAGCAGAGACAGTCGCTCACACATGATGAGGGTCATCATCCTCCTGCTCACACTGCATGTGCTAGGCGTCTCCAGTGTGATGAGTCTCAAAAAGAAG
2 GCGGCTCTGCGCGCGGCTTCTCAAAAATGGCGGCTGCAATGTGAAGTCTGGTGCCTGCTCCCTGAGCTAGCATGACAGAAGTGCTTTTGCTCGGGCGGAGAAGACCCGAGGTGCTTGGTGGCCCTGGTCCCCCTTGGGAAGTGGAGATGGAGTCCTGATGTTGGAGTCCTGATGGCTGTCTGCAGGGCAGGGGAGCCTTAGGGGCAAGTCCTGCGCTGGGAACGCCCCCTTACTGCCGCGCCAGCGTCCCGCCTCAGTTTGTCCCAACACTCCTGCCTCACACCCCTGGAAGCTTTACCCCAGATGCCAAGGCTGCTGTGTCTAAATTAGTGTTCTCTGTGGGCCATCTCCGCTGCTAGCACTCGCTGCTGACCTTCACACTTATTCGGACCCTCTTCACTGGCTCATCTTGCTAGAGGTATTCGGCCCCTGGCCCAGCTCCCCTCAACAGGCCCCCTCCCCAGGAGCACCGACAGCGCCCTCTGCAATTCTCCCCAGG
3                                                                                                                                                                                                                                                                                                                                                                                                                                             TACCGCTCGAAGTCGTGGCTTAGGGCGGGCTCTCCAATCTCCCGGCTGCAACTGGCTGCCTTGCTCAGGAG
4                                                                                                                                                                                                                                                                                                                                                                           TGCTTTTCAGGCTCTTCCGCTTTGCTCTTCTGCTTCGAATGAATTGAAATCTCCGCGAGCCGCCACGGCTCTGGTACTTTTATAAAACTGTCCTTGCTCTCTCTGCGTTCGTCCAGTCAAGGGTATCTTTGCCTGAG
5                                                                                                                                                                                 TCATGGTGCTGCCTCTGGACCGAGAGGCGAAAACTCTTTAAGTTTAGCCCGGGAGACCTAGACGCGGGAACGTCGCGGTCTCCGTGCTGTCCCCCGTGGGGCGCGCGGGCTGGCGGATCCCGGCTGTTGCGCGGCGGCGGCGGCGGCCGCAGCGGCGAAGGCGGGCGGCGGCCTAGAGTGGTGGTGGCGGCGGCGGCGGCGGCAGCAGCGACAGCGGCCCGGGAGCTTGCACGGGAGCCCGAGCCAGCTTGCTGCGGAGGCCGGCGAGCGCCCGGCGCTCCCCGGCGCGCGTAGGAGATGGCTGGCACCCGGGAACAATATGG
6                                                                                                                                                                                                                                                                                                                                                                                        AACGACAGCAGCTCCGACTGTCAGTGCAGGCCTTCCTCGTGCTGGACCCTTCCTAATTCAATTTCCTTCCCATTCCGGGCCCTTCCCTATCGTCGCCCCTTTCACCTTGGATCATGTTCAAGAA
Error in getBM(attributes = c("gene_exon", "cdna", "coding", "gene_exon_intron"),  : 
  The query to the BioMart webservice returned an invalid result: the number of columns in the result table does not equal the number of attributes in the query. Please report this to the mailing list.


In case it is useful, here is my sessionInfo: 

> sessionInfo()
R version 3.2.2 (2015-08-14)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.10.4 (Yosemite)

locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

attached base packages:
[1] stats4    parallel  stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] org.Mm.eg.db_3.1.2                      RSQLite_1.0.0                          
 [3] DBI_0.3.1                               TxDb.Mmusculus.UCSC.mm9.knownGene_3.1.2
 [5] GenomicFeatures_1.20.5                  AnnotationDbi_1.30.1                   
 [7] Biobase_2.28.0                          GenomicRanges_1.20.8                   
 [9] GenomeInfoDb_1.4.3                      IRanges_2.2.7                          
[11] S4Vectors_0.6.6                         BiocGenerics_0.14.0                    
[13] biomaRt_2.24.1                         

loaded via a namespace (and not attached):
 [1] XVector_0.8.0           zlibbioc_1.14.0         GenomicAlignments_1.4.1
 [4] BiocParallel_1.2.21     tools_3.2.2             lambda.r_1.1.7         
 [7] futile.logger_1.4.1     rtracklayer_1.28.10     futile.options_1.0.0   
[10] bitops_1.0-6            RCurl_1.95-4.7          Biostrings_2.36.4      
[13] Rsamtools_1.20.4        XML_3.98-1.3           

biomart • 921 views
ADD COMMENT
1
Entering edit mode
Thomas Maurel ▴ 800
@thomas-maurel-5295
Last seen 14 months ago
United Kingdom

Dear Eric,

I believe that the issue is coming from the fact that you have asked BioMart to retrieve 4 different type of sequences at the same time. BioMart only support the querying of one sequence type at the time. If you split up your query and run one query at a time it will work:

 

exons13 <- getBM(attributes = c("gene_exon"), filters = "chromosome_name", values = "X", mart = mart.mm)

exons13 <- getBM(attributes = c("cdna"), filters = "chromosome_name", values = "X", mart = mart.mm)

exons13 <- getBM(attributes = c("coding"), filters = "chromosome_name", values = "X", mart = mart.mm)

exons13 <- getBM(attributes = c("gene_exon_intron"), filters = "chromosome_name", values = "X", mart = mart.mm)

 

The above will only return raw sequences so you might want to add additional non sequence attributes like "ensembl_gene_id", "ensembl_transcript_id", "ensembl_exon_id", ...

 

Hope this helps,

Regards,

Thomas

ADD COMMENT
0
Entering edit mode

Hi Thomas, 

That worked. Thanks very much. 

Best wishes, 

Eric

ADD REPLY

Login before adding your answer.

Traffic: 666 users visited in the last hour
Help About
FAQ
Access RSS
API
Stats

Use of this site constitutes acceptance of our User Agreement and Privacy Policy.

Powered by the version 2.3.6