11410670

Source:http://linkedlifedata.com/resource/pubmed/id/11410670

Download in:

Switch to

Custom View

Named Graph Language Inference

Statements in which the resource exists as a subject.
Predicate	Object
rdf:type	pubmed:Citation
lifeskim:mentions	umls-concept:C0017337, umls-concept:C0017428, umls-concept:C0025663, umls-concept:C0034987, umls-concept:C0243095, umls-concept:C0439659, umls-concept:C0599840, umls-concept:C0681842, umls-concept:C1514562, umls-concept:C1519249
pubmed:issue	12
pubmed:dateCreated	2001-6-18
pubmed:abstractText	Improving the accuracy of prediction of gene starts is one of a few remaining open problems in computer prediction of prokaryotic genes. Its difficulty is caused by the absence of relatively strong sequence patterns identifying true translation initiation sites. In the current paper we show that the accuracy of gene start prediction can be improved by combining models of protein-coding and non-coding regions and models of regulatory sites near gene start within an iterative Hidden Markov model based algorithm. The new gene prediction method, called GeneMarkS, utilizes a non-supervised training procedure and can be used for a newly sequenced prokaryotic genome with no prior knowledge of any protein or rRNA genes. The GeneMarkS implementation uses an improved version of the gene finding program GeneMark.hmm, heuristic Markov models of coding and non-coding regions and the Gibbs sampling multiple alignment program. GeneMarkS predicted precisely 83.2% of the translation starts of GenBank annotated Bacillus subtilis genes and 94.4% of translation starts in an experimentally validated set of Escherichia coli genes. We have also observed that GeneMarkS detects prokaryotic genes, in terms of identifying open reading frames containing real genes, with an accuracy matching the level of the best currently used gene detection methods. Accurate translation start prediction, in addition to the refinement of protein sequence N-terminal data, provides the benefit of precise positioning of the sequence region situated upstream to a gene start. Therefore, sequence motifs related to transcription and translation regulatory sites can be revealed and analyzed with higher precision. These motifs were shown to possess a significant variability, the functional and evolutionary connections of which are discussed.
pubmed:commentsCorrections	http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10395892, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10411912, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10446249, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10481031, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10487864, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10556321, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10743554, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10745988, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10786309, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10869034, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-10879562, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-2172928, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-2193692, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-2231712, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-2531596, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-2684350, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-3908689, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-6364041, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-6694906, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-7528374, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-7542800, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-7584439, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-7597025, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-7984429, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-8211139, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-8520488, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-8521047, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-8688087, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-8863437, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-8905231, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9252185, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9278503, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9298646, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9371463, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9389475, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9421513, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9461475, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9611239, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9634230, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9697189, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9707594, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9719638, http://linkedlifedata.com/resource/pubmed/commentcorrection/11410670-9847079
pubmed:language	eng
pubmed:journal	http://linkedlifedata.com/resource/pubmed/journal/0411011
pubmed:citationSubset	IM
pubmed:chemical	http://linkedlifedata.com/resource/pubmed/chemical/Codon, Initiator
pubmed:status	MEDLINE
pubmed:month	Jun
pubmed:issn	1362-4962
pubmed:author	pubmed-author:BesemerJJ, pubmed-author:BorodovskyMM, pubmed-author:LomsadzeAA
pubmed:issnType	Electronic
pubmed:day	15
pubmed:volume	29
pubmed:owner	NLM
pubmed:authorsComplete	Y
pubmed:pagination	2607-18
pubmed:dateRevised	2009-11-18
pubmed:meshHeading	pubmed-meshheading:11410670-Algorithms, pubmed-meshheading:11410670-Bacillus subtilis, pubmed-meshheading:11410670-Base Sequence, pubmed-meshheading:11410670-Codon, Initiator, pubmed-meshheading:11410670-Computational Biology, pubmed-meshheading:11410670-Computer Simulation, pubmed-meshheading:11410670-Databases as Topic, pubmed-meshheading:11410670-Escherichia coli, pubmed-meshheading:11410670-Evolution, Molecular, pubmed-meshheading:11410670-Genes, Archaeal, pubmed-meshheading:11410670-Genes, Bacterial, pubmed-meshheading:11410670-Genes, Overlapping, pubmed-meshheading:11410670-Genome, Archaeal, pubmed-meshheading:11410670-Genome, Bacterial, pubmed-meshheading:11410670-Internet, pubmed-meshheading:11410670-Likelihood Functions, pubmed-meshheading:11410670-Markov Chains, pubmed-meshheading:11410670-Open Reading Frames, pubmed-meshheading:11410670-Protein Biosynthesis, pubmed-meshheading:11410670-Reproducibility of Results, pubmed-meshheading:11410670-Sensitivity and Specificity, pubmed-meshheading:11410670-Sequence Alignment, pubmed-meshheading:11410670-Software, pubmed-meshheading:11410670-Transcription, Genetic
pubmed:year	2001
pubmed:articleTitle	GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions.

More...