reciprocal_smallest_distance

Yazılım ekran görüntüsü:
reciprocal_smallest_distance
Yazılım detaylar:
Versiyon: 1.1.5
Qayıt: 20 Feb 15
Lisans: Ücretsiz
Popülerlik: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance global dizi hizalama ve dizileri arasında maksimum olabilirlik evrimsel mesafe doğru genomları arasındaki ortologlarını tespit için kullandığı bir ikili orthology algoritması.
Tarball'dan yükleme
Indirin ve github son sürümü Tar:
cd ~
kıvırmak L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar xvz
Python 2.7 kullanmaya emin, reciprocal_smallest_distance yükleyin:
cd reciprocal_smallest_distance-VERSION
piton setup.py install
Othologs Bul RSD kullanma
Aşağıdaki örnek, komutları rsd_search çalıştırmak için ana yöntem göstermektedir. Rsd_search her çağırma iki genomları için bir FASTA biçimlendirilmiş dizisi dosyasının konumunu belirterek gerektirir, sorgu ve konu genomları çağırdı. Onların sipariş keyfi, ancak --ids seçeneğini kullanırsanız, kimlikleri sorgu genom gelmelidir. Ayrıca MSB algoritması tarafından bulunan ortologlar sonuçlarını yazmak için bir dosyayı belirtmeniz gerekir. Çıktı dosyasının biçimi, her satırda bir orthologunu içerir. Her satır dizileri arasında (codeml tarafından hesaplanan) sorgu dizisi id, konu dizi id, ve mesafeyi içerir. İsteğe bağlı --ids seçeneğini kullanarak kimlikleri içeren bir dosyayı belirtebilirsiniz. Sonra rsd sadece bu kimlikleri için ortologlar arayacaktır. --divergence Ve --evalue kullanarak, varsayılan farklı eşik kullanma seçeneği vardır.
Rsd_search, rsd_blast, ya rsd_format çalıştırmak için nasıl yardım alın:
rsd_search -h
rsd_blast -h
rsd_format -h
Varsayılan uzaklaşma ve evalue eşiklerini kullanarak, sorgu ve konu genomları tüm dizileri arasında ortologlarını bul
rsd_search q örnekler / genomları / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = örnekler / genomları / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-O Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Birkaç varsayılan olmayan ayrışmanın ve evalue eşiklerini kullanarak ortologlarını bul
rsd_search q örnekler / genomları / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = örnekler / genomları / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0.2 1e-20 --de 0,5 0.00001 --de 0.8 0.1
Bu BLAST için FASTA dosya biçimlendirmek veya rsd_search sizin için yapar çünkü ŞOK vurur hesaplamak için gerekli değildir.
Eğer özellikle büyük genomları için, aynı genomları için rsd_search birden çok kez çalıştıran planlıyorsanız Ancak, eğer ŞOK vurur precomputing için FASTA dosyaları ve rsd_blast preformatting için rsd_format kullanarak zamandan tasarruf edebilirsiniz. Rsd_blast çalıştırırken, rsd_search vermek niyetinde büyük evalue eşiği gibi büyük bir --evalue kullandığınızdan emin olun.
Burada yer FASTA dosyaları bir çift biçimlendirmek nasıl:
rsd_format -g örnekler / genomları / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g örnekler / genomları / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Ve burada, FASTA'dır dosyaları biçimlendirmek (bu durumda geçerli dizin) başka bir dizine sonuçları koyarak nasıl
rsd_format -g örnekler / genomları / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g örnekler / genomları / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Burada ileri hesaplamak ve patlama hit (varsayılan evalue kullanarak) ters nasıl:
rsd_blast -v -q örnekler / genomları / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = örnekler / genomları / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-Hits q_s.hits --reverse-hit s_q.hits
İşte ileri hesaplamak için nasıl ve ters patlama zaten patlamanın biçimlendirilmiş olan genom ve bir varsayılan olmayan evalue kullanarak, rsd_search için vurur
rsd_blast v q Mycoplasma_genitalium.aa
--subject genom = Mycobacterium_leprae.aa
--forward-Hits q_s.hits --reverse-hit s_q.hits
0.1 --evalue --no-biçimi
Zaten patlamanın biçimlendirilmiş tüm sorguda dizileri ve genom kullanarak konu genomları arasındaki ortologlarını bul
rsd_search q Mycoplasma_genitalium.aa
--subject genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-biçimi
Tüm sorguda dizileri ve zaten bilgisayarlı olan hit kullanarak konu genomları arasındaki ortologlarını bulun. Patlama hit zaten hesaplanan beri genomları patlamanın biçimlendirilmiş olması gerekmez, çünkü --no-biçim, dahil olduğuna dikkat edin.
rsd_search -v --query-genom Mycoplasma_genitalium.aa
--subject genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-Hits q_s.hits --reverse-hit s_q.hits --no-biçimi
Sorgu genomuna özgü sekanslar için ortologlarını bulun. Hesaplama hızlandırabilir --no-patlama-cache kullanarak sadece birkaç dizileri için ortologlarını, bulmak için. YMMV.
rsd_search q örnekler / genomları / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = örnekler / genomları / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o örnekler / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
örnekler / Mycoplasma_genitalium.aa.ids.txt --no-patlama-cache --ids
Çıktı Biçimleri
Ortologları rsd_search ve --outfmt seçeneğini kullanarak farklı formatlarda kaydedilebilir. Varsayılan biçim, -1 --outfmt, Uniprot dat dosyaları esinlenerek 3. --outfmt anlamına gelir, ortologlar bir dizi daha sonra bir uç hattı vardır, o, bir parametre çizgi ile başlar 0 veya daha fazla ortologu hatları vardır. Parametes sorgu genom adı, konu genom adı, sapma eşik ve evalue eşiği vardır. Her ortologu sorgu dizisi kimliği, konu sırası id, ve maksimum olabilirlik mesafesi tahmini listeleyen bir tek hat üzerinde. Bu formatın hiçbir ortologlar ile parametrelerin tek bir dosyada parametrelerin birden fazla setleri için ortologlarını yanı sıra setleri temsil edebilir. Birden fazla sapma ve evalue eşik belirtirken nedenle rsd_search ile kullanım için uygundur.
İşte hiç ortologlarını sahip biri 2 parametre kombinasyonlarını içeren bir örnektir:
PA tLACJO tYEAS7 t0.2 t1e-15
YA tQ74IU0 tA6ZM40 t1.7016
YA tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
RSD orijinal formatı, 1 --outfmt, geriye dönük uyumluluk için sağlanır. Her satır konusu dizisi id, sorgu dizisi kimliği ve maksimum olabilirlik mesafesi tahmini olarak temsil edilen bir orthologunu içerir. Sadece bir dosyada ortologlar tek bir dizi temsil edebilir.
Örnek:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Ayrıca geriye dönük uyumluluk için sağlanan sorgu dizisi kimliği sütununda dışında orijinal MSB formatında gibi Roundup tarafından dahili olarak kullanılan bir biçim (http://roundup.hms.harvard.edu/), konu sırası kimliği önce olmasıdır.
Örnek:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Gereksinimler :

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4.4
  • Kalign 2.04

Benzer yazılım

Geant4
Geant4

20 Feb 15

PySCeS
PySCeS

14 Apr 15

Adun
Adun

3 Jun 15

Staden Package
Staden Package

12 May 15

Yorumlar reciprocal_smallest_distance

Yorum Bulunamadı
Yorum eklemek
Görüntülerde açın!