LINUX.ORG.RU

Как в UGENE собрать полный геном из контигов?

 ,


0

2

Собственно сабж. Пока что-то немного не получается.

И как можно с NCBI автоматически скачать последовательности? Качать все 299 контигов вручную задолбаюсь.

Заранее спасибо!

# cast DNA_Seq

★★

Если геном выгрузили в виде контигов значит во что-либо более крупное (например скаффолды) собрать его нельзя, так как требуется дополнительная информация о взаимном расположении контигов. В случае генома человека это были карты рекомбинаций составленные методами классической генетики. И при этом даже спустя 15 лет остаются вопросы о взаимном расположении некоторых генов. В случае бактерий например можно делать пцр с длинными фрагментами (neb'овская полимераза q5 великолепно вытягивает гц-богатые и повторяющиеся последовательности). А часто это и не нужно.
С NCBI я лично через фтп качаю при необходимости массовой загрузки.

DNA_Seq ★★☆☆☆ ()
Ответ на: комментарий от DNA_Seq

Ну а как понять, что на фтп - нужный мне файл? Потому что как таковых файлов GenBank я там что-то не вижу. Вижу данные WGS, но тут нужна сборка. В то время как через поиск на NCBI большинство этих геномов доступны уже в собранном виде. Что я пропускаю?

Где вообще почитать поподробнее о сборке геномов? Допустим, хочется собрать вот этот геном: ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/Yersinia_pestis/all_assem... - его фрагменты (контиги) выровнять сначала на уже собранный, а дальше?

Dorif ★★ ()
Ответ на: комментарий от DNA_Seq

Так, чуток разобрался. Одно не пойму: как понять, контиг + или -, а то попытался собрать для начала чего попроще: плазмиду pXO1 штамма СТИ-1 - и увидел, что часть контигов «ложатся» на референс сами по себе, а часть - только если взять реверс-комплементарную последовательность. И как понять, какой ориентации контиг?

Dorif ★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.