BASys - BASys

BASys
Содержание
ОписаниеДля автоматической аннотации бактериального генома и создания хромосомных карт
Типы данных
захвачен
Ввод данных: Исходная последовательность генома (формат FASTA), меченая последовательность генома (формат FAST) или предсказанная / меченая последовательность протеома (FASTA); Вывод данных: Полностью аннотированный геном вместе с интерактивной аннотированной картой генома.
Контакт
Исследовательский центрУниверситет Альберты
ЛабораторияД-р Дэвид Вишарт
Основное цитирование[1]
Доступ
Интернет сайтhttps://www.basys.ca/
Скачать URLhttps://www.basys.ca/
Разное
Выпуск данных
частота
Последнее обновление 2012
Политика курированияКурируется вручную

BASys (Система бактериальных аннотаций) - это свободно доступный веб-сервер, который можно использовать для выполнения автоматизированных комплексных аннотаций бактериальных аннотаций. геномы.[2] С появлением секвенирования ДНК следующего поколения теперь возможно секвенировать все геном из бактерия (обычно ~ 4 миллиона баз) в течение одного дня. Это привело к резкому увеличению числа полностью секвенированных микробы. Фактически, по состоянию на 2013 год насчитывалось более 2700 полностью секвенированных бактериальных геномы сдан на хранение GenBank. Тем не менее, постоянной проблемой микробной геномики является поиск ресурсов или инструментов для аннотирования большого количества вновь секвенированных геномы. BASys был разработан в 2005 году с учетом этих потребностей. Фактически, BASys был первым в мире общедоступным микробным геном аннотационный веб-сервер. Из-за своей широкой популярности сервер BASys был обновлен в 2011 году путем добавления нескольких серверных узлов для обработки большого количества получаемых запросов.

Сервер BASys предназначен для приема либо собранных данных генома (сырые Последовательность ДНК данные) или заполнить протеом назначения в качестве ввода. Если сырые Последовательность ДНК предоставляется, в BASys работает Мерцание (версия 2.1.3) для идентификации генов.[1] Результатом BASys является всеобъемлющая аннотация для всего генома (с ~ 60 подполями аннотации для каждого гена) и масштабируемая гиперссылка на карта генома генома запроса. BASys использует около 30 различных программ для определения и аннотирования названий генов / белков, функций GO, функций COG, возможных паралогов и ортологов, молекулярной массы, изоэлектрической точки, оперон структура, субклеточная локализация, сигнальные пептиды, трансмембранные области, вторичная структура, 3D-структура, реакции и пути. Полный список программ, используемых BASys, приведен ниже:

ИмяМетод
Блеск 2.1.3Мерцание это популярная и очень точная программа ab initio по поиску генов микробной ДНК. При исследовании 31 полного генома бактерий и архей, Мерцание достигли средней точности предсказания гена 99,36%. Мерцание использует интерполированные марковские модели, чтобы отличить кодирующие области от некодирующей ДНК. Мерцание производительность снижается с увеличением содержания GC. Для геномов с высоким содержанием GC (> 60%), Мерцание может генерировать большое количество ложноположительных прогнозов, поэтому его следует использовать с осторожностью.
HMMER 2.3.2Используется для местных поисков Pfam
Homodeller 2.0Разработано на местном уровне моделирование гомологии программа.
SignalP 3.0Прогнозирование сигнального пептида.
ТМХММ 2.0Прогнозирование трансмембранные спирали в белке.
PSIPRED 2.45Прогнозирование вторичной структуры. PSIPRED получает средний балл за третий квартал 80,6% для вторичная структура прогноз.
PS_scanИнструмент для локальных сканирований PROSITE.
VADAR 1.4Инструмент для анализа структуры белков, разработанный на местном уровне. BASys использует VADAR для анализа структур белков для получения вторичной структурной информации.
ПСОРТ-Б 2.0.4Используется для прогнозирования субклеточного местоположения. PSORT-B достигает точности 96% для Грамположительный и Грамотрицательный бактерии
ProteinNameExtractor 1.0Модуль прогнозирования функций BASys. Этот модуль был проверен по набору профессионально аннотированных белков из C.trachomatis.
FindParalogs 1.0Модуль BASys для идентификации паралогов. База данных паралогов создается из концептуальных переводов для идентифицированных кодирующих областей, предоставленных BASys от Мерцание или отправителем.
FindHomologs 1.0Модуль BASys для идентификации гомологов. Ищет в базах данных моделей организмов возможные гомологи.
GOSearch 1.0Модуль BASys для распаковки Генная онтология информация из разных источников.
OperonFinder 1.0Модуль BASys для идентификации опероны.
StructureManager 1.0Модуль BASys для управления структура белка файлы.
StructureClassifier 1.0Модуль BASys для определения класса конструкции из вторичная структура Информация.
Поиск структуры 1.0Модуль BASys для генерации белковые структуры из разных источников.
COG_Finder 1.0Модуль BASys для определения функциональных категорий и принадлежностей COG
Менеджер вторичной структуры 1.0Модуль BASys для генерации вторичная структура информация из разных источников.
ECNumber_FinderМодуль BASys для отображения EC_number в и из различных источников.
SwissProt Annotation Manager 1.0Модуль BASys для сравнения и транзитивного применения аннотаций из SwissProt записи.
Менеджер аннотаций CCDB 1.0Модуль BASys для сравнения и транзитивного применения аннотаций из записей CCDB.
Идентификатор гена 1.0Модуль BASys для координации информации по идентификации генов из мерцать или пользовательские материалы
BASys Annotation Manager 1.0Менеджер конвейера BASys.
Менеджер поиска KEGGМодуль BASys для поиска и извлечения метаболической информации из КЕГГ.
SubCellLocalization Manager 1.0Модуль BASys для генерации субклеточное расположение аннотация из разных источников.

В дополнение к обширной аннотации для каждого гена / белка в геноме запроса, BASys также генерирует красочные, интерактивные и полностью масштабируемые круговые карты каждого ввода хромосома. Эти бактериальные карты генома генерируются с помощью программы CGView (Circular Genome Viewer), которая была разработана в 2004 году.[3] В карты генома предназначены для быстрой навигации и подробной визуализации всех аннотаций генов, созданных BASys. Полный цикл BASys занимает около 16 часов для средней бактериальной хромосомы (примерно 4 мегабазы). Аннотации BASys можно просматривать и загружать анонимно или через систему доступа, защищенную паролем. BASys хранит аннотации бактериального генома на сервере не более 180 дней. BASys обрабатывает около 1000 заявок в год. BASys доступен по адресу https://www.basys.ca/

Объем и доступ

Все данные в BacMap не являются собственностью или получены из сторонних источников. Он находится в свободном доступе и доступен каждому. Кроме того, почти каждый элемент данных полностью отслеживается и явно ссылается на исходный источник. Данные BacMap доступны через общедоступный веб-интерфейс и загружаются.

Смотрите также

Рекомендации

  1. ^ а б Van Domselaar, GH; Stothard P; Шривастава S; Cruz JA; Guo A; Dong X; Лу П; Szafron D; Greiner R; Wishart DS. (Июль 2005 г.). «BASys: веб-сервер для автоматической аннотации бактериального генома». Нуклеиновые кислоты Res. 33 (Выпуск веб-сервера): W455–9. Дои:10.1093 / нар / gki593. ЧВК  1160269. PMID  15980511.
  2. ^ Стотхард П., Ван Домселаар Г., Шривастава С., Го А., О'Нил Б., Круз Дж., Эллисон М., Вишарт Д.С. (2005). «BacMap: интерактивный графический атлас аннотированных геномов бактерий». Нуклеиновые кислоты Res. 33 (Выпуск базы данных): D317–20. Дои:10.1093 / nar / gki075. ЧВК  540029. PMID  15608206.
  3. ^ Stothard, P; Уишарт Д.С. (2005). «Визуализация и исследование кругового генома с помощью CGView». Биоинформатика. 21 (4): 537–9. Дои:10.1093 / биоинформатика / bti054. PMID  15479716.