SnpEff - SnpEff

SnpEff
Содержание
ОписаниеИнструмент, который аннотирует варианты и прогнозирует их эффекты кодирования.
Контакт
АвторыПабло Чинголани
Дата выхода2012
Доступ
Интернет сайтSnpeff.sourceforge.сеть.html
Разное
Лицензияоткрытый исходный код - LGPLv3

SnpEff это инструмент с открытым исходным кодом, который аннотирует варианты и прогнозирует их влияние на гены, используя подход интервального леса. Эта программа берет заранее определенные варианты, перечисленные в файле данных, который содержит изменение нуклеотида и его положение, и прогнозирует, являются ли варианты вредоносными. Эта программа была впервые создана Пабло Чинголани для прогнозирования эффектов однонуклеотидных полиморфизмов (SNP) в Дросфила,[1] и теперь широко используется во многих университетах, таких как Гарвардский университет, Калифорнийский университет в Беркли, Стэнфордский университет и т. д.[2] SnpEff использовался для различных приложений[3][4][5] - от персонализированной медицины Стэнфордского университета,[6] профилирующим бактериям.[7] Это программное обеспечение для аннотаций и прогнозирования можно сравнить с ANNOVAR и Прогнозирующий эффект варианта, но каждый использует свою номенклатуру [8][9]

Путь использования SnpEff

использование

SnpEff может работать в системах Windows, Unix или Mac, хотя шаги установки различаются. Для всех систем SnpEff сначала загружается в виде файла ZIP, распакованного. [10] а затем скопировать и вставить в желаемое программное обеспечение (Windows) или требуется дополнительная командная строка (Unix и Mac). После установки программного обеспечения пользователь вводит VCF или же TXT файл в набор инструментов, который содержит столбцы, разделенные табуляцией: Хромосома имя, должность, идентификатор варианта, Контрольный геном, Альтернатива, Показатель качества, Фильтр качества и Информация.

Пример входного файла SnpEff

Столбцы с названием и положением хромосомы описывают, где находится вариант - номер хромосомы и положение нуклеотида. Если у варианта есть ранее определенное имя (пример: rs34567), оно указывается в столбце ID. В справочном столбце указаны конкретные нуклеотид в эталонном геноме - отличия от эталонного указаны в разделе «Альтернативы». Насколько точен вариант, будет отображаться в столбце «Качество», а его показания из фильтров качества включены в столбец «Фильтр». Любая другая геномная информация помещается в столбец INFO, который изменяется для отображения вывода после запуска SnpEff.

Пример вывода SnpEff

Вывод в разделе ИНФОРМАЦИЯ включает в себя: эффект варианта (стоп-лосс, стоп-выигрыш и т. Д.), Влияние эффекта на ген (высокий, средний, низкий или модификатор), функциональный класс варианта (бессмыслица, несоответствие, сдвиг кадра и т. Д.) .), изменение кодона, изменение аминокислоты, длина аминокислоты, название гена, биотип гена (кодирование белка, псевдоген, рРНК и т. д.)[11]), информация о кодировании, информация о расшифровке, информация об экзонах и любые обнаруженные ошибки или предупреждения. Влияние эффекта - это то, что SnpEff использует для определения того, насколько вреден вариант для генов. Например, выход ВЫСОКОГО воздействия означает, что SnpEff предсказывает, что вариант вызывает вредные генные эффекты.

SnpEff обычно используется в исследовательских и академических целях в учреждениях и компаниях, а в некоторых случаях и в персонализированной медицине.[нужна цитата ] Однако Пабло Чинголани теперь рекомендует использовать ClinEff (комбинацию SnpEff и SnpSift) в медицинских целях.[нужна цитата ]

Преимущества и ограничения

Преимущества SnpEff:

  • Быстрый инструмент, который может проанализировать все варианты из проекта 1000 Genome менее чем за 15 минут
  • Может быть интегрирован в другие инструменты, такие как Galaxy, GATK и GKNO
  • Можно комбинировать с другими наборами инструментов для сужения параметров прогнозирования вариантов (пример: белый список [12])
  • Перечисляет, как вариант был классифицирован
  • Рамка считывания 5 kb в восходящем / нисходящем направлении обеспечивает более тщательный анализ восходящих / нисходящих областей (1kb в ANNOVAR может пропустить важные регулирующие регионы)

Ограничения SnpEff:

  • Ложные срабатывания
  • Результаты варьируются от одного инструмента прогнозирования к другому
  • Не дает лучшего объяснения эффекта - пример: иногда вместо стоп-лосса указывается смещение кадра
  • Рамка считывания в восходящем / нисходящем направлении 5 кб может ошибочно принимать некодирующие области за точки регулирования

Текущее состояние

SnpEff не обновлялся с ноября 2017 года.

Смотрите также

Рекомендации

  1. ^ «Программа для аннотирования и прогнозирования эффектов однонуклеотидных полиморфизмов, SnpEff: SNP в геноме штамма Drosophila melanogaster w1118; iso-2; iso-3.», Cingolani P, Platts A, Wang le L, Coon M, Nguyen Т, Ван Л., Лэнд С.Дж., Лу Х, Руден Д.М. Fly (Остин). 2012 апрель-июнь; 6 (2): 80-92. PMID  22728672 [PubMed - в процессе]
  2. ^ "SnpEff". SnpEff. N.p., n.d. Интернет. 28 февраля 2017 г. <http://snpeff.sourceforge.net/SnpEff.html#who >.
  3. ^ Медина, Игнасио и др. «ВАРИАНТ: командная строка, веб-сервис и веб-интерфейс для быстрой и точной функциональной характеристики вариантов, найденных с помощью секвенирования следующего поколения». Исследование нуклеиновых кислот 40. W1 (2012): W54-W58.
  4. ^ Ким, Юн Джун и др. «Нейровизуализационные исследования и секвенирование всего экзома нейродегенерации, связанной с PLA2G6, в семье с внутрисемейной фенотипической гетерогенностью». Паркинсонизм и связанные с ним расстройства 21.4 (2015): 402-406.
  5. ^ Редди, Метту М. и Кандасами Улаганатан. «Проект последовательности генома Oryza sativa elite indica сорта RP Bio-226». Границы науки о растениях 6 (2015).
  6. ^ Дьюи, Фредерик Э. и др. «Распределение и клиническое влияние функциональных вариантов в 50 726 полных экзомных последовательностях из исследования DiscovEHR». Наука 354.6319 (2016): aaf6814.
  7. ^ Медведева, Э.С. и др. «Геномные и протеомные профили штаммов Acholeplasma laylawii, различающихся по чувствительности к ципрофлоксацину». Доклады Биохимии и биофизики. Vol. 466. № 1. Плеяды, 2016.
  8. ^ Ван К., Ли М., Хаконарсон Х. ANNOVAR: Функциональная аннотация генетических вариантов на основе данных секвенирования следующего поколения Nucleic Acids Research, 38: e164, 2010
  9. ^ «Прогнозирующий эффект варианта». Прогнозирующий эффект варианта. EMBL-EBI, декабрь 2016 г. Web. 28 февраля 2017 г. <http://uswest.ensembl.org/info/docs/tools/vep/index.html >.
  10. ^ "SnpEff". SnpEff. N.p., n.d. Интернет. 28 февраля 2017 г. <http://snpeff.sourceforge.net/SnpEff_manual.html >.
  11. ^ «Помощь - Часто задаваемые вопросы - Homo sapiens - Браузер генома ансамбля 87.» Помощь - Часто задаваемые вопросы - Homo sapiens - Программа просмотра генома ансамбля 87. N.p., n.d. Интернет. 28 февраля 2017 г.
  12. ^ Дьюи, Фредерик Э. и др. «Распределение и клиническое влияние функциональных вариантов в 50 726 полных экзомных последовательностях из исследования DiscovEHR». Наука 354.6319 (2016): aaf6814.

внешняя ссылка