Методы:
Используя данные из больших популяционных выборок и выборок "случай-контроль" (число случаев варьировалось от 62 138 до 443 264 в разных подвыборках), авторы провели серию предварительно зарегистрированных анализов, в которых изучались основные эффекты полиморфизма генов-кандидатов, взаимодействия полиморфизма с окружающей средой и эффекты на генном уровне для ряда операционных определений депрессии (например, для депрессии, связанной с депрессией у детей)., прижизненный диагноз, текущая тяжесть, рецидив эпизода) и факторы окружающей среды (например, сексуальное или физическое насилие в детстве, неблагоприятные социально-экономические условия).Результаты:
Не было обнаружено четких доказательств связи полиморфизма какого-либо гена-кандидата с фенотипами депрессии или каких-либо эффектов замедления полиморфизма в зависимости от окружающей среды. В целом гены-кандидаты на депрессию были связаны с фенотипами депрессии не больше, чем некандидатные гены. Авторы демонстрируют, что ошибка фенотипических измерений вряд ли может объяснить эти нулевые результаты.Выводы:
Результаты исследования не подтверждают предыдущие результаты исследования генов-кандидатов на депрессию, в которых часто сообщалось о значительных генетических эффектах в образцах, на порядок меньших по величине, чем те, которые были исследованы здесь. Вместо этого результаты показывают, что ранние гипотезы о генах-кандидатах на депрессию были неверными и что большое количество ассоциаций, описанных в литературе по генам-кандидатам на депрессию, скорее всего, являются ложноположительными.Тяжелое депрессивное расстройство (далее именуемое “депрессия”) является умеренно наследуемым (наследуемость от близнецов составляет ≈37%) (1), но его генетическая структура сложна, и выявление специфических полиморфизмов, лежащих в основе предрасположенности к депрессии, является сложной задачей. Учитывая возможность генотипирования определенных генетических вариантов и оптимизм в отношении потенциального воздействия выявления надежных биомаркеров депрессии на общественное здравоохранение (2), ранние исследования были сосредоточены на влиянии конкретных полиморфизмов-кандидатов в генах, которые, как предполагается, лежат в основе предрасположенности к депрессии. Эти гены были выбраны на основе гипотез о биологических основах депрессии. Полиморфизм 5-HTTLPR с переменным числом тандемных повторов (VNTR) в промоторной области гена-переносчика серотонина SLC6A4, наиболее часто изучаемый полиморфизм, связанный с депрессией (рис. 1; см. также таблицу S1.1 в онлайн-приложении), служит прототипическим примером: учитывая теоретическую важность серотонинергической системы в этиологии депрессии, логичной целью для ранних ассоциативных исследований был распространенный, крупный (и, следовательно, относительно легко поддающийся генотипированию) и потенциально функциональный повторяющийся полиморфизм в серотонинергический ген (3-5). Ранние исследования, хотя и были по необходимости сосредоточены на небольшом количестве вариантов (недорогие общегеномные массивы еще не были доступны), показали многообещающие положительные ассоциации. Однако попытки репликации привели к противоречивым результатам (6-8).
По мнению критиков результатов исследования генов-кандидатов, сбои в репликации предполагали, что первоначальные результаты были искусственными (9-11). Однако, по крайней мере, два альтернативных объяснения могут объяснить невозможность воспроизвести ранние результаты и противоречивые результаты разных исследований. Во-первых, в начале 2000-х годов Каспи и др. (12) предположили, что предыдущие несоответствия могли отражать эффекты полиморфизмов-кандидатов, которые зависели от воздействия окружающей среды (эффекты взаимодействия генов с окружающей средой [G×E])По мнению критиков результатов исследования генов-кандидатов, сбои в репликации предполагали, что первоначальные результаты были искусственными (9-11). Однако, по крайней мере, два альтернативных объяснения могут объяснить невозможность воспроизвести ранние результаты и противоречивые результаты разных исследований. Во-первых, в начале 2000-х годов Каспи и др. (12) предположили, что предыдущие несоответствия могли отражать эффекты полиморфизмов-кандидатов, которые зависели от воздействия окружающей среды (эффекты взаимодействия генов с окружающей средой [G×E]). В статье, которая стала одной из самых цитируемых (более 8000 ссылок на июль 2018 г.) и втатье, которая стала одной из самых цитируемых (более 8000 ссылок на июль 2018 г.) и влиятельных статей в области психиатрической генетики, Caspi и др. (13) сообщили, что влияние полиморфизма повтора 5-HTTLPR в SLC6A4 на депрессию было смягчено воздействием стрессовых жизненных событий, так что у пациентов с депрессией наблюдался положительная связь между стрессовыми жизненными событиями и депрессией была сильнее у лиц, носителей “короткого” аллеля. Эта ранняя работа побудила многих исследователей переключить свое внимание на гипотезы G×E, сосредоточившись на тех же полиморфизмах, которые впервые были исследованы на предмет основных эффектов (8). Во-вторых, в качестве альтернативной, но дополняющей друг друга версии другие исследователи предположили, что полиморфизмы в тех же генах-кандидатах, отличные от изученных ранее, вероятно, объясняют риск депрессии, учитывая предполагаемую биологическую значимость этих генов (14). Эти направления исследований хорошо представлены в литературе за последние 25 лет. В тысячах исследований депрессии или эндофенотипов депрессии изучались 1) прямые эффекты наиболее изученных полиморфизмоВ тысячах исследований депрессии или эндофенотипов депрессии изучались 1) прямые эффекты наиболее изученных полиморфизмов в генах-кандидатах, 2) смягчение их воздействия стрессовыми факторами окружающей среды или 3) эффекты альтернативных полиморфизмов в тех же генах-кандидатах. Популярность этих направлений исследований со временем не уменьшилась (рис. 1; см. также рисунки S1.4 и S1.5 онлайн-приложения), и во многих исследованиях сообщалось о статистически значимых взаимосвязях.
Возможно, удивительно, что, учитывая сохраняющийся интерес к изучению этих исторических генов-кандидатов на депрессию и большое количество ассоциаций, описанных в литературе по генам-кандидатам, многие исследователи выразили скептицизм по поводу достоверности таких результатов (11, 15-17). Для этого есть несколько причин. Во-первых, исследования общегеномных ассоциаций (GWASs), в ходе которых агностически изучаются ассоциации миллионов распространенных однонуклеотидных полиморфизмов (SNP) по всему геному в больших выборках, неВо-первых, исследования ощегеномных ассоциаций (GWASs), в ходе которых агностически изучаются ассоциации миллионов распространенных однонуклеотидных полиморфизмов (SNP) по всему геному в больших выбоках, неизменно показывают, что отдельные SNP оказывают незначительное влияние на генетически сложные признаки, такие как депрессия (18-20). Например, в последнем исследовании депрессии, в котором использовалась выборка из 135 458 пациентов и 344 901 контрольного пациента, был обнаружен самый сильный индивидуальный сигнал (rs12552; отношение шансов=1,044, p=6,07×10-19) потребовало бы,отношение шансов=1,044, p=6,07×10-19) потребовало бы, чтобы выборка из примерно 34 100 человек была выявлена с 80%-ной достоверностью при альфа-уровне 0,05, предполагая сбалансированный подход "случай-контроль" (18). Напротив, средний размер выборки в обзоре из 103 исследований-кандидатов, опубликованных в период с 2000 по 2009 год, составил 345, при этом в 65% исследований сообщалось о положительных результатах (15). Таким образом, учитывая, что обычно используются небольшие размеры выборки, возможности для исследования генов-кандидатов, вероятно, были сильно ограничены (21, 22). Это, в свою очередь, может свидетельствовать о том, что частота ложных открытий для многих положительных сообщений в литературе о генах-кандидатах высока. В соответствии с этой возможностью, целенаправленные, хорошо изученные генетические ассоциации депрессии и других психических фенотипов на больших выборках не подтвердили гипотезы о генах-кандидатах (18, 23-27). Например, предварительно зарегистрированный совместный мета-анализ взаимодействия стрессовых жизненных событий и генотипа 5-HTTLPR в выборке из 38 802 человек не подтвердил первоначальные выводы Каспи и соавт. (28), хотя мы отмечаем, что этот вариант и несколько других потенциальных VNTRS ранее не рассматривались в контексте GWAS (29, 30). Обращает на себя внимание отсутствие предыдущих исследований гипотез о VNTR на больших выборках, поскольку VNTR включают в себя несколько самых ранних полиморфизмов-кандидатов для изучения в контексте поведенческих исследований; опасения по поводу изменчивости процедур генотипирования VNTR и аналитических методов с течением времени еще больше усложнили интерпретацию литературы (31). Кроме того, ряд исследователей предположили, что большинство опубликованных исследований генов-кандидатов характеризуются неправильными аналитическими методами и неадекватным контролем за стратификацией популяции (21, 32-34), а другие исследователи поставили под сомнение клиническую полезность сосредоточения внимания на отдельных полиморфизмах или взаимодействии полиморфизма с окружающей средой (35). Наконец, имеются свидетельства систематической предвзятости публикаций в литературе по генам-кандидатам; в вышеупомянутом обзоре всех возможных исследований G× E, опубликованных в период с 2000 по 2009 год, 96% новых результатов были значимыми, по сравнению только с 27% попыток репликации, а попытки репликации, в которых сообщалось о нулевых результатах, имели больший объем выборки, чем те, в которых были представлены положительные результаты (15). В ответ на такой скептицизм сторонники генов-кандидатов утверждают
Настоящее исследование является наиболее полным и обоснованным на сегодняшний день исследованием исторического полиморфизма-кандидата и гипотез о генах-кандидатах при депрессии. Мы сосредоточились на трех направлениях исследования того, как исторические гены-кандидаты могут влиять на склонность к депрессии: 1) основные эффекты наиболее часто изучаемых полиморфизмов-кандидатов, 2) смягчение эффектов этих полиморфизмов воздействием окружающей среды и 3) основные эффекты общих SNP для каждого из генов-кандидатов.
Сначала мы эмпирически идентифицировали 18 широко изучаемых генов-кандидатов, представленных, по меньшей мере, в 10 рецензируемых журнальных статьях, посвященных депрессии, в период с 1991 по 2016 год, из массива публикаций, индексируемых в PubMed. В этих генах-кандидатах мы идентифицировали наиболее часто изучаемые полиморфизмы, а также их канонические аллели риска, после чего был предварительно зарегистрирован наш план первичного анализа. Использование нескольких больших выборок (Ns варьируются от 62 138 до 443 264 в разных подвыборках; всего N=621 214 человек), мы изучили множество показателей депрессии (например, диагностический статус в течение жизни, тяжесть симптомов у лиц, сообщающих о нарушениях настроения, количество эпизодов депрессии в течение жизни) (таблица 1), используя множество статистических методов (например, основные эффекты полиморфизмов и генов, влияние взаимодействия как на аддитивный, так и на депрессивный уровни). мультипликативные шкалы), а при анализе G×E учитываются многочисленные показатели воздействия окружающей среды (например, травматические события в детстве или во взрослой жизни). Предыдущие крупномасштабные исследования депрессии были в основном сосредоточены на генетическом влиянии на диагностику депрессии в контексте SNP-данных по всему геному. Напротив, мы рассмотрели несколько альтернативных фенотипов депрессии, проанализировали как основные эффекты, так и взаимодействия с несколькими потенциальными модераторами, включили наиболее изученные полиморфизмы, включая VNTRs (рис. 1), и использовали либеральный порог значимости. Мы также определили количественно, в какой степени ошибка фенотипических измерений могла повлиять на наши результаты. Объединяющий вопрос, лежащий в основе этого “мультивселенского” аналитического подхода (44), заключался в следующем: подтверждают ли большие массивы данных эпохи полногеномных данных какие-либо предыдущие гипотезы о генах-кандидатах на депрессию?
Методы
Идентификация генов и полиморфизмов
Используя биоинформационный пакет Biopython (45), мы идентифицировали 18 генов-кандидатов, изученных на предмет их связи с фенотипами депрессии, по меньшей мере, 10 раз из числа рецензируемой биомедицинской литературы, индексируемой в PubMed. Мы использовали регулярные выражения для поиска статей, потенциально соответствующих каждому гену, и вручную проверили количество правильно классифицированных статей по каждому гену, чтобы оценить гипергеометрические доверительные интервалы для истинного числа правильно классифицированных исследований (дополнительные подробности см. в разделе S1 онлайн-приложения). Мы идентифицировали единичные полиморфизмы, составляющие значительную долю исследуемых очагов, для 16 из 18 генов-кандидатов. На рисунке 1 приведены наиболее изученные гены-кандидаты и полиморфизмы внутри них, а также вероятностные оценки минимального количества раз, когда каждый из них был изучен в отношении депрессии, и количества исследований для каждого гена в год (доверительные интервалы представлены в таблице S1.1 в онлайн-приложении).Образцы
Образцы из британского биобанка
Большая часть данных, использованных в нашем анализе, была собрана британским биобанком - популяционной выборкой из 502 682 человек, собранной в 22 центрах по всему Соединенному Королевству в период с 2006 по 2010 год (46). В рамках этой группы мы проанализировали несколько фенотипов депрессии и их модераторов среди 177 950 неродственных (попарное геномное родство <0,05) лиц европейского происхождения, для которых были собраны соответствующие показатели депрессии. Мы проанализировали две частично совпадающие подгруппы этих людей: 91 121 человек, для которых были доступны выбранные вопросы из первоначального опроса с помощью сенсорного экрана, и 115 458 человек, которые заполнили серию онлайн-опросников по психическому здоровью, 62 138 из которых подтвердили, что в какой-то момент их жизни у них наблюдался двухнедельный период, характеризующийся ангедонией или подавленным настроением. ДНК была выделена из цельной крови и генотипирована с использованием Affymetrix UK Biobank Axiom array или Affymetrix UK BiLEVE Axiom array и внесена Британским Биобанком в справочный консорциум по гаплотипам (47). Более подробная информация о процедурах генотипирования и отбора проб доступна онлайн (48) и в разделе S2 онлайн-приложения. Поскольку VNTRs не были генотипированы в наборе данных британского биобанка, мы использовали два независимых набора данных по полногеномным SNP (проект "Семейный переход" [49] и "Генетика антисоциальной наркотической зависимости" [50, 51]), которые также измеряли эти повторяющиеся полиморфизмы в качестве эталонных панелей, чтобы отнести хорошо изученные VNTRS к одному из основных типов. DRD4, MAOA, SLC6A3 и SLC6A4 в британском биобанке. Предполагаемый коэффициент совпадения генотипов вне выборки составил ≥0,919 для всех четырех VNTRs (среднее значение R2=0,868; подробности приведены в ссылке 29).Образец из Консорциума психиатрической геномики
Чтобы исследовать гипотезы об основном влиянии полиморфизма генов-кандидатов, мы также использовали данные самого последнего исследования депрессии, проведенного Рабочей группой по основным депрессивным расстройствам Консорциума психиатрической геномики (PGC), которое подробно описано в работе Wray et al. (18). Отсутствие доступа к исходным генотипам для большого числа когорт PGC исключало возможность использования VNTRS в выборке PGC. Чтобы свести к минимуму совпадение выборки с британским биобанком, когорты, базирующиеся в Великобритании, были исключены из набора данных PGC, в результате чего была получена сводная статистика GWAS в общей сложности по 443 264 лицам (120 201 субъект наблюдения и 323 063 субъекта контроля) (более подробную информацию смотрите в разделе S2 онлайн-приложения).Фенотипы
В таблице 1 описаны все фенотипы, изученные в настоящем исследовании, а дополнительная информация представлена в разделе S3 онлайн-приложения. Корреляции между исходами депрессии и оценками Коэна по каппа для диагностических фенотипов представлены в таблицах S3.1 и S3.2 онлайн-приложения. Наследуемость на основе маркеров и генетические корреляции между исходами депрессии были оценены с помощью регрессии по шкале неравновесия по сцеплению (LD) (52) и представлены в таблицах S3.3 и S3.4 и рисунке S3.3 в онлайн-приложении (более подробную информацию смотрите в разделе S4.4 онлайн-приложения). дополнение).Анализы
Все анализы были предварительно зарегистрированы в Open Science Framework. Статистические модели подробно описаны в разделе S4 онлайн-приложения, а отклонения от предварительно зарегистрированных анализов описаны в разделе S5.Анализ с точки зрения полиморфизма
Мы проанализировали связи между исходами и каждым из 16 полиморфизмов-кандидатов, используя обобщенную линейную модель (функции связи приведены в таблице S4.1 в онлайн-приложении). Для двух генов, TPH2 и DTNBP1, в большинстве исследований не был исследован конкретный полиморфизм (см. рисунки S1.2 и S1.3 в онлайн-приложении), поэтому эти гены не были включены в анализ с точки зрения полиморфизма. Ковариаты включали набор данных для генотипирования, центр тестирования, пол, возраст, возраст в квадрате и первые 10 основных компонентов европейского происхождения. Шестнадцать эффектов полиморфизма в зависимости от окружающей среды были протестированы как по аддитивной, так и по мультипликативной шкалам для каждого из 16 полиморфизмов; каждая протестированная модель приведена в таблице S4.1 в онлайн-приложении. Для тестирования взаимодействия мы включили все термины "ковариация по полиморфизму" и "ковариация по модератору", чтобы исключить потенциальное смешивающее влияние ковариат на взаимодействие (53). Мы также протестировали модели взаимодействия, которые учитывали только ковариационные основные эффекты, что является недостаточным, но распространенным в литературе по генам-кандидатам (33). Для всех результатов мы использовали предварительно зарегистрированный порог значимости alphapoly=0,05/16=3,13×10-3, что соответствует коррекции Бонферрони для 16 наиболее вероятных полиморфизмов. Этот порог является либеральным, поскольку он не учитывает множество способов анализа каждого полиморфизма или множество исходов, в отношении которых он был оценен. Более подробная информация приведена в разделе S4.1 онлайн-приложения.Генетический анализ и анализ генного набора
Мы использовали данные Национального центра биотехнологической информации (NCBI) о 37 местоположениях генов для аннотирования SNP к генам, что позволило сопоставить каждому гену SNP в пределах 25 кбайт от начальной и конечной точек гена. Мы использовали MAGMA, версия 1.05b (54), для проведения анализа по генам и наборам генов для 18 лучших генов-кандидатов отдельно в наборах данных UK Biobank и PGC. Генетические тесты суммируют степень связи между фенотипом и полиморфизмами внутри данного гена; в отличие от этого, тесты на набор генов исследуют связь между фенотипом и набором генов, а не отдельными генами.Мы провели генетический анализ ассоциаций для каждого гена и результата, используя стандартную статистику ассоциаций на уровне генов MAGMA (статистика на основе sum -log p и регрессия главных компонент для тестов, основанных на суммарной статистике и генотипах на индивидуальном уровне, соответственно) и используя порог значимости, равный 0,05/18.=2,78×10-3 с поправкой на множественные тесты по 18 генам-кандидатам провели генетический анализ ассоциаций для каждого гена и результата, используя стандартную статистику ассоциаций на уровне генов MAGMA (статистика на основе sum -log p и регрессия главных компонент для тестов, основанных на суммарной статистике и генотипах на индивидуальном уровн, соответственно) и используя порог значимост, равный 0,0/18.=2,78×10-3 с поправкой на множественные тесты по 18 генам-кандидатам. В качестве исходных данных для анализа PGC мы использовали сводную статистику из GWAS по депрессии PGC2 (18) (за исключением когорт, базирующихся в Великобритании), в то время как индивидуальные геноВ качестве исходных данных для анализа PGC мы использовали сводную статистику из GWAS по депрессии PGC2 (18) (за исключением когорт, базирующихся в Великобритании), в то время как индивидуальные генотипы были доступны для британского биобанка. Статистика ассоциаций на генном уровне, в свою очередь, использовалась для проведения “конкурентных” тестов набора генов, в ходе которых сравнивалось обогащение локусов, ассоциированных с фенотипом депрессии, между нашим набором из 18 генов-кандидатов и всеми другими генами, отсутствующими в наборе генов, с целью выявления потенциально противоречивых характеристик генов. Дальнейшие анализы, в ходе которых сравнивались 18 генов-кандидатов с отрицательными контрольными наборами генов, участвующих в диабете 2 типа, росте или синаптических процессах, описаны в разделе S4.2 онлайн-приложения, а результаты представлены в разделе S11.
Результаты
Анализ на уровне полиморфизма
В таблице 2 приведены наиболее значимые результаты для каждого из наиболее изученных полиморфизмов генов-кандидатов в отношении основного эффекта для восьми исследованных исходов (восемь тестов на основной эффект для каждого полиморфизма) и эффекта взаимодействия для пяти В таблице 2 приведены наиболее значимые результаты для каждого из наиболее изученных полиморфизмов генов-кандидатов в отношении основного эффекта для восьми исследованных исходов (восемь тестов на основной эффект для каждого полиморфизма) и эффекта взаимодействия для пятимодераторов, измеренных в британском Биобанке (32 теста на взаимодействие для каждого полиморфизма [см. раздел S4.1 отчета). онлайн-приложение]). Учитывая количество проведенных тестов, было мало свидетельств того, что какой-либо эффект был больше, чем можно было бы ожидать случайно при нулевой гипотезе. Только для теста COMT rs4680 на текущую тяжесть депрессии были получены доказательства небольшого основного эффекта, который превысил наш либеральный порог значимости, так что частота встречаемости текущих оценок тяжести депрессии снизилась в 0,983 раза на копию аллеля G (отношение шансов 95% ДИ=0,967–0,999; p=0,989).0,002) (рис. 2). Для выявления эффекта такого масштаба при альфа-уровне 0,05 и мощности 80% потребовалась бы выборка из более чем 100 000 человек (см. раздел S4.3 онлайн-приложения). Аналогичным образом, по всем полиморфизмам, исходам и воздействиям, как в аддитивной, так и в мультипликативной шкалах, в alphapoly не быАналогичным образом, по всем полиморфизмам, исходам и воздействиям, как в аддитивной, так и в мультипликативной шкалах, в alphapoly не было выявлено значимых эффектов снижения полиморфизма в зависимости от воздействия. Неспособность включить все термины, зависящие от полиморфизма, и термины, зависящие от модератора, в качестве ковариат, как это принято в литературе по G × E (33), привела к завышению статистики тестирования терминов продукта в среднем, но не привела к каким-либо дополнительным существенным эффектам (см. раздел S10 онлайн-приложения). Полные результаты по всем исходам представлены в разделах S7–S10 онлайн-приложения.Несмотря на отсутствие доказательств влияния G×E, все модераторы продемонстрировали значительное влияние на все результаты в ожидаемых направлениях (см. раздел S6 онлайн-приложения). Например, перенесенная в детстве травма увеличила вероятность предполагаемого диагноза депрессии на протяжении всей жизни в 1,655 раза (z=32,048, p=2,33×10-225), а травматическое событие, произошедшее за последние 2 года, увеличило частоту встречаемости текущего индекса тяжести депрессии в 1,431 раза (z=27,004, p=1,32×10-160).
Анализ на генном уровне
Из всех генов-кандидатов и исходов только DRD2 продемонстрировал значительный генный эффект (альфагенный=0.05/18=2.78×10-3), и только при пожизненной диагностике депрессии PGC, используя как суммарную логарифмическую статистику p (p=5,14×10-7), так и статистику минимального значения p (p=2,74×10-3; на рисунке 3 показано влияние генов на предполагаемый диагноз депрессии в течение жизни и текущую тяжесть депрессии, в разделе S11.1 онлайн-приложения приведены все результаты с учетом генов, а в разделе S4.2 - сравнение методов). Предыдущая оПредыдущая оценка, основанная на статистике sum −log p, также была значимой на более жестком уровне всего генома (alphaGW=0.05/19,165=2.61×10-6). СД2 не оказал существенного влияния ни на один из результПопытка репликации 16 лучших локусов, выявленных по результатам PGC GWAS
Чтобы объяснить отсутствие репликации 16 генетических полиморфизмов-кандидатов, мы попытались воспроизвести 16 независимых локусов, значимых для всего генома, участвующих в пожизненной диагностике PGC, изучив их связь с предполагаемой пожизненной диагностикой в выборке независимого британского биобанка (подробности см. в разделе S4.5 онлайн-приложения). Три локуса достигли значимости при alphapoly (0,05/16) (rs12552, rs12658032 и rs11135349; см. раздел S12 онлайн-приложения), что согласуется с низкой мощностью обнаружения небольших ассоциаций; среднее значение мощности для 16 локусов составило 0,143, а 95%-ный доверительный интервал для числа повторов, которое мы ожидаем, учитывая оценки мощности, составлял от 2 до 7 (см. рисунок S4.6 в онлайн-приложении).Чувствительность результатов к погрешности измерений
Одной из возможных причин, по которой ассоциации полиморфизма генов-кандидатов, обнаруженные в небольших выборках, не воспроизводятся в больших GWAS, является потенциально худшее фенотипирование и более высокая погрешность измерения в предикторах или исходных переменных в наборах данных GWAS. Чтобы исследовать эту возможность, мы использовали процедуру Монте-Карло для количественной оценки того, в какой степени ошибка измерения могла повлиять на статистическую достоверность наших тестов. В качестве нижней границы величины эффекта исследования полиморфизма генов-кандидатов мы использовали минимально определяемое логарифмическое отношение шансов как для основных эффектов, так и для эффектов взаимодействия, соответствующее 50% мощности при альфа-значении 0,05 в сбалансированном исследовании "случай-контроль", в котором приняли участие 1000 человек, и где частота аллелей риска составляла 0,5 (например, для основных эффектов и эффектов взаимодействия). эффекты, геномный относительный риск=1,16). Моделирование показало, что мы обладаем 100%-ной способностью обнаруживать такие эффекты при множественных серьезных ошибках измерений в объеме выборки, типичном для наших анализов в британском биобанке (30 000 пациентов и 85 000 контрольных пациентов; смотрите раздел S4.3.3 онлайн-приложения). Это было справедливо даже в экстремальном сценарии, когда половина диагнозов и половина травмирующих воздействий были определены путем подбрасывания монеты (см. рисунок S4.5 в онлайн-приложении).Обсуждение
Мы изучили множество типов ассоциаций между 18 хорошо изученными генами-кандидатами на депрессию и множественными фенотипами депрессии. Исследование было очень результативным по сравнению с предыдущими исследованиями генов-кандидатов, в которых количество случаев варьировалось от 62 138 до 443 264 в разных подвыборках. Несмотря на высокую статистическую достоверность, ни один из наиболее изученных полиморфизмов в этих генах не продемонстрировал существенного влияния на склонность к депрессии. Кроме того, мы не нашли доказательств, подтверждающих умеренное влияние полиморфизма на психотравмирующие события или социально-экономические невзгоды. Мы также нашли мало свидетельств, подтверждающих вклад других распространенных полиморфизмов в этих генах в предрасположенность к депрессии, за исключением DRD2, который продемонстрировал значительное влияние всего генома на диагностику депрессии в выборке PGC, но не на какие-либо результаты в выборке британского биобанка. Причины, по которым DRD2 не удалось воспроизвести в британском биобанке, неясны, но это может быть связано с вариабельностью выборки, низкой статистической достоверностью в британском биобанке или ложноположительными или отрицательными результатами. Фенотипическая гетерогенность, однако, является маловероятным объяснением, поскольку оценки генетической корреляции между фенотипами депрессии в разных выборках были высокими (см. таблицу S3.3 и рисунок S3.3 в онлайн—приложении) - например, пожизненный диагноз депрессии с помощью PGC был тесно связан с предполагаемым пожизненным диагнозом депрессии, полученным от онлайн-наблюдения Британского Биобанка.опросник up (χ2LDSC=0,085, SE=0,004 и χ2LDSC=0,057, SE=0,007, соответственно; ηg= 0,855, SE=0,054, p=2,08×10-57), что, в свою очередь, было тесно связано с вероятным прижизненным диагнозом, установленным в ходе первоначального опроса с использованием сенсорного экрана в Британском Биобанке (χ2LDSC=0,090, SE=0,008; ηg=0,939, SE=0,082, p=2,83×10-30). Наконец, в целом гены-кандидаты на депрессию были связаны с фенотипами депрессии не больше, чем некандидатные гены. Наши результаты резко контрастируют с литературными данными о генах-кандидатах, где обычно сообщается о значительных статистически значимых эффектах для специфических полиморфизмов в 18 генах-кандидатах, которые мы исследовали здесь.Несколько особенностей этого исследования отличают его от предыдущих попыток репликации генов-кандидатов, мета-анализов исследований генов-кандидатов и общегеномных исследований, которые не смогли подтвердить роль полиморфизмов-кандидатов на депрессию. Во-первых, это единственное исследование, в котором были определены и изучены эффекты нескольких хорошо изученных полиморфизмов VNTR в большом наборе данных GWAS, включая 5-HTTLPR в SLC6A4, который был исследован в 38,14% исследований гена-кандидата на депрессию, которые мы идентифицировали (подробности расчета см. в ссылке 29). Во-вторых, мы тщательно изучили несколько различных фенотипов депрессии (например, диагноз, повторение депрессивных эпизодов, количество симптомов у людей, страдающих депрессией), чтобы убедиться, что наши результаты не отражают единичную операционализацию депрессии. Некоторые исследователи объясняют плохую воспроизводимость результатов исследования генов-кандидатов специфичностью эффектов в отношении конкретных типов депрессии или стрессоров (например, предшествующее и последующее начало депрессии в зависимости от воздействия стресса [38], повторяющаяся депрессия в сравнении с однократным эпизодом [55] и финансовый стресс в сравнении с другими факторами воздействия [56]).). Поэтому мы изучили все доступные фенотипы депрессии и воздействия, отражающие интересующие нас конструкции в литературе по генам-кандидатам. Результаты для всех измерений и вариантов моделирования (например, мультипликативных и аддитивных взаимодействий), подробно представленных в приложении (см. разделы S7–S11 онлайн-приложения), были неизменно нулевыми в отношении гипотез о генах-кандидатах. В-третьих, мы использовали чрезвычайно либеральные пороговые значения значимости (например, для анализа полиморфизма alphapoly=3,13×10-3, в отличие от стандартного alphaGWAS=5×10-8, используемого в GWASs) для всех результатов, чтобы гарантировать, что ни один возможный эффект не был упущен, с поправкой только на количество исследованных полиморфизмов. Таким образом, наши результаты позволяют предположить, что нулевые или близкие к нулю размеры эффекта этих полиморфизмов-кандидатов, а не необходимость многократного тестирования, вызванного сканированием всего генома, объясняют предыдущие неудачи крупных GWASs в выявлении эффектов полиморфизма-кандидата. Наконец, и, возможно, это самое важное, в отличие от мета-анализов, в которых используются ранее опубликованные данные о генах-кандидатах, на наши результаты не могут повлиять выборочные методы публикации или отчетности, которые могут привести к ошибкам первого типа и предвзятому представлению доказательств в пользу гипотез о генах-кандидатах.
Наше исследование имеет ряд ограничений. Во-первых, возможно, что нам не удалось выявить небольшое количество публикаций о генах-кандидатах, и это привело к отсутствию некоторых генов-кандидатов на депрессию, исследованных в 10 или более публикациях. Тем не менее, на девять из 18 идентифицированных генов приходилось 86,59% от предполагаемого числа исследований, и маловероятно, что мы пропустили какие-либо гены-кандидаты на депрессию, популярность которых приближается к популярности, например, SLC6A4 или COMT. Во-вторых, в выборке британского биобанка было установлено поведение, связанное с курением (исследование BiLEVE [57]), и контроль за пакетом генотипирования (который отличает две подвыборки) потенциально может вызвать смещение в сторону коллайдера (58). Однако только один из 16 полиморфизмов гена-кандидата продемонстрировал незначительные различия в частоте аллелей (MAF) в этих двух подвыборках (rs6311; χ2=12,558, df=2, p=0,002; MAF=0,402 в выборке BiLEVE, MAF=0,405 в противном случае), и маловероятно, что это было установлено в подвыборке BiLEVE. оказал чрезмерное влияние на статистику ассоциаций. Однако потенциальное влияние определения в подвыборке BiLEVE на оценки эффекта взаимодействия, а также другие возможные источники смещения, вызванного отбором, остается неясным. В–третьих, в то время как некоторые из изученных нами фенотипов точно соответствовали стандартным диагностическим инструментам (например, текущая тяжесть депрессии была основана на широко используемом опроснике состояния здоровья пациентов-9 [59]), надежность других была неопределенной. Например, один из девяти симптомов депрессии DSM-5 (двигательное возбуждение/заторможенность) был исключен из онлайн-опросника по психическому здоровью Британского Биобанка, и наш предполагаемый фенотип пожизненной диагностики депрессии требовал наличия четырех или более из восьми симптомов, а не стандартных пяти или более из девяти симптомов (в дополнение к продолжительность эпизода и критерии нарушения; см. раздел S3.1 онлайн-приложения). Однако применение более строгих критериев "случай-контроль" (т.е. сравнение лиц, у которых не было двухнедельного периода ангедонии или подавленного настроения на протяжении всей их жизни, с лицами, сообщавшими о повторяющихся эпизодах, у которых были пять или более из восьми симптомов и которые соответствовали критериям продолжительности и ухудшения состояния) не изменило результатов (см. разделы S7–S9 из онлайн-приложения), несмотря на то, что даже этот уменьшенный размер выборки (N=67 304) был намного больше, чем любое известное нам предыдущее исследование генов-кандидатов. В-четвертых, некоторые из исследованных нами фенотипов, возможно, были измерены с большей погрешностью, чем это обычно бывает при небольших исследованиях генов-кандидатов, и из-за этого крупные исследования часто подвергаются критике. Например, распространенность нашего показателя травматического воздействия во взрослом возрасте была необычайно высока (59,11%), и большинство наших ретроспективных измерений, вероятно, были искажены из-за предвзятости воспоминаний. Однако, как показано в разделе S4.3.3 онлайн-приложения, даже экстремальная погрешность измерений не может объяснить нашу неспособность обнаружить относительно значительные эффекты, необходимые для обнаружения в небольших образцах. Кроме того, последующие анализы продемонстрировали сильное влияние всех факторов, влияющих на окружающую среду, на все исходы (см. раздел S6 онлайн-приложения), что позволяет предположить, что как факторы, влияющие на окружающую среду, так и фенотипы депрессии были измерены с достаточной точностью для выявления известных экологических последствий. Чрезвычайно сложно построить правдоподобную модель погрешности измерения, которая могла бы, например, с комфортом согласовать оценку большого влияния детской травмы на предполагаемый диагноз в течение жизни (отношение шансов=1,655, p=2,33×10-225) и незначительную оценку эффекта взаимодействия 5-HTTLPR с детской травмой (шансы отношение=0,988, p=0,919) с существованием существенного эффекта взаимодействия G×E.
Генетические основы общих сложных признаков, таких как депрессия, по-видимому, гораздо сложнее, чем предполагалось первоначально (60, 61), и масштабные совместные усилия не подтвердили существование общих генетических вариантов, оказывающих значительное влияние на склонность к депрессии (18). В контексте нашего понимания психиатрической генетики в 1990-х и начале 2000-х годов наиболее изученные гены-кандидаты и их полиморфизмы были подходящими объектами для ассоциативных исследований. Однако наши результаты показывают, что полиморфизмы генов-кандидатов на депрессию в прошлом не оказывают заметного влияния на фенотипы депрессии. Более того, сами гены-кандидаты (за возможным исключением DRD2) были связаны с фенотипами депрессии не в большей степени, чем гены, выбранные случайным образом. Настоящее исследование имело мощность >99,99% при alphaGWAS=5×10-8, что позволило выявить основной эффект, о котором обычно сообщают в исследованиях генов-кандидатов, даже с учетом крайней погрешности измерения как исходных, так и замедляющих фенотипов (см. раздел S4.3 онлайн-приложения). Таким образом, крайне маловероятно, что нам не удалось обнаружить каких-либо истинных ассоциаций между фенотипами депрессии и этими генами-кандидатами. Таким образом, вывод нашего исследования заключается в том, что предыдущие результаты о положительном основном эффекте или эффекте взаимодействия для этих 18 генов-кандидатов в отношении депрессии были ложноположительными. Наши результаты отражают результаты тщательных исследований гипотез о генах-кандидатах для других сложных признаков, включая шизофрению (16, 25) и микроструктуру белого вещества (19). Потенциал самокоррекции является существенной силой научного предприятия; именно с учетом этого механизма мы представляем эти результаты. В соответствии с недавними рекомендациями Национального института Совета по вопросам психического здоровья рабочей группы по геномике (62), мы приходим к выводу, что настало время для исследования депрессии отказаться кандидат исторических Гена и Гена с окружающей средой кандидат гипотезы взаимодействия.