banner

Nachricht

Sep 14, 2023

Nummernvariation kopieren

Kommunikationsbiologie Band 6, Artikelnummer: 189 (2023) Diesen Artikel zitieren

733 Zugriffe

2 Altmetrisch

Details zu den Metriken

Variationen der Kopienzahl (Copy Number Variations, CNVs) gelten seit langem als pathogene Faktoren für angeborene Herzfehler (KHK). Wenige KHK-assoziierte CNVs könnten aufgrund einer Störung der Kodierungssequenzen als Dosiseffekt interpretiert werden. Neue Erkenntnisse haben die regulatorische Rolle langer nichtkodierender RNAs (lncRNAs) bei der Herzentwicklung hervorgehoben. Es bleibt hingegen unerforscht, ob lncRNAs in CNVs (CNV-lncRNAs) zur Ätiologie von KHK-assoziierten CNVs beitragen könnten. Hier konstruierten wir Koexpressionsnetzwerke, die CNV-lncRNAs innerhalb von CHD-assoziierten CNVs und Protein-kodierenden Genen unter Verwendung der transkriptomischen Entwicklungsdaten menschlicher Organe einbeziehen, und zeigten, dass CNV-lncRNAs innerhalb von 10 der nicht-syndromalen CHD-assoziierten CNVs im wichtigsten herzkorrelierten Modul geclustert sind, und wies eine stark korrelierte Koexpression mit mehreren wichtigen CHD-Genen auf. HSALNG0104472 innerhalb der 15q11.2-Region wurde als Hub-CNV-lncRNA mit herzabhängiger Expression identifiziert und experimentell validiert. Unsere Ergebnisse zeigten, dass HSALNG0104472 ein Haupteffektor sein sollte, der für Herzfehler der 15q11.2-Deletion verantwortlich ist, indem er die Differenzierung der Kardiomyozyten reguliert. Unsere Ergebnisse legen nahe, dass CNV-lncRNAs möglicherweise zu den Pathologien von maximal 68,4 % (13/19) der nicht-syndromalen KHK-assoziierten CNVs beitragen könnten. Diese Ergebnisse deuten darauf hin, dass bei der Erklärung der Pathogenese von KHK-assoziierten CNVs die nichtkodierenden Regionen berücksichtigt werden sollten.

Angeborene Herzfehler (KHK) sind weltweit die häufigste angeborene Anomalie mit einer Inzidenz von 6–13 pro 1000 Lebendgeburten1,2,3. Obwohl Fortschritte in der chirurgischen Korrektur und der klinischen Versorgung dafür sorgten, dass die meisten Patienten das Erwachsenenalter erreichen, bleibt die koronare Herzkrankheit eine der Hauptursachen für die Sterblichkeit bei Neugeborenen. Die Ursachen der KHK waren vielfältig. Bisher konnten etwa 20–30 % der KHK-Fälle durch Umwelt- oder genetische Faktoren identifiziert werden, obwohl sich diese Zahl mit der breiten Anwendung neuer Testmethoden wie Next Generation Sequencing (NGS) ändern könnte4,5. Die größte Next-Generation-Sequenzierungsstudie der KHK-Kohorte ergab, dass für ein Drittel der Patienten mit KHK genetische Ursachen identifiziert werden konnten; De-novo-Varianten (DNVs) und vererbte autosomal-rezessive Varianten machen 8 % bzw. 2 % der Patienten aus6. Variationen der Kopienzahl (Copy Number Variations, CNVs) sind wichtige Quellen für genetische Ätiologien der KHK. Pathogene CNVs wurden in 3–25 % der syndromalen KHK-Fälle und 3–10 % der isolierten KHK-Fälle festgestellt4. Die Pathogenität von CNVs, an denen kodierende Sequenzen beteiligt sind, wurde üblicherweise auf der Grundlage ihrer Auswirkung auf die Gendosis interpretiert. Trotz des Erfolgs einer solchen Strategie bei vielen Krankheiten blieben die Pathologien der meisten KHK-assoziierten CNVs unbestimmt4,5,7.

Die Organogenese des Herzens ist ein komplexer Prozess, der die Differenzierung, Spezifikation und Migration mehrerer Zelllinien umfasst und ausgefeilte Genregulationsnetzwerke erfordert, die durch zentrale, die Abstammungslinie bestimmende Transkriptionsfaktoren (TFs) wie NKX2-5, MESP1, GATA4, GATA6 und TBX55 initialisiert und gesteuert werden . In den letzten zwei Jahrzehnten haben viele Studien gezeigt, dass ein großer Teil des nichtkodierenden Genoms (Primärtranskripte und verarbeitete Transkripte decken 74,7 % bzw. 62,1 % des menschlichen Genoms ab) transkribiert wurde8. Lange nichtkodierende RNAs (lncRNAs), die als Transkripte von mehr als 200 Nukleotiden ohne Kodierungspotential definiert sind, erweisen sich als Schlüsselkomponenten in Genregulationsnetzwerken, die das Schicksal von Zellen während der Entwicklung steuern8,9. Seit der Entdeckung von lncRNA Braveheart (Bhvt), das mit der kardiovaskulären Entwicklung assoziiert ist, in Mäusen10, wurde festgestellt, dass Dutzende von lncRNA wie Fendrr11, Chast12, HBL113, Uph14, Hdn15, BANCR16 und lncExACT117 in Zell- und Tiermodellen an Herzentwicklungsprozessen beteiligt sind. KHK zeichnet sich durch eine hohe genetische Heterogenität aus, was die Entdeckung pathogenetischer lncRNAs frustrierend erschwerte. Dennoch haben wiederkehrende pathogene CNVs von den gesammelten Beweisen profitiert, die den starken Zusammenhang von CNVs mit KHK belegen, und eine natürliche Quelle für die Verbindung von lncRNAs mit Krankheitsphänotypen bereitgestellt.

Die meisten CNVs betreffen Genomregionen, die lncRNAs umfassen. Der Beitrag von lncRNAs zur CNV-bedingten Pathogenese wurde in mehreren neurologischen Studien untersucht. Meng et al. untersuchten lncRNAs in 10 mit Schizophrenierisiko assoziierten CNV-Regionen und identifizierten DGCR5 in 22q11.2 als Hub-Gen, das schizophreniebezogene Gene reguliert18. Alinejad-Rokny et al. identifizierten 47 mit wiederkehrenden Autismus-Spektrum-Störungen assoziierte CNVs und zeigten, dass im Gehirn angereicherte kodierende Gene und lncRNAs in diesen Regionen überrepräsentiert waren19. Kürzlich zeigte eine Trio-basierte Studie zur Sequenzierung des gesamten Genoms von 749 KHK-Probanden eine Anreicherung potenziell störender regulatorischer nichtkodierender De-novo-Varianten (DNVs)20, was die Bedeutung nichtkodierender Variationen in KHK-Studien hervorhob. Meerschaut et al. führten eine retrospektive Neubewertung von 138 CNVs mit unbekannter Pathogenität durch und schlugen eine mögliche Relevanz nicht-kodierender Genregulationselemente für die CNV-bedingte KHK-Pathogenese vor21. Die Beiträge von lncRNAs in CNV-Regionen (CNV-lncRNAs) zur Entstehung von KHK wurden hingegen nicht systematisch untersucht.

Wir stellten die Hypothese auf, dass CHD-assoziierte CNVs einige, wenn nicht alle CNV-lncRNAs stören könnten, was folglich ihre Zielgene fehlregulieren und zur Ätiologie von CHD beitragen würde. Um unsere Hypothese zu testen, haben wir wiederkehrende CHD-assoziierte CNVs zusammengefasst und Kandidaten-CNV-lncRNAs gefunden, die sich in diesen Regionen befinden. Das integrierte Koexpressionsprofil solcher CNV-lncRNAs und proteinkodierender Gene wurde auf der Grundlage der gewichteten Genkoexpressionsnetzwerkanalyse (WGCNA)22 der transkriptomischen Daten zur Entwicklung menschlicher Organe von LncExpDB23 erstellt. Wir identifizierten zwei Module, die signifikant mit Herzgewebe korrelierten, von denen eines eine Anreicherung bekannter CHD-Gene aufwies. Es fiel auf, dass CNV-lncRNAs von 52,6 % (10/19) aller nicht-syndromalen KHK-assoziierten CNVs im wichtigsten Herzmodul geclustert waren. Die Hub-CNV-lncRNA HSALNG0104472 dieses Moduls befand sich in der Region 15q11.2, deren Deletion zuvor nachweislich mit einer totalen anomalen Lungenvenenverbindung (TAPVC) verbunden war24. Anschließend führten wir In-vitro-Experimente durch, um die mögliche regulatorische Wirkung von HSALNG0104472 auf die bekannten CHD-Gene zu validieren und seine mögliche Rolle bei der Herzentwicklung hervorzuheben (Abb. 1).

Es wurden 19 rezidivierende nicht-syndromale KHK und 21 mit syndromaler KHK assoziierte CNVs zusammengefasst. Wir haben Kandidaten-CNV-lncRNAs abgerufen, die sich in diesen Regionen befanden und während der Herzentwicklung exprimiert wurden, basierend auf transkriptomischen Daten zur Entwicklung menschlicher Organe (n = 313) von LncExpDB. b Eine gewichtete Gen-Koexpressions-Netzwerkanalyse (WGCNA) wurde durchgeführt, um das Koexpressionsprofil von CNV-lncRNAs und proteinkodierenden Genen auf der Grundlage transkriptomischer Daten zur Entwicklung menschlicher Organe zu charakterisieren. Nachgeschaltete Analysen, einschließlich Pathway-Analysen, Anreicherungsanalysen und Differentialexpressionsanalysen, wurden durchgeführt, um CHD-assoziierte Module und Hub-CNV-lncRNAs zu identifizieren. CNV-lncRNA-miRNA-mRNA-Regulationsnetzwerke wurden auch auf der Grundlage von miRNA-Interaktionsdaten und konkurrierenden molekularen Mechanismen endogener RNA (ceRNA) identifiziert. c Koexpressionsbeziehungen im herzassoziierten nicht-syndromalen schwarzen Modul wurden basierend auf In-vitro-Kardiomyozyten-Differenzierungsdatensätzen (n = 297) von LncExpDB validiert. d Die relative Gewichtsanalyse (RWA) zeigte eine starke Rolle der Hub-CNV-lncRNA HSALNG0104472 bei der Regulierung mehrerer wichtiger KHK-Gene. e In-vitro-Experimente wurden durchgeführt, um die vorhergesagte Regulation der Hub-CNV-lncRNA HSALNG0104472 zu validieren.

Insgesamt 19 CNVs, darunter zwei Deletionen, sechs Duplikationen und 11 Deletionen/Duplikationen, wurden als wiederkehrende nicht-syndromale KHK-assoziierte CNVs definiert (Abb. 2a; Tabelle 1; ergänzende Abb. 1a und ergänzende Tabelle 1)25, 26, 27, 28, 29,30. Insgesamt 568 CNV-lncRNA-Kandidaten, die das Kriterium erfüllten, wurden zusammen mit 19957 proteinkodierenden Genen für weitere Untersuchungen verwendet (Supplementary Data 1). Wir haben unsere Analyse auch auf 21 mit syndromaler KHK assoziierte CNVs4 ausgeweitet (Ergänzungstabelle 2). Im Vergleich dazu waren die meisten mit syndromaler KHK assoziierten CNVs (19/21) Deletionen, und die anderen beiden CNVs konnten entweder Deletion oder Duplikation sein (ergänzende Abbildung 1b; ergänzende Tabelle 2). Vier CNVs (1q21.1-Deletion/Duplikation, 8p23.1-Deletion/Duplikation, 16p12.2-Deletion/Duplikation und 22q11.21-Deletion/Duplikation) waren sowohl mit nicht-syndromalen als auch mit syndromalen KHK-Fällen assoziiert (Abb. 2a).

a Die Verteilung wiederkehrender nicht-syndromaler (n = 19) und syndromaler KHK (n = 21) assoziierter CNVs auf menschlichen Chromosomen ist dargestellt. Die Farben der Bänder stellen KHK-Falltypen dar, bei denen CNVs gemeldet wurden. Die Farben der Schriftarten repräsentieren CNV-Typen. b Es wurden positiv herzkorrelierte (r > 0,6, n = 2) Koexpressionsmodule (die schwarzen und dunkelgrünen Module) identifiziert, die mit dem Datensatz zur Entwicklung menschlicher Organe (n = 313) erstellt wurden (Ergänzungsdaten 1). Die y-Achse stellt verschiedene CNV-lncRNA-Koexpressionsmodule dar. Auf der x-Achse sind die Werte des Pearson-Korrelationskoeffizienten (r) zum Herzgewebe dargestellt. Die roten gestrichelten Linien zeigen |r| an = 0,6. Die Größe der Knoten stellt die Anzahl der CNV-lncRNAs in jedem Modul dar. Die Farben der Knoten stellen Werte von −log10(Padj) dar. Der angepasste P-Wert wurde mit der Funktion corPvalueStudent im WGCNA R-Paket berechnet. c Funktionelle Anmerkungen der positiv herzkorrelierten Koexpressionsmodule werden angezeigt (Ergänzungsdaten 2). Horizontale Balken stellen GO-Begriffe dar und die Farben der Balken stellen verschiedene CNV-lncRNA-Koexpressionsmodule dar. Für jedes positiv mit dem Herzen korrelierte Modul sind auf der Y-Achse die fünf besten GO-Begriffe (nach Padj geordnet) aufgeführt. Auf der x-Achse werden Werte von −log10(Padj) angezeigt. Die rote gestrichelte Linie zeigt einen Padj von 0,05 an. d Klassifizierungen von CNV-lncRNAs im schwarzen Modul. Die Zählungen für jede Klasse der CNV-lncRNAs sind in Klammern angegeben. e Sequenzkonservierung der CNV-lncRNAs im schwarzen Modul (Supplementary Data 3).

WGCNA wurde an den transkriptomischen Entwicklungsdaten menschlicher Organe von LncExpDB durchgeführt, um Koexpressionsmodule zu konstruieren, an denen Kandidaten für nicht-syndromale CHD-assoziierte CNV-lncRNAs und proteinkodierende Gene beteiligt waren. Wir identifizierten insgesamt 43 Koexpressionsmodule, von denen 34 511 der 568 Kandidaten-CNV-lncRNAs enthielten. Die verbleibenden 57 CNV-lncRNAs-Kandidaten gruppierten sich in keinem Koexpressionsmodul (Ergänzungsdaten 1). Darüber hinaus enthielten 13 Module mindestens eine Hub-CNV-lncRNA mit einer Modulmitgliedschaft (MM) ≥ 0,8 und P <0,05 (Supplementary Data 1). Anschließend berechneten wir die Pearson-Korrelationskoeffizienten zwischen den Modulen und Herzgeweben (quantisierte Merkmalsinformationen der Proben sind in den Zusatzdaten 1 aufgeführt) und stellten fest, dass zwei Module (schwarz und dunkelgrün) eine signifikante positive Korrelation aufwiesen (r > 0,6, P < 0,05; Abb. 2b).

Proteinkodierende Gene in zwei herzkorrelierten Koexpressionsmodulen wurden verwendet, um funktionelle Anreicherungsanalysen mit den Signalwegen Gene Ontology (GO) und Kyoto Encyclopedia of Genes and Genomes (KEGG) durchzuführen. Bemerkenswerterweise hing das Schwarzmodul, das am signifikantesten mit dem Herzen korrelierte (r = 0,88, P = 3,20 × 10−104), mit dem Prozess des Muskelsystems (Padj = 3,35 × 10−47, Padj stellt den angepassten P-Wert) und dem Muskel zusammen Kontraktion (Padj = 3,55 × 10−42), Herzprozess (Padj = 1,14 × 10−33), Herzkontraktion (Padj = 1,14 × 10−33) und Muskelgewebeentwicklung (Padj = 3,04 × 10−32) (Abb . 2c). Diese Gene wurden auch in KEGG-Signalwegen der hypertrophen Kardiomyopathie (Padj = 7,62 × 10–13), der dilatativen Kardiomyopathie (Padj = 1,87 × 10–12), der Herzmuskelkontraktion (Padj = 1,15 × 10–9) und der adrenergen Signalübertragung in Kardiomyozyten angereichert (Padj = 4,24 × 10−9) und arrhythmogene rechtsventrikuläre Kardiomyopathie (Padj = 3,97 × 10−7) (Ergänzende Daten 2). Die mittleren Expressionswerte von CNV-lncRNAs in den Herzentwicklungsproben (n = 50) für das schwarze Modul rangierten ebenfalls an der Spitze der 34 Module, die CNV-lncRNAs enthielten (Rang 3 von 34, mittlere tpm = 7,17; Zusatzdaten 1). Basierend auf den genomischen Positionen relativ zu benachbarten Protein-kodierenden Genen könnten lncRNAs als intergenisch, intronisch (Sense), intronisch (Antisense), überlappend (Sense), überlappend (Antisense), Sense und Antisense31 klassifiziert werden. Sense-, intergenische und Antisense-lncRNAs machten den größten Teil der CNV-lncRNAs (28/30) im schwarzen Modul aus (Abb. 2d). Die Sequenzkonservierung von 30 CNV-lncRNAs im schwarzen Modul wurde anhand der Alignment-Daten von LncBook v2.032 identifiziert (Abb. 2e; Ergänzungsdaten 3). Ein hoher Anteil der im schwarzen Modul enthaltenen CNV-lncRNAs korrelierte stark mit mehreren gut charakterisierten CHD-Genen wie HAND1, HAND2, NKX2-5, TBX5, GATA6 und MYH6 (Abb. 3a). Diese lncRNAs verteilten sich in 52,6 % (10/19) der wiederkehrenden nicht-syndromalen KHK-assoziierten CNVs (Abb. 3a). Außerdem wurden Korrelationen der Module mit Entwicklungsstadium und Geschlecht berechnet (Ergänzende Abbildung 2 und Ergänzende Daten 1, 2). Basierend auf dem genomischen Locus von CNV-lncRNAs und spezifischen nicht-syndromalen CHD-assoziierten CNV-Aufzeichnungen, die den Phänotyp des Patienten umfassten, identifizierten wir 34 mögliche Assoziationen zwischen CNV-lncRNAs und den CHD-Subtypen im schwarzen Modul (Abb. 3b und ergänzende Daten 4). ).

a Nicht-syndromal assoziierte CNVs (n = 19), co-exprimierte CNV-lncRNAs (n = 30, verteilt auf 10 CNVs) und 12 CHD-Gene im herzkorrelierten schwarzen Modul sind im Zirkusdiagramm dargestellt. Die Farben der CNVs repräsentieren CNV-Typen. Die Farben der Linien stellen den Pearson-Korrelationskoeffizienten (berechnet mit dem Datensatz zur Entwicklung menschlicher Organe, n = 313) jedes Genpaars dar. Zwei Hub-CNV-lncRNAs im schwarzen Modul sind fett gedruckt. b Korrelationen zwischen CNV-lncRNAs und den CHD-Subtypen im schwarzen Modul. Diese Beziehungen werden anhand der Schnittmenge von CNV-lncRNAs und nicht-syndromalen CHD-assoziierten CNVs identifiziert (Supplementary Data 4).

Um den möglichen Zusammenhang zwischen herzkorrelierten Koexpressionsmodulen und KHK zu untersuchen, führten wir hypergeometrische Tests zur Anreicherungsanalyse dieser Module anhand von vier KHK-bezogenen Genlisten durch (Ergänzungsdaten 5): ein 22-Gen-Satz, der für monogene Ursachen isolierter KHK verantwortlich ist. ein 69-Gen-Satz, der mit monogenen Erkrankungen mit syndromaler CHD5 assoziiert ist, ein 66-Gen-Satz mit LOF-Varianten (Loss of Function) für KHK und ein 80-Gen-Satz mit schädlichen Missense-Varianten (DMVs) für CHD27. Die Ergebnisse zeigten, dass zwei Module (schwarz: P = 2,12 × 10−11 und Lachs: P = 0,04) für die isolierten CHD-Gene angereichert waren; zwei Module (türkis: P = 3,97 × 10−6 und weiß: P = 0,03) wurden für die syndromalen CHD-Gene angereichert; Drei Module (rosa: P = 2,94 × 10−5, schwarz: P = 1,34 × 10−3 und türkis: P = 6,27 × 10−3) wurden für die LOF-CHD-Gene angereichert, und fünf Module (schwarz: P = 5,62 × 10−5, rosa: P = 3,02 × 10−3, türkis: P = 5,35 × 10−3, orange: P = 6,78 × 10−3 und dunkelorange: P = 0,05) wurden für DMV-CHD-Gene angereichert ( Ergänzende Daten 5). Besonders interessant ist, dass die schwarzen und türkisfarbenen Module jeweils drei der vier CHD-Gensätze signifikant anreicherten (Abb. 4a – d und ergänzende Daten 5). Darüber hinaus stellten wir fest, dass eine bestimmte Anzahl von Signalwegen, die mit der Herzentwicklung in Zusammenhang standen, sowohl in schwarzen als auch in türkisfarbenen Modulen deutlich angereichert waren, was auf einen wichtigen Zusammenhang zwischen diesen Modulen und der Herzentwicklung hindeutet (Abb. 4e und ergänzende Daten 2).

Dargestellt sind zwei herzassoziierte Module, schwarz und türkis, die drei von vier CHD-Gensätzen deutlich bereichert haben. Hub-CNV-lncRNAs und CHD-Gene in den Koexpressionsmodulen Schwarz (a) und Türkis (b) sind aufgeführt (Ergänzungsdaten 1 und 5). Hub-CNV-lncRNAs werden mit rotem Rand hervorgehoben. Teilmengen von CHD-Genen werden in verschiedenen Farben angezeigt. Die Größe der Knoten stellt den Genmodul-Mitgliedschaftswert (MM) im entsprechenden Modul dar (Ergänzungsdaten 5). Der hypergeometrische Test wurde verwendet, um die statistische Signifikanz für die Anreicherung koexprimierter proteinkodierender Gene im schwarzen (c) und türkisfarbenen (d) Modul gegenüber vier CHD-Gensätzen zu berechnen. CHD-Gensätze werden in verschiedenen Farben angezeigt. Eine signifikante Anreicherung (PH < 0,05, PH stellt den hypergeometrischen P-Wert dar) wurde mit dem PH-Wert in roter Schrift angezeigt. Als Hintergrund-Genliste wurden proteinkodierende Gene verwendet, die sich für WGCNA entschieden (n = 19.957). e Herzentwicklungsbezogene Pfade in den schwarzen und türkisen Modulen (Ergänzungsdaten 2). Die horizontale Achse stellt GO-Begriffe dar. Die Farben der Punkte kennzeichnen unterschiedliche Module. Die Größe der Punkte stellt die Genanzahl jedes Moduls dar, das an den entsprechenden GO-Begriffen beteiligt ist. Auf der x-Achse werden Werte von −log10(Padj) angezeigt. Die rote gestrichelte Linie zeigt einen Padj von 0,05 an.

Konkurrierende endogene RNA (ceRNA) wurde als wichtiger molekularer Mechanismus erkannt, der der mRNA-Expression zugrunde liegt, die durch die lncRNA-miRNA-Wechselwirkung reguliert wird. Zuvor haben wir erfolgreich lncRNA-miRNA-mRNA-Regulationsnetzwerke im Herzgewebe von Patienten mit Fallot-Tetralogie33 identifiziert, indem wir eine kausale Inferenzmethode34 implementiert haben. In der vorliegenden Studie haben wir diese Analyse auch auf die transkriptomischen Daten zur Entwicklung menschlicher Organe angewendet (n = 313). Insgesamt wurden 10 Hub-CNV-lncRNAs identifiziert, die ceRNA-Netzwerke vermitteln (Ergänzende Abbildung 3; Ergänzende Daten 6). Diese CNV-lncRNAs sind im gelben Modul (HSALNG0063477), im türkisfarbenen Modul (HSALNG0112753, HSALNG0044817, HSALNG0006725), im grauen Modul (HSALNG0022874), im blauen Modul (HSALNG0110179) und im orangefarbenen Modul (HSALNG0022140) verteilt. HSALNG0096627, HSALNG0019873, HSALNG0044901 wurden in keinem Koexpressionsmodul geclustert und waren grau gekennzeichnet. An diesen ceRNA-Netzwerken war jedoch keines der bekannten CHD-Gene beteiligt. Darüber hinaus verteilten sich die CNV-lncRNAs und mRNAs, die eine regulatorische Beziehung zwischen Schwamm-lncRNA und mRNA hatten, selten im selben Koexpressionsmodul (Ergänzungsdaten 1 und 6).

KHK tritt häufig als Syndrom auf, und für KHK und andere Anomalien, insbesondere neurologische Entwicklungsstörungen, wurde ein gemeinsamer genetischer Beitrag entdeckt. Wir stellten fest, dass unter den nicht-syndromalen und syndromalen CHD-Genen (n = 88; Ergänzende Daten 7) 13,6 % (12/88) eine maximale Expression im Herzgewebe zeigten. Überraschenderweise zeigten 33,0 % (29/88) eine maximale Expression im Gehirn- und Kleinhirngewebe (Gehirn: 19, Kleinhirn: 10, Zusatzdaten 7). Für diese CHD-Gene wurden differenzielle Expressionsanalysen durchgeführt, an denen CNV-lncRNAs zwischen den Entwicklungsproben des Herzens (n ​​= 50) und des Gehirns (n ​​= 87) beteiligt waren (ergänzende Abbildung 4). Wir fanden 21 herzhochregulierte (|log2FoldChange | ≥ 1, Padj <0,05) und 8 hirnhochregulierte Gene in der Liste der bekannten KHK-Gene (Abb. 5a-c; ergänzende Daten 7).

Hochregulierte CHD-Gene (|log2FoldChange| ≥ 1, Padj < 0,05) in Entwicklungsproben von Herz (21 Gene) und Gehirn (8 Gene) (Herzproben: n = 50, Gehirnproben: n = 87) sind in der Heatmap (a) dargestellt. . Für jeden Cluster werden statistisch angereicherte GO Biological Process-Begriffe und Padj auf dem Panel angezeigt. Kreisdiagramme zeigen den zugehörigen CHD-Typ jedes unterschiedlich exprimierten CHD-Genclusters (b). Die am höchsten differenziell exprimierten CHD-Gene (c) und CNV-lncRNAs (d) für jeden Cluster sind in Vulkandiagrammen markiert (nach log2FoldChange geordnet). Die x- und y-Achsen repräsentieren log2FoldChange (Herz vs. Gehirn) bzw. −log10(Padj). Rote Punkte stellen deutlich hochregulierte Gene im Herzen dar (log2FoldChange ≥ 1, Padj < 0,05). Blaue Punkte stellen deutlich hochregulierte Gene im Gehirn dar (log2FoldChange ≤ −1, Padj < 0,05). Graue Punkte stellen Gene dar, die nicht unterschiedlich exprimiert werden. Die horizontale und vertikale rote gestrichelte Linie zeigen Padj = 0,05 und |log2FoldChange| an = 1 bzw. Kreisdiagramme neben jedem Cluster zeigen die Verteilung der Gene in Koexpressionsmodulen, die durch syndromale WGCNA erstellt wurden. Nur Module mit dem höchsten Genanteil jedes Clusters sind gefärbt.

Wir haben außerdem 21 syndromale KHK-assoziierte CNVs für eine vergleichende Analyse einbezogen (Ergänzungstabelle 2). Mit den gleichen Kriterien wie bei der vorherigen Analyse wurden 1500 CNV-lncRNAs für WGCNA mit den proteinkodierenden Genen von 19957 ausgewählt (Supplementary Data 1). Es wurden entsprechende Module für syndromale und nicht-syndromale KHK identifiziert (Supplementary Data 8). Anschließend haben wir die Korrelation zwischen den Syndrommodulen und sieben Organen getestet. Das syndromale Braunmodul (r = 0,73) mit 57 CNV-lncRNAs und das Magenta-Modul (r = 0,71) mit 28 korrelierten stark mit dem Gehirn, und das syndromale Grünmodul (r = 0,87) mit 120 CNV-lncRNAs korrelierte stark mit dem Kleinhirn (Abb. 6 und ergänzende Daten 8). Das syndromale Gelbmodul (s-gelb) sollte dem nicht-syndromalen Schwarzmodul entsprechen: (1) Das s-gelbe Modul zeigte die höchsten Korrelationen mit Herzgewebe (r_heart = 0,83) (Abb. 2, 6); (2) Die meisten (84,89 %, 579/682) Gene im nicht-syndromalen schwarzen Modul erschienen im s-gelben Modul (Supplementary Data 8); (3) Gene in zwei Modulen wurden mit denselben Funktionen angereichert (Supplementary Data 8). Die Gentypen und die Sequenzkonservierung von CNV-lncRNAs in s-gelben und s-türkisen Modulen wurden identifiziert (Ergänzende Abbildungen 5 und 6; und ergänzende Daten 1 und 3). Für 1500 CNV-lncRNAs zwischen Herz- und Gehirnproben wurde außerdem eine Analyse der differentiellen Expression durchgeführt. Wir fanden 221 vom Herzen hochregulierte (|log2FoldChange| ≥ 1) und 205 vom Gehirn hochregulierte CNV-lncRNAs. (Abb. 5d und ergänzende Daten 7). Um den Zusammenhang zwischen KHK und neurologischen Entwicklungsstörungen weiter zu untersuchen, haben wir die Verteilung der repräsentativen Gene im Zusammenhang mit Autismus-Spektrum-Störungen beschrieben35 und ihre Anreicherung in den syndromalen WGCNA-Modulen getestet. Die Ergebnisse zeigten, dass proteinkodierende Gene in den syndromalen Modulen Türkis (P = 7,66 × 10−14), Braun (P = 9,18 × 10−7) und Mittelviolett3 (P = 6,96 × 10−4) im Autismusspektrum signifikant angereichert waren störungsbezogene Gene (Supplementary Data 9). Es war interessant festzustellen, dass das nicht-syndromale Türkismodul (entsprechend S-Türkis) sowohl die Gensätze für KHK als auch für Autismus-Spektrum-Störungen signifikant anreicherte (Abb. 4d und ergänzende Daten 5 und 9). Dieses Modul enthielt einen hohen Anteil an im Gehirn hochregulierten CNV-lncRNAs und syndromalen CHD-Genen, die mit der Entwicklung mehrerer Systeme und der Aufrechterhaltung der Stammzellpopulation in Zusammenhang standen (Abb. 5 und ergänzende Daten 7).

Der Pearson-Korrelationskoeffizient (r) zwischen 45 Koexpressionsmodulen und Probenmerkmalen (Gewebetypen) wurde in syndromaler WGCNA (Supplementary Data 8) berechnet. Nur signifikante Korrelationen (|r| > 0,6, Padj < 0,05) werden gekennzeichnet. Die Farben stellen den Wert und die Richtung des Korrelationskoeffizienten dar. **Padj < 0,01.

Den obigen Analysen zufolge wurde HSALNG0104472 als Hub-CNV-lncRNA (Modulmitgliedschaftswert des nicht-syndromalen schwarzen Moduls = 0,83; Zusatzdaten 1) im herzkorrelierten nicht-syndromischen schwarzen Modul (Abb. 2b) identifiziert und zeigte die meisten voreingenommene Expression in den Herzproben im Vergleich zu den Gehirnproben (Abb. 5d und ergänzende Daten 7). Die relative Gewichtsanalyse (RWA) zeigte auch, dass sie eine wichtige Rolle bei der Regulierung mehrerer wichtiger KHK-Gene spielt (Abb. 7a und ergänzende Daten 10). Darüber hinaus wurden die meisten dieser Koexpressionsbeziehungen zwischen HSALNG0104472- und CHD-Genen auch in den induzierten pluripotenten Stammzellen (iPSCs) beobachtet, basierend auf In-vitro-Datensätzen zur Kardiomyozytendifferenzierung (n = 297) (Abb. 7b; ergänzende Abb. 7 und ergänzende Daten). 11).

a Das relative Gewicht von CNV-lncRNAs (n = 30) zu wichtigen CHD-Genen im nicht-syndromalen schwarzen Modul wird angezeigt (Ergänzende Daten 10). Auf der Y-Achse werden Werte der neu skalierten relativen Gewichtung (als Prozentsatz der vorhergesagten Varianz in der jedem Prädiktor zugeordneten Kriteriumsvariablen, innerhalb des Rundungsfehlers neu skalierte Gewichte der Prädiktoren in einer Testsumme auf 100 %) angezeigt, die den Regulierungseffekt darstellen. Der mittlere Expressionswert (Transkripte pro Million, tpm) von CNV-lncRNAs in den Entwicklungsherzproben (n = 50) ist auf der x-Achse dargestellt. Die roten gestrichelten Linien zeigen den mittleren Wert jeder Achse an. Rote Punkte stellen wichtige Prädiktoren dar. Graue Punkte stellen nichtsignifikante Prädiktoren dar. b Expressionsmuster von HSALNG0104472 und 8 vorhergesagten regulierten CHD-Genen im nicht-syndromalen schwarzen Modul während der In-vitro-Differenzierung von menschlichen iPSCs zu Kardiomyozyten (n = 297) (Supplementary Data 11). Die x- und y-Achsen repräsentieren das Kardiomyozyten-Differenzierungsstadium (Tag) bzw. den mittleren Expressionswert (tpm) jedes Stadiums. Die Mittellinie stellt einen Mittelwert dar. Die Boxgrenzen repräsentieren obere und untere Quartile. Die Whisker repräsentieren den 1,5-fachen Interquartilabstand. Die Punkte stellen Ausreißer dar.

Überexpression und Knockdown von HSALNG0104472 wurden in der adulten menschlichen Kardiomyozyten-Zelllinie (AC16) durchgeführt. Unsere Ergebnisse legen nahe, dass der Abbau von HSALNG0104472 die Expression von 1310 proteinkodierenden Genen (|log2FoldChange| ≥ 1, Padj <0,05) signifikant beeinflusst, die an Signalwegen wie der Regulierung der Gefäßentwicklung und der Regulierung der Angiogenese angereichert sind (Supplementary Data 12). Dennoch erschien keines der CHD-Gene, von denen vorhergesagt wurde, dass sie durch die CNV-lncRNAs reguliert werden, in der Liste der differentiellen Expressionsgene (Supplementary Data 12). Außerdem zeigte die Überexpression von HSALNG0104472 keinen signifikanten Einfluss auf die Genexpression in AC16-Zellen (ergänzende Abbildung 8).

In iPSCs wurde ein erfolgreicher shRNA-Knockdown von HSALNG0104472 durchgeführt, und die Expression von NKX2-5, ACTC1 und TBX20 wurde signifikant herunterreguliert (Ergänzende Abbildung 9a und Ergänzende Daten 13). Bei den in vitro induzierten HSALNG0104472-Knockdown-iPSCs (am Tag 9) wurde im Vergleich zu den Kontrollgruppen (am Tag 7) ein verzögertes Auftreten schlagender Kardiomyozyten beobachtet (ergänzende Abbildung 10). Der shRNA-Knockdown von HSALNG0104472 in iPSCs beeinflusste das Schlagverhalten differenzierter Kardiomyozyten (am Tag 18) erheblich. Die Schlagfrequenz der Knockdown-Gruppe betrug 24 Mal pro Minute, im Gegensatz zu 57 Mal pro Minute in der Kontrollgruppe. (Zusatzfilm 1 und 2). Es wurde eine deutliche Herunterregulierung von GATA6 festgestellt (Ergänzende Abbildung 9b und Ergänzende Daten 13). Der HSALNG0104472-Knockdown-Effekt auf die Differenzierung von Kardiomyozyten wurde durch Transduktion eines Smart Silencers, der kleine interferierende RNA und Antisense-Oligonukleotide in iPSCs nach Induktion der Differenzierung von Kardiomyozyten enthält, weiter validiert (Abb. 8a). Die durchflusszytometrische Analyse unter Verwendung des Kardiomyozyten-Markers Troponin T (cTnT) zeigte, dass der Abbau von HSALNG0104472 die Effizienz der Kardiomyozyten-Differenzierung signifikant verringerte (P = 0,006; Abb. 8b, ergänzende Abbildungen 11–16 und ergänzende Daten 13). Wir haben auch den HSALNG0104472-Knockdown-Effekt in den differenzierten Kardiomyozyten (am Tag 18) durch vorübergehende Transfektion validiert. Ein Immunfluoreszenztest der Kardiomyozyten zeigte, dass ein verringertes kardiales Troponin I (cTnI) und ein Mangel an reifem Myokardsarkomer auf die HSALNG0104472-Reduktion zurückzuführen waren (Abb. 8c).

a Für HSALNG0104472-Knockdown- und Kontrollgruppen wurden drei Zeitpunkte während der Differenzierung menschlicher iPSCs zu Kardiomyozyten erfasst. Maßstabsbalken, 40 μm. b Für HSALNG0104472-Knockdown- und Kontrollgruppen wird die Quantifizierung von Kardiomyozyten (am Tag 8 nach der Induktion) gezeigt, die kardiales Troponin T (cTnT) enthalten (Ergänzende Abbildungen 11–16 und Ergänzende Daten 13). Die Fehlerbalken zeigen den Mittelwert ± SD von drei biologisch unabhängigen Experimenten. Zum Vergleich zwischen zwei Gruppen wurde der zweiseitige Student-t-Test verwendet. **P < 0,01. c Immunfluoreszenz kardialer Sarkomermarker in induzierten Kardiomyozyten. DAPI (blau), cTnl (rot) und α-Actinin (grün). Maßstabsbalken, 15 μm. cTnl kardiales Troponin I.

CNVs wurden seit langem als wichtige Ursachen für KHK erkannt. Da CNVs in ihrer Größe sehr unterschiedlich sind und immer mehrere phänotypische Effekte zeigen, blieb die Identifizierung des relevanten Gens oder kritischen Intervalls eines spezifischen pathogenen CNV für KHK eine Herausforderung4. In klinischen Anwendungen wäre es naheliegend, die Pathogenität von CNVs anhand von Gendosiseffekten zu interpretieren, die sich aus der Störung kodierender Sequenzen ergeben. Leider wurde bisher nur dokumentiert, dass 2 (22q11.2: TBX1 und 8p23.1: GATA4) der 19 nicht-syndromalen CNVs ein relevantes proteinkodierendes Gen enthalten, das für Herzfehler verantwortlich ist (Tabelle 1). Offensichtlich würde eine solche Strategie mit der Identifizierung dosisempfindlicher Protein-kodierender Gene bei weitem nicht ausreichen, um die Ursachen der durch CNVs verursachten KHK aufzuklären.

Proteinkodierende Regionen nehmen nur etwa 2 % des menschlichen Genoms ein. Im Gegensatz dazu könnten insgesamt 60–70 % des menschlichen Genoms transkribiert werden8. Daher wäre es sinnvoll, die Auswirkungen nichtkodierender RNAs auf die Ätiologie von KHK-assoziiertem CNV zu untersuchen. In den letzten Jahren wurde vermutet, dass lncRNAs an der Orchestrierung der Genexpression in kardialen Entwicklungsprozessen beteiligt sind. In der aktuellen Studie untersuchten wir die potenziellen regulatorischen Rollen von CNV-lncRNAs und ihren Beitrag zur Ätiologie der durch CNVs verursachten KHK. Durch WGCNA identifizierten wir zwei mit Herzgewebe korrelierte Koexpressionsmodule, die insgesamt 35 CNV-lncRNAs enthielten (Supplementary Data 1). Funktionsanreicherungsanalysen zeigten, dass diese Module mit biologischen Prozessen wie Herzprozessen, Muskelentwicklung und Energiestoffwechsel in Zusammenhang stehen, die als wichtige Komponenten des Herzentwicklungsprozesses erkannt wurden (Abb. 2c). Das nicht-syndromale schwarze Modul, das die höchste Korrelation mit Herzgewebe zeigte, enthielt die Hälfte (11/22, P = 2,12 × 10−11) der gut charakterisierten nicht-syndromalen CHD-Gene, aber nur 2 der 69 syndromalen CHD-Gene ( P = 0,66). Darüber hinaus wurden die proteinkodierenden Gene im schwarzen Modul auch in den CHD-Gensätzen LOF (P = 1,34 × 10−3) und DMV (P = 5,62 × 10−5) angereichert (Abb. 4a, c und ergänzende Daten 5). , die nach groß angelegten Entdeckungen seltener Varianten mithilfe der Sequenzierung der nächsten Generation erhalten wurden36. Zusammengenommen deuten diese Ergebnisse darauf hin, dass das nicht-syndromale schwarze Modul eine Veranlagung hatte, kardiale Phänotypen zu beeinflussen. Darüber hinaus umfassten mehr als die Hälfte (52,63 %, 10/19) der wiederkehrenden nicht-syndromalen CHD-assoziierten CNVs mindestens eine lncRNA, die mit mehreren wichtigen CHD-Genen im nicht-syndromalen schwarzen Modul koexprimiert wurde (Abb. 3a).

Das nicht-syndromale schwarze Modul enthielt 2 Hub-CNV-lncRNAs (HSALNG0104472 in 15q11.2 und HSALNG0137903 in Xp11.22) (Abb. 4a und ergänzende Daten 1). Die relative Gewichtsanalyse (RWA) zeigte, dass HSALNG0104472 einen signifikanten Einfluss auf die Expressionsregulation aller 12 im nicht-syndromalen schwarzen Modul koexprimierten CHD-Gene hatte und dass HSALNG0137903 die Regulation von 10 koexprimierten CHD-Genen mit Ausnahme von MYH6 und SMAD6 signifikant beeinflusste (Abb. 7a und ergänzende Daten 10). Es wurde wiederholt berichtet, dass die 15q11.2-Deletion zu Störungen der neurologischen Entwicklung beiträgt. Der Zusammenhang mit KHK war jedoch umstritten37. Wir haben kürzlich herausgefunden, dass die Deletion von 15q11.2 mit TAPVC, einer seltenen und schweren Form von KHK24, zusammenhängt. Die entscheidenden Gene der 15q11.2-Deletion, die für Herzfehler verantwortlich sind, blieben hingegen unbekannt. Interessanterweise zeigte HSALNG0104472 von den 30 CNV-lncRNAs im nicht-syndromalen schwarzen Modul im Vergleich zum Gehirn die deutlichste voreingenommene Expression im Entwicklungsherzen (Abb. 5d und ergänzende Daten 7). Anschließend führten wir Überexpressions- und Knockdown-Experimente in Kardiomyozyten-Zelllinien durch, um die regulatorischen Wirkungen von HSALNG0104472 zu untersuchen. Die Überexpression von HSALNG0104472 führte nicht zu einer signifikanten Störung der Genexpression in AC16-Zelllinien. Mit dem Abbau von HSALNG0104472 in AC16 identifizierten wir herunterregulierte Gene, die an Signalwegen wie der positiven Regulierung der Angiogenese, der positiven Regulierung der Gefäßentwicklung und der Regulierung der Gefäßentwicklung beteiligt sind. Dennoch konnten wir die Koexpressionsbeziehung zwischen HSALNG0104472 und den im nicht-syndromalen schwarzen Modul identifizierten CHD-Genen nicht eindeutig validieren (Supplementary Data 12). Wir haben vermutet, dass diese Inkonsistenz auf die Tatsache zurückzuführen ist, dass die Koexpressionsmodule auf der Grundlage von Entwicklungsdatensätzen erstellt wurden, wohingegen AC16 eine adulte menschliche Kardiomyozyten-Zelllinie darstellt. Eine weitere Validierung mithilfe des iPSCs-Kardiomyozyten-Differenzierungssystems zeigte stadienspezifische regulatorische Wirkungen von HSALNG0104472 auf die CHD-Gene (NKX2-5, ACTC1 und TBX20 in iPSCs und GATA6 in differenzierten Kardiomyozyten, ergänzende Abbildung 9). Die 15q11.2-Deletionsregion umfasst hauptsächlich vier proteinkodierende Gene: TUBGCP5, CYFIP1, NIPA1 und NIPA2. In dieser Studie zeigte unsere Analyse der unterschiedlichen Genexpression zwischen Herz- und Hirngewebe in der Entwicklung, dass NIPA1 bevorzugt in Hirngewebe in der Entwicklung exprimiert wurde, wohingegen die anderen drei Gene keine signifikante unterschiedliche Expression zeigten (Supplementary Data 7). Da berichtet wurde, dass nur TUBGCP5 und NIPA1 in fötalen Herzen exprimiert werden, haben wir zuvor TUBGCP5-Knockout-iPSCs erstellt und nachgewiesen, dass eine Reduzierung von TUBGCP5 die Differenzierung von Kardiomyozyten beeinflussen würde24. Hier haben wir bewiesen, dass die CNV-lncRNA HSALNG0104472 spezifisch in sich entwickelnden Herzgeweben exprimiert wird und ihre Reduzierung schwerwiegendere Auswirkungen auf die Differenzierung der Kardiomyozyten haben würde. Daher sollte HSALNG0104472 ein Hauptauslöser für Herzfehler sein, die aus der Deletion von 15q11.2 resultieren.

Die jüngste Entdeckung zahlreicher neuer CHD-Gene profitierte von der Anwendung groß angelegter Next-Generation-Sequenzierung bei CHD-Kohorten. Da sich die meisten Hinweise auf diese Gene (wie in LOF- und DMV-Gensätzen, Supplementary Data 5 zusammengefasst) auf seltene Varianten bezogen, war es vernünftig, dass diese Gene mit viel mehr Koexpressionsmodulen angereichert waren. Daher hat die auf Sequenzierung der nächsten Generation basierende Entdeckung seltener Varianten unser Wissen über die genetischen Ätiologien der KHK erheblich erweitert. Solche Ergebnisse stimmten auch mit der universellen genetischen Heterogenität der KHK überein. Syndromische und nicht-syndromale KHK-Gensätze wurden ebenfalls in verschiedenen Modulen angereichert, was auf eine Divergenz der molekularen Basis hindeutet, die der syndromalen und nicht-syndromischen KHK zugrunde liegt (Abb. 4 und ergänzende Daten 5). Daher haben wir unsere Analyse auf lncRNAs innerhalb syndromaler KHK-assoziierter CNVs ausgeweitet. Im Vergleich zur nicht-syndromalen KHK waren fast alle mit der syndromalen KHK assoziierten CNVs Deletionen4. Im Allgemeinen sollten Löschungen schädlicher sein als Duplikationen4. Andererseits zeigte eine beträchtliche Anzahl wiederkehrender Deletionssyndrome eine verringerte Penetranz oder eine hohe klinische Variabilität7. Die syndromalen CHD-assoziierten CNVs enthielten mehr lncRNAs und Hub-CNV-lncRNAs, die an mehr als doppelt (29/13) so vielen Modulen beteiligt waren wie nicht-syndromale CHD (Supplementary Data 1 und 8). Durch differenzielle Genexpressionsanalysen der 88 syndromalen und nicht-syndromalen CHD-Gene und CNV-lncRNAs in Herz- und Gehirnentwicklungsproben identifizierten wir 21 bzw. 8 Gene, die im Herzen bzw. im Gehirn hochreguliert sind. Die durch das Herz hochregulierten Gene standen in Zusammenhang mit der Herzentwicklung, und die durch das Gehirn hochregulierten Gene standen in Zusammenhang mit der Entwicklung mehrerer Systeme (Abb. 5a – c). Bemerkenswerterweise waren sowohl die herzhochregulierten Protein-kodierenden Gene als auch die CNV-lncRNAs am stärksten im s-gelben Modul angereichert, was dem nicht-syndromalen schwarzen Modul entsprach (Abb. 5c, d und ergänzende Daten 7). Das größte türkisfarbene Modul war mit den syndromalen CHD-, LOF- und DMV-CHD-Gensätzen angereichert (Abb. 4b, d und ergänzende Daten 5). Wir haben herausgefunden, dass ein großer Teil der im Gehirn hochregulierten syndromalen KHK-assoziierten CNV-lncRNAs im entsprechenden (s-türkisen) Modul geclustert war (Abb. 5d und ergänzende Daten 7). Die Autismus-Spektrum-Störung stellt eine neurologische Entwicklungsstörung mit einer gemeinsamen genetischen Grundlage für die KHK dar. Wir haben Gene für Autismus-Spektrum-Störungen in den syndromalen Koexpressionsmodulen getestet (Supplementary Data 9). Zusammenfassend unterstreichen diese Ergebnisse die Bedeutung von CNV-lncRNAs innerhalb des türkisfarbenen (s-türkisen) Moduls für die Ätiologie syndromaler KHK mit neurologischen Entwicklungsdefekten.

Umweltfaktoren könnten mit bis zu 30 % der KHK-Fälle verbunden sein, wohingegen einzelne Umweltursachen nur in 2 % der Fälle identifizierbar sind4. Es wurde vermutet, dass die meisten ungeklärten KHK-Fälle durch Wechselwirkungen genetischer und umweltbedingter Faktoren verursacht werden, die möglicherweise durch epigenetische Regulatoren moduliert werden. Zunehmende Hinweise auf eine Beteiligung von lncRNAs an der Herzentwicklung legen nahe, dass deren Fehlregulation, die der Herz-Kreislauf-Erkrankung zugrunde liegt, ernsthaft in Betracht gezogen werden sollte. Im Gegensatz zu mRNA und miRNAs entwickelten sich lncRNAs im Hinblick auf Sequenz und Expressionsniveaus schnell. Ihre Gewebespezifitäten bleiben jedoch häufig erhalten. LncRNAs könnten Genexpressionen in cis oder trans entweder unterdrücken oder aktivieren. Unseren Analysen zufolge korrelierten die meisten CNV-lncRNAs stark mit bekannten CHD-Genen außerhalb ihrer entsprechenden CNV-Regionen (Abb. 3a) und funktionierten somit in trans. Mechanisch könnten lncRNAs in Signal-lncRNAs, Decoy-lncRNAs, Guide-lncRNAs, Gerüst-lncRNAs und Enhancer-lncRNAs kategorisiert werden. Zuvor haben wir mit CHD33 erfolgreich Genregulationsnetzwerke aus lncRNA-miRNA-mRNA in Herzgewebe aufgebaut. In der vorliegenden Studie haben wir auch Hub-CNV-lncRNAs identifiziert, die das regulatorische Netzwerk lncRNA-miRNA-mRNA steuern könnten (ergänzende Abbildung 3). Allerdings befand sich keine der Ziel-mRNAs in der bekannten CHD-Genliste (Supplementary Data 5).

Die Pathogenität von CNVs wurde am häufigsten auf der Grundlage ihrer Wirkung auf die Gendosis durch die Störung kodierender Sequenzen interpretiert, und dieser Ansatz wurde erfolgreich bei der Entdeckung ursächlicher Gene für CNVs bei Mendelschen Krankheiten angewendet7. Trotz des Erfolgs einer solchen Strategie blieben die Pathologien der meisten KHK-assoziierten CNVs lange Zeit ungeklärt. Da die meisten CNVs auch genomische Regionen von lncRNAs beeinflussen, müssen pathogene Mechanismen, an denen regulatorische lncRNAs beteiligt sind, ernsthaft in Betracht gezogen werden. Selbst wenn wir nur das Modul (nicht-syndromales schwarzes Modul) berücksichtigten, das am signifikantesten mit Herzgewebe korrelierte, enthielten überraschenderweise mehr als die Hälfte der nicht-syndromalen KHK-assoziierten CNVs (52,6 %, 10/19) mindestens eine lncRNA, die einen hohen Wert aufwies Koexpression und Korrelation mit mehreren wichtigen CHD-Genen (Abb. 3a). Von den oben genannten 10 lncRNA-haltigen CNVs umfassten 1q21.1, 2q24.1, 2q35, 2q37.1, 8p23.1 und 13q14.11 auch Hub-lncRNA(s), die am ceRNA-Mechanismus beteiligt sind. Abgesehen von diesen CNVs enthielten auch andere drei nicht-syndromale CHD-assoziierte CNVs (5q31.1, 16p12.2 und 16q23.1) Hub-lncRNAs, die an den ceRNA-Analysen beteiligt waren (Abb. 3a und ergänzende Daten 6). Obwohl CHD-Gene nicht als Ziele von Hub-lncRNAs für das ceRNA-Netzwerk identifiziert wurden, konnten wir die Wirkung des ceRNA-Mechanismus aufgrund seiner allgegenwärtigen regulatorischen Rolle bei der Herzentwicklung nicht ignorieren38. Insgesamt könnten CNV-lncRNAs potenziell zu den Pathologien eines maximalen Anteils von 68,4 % (13/19) der nicht-syndromalen KHK-assoziierten CNVs beitragen (Abb. 3a; Tabelle 1; und ergänzende Daten 6).

Weitere Untersuchungen sind erforderlich, da unsere Forschung mehreren Einschränkungen unterliegt. Zunächst sollten aus den Koexpressionsnetzwerken kausale lncRNAs identifiziert werden, die KHK-Fälle aufgrund von CNVs erklären könnten, was auch die ursprüngliche Motivation dieser Arbeit war. Zweitens haben wir in den Analysen vier bekannte KHK-Gensätze verwendet (Supplementary Data 5). Die Ergebnisse könnten unvollständig sein, da die Liste der CHD-Gene immer noch wächst. Obwohl wir mRNA und CNV-lncRNAs zur Vereinfachung der Analysen in Module gruppiert haben, könnten die CNV-lncRNAs und mRNAs in zeitlicher und räumlicher Sicht komplexe Wechselwirkungen zwischen Modulen aufweisen. Die Hub-CNV-lncRNA HSALNG0104472 beispielsweise, deren inkonsistente regulatorische Wirkung auf bekannte CHD-Gene in iPSC und differenzierten Kardiomyozyten beobachtet wurde (d. h. die Transkriptionsniveaus von NKX2.5, ACTC1 und TBX20 wurden in iPSCs, jedoch nicht in differenzierten Kardiomyozyten herunterreguliert), gaben die stufenspezifischen Rollen von HSALNG0104472 an (Ergänzende Abbildung 9 und Ergänzende Daten 13). Schließlich ist das Fehlen einer tiefgreifenden mechanistischen Untersuchung eine Einschränkung der Studie. Insgesamt haben wir Beweise dafür geliefert, dass CNV-lncRNAs möglicherweise die Expressionsmuster gut etablierter CHD-Gene regulieren. Um ihre molekularen Mechanismen bei KHK aufzudecken, ist die Integration mehrdimensionaler Datensätze erforderlich. Es sind jedoch noch weitere Arbeiten erforderlich, um die regulatorischen Rollen von CNV-lncRNAs bei KHK vollständig aufzudecken. Um dieses Ziel zu erreichen, sollten Verbesserungen im Zell- und In-vitro-/In-vivo-Modell sowie die Sammlung klinischer genetischer Daten erforderlich sein. Da die meisten CNV-lncRNAs nicht evolutionär konserviert sind, haben sich In-vitro-Modelle wie Herzorganoide als potenzielle Werkzeuge herausgestellt, um Erkenntnisse über molekulare Mechanismen für sie zu gewinnen.

Um abschließend zu untersuchen, ob lncRNAs zur Pathogenität von CNVs beitragen, die zu KHK führen, haben wir unter Verwendung von Entwicklungsdaten menschlicher Organe ein Koexpressionsnetzwerk für KHK-assoziierte CNV-lncRNAs und proteinkodierende Gene aufgebaut. Unsere Ergebnisse legen nahe, dass bekannte CHD-Gene durch mehrere lncRNAs sowohl in nicht-syndromalen als auch syndromalen CHD-assoziierten CNV-Regionen reguliert werden könnten. Für das nicht-syndromale schwarze Modul, das hauptsächlich mit nicht-syndromalen CHD-Genen angereichert ist, haben wir die regulatorischen Rollen einer Hub-CNV-lncRNA HSALNG0104472 innerhalb der 15q11.2-Region validiert. Es zeigte sich, dass HSALNG0104472 ein Haupteffektor sein sollte, der für Herzfehler der 15q11.2-Deletion verantwortlich ist, indem es die Differenzierung der Kardiomyozyten reguliert. Unsere Ergebnisse verdeutlichten den potenziellen Beitrag von lncRNAs zur Pathogenität von KHK-assoziierten CNVs.

Unser Ziel war es, den möglichen Beitrag von lncRNAs zur Pathogenität von KHK-assoziierten CNVs aufzudecken. Nicht-syndromale und syndromale CHD-assoziierte CNVs wurden aus CHDGKB39 bzw. einer aktuellen Übersicht über CHD4 abgerufen. Wir beschränkten unsere Analyse zunächst auf die wiederkehrenden nicht-syndromalen CNVs, die in mindestens drei Fällen gemeldet wurden. Wir konstruierten Koexpressionsnetzwerke für die 568 nicht-syndromalen CNV-lncRNAs und 19.957 Protein-kodierenden Gene unter Verwendung der transkriptomischen Daten zur Entwicklung menschlicher Organe (n = 313) von LncExpDB23. Genexpressionsmatrizen (tpm-Wert) aller 313 Proben wurden für WGCNA verwendet, was die Identifizierung robuster Koexpressionsbeziehungen mit CNV-lncRNAs ermöglichte.

Um die molekulare Basis aufzudecken, die den Unterschieden zwischen nicht-syndromaler und syndromaler KHK zugrunde liegt, führten wir eine weitere WGCNA mit 1500 nicht-syndromalen und syndromalen KHK-assoziierten CNV-lncRNAs durch. Wir identifizierten auch unterschiedlich exprimierte CHD-Gene und CNV-lncRNAs zwischen den Gehirn- (n = 87) und Herzproben (n = 50).

Die identifizierten WGCNA-Module wurden mit dem Geschlecht, dem Entwicklungsstadium und den sieben Organen mit dem WGCNA-R-Paket korreliert. Wir haben uns hauptsächlich auf die Module konzentriert, die signifikant mit Herzgewebe korrelieren. HSALNG0104472, eine Hub-CNV-lncRNA innerhalb von 15q11.2, zeigte eine hohe Koexpression und Korrelation mit mehreren wichtigen CHD-Genen. Anschließend führten wir eine Reihe von Zellexperimenten durch, um die möglichen regulatorischen Auswirkungen auf Kardiomyozyten zu validieren.

Die iPSC-Linie wurde in unserer vorherigen Studie24 von einer gesunden Frau generiert. Die Einverständniserklärung des Teilnehmers wurde eingeholt. Die Ethikkommission des SCMC hat diese Studie überprüft und genehmigt (SCMCIRB-K2022182-1). Alle in Studien mit menschlichen Teilnehmern durchgeführten Verfahren entsprachen den ethischen Standards des institutionellen und/oder nationalen Forschungsausschusses sowie der Helsinki-Erklärung von 1964 und ihren späteren Änderungen – vergleichbaren ethischen Standards.

Nicht-syndromale CNVs wurden von CHDGKB39 gesammelt. Da wiederkehrende CNVs viel größere klinische Auswirkungen hatten, verwendeten wir für unsere Analyse nur die 19 CNVs, die in mindestens drei Fällen auftraten (Tabelle 1). Darüber hinaus wurden 21 syndromale CNVs aus der aktuellen Übersicht4 zur vergleichenden Analyse zusammengefasst. Die annotierten lncRNAs23,31, die diesen genomischen Regionen mit einem maximalen Expressionswert (Transkripte pro Million, tpm) ≥ 1 in den 50 Herzentwicklungsproben zugeordnet waren, wurden als während der Herzentwicklung exprimiert angesehen. BEDTools v2.29.2 wurde für den CNV-lncRNA-Abruf40 verwendet. Für die Koexpressionsanalyse wurden verarbeitete Genexpressionsdaten dieser Gene für die 313 von LncExpDB bereitgestellten Entwicklungsgewebeproben menschlicher Organe verwendet. Das R-Paket WGCNA v1.7022 wurde für den Aufbau des Koexpressionsnetzwerks und die Modulidentifizierung verwendet. Mithilfe der Pearson-Korrelation wurden paarweise Genexpressionskorrelationen und Modul-Merkmalskorrelationen berechnet. Für Modul-Merkmal-Korrelationen wurde der angepasste P-Wert mit der Funktion corPvalueStudent im WGCNA R-Paket berechnet. Der Leistungswert für den Aufbau des Koexpressionsnetzwerks wurde auf sechs festgelegt. Die Parameter für die blockwiseModules-Funktion waren wie folgt: maxBlockSize = 6000, TOMType = „unsigned“, minModuleSize = 30, reassignThreshold = 0, mergeCutHeight = 0,25, numericLabels = T und pamRespectsDendro = F. Der Wert der Modulmitgliedschaft (MM). wurde als Schätzung der Korrelation zwischen einem Gen/lncRNA und dem entsprechenden Modul-Eigengen verwendet und zur Definition von Hub-CNV-lncRNAs verwendet. Proteinkodierende Gene in jedem Modul wurden als Eingabe für die Anreicherungsanalyse der Genontologie (GO) und die Signalweganreicherungsanalyse der Kyoto Encyclopedia of Genes and Genomes (KEGG) mit dem R-Paket ClusterProfiler v3.1041 verwendet.

Wir haben 598537 lncRNA-miRNA- und 331604 miRNA-mRNA-Interaktionsnachweise aus LncBook25, NPInter42, miRTarBase43 und TarBase44 abgerufen. Durch Integration der Interaktionsnachweise mit Genexpressionsdaten der Herzentwicklungsproben (n = 50) haben wir das lncRNA-miRNA-mRNA-Regulierungsnetzwerk unter Verwendung von LncmiRSRN v3.034 erstellt, um den Beitrag des ceRNA-Mechanismus zur Pathogenität der damit verbundenen nicht-syndromalen KHK abzuschätzen CNVs.

Die in unserem Labor24 von einer gesunden Frau erzeugte iPSC-Linie wurde für Experimente zur Kardiomyozyten-Differenzierung verwendet. Die iPSCs (1 × 106) wurden in mit Matrigel vorbeschichteten 6-Well-Platten (BD Bioscience, Heidelberg, Deutschland) inokuliert. Die iPSCs wurden mit E8-Medium ausgesät und kultiviert. Als die iPSCs die Konfluenz von 80 % bis 90 % erreichten, wurde eine in vitro induzierte Kardiomyozytendifferenzierung mit dem CardioEasy-Kit (Cellapybio, Peking, China) gemäß dem Protokoll durchgeführt. Die Effizienz der Kardiomyozyten-Differenzierung wurde mittels Durchflusszytometrie quantifiziert (siehe Abschnitt „Bewertung der Effizienz der Kardiomyozyten-Differenzierung“).

Zur Immunfluoreszenzfärbung wurden die Zellen 20 Minuten lang bei Raumtemperatur mit PBS, das 4 % Paraformaldehyd enthielt, fixiert. Nach dem Waschen mit PBS wurden die Zellen 30 Minuten lang mit PBS, das 5 % Rinderserum enthielt, blockiert. Die Färbung mit primären Antikörpern: kardiales Troponin I (cTnI) (RRID: AB_2532494, ThermoFisher, Waltham, MA, USA), α-Actinin (RRID: AB_2692251, ThermoFisher, Waltham, MA, USA), verdünnt in Blockierungspuffer, wurde über Nacht bei durchgeführt −4 °C Temperatur. Am nächsten Tag wurden nach der Färbung mit DAPI Sekundärantikörper zum Nachweis des Zellkerns verwendet. Fluoreszenzbilder wurden mit einem konfokalen Lasermikroskop (Leica TCS SP8) aufgenommen.

Die gesamte zelluläre RNA wurde mit TRIzol-Reagenz (Ambion, Austin, TX, USA) gemäß dem Protokoll isoliert. Die RNA-Konzentration und -Integrität wurde mit dem Agilent Bioanalyzer 2100-System gemessen. Proben mit RIN ≥ 7 waren für den Aufbau der Sequenzierungsbibliothek qualifiziert. Wir haben die Sequenzierungsbibliotheken mit dem mRNA-seq Lib Prep Kit für Illumina (ABclonal Technology Co., Wuhan, China) mit Adaptern für die BGI-Plattform vorbereitet. Die Sequenzierung wurde auf dem DNBSEQ-T7 durchgeführt. Die Daten wurden wie folgt verarbeitet: Qualitätsanalyse und Basisqualitätsfilterung mit FastQC v0.11.9 (https://www.bioinformatics.babraham.ac.uk/projects/fastqc) und Trim Galore v0.6.6 (https://github. com/FelixKrueger/TrimGalore), rRNA-Entfernung mit SortMeRNA v4.3.445, Ausrichtung mit STAR v2.7.1046, Lesezählung mit featureCounts47, implementiert im Subread-Paket v2.0.3, Differenzialausdrucksanalyse und Hauptkomponentenanalyse mit DESeq2 v1.3248 und funktional Anreicherungsanalyse mit ClusterProfiler v3.1041. Für die differenzielle Expressionsanalyse wurden die Gen-Rohzahlen mit der Rlog-Funktion in DESeq2 v1.3248 normalisiert.

Die Genexpressionsdaten von LncExpDB23 wurden durch umfassende Annotation für lncRNAs des ursprünglichen Datensatzes von Entwicklungsproben (n = 313, Gehirn: 55, Kleinhirn: 59, Herz: 50, Niere: 40, Leber: 50, Eierstöcke: 18 usw.) generiert Hoden: 41) gesammelt von ArrayExpress (E-MTAB-6814). Die Gewebeentnahme begann vier Wochen nach der Empfängnis und wurde dann jede Woche bis zur 20. Woche nach der Empfängnis entnommen, mit Ausnahme der 14., 15. und 17. Woche nach der Empfängnis. Postnatale Gewebe wurden bei Neugeborenen, Säuglingen (6–9 Monate), Kleinkindern (2–4 Jahre), Schulalter (7–9 Jahre), Teenagern (13–19 Jahre) und Erwachsenen (~65 Jahre) entnommen. Die Nierenentwicklung wurde bis zum Alter von 8 Jahren untersucht und die Eierstockentwicklung wurde nur pränatal untersucht49.

Die verarbeiteten transkriptomischen Daten (n = 297) der In-vitro-Kardiomyozytendifferenzierung von LncExpDB23 wurden verwendet, um die stark korrelierte Koexpressionsbeziehung zwischen den CNV-lncRNAs und CHD-Genen im durch WGCNA identifizierten nicht-syndromalen schwarzen Modul zu validieren. Die Originaldaten wurden vom Gene Expression Omnibus (GEO) unter der Zugangsnummer GSE122380 gesammelt. Die ursprünglichen Daten wurden aus der Kardiomyozytendifferenzierung von iPSC-Linien von 19 Personen aus der Yoruba-HapMap-Population50 generiert.

Beispielmerkmale in Daten zur Entwicklung menschlicher Organe wurden von LncExpDB23 gesammelt. Kategoriale Variablen (Geschlecht und Gewebe) der Proben wurden in 1 und 0 quantisiert. Für das Geschlecht wurde männlich in 1 und weiblich in 0 quantisiert. Für 7 Organe (z. B. Herz) wurden Herzproben in 1 und andere Proben quantisiert wurden zu 0 quantisiert. Kontinuierliche Variablen (Entwicklungsstadium) von Proben wurden gemäß den folgenden Regeln in Wochen quantisiert: Bei Embryonenproben (vor der Geburt) entspricht der Wert des Entwicklungsstadiums der Anzahl der Wochen nach der Empfängnis (z. B. wenn der Embryo war 10 Wochen alt, der Wert war 10.). Bei Proben, die nach der Geburt entnommen werden, beträgt der Wert für das Entwicklungsstadium 40 (geschätzter Wert der menschlichen Schwangerschaft von 40 Wochen) plus Alter (Anzahl in Wochen). 1 Jahr wurde als 52 Wochen, 1 Monat als 1/12 Jahre und 1 Woche als 7 Tage berechnet. (Zum Beispiel betrug der Entwicklungsstadiumswert für eine Stichprobe 6 Monate nach der Geburt 40 + 6/12 × 52 = 66; für eine Stichprobe 7 Tage nach der Geburt betrug der Entwicklungsstadiumswert 40 + 7/7 = 41. ) (Ergänzende Daten 1).

Details (einschließlich KHK-Subtyp) zu wiederkehrenden nicht-syndromalen KHK-assoziierten CNVs wurden von CHDGKB39 gesammelt. Nach dem Filtern der CNV-Datensätze ohne spezifische CNV-Koordinateninformationen wurden die ursprünglichen Koordinaten jedes CNV-Datensatzes mit dem Liftover-Tool in UCSC (http://genome.ucsc.edu) in die hg38-Assembly konvertiert (http://genome.ucsc.edu)51. Die Koordinaten aller CNV-lncRNAs (hg38-Assembly) wurden von LncExpDB23 abgerufen. Wir haben den Schnittpunkt der Koordinaten verwendet, um die Assoziation zwischen CNV-lncRNA und dem CHD-Subtyp zu identifizieren.

Die relative Gewichtsanalyse (RWA), auch als Treiberanalyse bekannt, wurde mit RWA Web und dem R-Paket52 durchgeführt, um die wichtigsten Treiber-CNV-lncRNAs im nicht-syndromalen schwarzen Modul zu identifizieren. Für jede RWA-Analyse wurde das CHD-Gen als Antwortvariable und CNV-lncRNAs als Prädiktoren verwendet. R2 schätzte den Beitrag einer Gruppe von Prädiktoren zur Antwortvariablen. Wenn 0 nicht in den Konfidenzintervallen enthalten war, wurde das relative Gewicht als signifikant bezeichnet. Ansonsten wichen die relativen Gewichte nicht wesentlich voneinander ab. Weitere Einzelheiten finden Sie im RWA-Web.

Für die Überexpressionsexperimente wurde die volle Länge des Transkripts (HSALNT0217290) für HSALNG0104472 in den lentiviralen Vektor PCDH-CMV-MCS-EF1a-gfp-T2A-puro kloniert, der leere Vektor wurde als Kontrolle verwendet. Für die stabilen Knockdown-Experimente mit shRNA wurde eine komplementäre Sequenz (AGGGAACCAGCTTCAGAACTCAAGAGGTTCTGAAGCTGGTTCCCTTTTTTT), die auf das HSALNG0104472-Transkript abzielt, in den lentiviralen Vektor pLVX-shRNA2-zsGreen-PGK-puro eingefügt. Als Kontrolle wurde die entsprechende Scramble-Sequenz (CGTATACCCGGAACAAAGGTCAAGAGCCTTTGTTCCGGGTATACGTTTTTT) verwendet. Die konstruierten lentiviralen Plasmide wurden jeweils mit den Verpackungsplasmiden psPAX2 und pMD2·G durch Lipofectamine 2000 (Invitrogen, Carlsbad, CA, USA) in HEK293-Zellen transfiziert, um Viren zu produzieren. AC16/iPSCs wurden nach mehrtägiger Puromycin-Behandlung mit den Lentiviren infiziert, um die Überexpressions- und Knockdown-Zelllinien zu erhalten. Knockdown-Experimente wurden auch durch vorübergehende Transfektion mit einem Smart Silencer (Mischung aus kleinen interferierenden RNAs und Antisense-Oligonukleotiden gegen HSALNG010447, synthetisiert von RiboBio, Guang Zhou, China) wiederholt. Der Smart Silencer wurde in iPSCs oder Kardiomyozyten mit dem Lipofectamine RNAiMAX (Invitrogen, Carlsbad, CA, USA) transfiziert. Die Silencer-Sequenzen sind in der Ergänzungstabelle 3 aufgeführt.

Insgesamt 1 µg zelluläre RNA wurde als Vorlage für die cDNA-Präparation mit dem PrimeScript RT Reagent Kit (Takara, Dalian, China) verwendet. Quantitative Reverse Transkription qPCR (RT-qPCR) wurde mit dem TB Green Premix Ex Taq II Kit (Takara, Dalian, China) auf dem CFX 96 Real-Time PCR-Nachweissystem (Bio-Rad Laboratories, Inc., Hercules, CA, USA) durchgeführt. Vereinigte Staaten). Die relativen Genexpressionsniveaus wurden basierend auf der 2−∆∆Ct-Methode berechnet. Für jede Gruppe wurden mindestens drei biologisch unabhängige Experimente durchgeführt. Als internes Referenzgen wurde GAPDH verwendet. Die RT-qPCR-Primerpaare sind in der Ergänzungstabelle 4 aufgeführt.

Die Durchflusszytometrie wurde verwendet, um die relative Ausbeute an Kardiomyozyten und die Effizienz der Zelldifferenzierung zu bewerten, indem die Anzahl der Zellen gemessen wurde, die herzspezifische Proteine ​​kardiales Troponin T (cTnT) exprimieren. Der polyklonale PE-konjugierte kardiale Troponin-T-Antikörper (Katalognummer: #C90559PE) wurde zur gezielten Bekämpfung von Kardiomyozyten verwendet. Zur Probenvorbereitung Kardiomyozyten 5 Minuten lang mit milden Verdauungsenzymen verdauen. Fügen Sie ein gleiches Volumen Zellkulturmedium hinzu, um die Reaktion zu stoppen. Bei 25 °C 800 × g für 5 Minuten zentrifugieren und Zellen mit PBS resuspendieren, um die Zellen 2 Mal im gleichen Verfahren zu waschen. Aliquotieren Sie pro Test 1 × 106 Zellen aus der vorbehandelten Probe in 100 μl Volumen in einem 5-ml-Teströhrchen. Geben Sie den PE-konjugierten polyklonalen Antikörper gegen kardiales Troponin T in der entsprechenden Verdünnung (1:100) in die Teströhrchen. 1 Stunde bei 37 °C inkubieren. Durch Zentrifugation in 2–3 ml Waschpuffer (PBS mit 0,1 % FBS) waschen. Zellen in 0,3–0,5 ml PBS resuspendieren und auf einem Durchflusszytometer analysieren. Das BD FACSCanto™ Durchflusszytometer wurde für Kardiomyozyten-Differenzierungstests verwendet. Der Prozentsatz der Zellen wurde mit der Software BD FACSDiva™ v8.0.1 ermittelt. Die Häufigkeit positiver und negativer Fraktionen wurde durch Zellzählung nach der Sortierung bestimmt. Die Gating-Strategie wurde in den Zusatzinformationen (Ergänzende Abbildung 10) dargestellt.

Für die differenzielle Genexpressionsanalyse wurde ein Schwellenwert eines angepassten P-Werts < 0,05 verwendet. Die P-Werte wurden für Mehrfachtests mit der Benjamini-Hochberg-Methode angepasst. Hypergeometrische Tests wurden verwendet, um die Bedeutung der Anreicherung bekannter CHD-Gene in Koexpressionsmodulen abzuschätzen. Zum Vergleich zwischen zwei Gruppen wurde der zweiseitige Student-t-Test verwendet. Für jede Gruppe wurden mindestens drei biologisch unabhängige Experimente durchgeführt.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die RNAseq-Rohdaten für Überexpressions- und Knockdown-Experimente zu HSALNG0104472 in AC16-Kardiomyozyten, die die Ergebnisse dieser Studie stützen, sind unter GEO: GSE201076 offen verfügbar. Alle Daten sind im Haupttext oder den ergänzenden Materialien verfügbar. Das Plasmid für die Überexpression und den Knockdown von HSALNG0104472 wurde bei Addgene (197902, 197989 und 197991) hinterlegt.

GBD 2017 Mitarbeiter bei angeborenen Herzkrankheiten. Globale, regionale und nationale Belastung durch angeborene Herzerkrankungen, 1990–2017: eine systematische Analyse für die Global Burden of Disease Study 2017. Lancet Child Adolesc. Gesundheit 4, 185–200 (2020).

Artikel Google Scholar

Liu, Y. et al. Weltweite Geburtenprävalenz angeborener Herzfehler 1970–2017: aktualisierte systematische Überprüfung und Metaanalyse von 260 Studien. Int J. Epidemiol. 48, 455–463 (2019).

Artikel PubMed PubMed Central Google Scholar

Leirgul, E. et al. Geburtenprävalenz angeborener Herzfehler in Norwegen 1994–2009 – eine landesweite Studie. Bin. Heart J. 168, 956–964 (2014).

Artikel PubMed Google Scholar

Pierpont, ME et al. Genetische Grundlage für angeborene Herzfehler: überarbeitet: eine wissenschaftliche Stellungnahme der American Heart Association. Auflage 138, e653–e711 (2018).

Artikel PubMed PubMed Central Google Scholar

Nees, SN & Chung, WK Genetische Grundlagen menschlicher angeborener Herzfehler. Kalter Frühling Harb. Perspektive. Biol. https://doi.org/10.1101/cshperspect.a036749 (2020).

Jin, SC et al. Beitrag seltener erblicher und De-novo-Varianten bei 2.871 Probanden mit angeborenen Herzerkrankungen. Nat. Genet. 49, 1593–1601 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Spielmann, M., Lupianez, DG & Mundlos, S. Strukturelle Variation im 3D-Genom. Nat. Rev. Genet. 19, 453–467 (2018).

Artikel CAS PubMed Google Scholar

Djebali, S. et al. Landschaft der Transkription in menschlichen Zellen. Natur 489, 101–108 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Batista, PJ & Chang, HY Lange nichtkodierende RNAs: zelluläre Adresscodes in Entwicklung und Krankheit. Zelle 152, 1298–1307 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Klattenhoff, CA et al. Braveheart, eine lange nichtkodierende RNA, die für die Bindung kardiovaskulärer Abstammungslinien erforderlich ist. Zelle 152, 570–583 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Grote, P. et al. Die gewebespezifische lncRNA Fendrr ist ein wesentlicher Regulator der Herz- und Körperwandentwicklung bei der Maus. Entwickler Zelle 24, 206–214 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Viereck, J. et al. Lange nichtkodierende RNA-Chast fördert den Umbau des Herzens. Wissenschaft. Übers. Med. 8, 326ra322 (2016).

Artikel Google Scholar

Liu, J., Li, Y., Lin, B., Sheng, Y. & Yang, L. HBL1 ist eine lange nichtkodierende RNA des Menschen, die die Entwicklung von Kardiomyozyten aus pluripotenten Stammzellen moduliert, indem sie MIR1 entgegenwirkt. Entwickler Zelle 42, 333–348 e335 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Anderson, KM et al. Die Transkription der nichtkodierenden RNA-Oberhand steuert die Hand2-Expression und die Herzentwicklung. Natur 539, 433–436 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Ritter, N. et al. Der lncRNA-Locus reguliert zweifellos Herzgenprogramme und ist für die frühe Mausentwicklung von wesentlicher Bedeutung. Entwickler Zelle 50, 644–657.e648 (2019).

Artikel CAS PubMed Google Scholar

Wilson, KD et al. Endogene Retrovirus-abgeleitete lncRNA BANCR fördert die Migration von Kardiomyozyten bei Menschen und nichtmenschlichen Primaten. Entwickler Zelle 54, 694–709.e699 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Li, H. et al. lncExACT1 und DCHS2 regulieren das physiologische und pathologische Herzwachstum. Verkehr. https://doi.org/10.1161/CIRCULATIONAHA.121.056850 (2022).

Meng, Q. et al. Die lange nichtkodierende RNA von DGCR5 kann die Expression mehrerer mit Schizophrenie in Zusammenhang stehender Gene regulieren. Wissenschaft. Übers. Med. https://doi.org/10.1126/scitranslmed.aat6912 (2018).

Alinejad-Rokny, H., Heng, JIT & Forrest, ARR Gehirnangereicherte kodierende und lange nichtkodierende RNA-Gene sind in CNVs mit wiederkehrenden neurologischen Entwicklungsstörungen überrepräsentiert. Cell Rep. 33, 108307 (2020).

Artikel CAS PubMed Google Scholar

Richter, F. et al. Genomanalysen deuten auf nichtkodierende De-novo-Varianten bei angeborenen Herzfehlern hin. Nat. Genet. 52, 769–777 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Meerschaut, I. et al. Eine Neubewertung der Variationen der Kopienzahl bei angeborenen Herzfehlern: Darstellung des gesamten Genoms. Gene (Basel). https://doi.org/10.3390/genes12071048 (2021).

Langfelder, P. & Horvath, S. WGCNA: ein R-Paket für die gewichtete Korrelationsnetzwerkanalyse. BMC Bioinform. 9, 559 (2008).

Artikel Google Scholar

Li, Z. et al. LncExpDB: eine Expressionsdatenbank menschlicher langer nichtkodierender RNAs. Nukleinsäuren Res. 49, D962–D968 (2021).

Artikel CAS PubMed Google Scholar

Li, X. et al. Die 15q11.2-Deletion ist bei Patienten mit vollständig anomaler pulmonalvenöser Verbindung verstärkt. J. Med. Genet. https://doi.org/10.1136/jmedgenet-2019-106608 (2020).

Soemedi, R. et al. Beitrag globaler seltener Kopienzahlvarianten zum Risiko sporadischer angeborener Herzerkrankungen. Bin. J. Hum. Genet. 91, 489–501 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Silversides, CK et al. Seltene Variationen der Kopienzahl bei Erwachsenen mit Fallot-Tetralogie deuten auf neuartige Risikogenwege hin. PLoS Genet. 8, e1002843 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Xie, L. et al. Seltene De-novo-Kopienzahlvarianten bei Patienten mit angeborener Lungenatresie. PLoS ONE 9, e96471 (2014).

Artikel PubMed PubMed Central Google Scholar

Glessner, JT et al. Erhöhte Häufigkeit von De-novo-Kopienzahlvarianten bei angeborenen Herzfehlern durch integrative Analyse von Einzelnukleotid-Polymorphismus-Arrays und Exomsequenzdaten. Zirkel. Res. 115, 884–896 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Sanchez-Castro, M. et al. Die Suche nach seltenen Varianten der Kopienzahl bei angeborenen Herzfehlern identifiziert neue Kandidatengene und eine mögliche Rolle für FOXC1 bei Patienten mit Aortenisthmusstenose. Zirkel. Herz-Kreislauf. Genet. 9, 86–94 (2016).

Artikel CAS PubMed Google Scholar

Costain, G. et al. Genomweite Variationen seltener Kopienzahlen tragen zum genetischen Risiko einer Transposition der großen Arterien bei. Int. J. Cardiol. 204, 115–121 (2016).

Artikel PubMed Google Scholar

Ma, L. et al. LncBook: eine kuratierte Wissensdatenbank über lange nichtkodierende menschliche RNAs. Nukleinsäuren Res. 47, D128–D134 (2019).

Artikel CAS PubMed Google Scholar

Li, Z. et al. LncBook 2.0: Integration menschlicher langer nichtkodierender RNAs mit Multi-Omics-Annotationen. Nukleinsäuren Res. https://doi.org/10.1093/nar/gkac999 (2022).

Zhang, X. et al. FGD5-AS1 ist eine Hub-lncRNA-ceRNA in Herzen mit Fallot-Tetralogie, die Gene für angeborene Herzerkrankungen transkriptionell und epigenetisch reguliert. Vorderseite. Zellentwickler. Biol. 9, 630634 (2021).

Artikel PubMed PubMed Central Google Scholar

Zhang, J., Liu, L., Li, J. & Le, TD LncmiRSRN: Identifizierung und Analyse eines langen, nicht-kodierenden RNA-bezogenen miRNA-Schwamm-Regulationsnetzwerks bei menschlichem Krebs. Bioinformatik 34, 4232–4240 (2018).

Artikel CAS PubMed Google Scholar

Abrahams, BS et al. SFARI Gene 2.0: eine von der Community betriebene Wissensdatenbank für Autismus-Spektrum-Störungen (ASDs). Mol. Autismus 4, 36 (2013).

Artikel PubMed PubMed Central Google Scholar

Morton, SU, Quiat, D., Seidman, JG & Seidman, CE Genomische Grenzen bei angeborenen Herzfehlern. Nat. Rev. Cardiol. 19, 26–42 (2022).

Artikel PubMed Google Scholar

Zhao, W. et al. Hochauflösende Analyse von Kopienzahlvarianten bei Erwachsenen mit leichtem bis mittelschwerem angeborenem Herzfehler. Bin. J. Med. Genet. A 161A, 3087–3094 (2013).

Artikel PubMed Google Scholar

Alexanian, M. & Ounzain, S. Lange nichtkodierende RNAs in der Herzentwicklung. Kalter Frühling Harb. Perspektive. Biol. https://doi.org/10.1101/cshperspect.a037374 (2020).

Yang, L. et al. CHDGKB: eine Wissensdatenbank zum systematischen Verständnis genetischer Variationen im Zusammenhang mit nicht-syndromalen angeborenen Herzfehlern. Datenbank (Oxford). https://doi.org/10.1093/database/baaa048 (2020).

Quinlan, AR & Hall, IM BEDTools: eine flexible Suite von Dienstprogrammen zum Vergleich genomischer Merkmale. Bioinformatik 26, 841–842 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Yu, G., Wang, LG, Han, Y. & He, QY ClusterProfiler: ein R-Paket zum Vergleich biologischer Themen zwischen Genclustern. OMICS 16, 284–287 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Hao, Y. et al. NPInter v3.0: eine aktualisierte Datenbank nichtkodierender RNA-assoziierter Interaktionen. Datenbank (Oxford). https://doi.org/10.1093/database/baw057 (2016).

Chou, CH et al. miRTarBase-Update 2018: eine Ressource für experimentell validierte microRNA-Zielinteraktionen. Nukleinsäuren Res. 46, D296–D302 (2018).

Artikel CAS PubMed Google Scholar

Vlachos, IS et al. DIANA-TarBase v7.0: Indizierung von mehr als einer halben Million experimentell unterstützter miRNA:mRNA-Interaktionen. Nukleinsäuren Res. 43, D153–D159 (2015).

Artikel CAS PubMed Google Scholar

Kopylova, E., Noe, L. & Touzet, H. SortMeRNA: schnelle und genaue Filterung ribosomaler RNAs in metatranskriptomischen Daten. Bioinformatik 28, 3211–3217 (2012).

Artikel CAS PubMed Google Scholar

Dobin, A. et al. STAR: ultraschneller universeller RNA-seq-Aligner. Bioinformatik 29, 15–21 (2013).

Artikel CAS PubMed Google Scholar

Liao, Y., Smyth, GK & Shi, W. featureCounts: ein effizientes Allzweckprogramm zum Zuweisen von Sequenzablesungen zu genomischen Merkmalen. Bioinformatik 30, 923–930 (2014).

Artikel CAS PubMed Google Scholar

Love, MI, Huber, W. & Anders, S. Moderierte Schätzung der Faltungsänderung und Streuung für RNA-seq-Daten mit DESeq2. Genombiol. 15, 550 (2014).

Artikel PubMed PubMed Central Google Scholar

Cardoso-Moreira, M. et al. Genexpression in der Organentwicklung von Säugetieren. Natur 571, 505–509 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Strober, BJ et al. Dynamische genetische Regulation der Genexpression während der Zelldifferenzierung. Wissenschaft 364, 1287–1290 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Kent, WJ et al. Der menschliche Genombrowser an der UCSC. Genomres. 12, 996–1006 (2002).

Artikel CAS PubMed PubMed Central Google Scholar

Tonidandel, S. & LeBreton, JM RWA Web: ein kostenloses, umfassendes, webbasiertes und benutzerfreundliches Tool für relative Gewichtsanalysen. J. Bus. Psychol. 30, 207–216 (2015).

Artikel Google Scholar

Sicko, RJ et al. Genetische Varianten der isolierten Ebstein-Anomalie, die an den Entwicklungswegen des Myokards beteiligt sind. PLoS ONE 11, e0165174 (2016).

Artikel PubMed PubMed Central Google Scholar

Yagi, H. et al. Rolle von TBX1 beim menschlichen del22q11.2-Syndrom. Lancet 362, 1366–1373 (2003).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Wir danken allen Teilnehmern für ihre Mitarbeit bei dieser Forschung. Wir danken auch Frau MJ Zhou von Fresenius Medical Care für die Bearbeitung des englischen Textes eines Entwurfs dieses Manuskripts. Diese Arbeit wurde vom National Key R&D Program of China [2021YFC2701104 an Qh.F.] unterstützt; National Natural Science Foundation of China [82172352 an BW, 82072372 an Qh.F.]; Pudong Science Technology and Economy Commission [PKJ2022-Y04 bis BW]; Nationale Einrichtung für translationale Medizin (Shanghai) [TMSK-2021-133 an BW]; und Shanghai Municipal Science and Technology [20JC1418500, 21Y31900300 und 20dz2260900 bis Qh.F.].

Diese Autoren haben gleichermaßen beigetragen: Yibo Lu, Qing Fang, Ming Qi.

Institut für pädiatrische translationale Medizin, Shanghai Children's Medical Center, School of Medicine, Shanghai Jiao Tong University, Shanghai, China

Yibo Lu, Qing Fang, Ming Qi, Xingyu Zhang, Yuwan Lin, Ying Xiang, Qihua Fu und Bo Wang

Abteilung für medizinische Genetik und molekulardiagnostisches Labor, Shanghai Children's Medical Center, School of Medicine, Shanghai Jiao Tong University, Shanghai, China

Xiaoliang Li

Shanghai Key Laboratory of Clinical Molecular Diagnostics for Pediatrics, Shanghai, China

Ying Xiang, Qihua Fu und Bo Wang

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Yb.L. und BW trug zur Literaturrecherche, zum Studiendesign, zur Datenerfassung, Datenanalyse, Dateninterpretation und zum Verfassen des Manuskripts bei; QF, MQ, XL, Yw.L. und XZ trugen zur Datenerfassung, experimentellen Validierung, Dateninterpretation und Manuskripterstellung bei; YX, Qh.F. und BW trugen zur Aufsicht aller Aspekte der Studie und Manuskripterstellung bei. Die Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Ying Xiang, Qihua Fu oder Bo Wang.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Communications Biology dankt Marlin Touma und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptredakteur: George Inglis. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Lu, Y., Fang, Q., Qi, M. et al. Mit der Variation der Kopienzahl assoziierte lncRNAs können zur Entstehung angeborener Herzerkrankungen beitragen. Commun Biol 6, 189 (2023). https://doi.org/10.1038/s42003-023-04565-z

Zitat herunterladen

Eingegangen: 23. Juni 2022

Angenommen: 08. Februar 2023

Veröffentlicht: 17. Februar 2023

DOI: https://doi.org/10.1038/s42003-023-04565-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

AKTIE