Inligting

Motiewe in ongerigte netwerke

Motiewe in ongerigte netwerke


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ek het 'n ongerigte netwerk en ek is tans besig om beide drie en 4 nodus motiewe in die netwerk te ontleed. Ek kan egter geen artikels vind wat die biologiese betekenis van 3 van 4 nodusmotiewe in my netwerk beskryf nie. In vergelyking met ewekansige gegenereerde netwerke, kan ek aflei dat die aantal drie nodusmotiewe en 4 nodusmotiewe aansienlik hoër is. Ek kan egter geen biologiese betekenis vir hierdie bevinding aflei nie.


Ek is nie 100% seker dat ek die vraag verstaan ​​nie, maar ek gaan probeer om te antwoord, gebaseer op die volgende aannames:

  1. Die "aantal 3 en 4 nodus motiewe" is nie baie duidelik nie. As ek reg verstaan, behoort dit 'n hoeveelheid te wees wat grootliks deur die graadverspreiding bepaal word. Jy kan jou netwerk herbedraad om alle inligting oor die TRN behalwe graadverspreiding te verloor en hierdie nommer is waarskynlik baie soortgelyk (of dit is 'n nogal vreemde netwerk, wat my agterdogtig sou maak oor die data).
  2. Daarom is die aantal sulke motiewe van grootte $k$ nie besonder interessant biologies nie, spesifiek as gevolg van tegniese kwessies soos onvolledige vasstelling van rande, ens. Die ware netwerk kan baie meer rande hê, en dit sal hierdie getal verander, dus die graadverspreiding is nie self interessant nie - dit is in werklikheid die ding waarvoor jy wil beheer.
  3. Daarom, wanneer jy met ewekansig gegenereerde netwerke vergelyk en verskillende getalle motiewe van $k$ nodes vind, vermoed ek dat die ewekansige netwerke met 'n ander graadverspreiding gegenereer is. (Dit is redelik maklik om netwerke van dieselfde graadverspreiding te genereer, met behulp van bvherdraad()funksie in igraph)
  4. Daarom interpreteer ek die vraag meer spesifiek: "Tussen al 3 en 4 nodusmotiewe is 'n subset oorverteenwoordig in my TRN in vergelyking met ewekansige grafieke van dieselfde graadverspreiding. Wat is 'n paar maniere om hierdie motiewe te interpreteer?" Dit is die soort vraag wat tradisioneel met TRN'e gevra word in my ervaring.

As 'n voorbeeld van hoe ander groepe TRN-motiewe ontleed het, stel ek voor om na Figuur 5 en 6 van hierdie vraestel te kyk. Byvoorbeeld, die "toevoer"-motief word oorverteenwoordig vir skakels wat sommige TF's betrek. Ek glo dat dit standaard is om motiefverspreidings met ander biologiese netwerke te vergelyk, soos die C. elegans neurale netwerk. Daar is verwysings in die Sel-vraestel wat jou waarskynlik verder kan help. Die wikipedia-artikel oor netwerkmotiewe het blykbaar ook inligting, en daar is ander hulpbronne op die internet as jy google.

Alhoewel daar nie noodwendig 'n streng biologiese interpretasie van sulke motiewe is nie, kan hulle nietemin insiggewend wees om spesifieke patrone eie aan verskillende TF's of meesterreguleerders te identifiseer.

Waarskuwing Dit is moontlik dat ek die vraag verkeerd verstaan ​​het of slegte aannames gemaak het - my grafiekteorie is oppervlakkig. Maar as ek verkeerd is en jy stel eintlik belang in die eenvoudige aantal motiewe van grootte $k$, is daardie waarneming van belang as 'n "Ek het 'n vreemde grafiek" teoretiese probleem, nie as 'n "dit is biologies interessant" probleem. As 'n bioloog sal ek baie meer omgee oor watter spesifieke motiewe van grootte $k$ jy het, eerder as die gesommeerde telling van alle motiewe van grootte $k$.

Aan die ander kant, om vir 'n oomblik van motiewe te vergeet, kan 'n "vreemde" netwerk biologies nogal topologies interessant wees. Assosieer jou verskillende gegroepeerde komponente byvoorbeeld met verskillende stukke biologie, soos suikermetabolisme vs. morfogenese? Dit sou verwag word, maar dit het baie min te doen met motiewe - hulle kan net 'n newe-effek van daardie funksionele topologie wees. In daardie geval sal dit nie net graadverspreiding wees nie, maar ook daardie topologie waarvoor jy sal moet beheer om interessante stellings oor motiewe te maak.

Sterkte!


Biologiese netwerkmotiefopsporing en -evaluering

Molekulêre vlak van biologiese data kan gekonstrueer word in sisteemvlak van data as biologiese netwerke. Netwerkmotiewe word gedefinieer as oorverteenwoordigde klein gekoppelde subgrafieke in netwerke en hulle is vir baie biologiese toepassings gebruik. Aangesien die ontdekking van netwerkmotief rekenkundig uitdagende prosesse behels, het vorige algoritmes op berekeningsdoeltreffendheid gefokus. Ons glo egter dat die biologiese kwaliteit van netwerkmotiewe ook baie belangrik is.

Resultate

Ons definieer biologiese netwerkmotiewe as biologies betekenisvolle subgrafieke en tradisionele netwerkmotiewe word in hierdie artikel as strukturele netwerkmotiewe gedifferensieer. Ons ontwikkel vyf algoritmes, naamlik E DGE GO-BNM, E DGE B ETWEENNESS-BNM, NMF-BNM, NMFGO-BNM en V OLTAGE-BNM, vir doeltreffende opsporing van biologiese netwerkmotiewe, en stel verskeie evalueringsmaatreëls in, insluitend motiewe ingesluit in kompleks, motiewe ingesluit in funksionele module en GO term groepering telling In hierdie dokument. Eksperimentele resultate toon dat E DGE GO- BNM en E DGE B ETWEENNESS-BNM beter presteer as bestaande algoritmes en al ons algoritmes is ook van toepassing om strukturele netwerkmotiewe te vind.

Afsluiting

Ons bied nuwe benaderings om netwerkmotiewe in biologiese netwerke te vind. Ons algoritmes bespeur biologiese netwerkmotiewe doeltreffend en verbeter bestaande algoritmes verder om strukturele netwerkmotiewe van hoë gehalte te vind, wat onmoontlik sou wees deur bestaande algoritmes te gebruik. Die prestasies van die algoritmes word vergelyk op grond van ons nuwe evalueringsmaatreëls in biologiese kontekste. Ons glo dat ons werk 'n paar riglyne gee van navorsing oor netwerkmotiewe vir die biologiese netwerke.


Inleiding

Komplekse verhoudingsisteme uit verskillende domeine, soos biologie, sosiologie of ekonomie, kan sistematies ontleed word deur hul netwerkvoorstellings te gebruik. A netwerk (ook bekend as a grafiek) is saamgestel uit nodusse en rande, waar nodusse verteenwoordig die entiteite in die stelsel en rande verteenwoordig die verhoudings tussen hierdie entiteite. Afhangende van die tipe voorgestelde verhoudings, kan die noduspare wat die rande vorm 'n sekere volgorde hê, in welke geval die resulterende netwerk genoem word gerig. Byvoorbeeld, in netwerke van biologiese neurone en sinapse (ook bekend as neuronale verbindings [1]), stem die nodusse ooreen met individuele neurone, terwyl gerigte rande tussen die nodusse (tipies) die bestaan ​​van chemiese sinapse verteenwoordig wat kommunikasie tussen neurone moontlik maak [2]. Die bedradingspatrone van netwerke werp lig op die funksionele meganismes van die geanaliseerde komplekse stelsels, en daarom kry netwerkstruktuurontleding toenemende belangstelling van verskillende dissiplines.

Baie netwerkontledingsprobleme is egter rekenaarmatig onoplosbaar [3]. Daarom is die enigste beskikbare oplossings gebaseer op benaderings tot die presiese oplossings van hierdie probleme. Netwerk eienskappe wat verskillende bedradingeienskappe van netwerke beskryf, word vir hierdie doel gebruik. Byvoorbeeld, gegewe twee netwerke sonder enige byskrifte op die nodusse, is die probleem om al die noduspare te vind wat identiese bedradingspatrone in die twee netwerke het, 'n rekenaarmatig onoplosbare probleem. Hierdie probleem kan egter vereenvoudig word deur die te bereken grade (m.a.w. die aantal bure wat 'n nodus het) van alle nodusse en die gebruik van die graadstatistieke om die nodusse te vergelyk. Selfs as die gevolglike passings nie gewaarborg word om identiese bedradingspatrone te hê nie, sal hierdie passings die grootte van die soekspasie aansienlik verminder. Die soekruimte kan selfs verder verminder word deur ander netwerkeienskappe te bereken wat verskillende tipes interaksiepatrone vasvang, bv. deur die ooreenkomste van groeperingskoëffisiënte wat die neiging van nodusse meet om driehoekige interaksies te vorm [4].

Anders subgrafieke van 'n netwerk kan verkry word vanaf verskillende subsets van sy nodusse en rande. Baie van die netwerkeienskappe is inderdaad afhanklik van die subgrafiekeienskappe van die netwerke, bv. groeperingkoëffisiënt word gedefinieer gebaseer op drie-nodus subgrafieke van 'n netwerk waarin alle nodusse met mekaar verbind is en 'n driehoek vorm. In 'n verbind subgrafiek, is alle nodusse bereikbaar vanaf enige van die ander nodusse in die subgrafiek. 'n Subgrafiek is geïnduseer (ook bekend as nodus geïnduseer) as dit afgedwing word dat al die rande tussen die gekose subset nodusse by die subgrafiek ingesluit is. Die subgrafieke wat nie die geïnduseerde eienskap dra nie, word genoem gedeeltelik (ook bekend as rand geïnduseer) subgrafieke. Byvoorbeeld, 'n 3-nodus kliek bevat 3 verskillende twee-pad subgrafieke (twee-pad subgrafieke is dié wat 3 nodusse en 2 rande bevat) wanneer gedeeltelike subgrafiek eienskappe in ag geneem word. So 'n grafiek bevat egter geen twee-pad subgrafieke wanneer geïnduseerde subgrafiek eienskappe in ag geneem word nie.

Driehoekige patrone in netwerke word algemeen gebruik om die netwerktopologie te ontleed. In ongerigte netwerke, die groeperingskoëffisiënt van 'n nodus word bereken deur die aantal driehoeke rondom die nodus te deel deur die aantal verskillende pare van sy bure [5]. Gemiddelde groeperingskoëffisiënt verduidelik die groepering (triangulasie) binne 'n netwerk deur middel van die groeperingskoëffisiënte van al sy nodusse. Uitbreiding van groeperingskoëffisiënt na gerigte netwerke is nie triviaal nie aangesien daar twee verskillende tipes driehoekgerigte subgrafieke is, een is 'n sikliese subgrafiek (m =𠂥 in Fig. 1 en ​ en2) 2) en die ander is 'n asikliese subgrafiek (m =𠂩 in Fig. 1 en ​ en2). 2). Gebaseer op die tellings van die vier afsonderlike nodusrolle op hierdie twee subgrafieke (d.w.s. en 18 in Fig. 1 en ​ en2), 2), is die definisie van groeperingskoëffisiënt uitgebrei na die gerigte geval [4], [6]. 'n Ander maatstaf vir die kwantifisering van netwerkgroepering bekend as oorganklikheid word bereken deur elke moontlike kombinasie van drie nodusse in 'n netwerk te oorweeg, en te tel hoeveel van hierdie drieklanke onderling verbind is deur drie rande, genormaliseer deur die aantal drieklanke met ten minste twee rande [7]. Dit is soortgelyk aan groeperingskoëffisiënt, maar anders as daardie metrieke, is dit nie 'n gemiddelde van plaaslike nodusspesifieke groepering nie. Transitiwiteit word tipies gebruik vir ongerigte netwerke eerder as gerigte netwerke, maar 'n uitdrukking vir gerigte transitiwiteit word gegee in [8].

'n Gerigte netwerk word veronderstel. Die numeriese etiket vir elke motief (aangedui met die etiket m) is identies aan dié wat in [9] gebruik word. Elke afsonderlike motief-rol binne elke motief word aangedui deur verskillende kleure, en die numeriese etiket langs elke nodus. Die numeriese etiket wat vir elke motiefrol verskaf word, word deur die etiket voorgestel in die teks en in Fig. 2, waar .

Die eerste kolom beeld die 9 afsonderlike rolle op funksionele motiewe uit. Elke ry wys elke drie-nodus motief waarin die ooreenstemmende rol verskyn (geïndexeer deur ), en die pluraliteit met watter motief-rol verskyn binne die motief (sien Metodes). Swart gevulde sirkels dui die nodusse in motief aan wat motief-rol speel (sien ook Fig. 1). Die vergelykings wat vir elke rol gewys word, r, is die inskrywings van die funksionele motief-rol vingerafdrukmatriks, , waar dui die Hadamard-produk aan, is 'n eenheid kolom matriks, is die identiteitsmatriks, en is die matriks van wederkerige rande.

Onlangse werk oor netwerkeienskappe gebruik die statistieke van alle waarneembare gekoppelde subgrafiekkonfigurasies as gedetailleerde beskrywings van die bedrading in netwerke [9], [10]. Netwerkmotiewe is oorspronklik gedefinieer as die gedeeltelike subgrafiekpatrone van 'n netwerk wat meer gereeld voorkom as wat verwag word van 'n ’nul-hipotese’ netwerkmodel wat die insetnetwerk se graadverspreiding, of ander statistiese eienskappe bewaar [9], [11]– [15]. Netwerkmotiewe word gedefinieer vir beide gerigte en ongerigte netwerke, en dek alle waarneembare subgrafieke patrone op stelle nodusse wat in dimensie wissel van 2 tot n. Netwerkmotiewe is gebruik om netwerkstrukture van 'n wye reeks netwerke te analiseer, soos dié van die neuronale konneksoom van C. elegans [16]–[20]. Prakties word netwerkmotiefontledings uitgevoer met 3-node subgrafiekpatrone as gevolg van die hoë berekeningskoste van nulmodelgenereringstap vir groter subgrafieke, alle gerigte 3-node subgrafiekpatrone word in Fig. 1 geïllustreer.

Nog 'n groep netwerkeienskappe wat op subgrafiektellings gebaseer is, is bestudeer in die konteks van grafies𠅍it is klein, gekoppelde, nie-isomorfiese en geïnduseerde subgrafieke van 'n groot netwerk [10]. Daar is drie groot verskille tussen netwerkmotiewe en grafiete:

netwerkmotiewe is verantwoordelik vir gedeeltelike subgrafieke terwyl graflete op geïnduseerde subgrafieke gebaseer is

netwerkmotiewe is afhanklik van 'n gegewe nulnetwerkmodel terwyl graflete heeltemal onafhanklik is van enige nulhipoteses en

grafiete word slegs gedefinieer vir ongerigte grafieke terwyl netwerkmotiewe ook vir gerigte grafieke gedefinieer word.

Die aantal kere wat elke graflet in 'n netwerk verskyn, beskryf die netwerk se topologie [10]. Tans is die mees gevorderde metode om die topologie van 'n ongerigte netwerk te beskryf gebaseer op die afhanklikhede tussen verskillende graflete [21].

Subgrafiese eienskappe is nie net nuttig om die topologie van netwerke te beskryf nie, maar dit kan ook gebruik word om die plaaslike bedrading rondom nodusse te beskryf. Grade beskryf byvoorbeeld die bedrading rondom 'n nodus deur die aantal rande wat die nodus raak te tel. Deur rande met subgrafieke van elke soort in hierdie definisie te vervang, kan die plaaslike bedrading rondom 'n nodus beskryf word deur die aantal subgrafiekpatrone waaraan die nodus deelneem. Terwyl hierdie subgrafiekstatistieke oor nodusse bereken kan word sonder om enige oriëntasies op die subgrafieke af te dwing [8 ], [22], 'n nodus se rol in die netwerk kan meer akkuraat gekarakteriseer word deur die bekendstelling van sulke oriëntasiebeperkings gebaseer op die simmetrieë binne die subgrafieke [23]–[25]. Byvoorbeeld, soos geïllustreer in Figuur 1 van [23], en Fig. 1 hier, is daar 30 unieke motief-rolle op die 3-node gerigte subgraaf konfigurasies. Przulj [25] identifiseer die wentelbane (d.w.s. die nodusse wat identiese bedradingspatrone binne graflete het) van alle 2- tot 5-node graflets en gebruik hierdie wentelbane om die bedrading rondom 'n nodus te beskryf deur te definieer grafiet graad, wat die aantal graflete is wat 'n knoop in 'n wentelbaan raak. Verder word die vektor wat die grafietgrade van al 73 bane van 2- tot 5-node graflete bevat, die grafiet graad vektor en suksesvol toegepas vir die identifisering van die bedradingooreenkomste tussen die nodusse van 'n netwerk, en ook tussen die nodusse van verskillende netwerke [26], [27]. Daar is geargumenteer dat ontleding van neuronale konneksoomdata in ag sal moet neem knooppuntverwysde heterogeniteit [28]–[30], soos gemeet deur grafietgraad. Nog 'n moontlike toepassing is in die ontleding van genetiese netwerke [31].

Die terminologie oor subgrafiese eienskappe is nie goed gedefinieer nie, met sommige studies wat die terme “subgraphs”, “netwerkmotiewe” en “graphlets” uitruilbaar gebruik. Om verwarring te voorkom, gebruik ons ​​die term “funksionele motiewe” om die gedeeltelike subgrafiek-eienskappe voor te stel (bv. netwerkmotief-eienskappe gedefinieer in [9]), en “strukturele motiewe” om die geïnduseerde subgrafiek-eienskappe (bv. graflet-eienskappe gedefinieer in [10], [25]) op 'n konsekwente wyse met [8] voor te stel. Strukturele motiewe kwantifiseer anatomiese boustene, terwyl funksionele motiewe elementêre verwerkingsmodusse van die netwerke verteenwoordig [22]. Hierdie onderskeid tussen strukturele en funksionele subgrafiese eienskappe het verskillende implikasies vir neuronale netwerke: strukturele motiewe beskryf alle sinapse onder 'n spesifieke subset van neurone. Daarteenoor kan funksionele motiewe byvoorbeeld potensiële patrone van werklike sinaptiese aktiverings beskryf wat (naby) gelyktydig tussen 'n spesifieke subset van neurone plaasvind. Daar word verwag om korrelasie tussen strukturele en funksionele subgrafiese eienskappe in 'n mate waar te neem. Alhoewel dit die geval is, verskil die bedradingeienskappe wat deur hierdie twee tipes subgrafieke vasgelê kan word. Byvoorbeeld, 'n nodus se belangrikheid in die netwerke as 'n ‘makelaar’ (bv. in Fig. 2) kan slegs deur strukturele motiewe vasgevang word aangesien funksionele motiewe ook die gevalle oorweeg dat die nodus as rolle verskyn of 19 (Fig. 2). In hierdie gevalle is die verwysingsnodus nie 'n makelaar nie as gevolg van die rand tussen die twee ander nodusse.

Vir beide strukturele en funksionele motiewe, oorweeg ons vier verskillende tipes subgraaffrekwensie-afgeleide netwerkeienskappe, soos volg:

Globale statistieke: Hierdie metrieke het ten doel om die topologie van 'n hele netwerk te beskryf.

Motief tel: 'n Netwerk se topologie kan beskryf word deur die aantal subgrafieke wat in die netwerk verskyn. Ons gebruik die term motief tel om hierdie netwerkstatistieke voor te stel. Anders as die oorspronklike definisie van netwerkmotiewe [9] (maar in ooreenstemming met gebruik in [8]), is ons motiefstatistieke onafhanklik van enige vergelyking met nulhipotese-netwerkmodel. Vir 'n gegewe netwerk vorm die ooreenstemmende motieftellings a M. dimensionele vektor, elke waarde verteenwoordig die telling vir een van die M. subgrafieke.

Motief-rol tel: 'n Netwerk se topologie kan ook beskryf word in terme van die rolle binne subgrafieke. Ons gebruik die term motief-rol tel om die aantal kere wat 'n gegewe motiefrol in 'n netwerk voorkom, voor te stel. Motief-roltellings kan direk verkry word deur die motieftellings te skaal na gelang van die aantal kere wat die motiefrol binne die ooreenstemmende subgrafiek verskyn. Vir 'n gegewe netwerk vorm die ooreenstemmende motief-roltellings 'n L dimensionele vektor, elke waarde verteenwoordig die aantal kere een van die L nodusrolle verskyn in die netwerk.

Nodus-verwysde maatstawwe: Hierdie maatstawwe het ten doel om die plaaslike topologie rondom 'n nodus in die netwerk te beskryf.

Motief Vingerafdrukke: Die bedrading rondom 'n nodus in 'n netwerk kan beskryf word deur die aantal subgrafiekpatrone waaraan dit deelneem, onafhanklik van die posisie (d.i. die rol) op hierdie subgrafieke. Sulke statistieke is genoem motief vingerafdrukke [8], [22]. Vir elk van die N nodusse in 'n gegewe netwerk, is die ooreenstemmende motiefvingerafdrukke M. dimensionele vektore, elke waarde wat ooreenstem met telling van een van die M. subgrafieke waaraan die nodus deelneem.

Motief-rol vingerafdrukke: Die bedrading rondom 'n nodus in die netwerk kan in 'n fyner detail beskryf word deur die aantal subgrafieke wat die nodus op 'n spesifieke oriëntasie raak (d.w.s. op 'n nodus-rol binne die subgraaf). Ons noem sulke statistieke as motief-rol vingerafdrukke. Vir elk van die N nodusse in 'n gegewe netwerk, is die ooreenstemmende motief-rol vingerafdrukke L dimensionele vektore, elke waarde wat ooreenstem met die aantal subgrafieke wat 'n nodus raak by een van die L nodus-rol posisies.

In hierdie studie ondersoek ons ​​die verwantskappe tussen al hierdie verskillende tipes subgrafiekstatistieke (sien Fig. 3). Eerstens bied ons doeltreffende maniere aan om die funksionele motief-rol vingerafdrukke van 'n gegewe gerigte netwerk te bereken. Tweedens wys ons dat strukturele motiefstatistieke afgelei kan word van funksionele motiefstatistieke en omgekeerd. Hierdie transformasie maak doeltreffende berekening van strukturele motief-vingerafdrukke moontlik wat berekeningsgewys duurder is om te verkry. Derdens wys ons dat die motief-rol-vingerafdrukke die mees fundamentele en insiggewende van al die ander subgrafiek-metrieke is. Ons identifiseer die transformasies wat alle ander subgrafiekstatistieke (d.i. motiefvingerafdrukke, motiefroltellings, motieftellings) van die motiefrolvingerafdrukke aflei. Vierdens bespreek ons ​​die verwantskappe tussen motief-rol-vingerafdrukke en gerigte groeperingskoëffisiënte en transitiwiteite, en wys hoe dit van motief-rol-vingerafdrukke afgelei kan word. Laastens illustreer ons toepassings van hierdie transformasies op die neuronale konneksoom van c. elegans.

Pyle dui aan dat metrieke van ander metrieke afgelei kan word en getalle tussen hakies verwys na vergelykings in die teks wat hierdie afhanklikhede wiskundig beskryf. Die linkerkant van die figuur lys maatstawwe wat subgrafieke tel, terwyl die regterkant maatstawwe toon wat verhoudings van subgrafiektellings is. Die boonste helfte van die figuur toon metrieke wat nodusverwysde subgrafiektellings is, terwyl die onderste helfte metrieke toon wat globale subgrafiektellings is.


Eerstens laai ons die pakkie.

Visualiseer 'n multi-vlak netwerk

Die volgende netwerk is 'n voorbeeldnetwerk uit 'n empiriese ontleding van vleilandebestuur in Switserland. Dit bestaan ​​uit twee vlakke - een vlak spesifiseer 'n netwerk van verhoudings tussen akteurs. 'n Tweede vlak spesifiseer 'n netwerk van verhoudings tussen verskillende aktiwiteite wat in die vleiland voorkom, gebaseer op oorsaaklike interafhanklikheid tussen aktiwiteite. Skakels tussen die vlakke spesifiseer watter akteurs watter aktiwiteite uitvoer.

Dit is moontlik om uitlegte vir elke netwerkvlak afsonderlik te spesifiseer. Hieronder is een vlak gegrond op 'n sirkeluitleg, die tweede een gebaseer op Kamada-Kawai.

motifr bied 'n betroubare beginpunt vir multi-vlak netwerk visualisering, maar is gefokus op motief analise in sy kern. Vir gevorderde visualisering van multi-vlak netwerke beveel ons aan om ggraf en grafiekuitlegte te koppel. Hierdie blogpos bied 'n uitstekende inleiding.

Kies motiewe

Sien die vignet op die motief dieretuin ( vignet("motif_zoo") vir besonderhede oor nomenklatuur vir motiewe (motief identifiseerder stringe). Ons beveel die gebruik van twee helperfunksies wat in motifr geïmplementeer is sterk aan om te verseker dat die sagteware die motiefidentifiseerder interpreteer soos deur die ontleder bedoel.

gebruik explore_motifs() om 'n blink toepassing te begin waar alle motiewe wat vir analise met motifr geïmplementeer is, vertoon kan word. Jy kan jou eie netwerk deurgee na explore_motifs() om te sien wat motiewe presies vir jou data beteken. Byvoorbeeld, as jou netwerk gestoor word in 'n voorwerp genaamd my_net met 'n vlakkenmerk lvl, kan jy motiewe daarbinne interaktief verken deur explore_motifs(net = my_net, lvl_attr = "lvl") te gebruik. Wees bewus daarvan dat as jou netwerk nie 'n spesifieke motief bevat nie, dit nie vertoon kan word nie.

kontroleer 'n spesifieke motief van belang deur gebruik te maak van show_motif() , wat óf die motief in 'n dummy-voorbeeldnetwerk sal illustreer óf, as jy 'n netwerkvoorwerp na die funksie deurgee, in jou netwerk. show_motif() is spesifiek nuttig om die impak van posisiepassing te verken (sien vignet ("motif_zoo") vir meer besonderhede).

Tel motiewe

Motiewe kan getel word deur die veelsydige funksie count_motifs() te gebruik. Dit neem as parameters 'n statnet netwerk of igraph grafiek voorwerp (gebruik ml_net of dummy_net verskaf deur hierdie pakket as voorbeelde) en 'n lys van motief identifiseerders (sien hieronder) wat die motiewe spesifiseer.

Kom ons kyk gou na twee klassieke voorbeelde van drie-nodes, twee-vlak motiewe (oop en geslote driehoeke) in die vleilande bestuursnetwerk hierbo bekendgestel:

Kom ons tel die aantal van hierdie motiewe in die hele netwerk.

'n Verkennende benadering kan gevolg word deur motif_summary() te noem. Hierdie funksie tel die voorkoms van 'n paar basiese motiewe. Verder bereken dit verwagtinge en variansies vir die voorkoms van hierdie motiewe in 'n gewysigde Erdős-Rényi of sogenaamde "Actor's choice" model. Sien die pakketvignet ("random_baselines") vir besonderhede.

Identifiseer gapings en kritieke rande

motifr maak dit moontlik om gapings en kritieke rande in multi-vlak netwerke te identifiseer. Dit word gemotiveer deur teorieë van funksionele passing en wanpassing in netwerke, wat beweer dat sekere motiewe veral waardevol is vir netwerkuitkomste (afhangende van die konteks).

Met betrekking tot gapings kan ons dus probeer om potensiële rande te identifiseer wat 'n groot aantal van 'n gegewe motief sou skep as hulle sou bestaan ​​("geaktiveer" of "omgekeer"). Die aantal sulke motiewe wat deur 'n rand geskep word, is hul bydrae. Byvoorbeeld, ons kan alle rande kry wat geslote driehoeke sou skep ("1,2[II.C]"), insluitend die inligting oor hoeveel sulke driehoeke hulle vir die vleilande-gevallestudienetwerk sou skep:

Ons kan ook hierdie gapings op verskeie maniere in ons netwerk plot, insluitend die opsie om slegs na gapings bo 'n sekere gewig (bydrae) en verskillende vlakke van fokus te kyk om slegs nodusse te wys wat by sulke gapings betrokke is. Hier weer vir die vleilandebestuursnetwerk, wys slegs gapings met 'n gewig bo 5 en onderstel die vlak waar ons gapings ontleed om slegs nodusse te bevat wat by gapings betrokke is.

identifi_gaps het 'n broer of suster in kritieke_dyads . Critical_dyads werk omgekeerd van die identifisering van gapings - dit ontleed vir elke bestaande rand hoeveel gevalle van 'n gegewe motief sou verdwyn as die rand verwyder sou word. Hieronder 'n voorbeeld wat kritieke diades in 'n plot van die volledige vleilandebestuursvoorbeeldnetwerk toon.

Vergelyk motiefvoorkoms met 'n basislynmodel

Motifr kan gebruik word om 'n basislyn van netwerke te simuleer om mee te vergelyk. Motieftellings in 'n empiriese netwerk kan dan vergelyk word met die verspreiding van motieftellings in die netwerke wat vanaf die basislynmodel gesimuleer is. Vier verskillende maniere om modelle vir basislynverspreidings te spesifiseer, word in motifr geïmplementeer, van 'n basiese Erdős–Rényi-model tot die moontlikheid om 'n eksponensiële ewekansige grafiekmodel (ERGM) te verskaf om simulasies van te teken. Sien die vignet ("random_baselines") vir besonderhede.

Ter illustrasie simuleer ons netwerke vanaf 'n "Actor's choice" basislynmodel hier as 'n basislyn om tellings van oop en geslote driehoeke in die vleilandbestuursnetwerk te vergelyk. Hierdie model hou alle bande vas, behalwe bande op 'n spesifieke vlak. Op hierdie vlak (hier gestel deur vlak op 1 te stel, wat die akteursvlak in hierdie netwerk is), word bande toegelaat om te wissel op grond van 'n vaste waarskynlikheid (Erdős-Rényi) model.

Ons vind dat oop driehoeke baie minder gereeld voorkom en geslote driehoeke baie meer dikwels as in die basislynmodel.

Dit is 'n onverrassende resultaat - alles anders sou kommerwekkend gewees het. Dit dui daarop dat akteurs geneig is om driehoeke oor vlakke heen te sluit vir ander akteurs wat aan dieselfde vleilandbestuurstake werk baie meer dikwels in vergelyking met wat verwag sou word as hulle net ewekansige samewerkingsvennote kies. Ons sou sulke "fit to task" verwag in 'n netwerk van professionele organisasies wat in vleilandbestuur werk. Ons beklemtoon hierdie interpretasie omdat ons wil beklemtoon dat basislynmodelle baie versigtig beoordeel moet word vir wat hulle wesenlik verteenwoordig. Dit is hoekom motifr 'n verskeidenheid basislynmodelkonfigurasies moontlik maak (insluitend toegeruste ergm-voorwerpe).


Identifikasie van belangrike nodusse in gerigte biologiese netwerke: 'n netwerkmotiefbenadering

Identifisering van belangrike nodusse in komplekse netwerke het die afgelope dekade toenemend aandag getrek. Verskeie maatreëls is voorgestel om die belangrikheid van nodusse in komplekse netwerke te karakteriseer, soos die graad, tussenheid en PageRank. Verskillende maatreëls neem verskillende aspekte van komplekse netwerke in ag. Alhoewel daar talle resultate oor ongerigte komplekse netwerke gerapporteer is, is min resultate oor gerigte biologiese netwerke gerapporteer. Gebaseer op netwerkmotiewe en hoofkomponent-analise (PCA), het hierdie artikel ten doel om 'n nuwe maatstaf bekend te stel om nodus belangrikheid in gerigte biologiese netwerke te karakteriseer. Ondersoeke oor vyf werklike biologiese netwerke dui daarop dat die voorgestelde metode werklik belangrike nodusse in verskillende netwerke robuust kan identifiseer, soos die vind van bevelinterneurone, globale reguleerders en nie-hub maar evolusionêr behoue ​​eintlik belangrike nodusse in biologiese netwerke. Ontvanger Operating Characteristic (ROC) kurwes vir die vyf netwerke dui op merkwaardige voorspelling akkuraatheid van die voorgestelde maatstaf. Die voorgestelde indeks verskaf 'n alternatiewe komplekse netwerkmetriek. Potensiële implikasies van die verwante ondersoeke sluit in die identifisering van netwerkbeheer- en reguleringsteikens, biologiese netwerkmodellering en -analise, sowel as genetwerkte medisyne.

Verklaring van belangebotsing

Mededingende belange: Die skrywers het verklaar dat geen mededingende belange bestaan ​​nie.

Syfers

Figuur 1. 'n Werklike biologiese netwerk en...

Figuur 1. 'n Werklike biologiese netwerk en 'n paar netwerkmotiewe.

(a) 'n Drosophila ontwikkelings transkripsie ...

Figuur 2. 'n Illustratiewe voorbeeld.

Figuur 2. 'n Illustratiewe voorbeeld.

(a) 'n Eenvoudige netwerk met ses nodusse. (b) Onderskrifte wat...

Figuur 3. Trosontleding vir die geïdentifiseerde...

Figuur 3. Trosontleding vir die geïdentifiseerde top-30 nodusse in die vyf netwerke gebaseer op...

Figuur 4. ROC-kurwes gebaseer op die...

Figuur 4. ROC-kurwes gebaseer op die beskikbare inligting in die CEN en ECT.

Figuur 5. Evaluering van ek telling via...

Figuur 5. Evaluering van ek telling via ROC-krommes met saamgestelde verwysingstandaarde vir die ...

Figuur 6. Topologiese woonbuurte van verskeie nodusse.

Figuur 6. Topologiese woonbuurte van verskeie nodusse.

(a) Topologiese omgewing van 'n spilpunt, maar nie ...

Figuur 7. Die krommes van verbindingsdigtheid...

Figuur 7. Die krommes van verbindingsdigtheid teenoor vir verskillende rangordemaatstawwe in die ECT...


Metodes

Ons begin deur 'n metode te beskryf wat die telling van bereken F1 en F2 vir 'n gegewe motief in 'n statiese netwerk. Vervolgens beskryf ons moontlike netwerkbedrywighede wat die topologie van die netwerke verander, en bespreek hoe om die telling van dinamies op te dateer F1 en F2 vir elk van hierdie operasies.

Motieftelling in statiese netwerke

Aanvaar dat ons 'n motieftopologie gegee word waarmee aangedui word P. 'n grafiek gegee G, wil ons die telling van bereken F1 en F2 van patroon P in G. Kom ons dui die stel van alle inbedding van P in G met S. Ons dui die kardinaliteit van die stel aan S (d.w.s. F1 tel van P) met |S|. Onthou dat die F2 telling van patroon P is die kardinaliteit van die maksimum stel inbeddings waar twee inbeddings nie rande deel nie. Ons dui so 'n versameling aan met (S^<'>phantom !>). Om die te bereken F2 tel van P, stel ons die konsep van 'n voor oorvleuel grafiek, wat uniek is aan P en G. Kom ons dui die oorvleuelingsgrafiek aan met (phantom !>G^=(V^, E^)) . Hier, elke nodus in V o stem ooreen met 'n inbedding van P gelys in S. Kom ons dui die verwantskap tussen die nodusse in V o en die inbeddings in S met 'n byeksiefunksie ϕ:V oS. Elke rand (u,v) ∈ E o dui aan dat die twee inbeddings ϕ(u) en ϕ(v) deel ten minste een rand.

Ons gebruik die oorvleuelingsgrafiek om die maksimum, nie-oorvleuelende inbeddingstel (S^<'>phantom !>) op 'n iteratiewe wyse. Eerstens vind ons die nodus uV o met die kleinste graad. As daar veelvuldige nodusse met dieselfde kleinste graad is, kies ons lukraak een van hulle. Ons voeg die ooreenstemmende inbedding in ϕ(u) in (S^<'>phantom !>). Sedert (S^<'>phantom !>) bevat slegs nie-oorvleuelende inbeddings, ons verwyder nodus u van V o saam met al die nodusse vV o , sodat (u,v) ∈ E o . Ons herhaal hierdie proses om (phantom !>S^<'>) tot V o word die leë stel.

Motieftelling in dinamiese netwerke

Kom ons dui die gegewe netwerk aan met G=(V,E). Laat ons ook die topologie van die netwerk aandui na die ekste rand invoeging of skrap met G ek=(V,E ek). So, ons het G0=G en ∀ ek≥0,|E ekEek−1|=1. Gegee 'n motieftopologie wat met patroon aangedui word M., bereken ons die F1 en F2 tellings van M. in die aanvanklike netwerk G0 deur die metode te gebruik wat in "Motieftelling in statiese netwerke" onderafdeling beskryf word. As die netwerk G ontwikkel (d.w.s. nuwe rande word bygevoeg en/of uitgevee), die telling van F1 en F2 van M. kan verander. Vervolgens sal ons 'n algoritme wys vir die doeltreffende opdatering van die F1 en F2 tel soos die netwerk ontwikkel G ek aan Gek+1ek≥0. Deur ons algoritme herhaaldelik toe te pas, na elke netwerkwysigingsbewerking, word die motieftelling opgedateer vir 'n arbitrêre groot reeks netwerkopdaterings.

Opdatering van die F1 tel

Ons beskryf nou ons metode vir die opdatering van die telling van F1 van M. as G ek ontwikkel in Gek+1. Ons aanvaar dit F1 vir G ek is bekend. Ons algoritme vir opdatering F1 relies on initially constructing and maintaining an auxiliary data structure that allows for the embeddings containing an edge to be efficiently queried. Thus, at the beginning of our algorithm, we find all embeddings of a given motif M. in the initial network G0. After finding these embeddings, we create a list of embeddings for each edge eE, denoted as D e, which stores all embeddings that contain e. That is, for a motif M., laat m be an embedding in a given network. Toe mD e as em. This data structure, which we refer to as the edge compressed bitmap, is updated each time an edge is either added or deleted. Die F1 is then updated based on the edge compressed bitmap.

Suppose that as the network G ek evolves to Gek+1 die eE ek is deleted. Dit verminder die F1 count of motif M., if the deleted edge is a part of embeddings of M.. Van die edge compressed bitmap, we find the set of embeddings of M. wat bevat e. We remove this set (D e) from the edge compressed bitmap and reduce the F1 count of M. by the cardinality of this set.

Next, assume that an edge eE ek word bygevoeg G ek. Unlike the edge deletion, prior to this update, we do not know whether e is a part of an embedding of M. in Gek+1. We locate such embeddings of M. in Gek+1 as follows. Let us denote the diameter of M. met k. We search the k-neighborhood van e in Gek+1. The set of embeddings of M. wat bevat e can be formed with its neighboring edges. We add this set to the edge compressed bitmap and increase the F1 count of M. by the cardinality of the set of new embeddings.

Updating the F2 count

After updating the F1 count, we proceed to update the F2 count. Updating the F2 count is more challenging than updating F1 because computing the count of F2 is NP-complete [9] and the methods used are heuristics. As gevolg hiervan, die F2 count we compute even for a single static network may deviate from the optimal result. We would like to minimize the additional errors introduced by dynamic updates.

First, we assume that we have already computed the F1 en F2 counts of the given motif M. in G ek en die F1 count of M. in Gek+1. Next, we describe how we update the F2 count for Gek+1. There are following two possible scenarios: (1) an edge has been deleted from G ek, and (2) and edge has been added to G ek. In the first scenario, the removal of an edge e van G ek sal veroorsaak dat die F2 count to either remain the same or decrease by one. The former case occurs when none of the embeddings in the set D e contribute to the F2 count in G ek. The latter case occurs when one of the embeddings from the set D e, contributes to the F2 count of G ek. Let us denote that embedding with X (XD e). After removing e, the embedding X does not exist in Gek+1. Dit verminder die F2 count of M. by one. However, it is possible that there is another embedding (say Y), which can be included in the F2 count for Gek+1 om te vervang X. For this to happen, Y must satisfy two conditions: (i) Y overlaps with X, and (ii) Y does not overlap with any other embedding included in the F2 count of M. in G ek. If such an embedding Y exists, we include it in the F2 set. Dus die F2 count remains unaltered. Otherwise the F2 count decreases by one.

In order to identify any embedding Y that satisfies the two condition above, we explore the neighbors van X in the overlap graph. Recall that the neighbors of an embedding in the overlap graph are those embeddings of M. which share at least one common edge with that embedding. If say, X consists of edges e1, e2 en e3 Dan die neighbors van X will be the union of sets (D_>) , (D_>) and (D_>) .

From the set of neighbors van X, we consider each embedding and check if they can be included in the updated F2 count. If an embedding Y in that set, has all of its edges free then we include it in the F2 set for Gek+1. Therefore, if such an embedding Y bestaan, die F2 count remains unaltered as the inclusion of Y compensates for the deletion of X. Otherwise we decrease the F2 count by one.

Assume that an edge e, waar Eek+1E ek=<e> is added G ek.This addition will either increase the F2 count of M. in Gek+1 by one or has no influence. The new edge can form new embeddings of M. in Gek+1. We explain how we obtain such new embeddings in “Updating the F1 count” section. We then check if any of these new embeddings can be included in the updated F2 count. To do this, we consider each new embedding, and check if all of its edges are uninvolved in the F2 count (they could be involved in the F2 count with other embeddings). If such an embedding exists, we include it in the F2 set and increase the F2 count by one.


We note here that only the observed number of motifs is cited in Wuchty & Stadler (2003), not their Z-scores. Moreover in a network comprising 3183 proteins they find e.g. 3.6 million copies of motif 1 in figure 2b. This can only happen if motifs are counted in a highly degenerate way which raises the question as to whether such a motif definition will give rise to biologically meaningful results.

Start from an empty graph at time t=0 which contains no nodes and no edges (we could also start from , a network with a single node and a single edge which starts and ends at the same node).


Gevolgtrekkings

Genome wide expression analysis of transcription factor mutants has traditionally been used to predict novel transcription factor targets. However, as shown in this paper, these data sets contain only a small fraction (about 10 to 20%) of direct targets. In order to understand the indirect response mechanisms following the deletion or overexpression of a transcription factor, we introduced the concept of regulatory path motifs, short paths in an integrated network of transcriptional, protein-protein and phosphorylation interactions which occur significantly more often than expected by chance between transcription factors and their perturbed targets in large-scale deletion and overexpression libraries. Regulatory path motifs extend the well-known notion of static network motifs and are conceptually related to the recently introduced activity motifs. We found eight enriched paths, of which five were overrepresented in both deletion and overexpression data (TRI, TRI-TRI, PPI-TRI, PPI-TRI-TRI and PPI-PhI-TRI). The TRI-PPI path is overrepresented only in deletion data, while the TRI-PhI-TRI and TRI-PPI-TRI paths are overrepresented only in overexpression data. These eight motifs explain about 13% of all genes differentially expressed in the deletion data and 24% in overexpression data, a more than five- to ten-fold increase compared to direct transcriptional links. Like static network motifs, regulatory path motifs are organized in a modular structure where a module consists of perturbed genes reached from a transcription factor by the same type of path with the same intermediate nodes. These modules contain strongly coexpressed and functionally coherent genes and can be used for diverse purposes like predicting periodically expressed genes.

An important property of regulatory networks is their condition-dependent nature. Although currently only a limited number of transcription factor mutant expression experiments are available under different conditions, we have shown that the relative abundance of the eight path motifs in a DNA-damage and cell cycle specific network agrees well with previously observed qualitative differences between exogenous and endogenous processes. Thus regulatory path motifs can be used to characterize the condition-dependency of the response mechanisms across multiple integrated networks.

As the amount of interaction data covering cellular networks at multiple levels of regulation continues to increase, questions regarding the cross-talk between these networks and which parts of the networks are activated upon different kinds of perturbations will quickly gain importance. In this paper we have shown that searching for small, statistically overrepresented patterns integrating functional and interaction data is a simple, yet effective way to address these problems. We have implemented our method as a Cytoscape plugin Pathicular which allows to calculate regulatory path significance values, to visualize regulatory paths on the integrated interaction network, and to extract and visualize regulatory path modules.

Pathicular is applicable to a wide variety of cause-effect and physical interaction networks and is freely available for academic use.


Motif metrics

With the motif scheme in mind, the very first thing we want to know is given a motif (one of the figure below), how can we tell this motif is betekenisvol?. One approach to this problem is to compare the motif count between the given network and a random network of the same order (same number of nodes). I wonder which type of motif statistic or random network is the best for comparision…

Z-score

z-score measures the different between the number of a motif type found in the network we need to analyse and the mean number of that motif in random networks of the same order (i.e. number of nodes and edges). The tool I used for graph motif analysis is a Python package called graph-tool . Since motif analysis is a demanding task, running undirected-size-4 motif z-score on Blogcatalog3 (

300k edges) takes almost 2 weeks on my lab machine (single thread). However, there is a trick to krag graph-tool to use multiple-cores processing mentioned here.

The selection of the graph random-rewire algorithm is also an open question in complex network research. In my work, I settle with the configuration model for random graph generation. However, other random graph models such as block model could be better for a certain type of motif. Professor Barabasi also mentioned about this matter in his slide (Barabasi 2016). graph-tool also provides the implementations of some popular random graph rewiring functions.


Kyk die video: Knitting patterns for beginners. Crochet mini doilies. Scheme (Oktober 2022).