ITEM METADATA RECORD
Title: Simultaneous component methods to identify common and distinctive mechanisms underlying linked data
Authors: Schouteden, Martijn; M0319354
Issue Date: 19-Oct-2012
Abstract: Vaak worden gelijktijdig verschillende soorten informatie verzameld over eenzelfde groep van entiteiten. Een voorbeeld van entiteiten zijn items van een vragenlijst en verschillende soorten informatie die men hierover kan verzamelen zijn antwoorden van respondenten afkomstig uit verschillende culturen. Entiteiten kunnen bijvoorbeeld ook verwijzen naar participanten waarover men verschillende soorten informatie kan inzamelen door verschillende vragenlijsten van hen af te nemen. In al deze gevallen kan de verzamelde informatie worden gegroepeerd in verschillende data blokken. In het eerste geval krijgt men dan, voor iedere cultuur, één respondent bij item data blok, en in het tweede geval één participant bij item data blok per vragenlijst. Omdat de informatie in de verschillende data blokken betrekking heeft op dezelfde groep van entiteiten, worden dit ook gekoppelde data genoemd. In het eerste geval zijn de data blokken gekoppeld via de items, in het tweede geval via de respondenten. Tal van onderzoeksvragen kunnen geassocieerd worden met gekoppelde data. In dit proefschrift wordt de nadruk gelegd op het zoeken naar mechanismen die de variatie in de data kunnen verklaren. Hiervoor wordt een beroep gedaan op de familie van methoden voor Simultane Componenten Analyse (SCA). In SCA worden de data blokken ontbonden in een beperkt aantal componenten die een maximale hoeveelheid van de variantie in de data verklaren. Bij het op zoek gaan naar achterliggende mechanismen kan men zich in een verdere stap afvragen welke mechanismen gemeenschappelijk zijn voor alle data blokken, en welke specifiek zijn voor één of enkele ervan. Traditionele SCA methoden bieden hierop geen adequaat antwoord omdat ze componenten opleveren die een mix bevatten van gemeenschappelijke en specifieke informatie. In dit proefschrift wordt dit probleem aangepakt doorheen vijf hoofdstukken. In Hoofdstuk 1 nemen we het begrip variantie verklaard door een simultane component in een data blok onder de loep, aangezien dit begrip, op eerste zicht, uitermate geschikt lijkt te zijn voor het formaliseren van gemeenschappelijke en specifieke mechanismen. We bewijzen dat, in vele gevallen, de bepaling van de variantie die een simultane component uniek verklaart in een data blok problematisch is, tenzij er enkele mathematische condities vervuld zijn.In Hoofdstuk 2 presenteren we een eerste methode om gemeenschappelijke en specifieke informatie te ontwarren in gekoppelde data. Deze methode maakt gebruik van de rotationele vrijheid van een SCA model, en verloopt in twee stappen: Eerst worden de gekoppelde data geanalyseerd met SCA; vervolgens worden de bekomen simultane componenten geroteerd op een speciale manier om de gemeenschappelijke en specifieke informatie te ontwarren. We karakteriseren deze methode als een zachte methode omdat er met deze methode geen model fit verloren gaat. In Hoofdstuk 3, presenteren we een software pakket waarmee het hele data-analytisch proces van de methode vermeld in Hoofdstuk 2 kan worden uitgevoerd. Naast zijn gebruiksvriendelijkheid, vergemakkelijkt dit software pakket de keuze van model parameters zoals het aantal mechanismen en hun status als gemeenschappelijk of specifiek. Verder biedt het de mogelijkheid om de data op verschillende manier voor te bewerken. Zowel een alleenstaande versie van het software pakket, als een MATLAB versie zijn vrij beschikbaar.In sommige gevallen kan het verder aangewezen zijn om extra beperkingen op te leggen aan de componentenstructuur om zo de gemeenschappelijke en specifieke componenten uit elkaar te kunnen trekken. In vergelijking met de eerste methode, zal de interpretatie van de componenten daardoor verbeteren. Echter, het opleggen van extra beperkingen zal ook leiden tot een verlies in model fit. Om een optimale balans te vinden tussen verlies in fit en winst in interpreteerbaarheid, presenteren we in Hoofdstuk 4 een uitbreiding van de eerste methode die de mogelijkheid biedt om extra beperkingen op te leggen met een, door de gebruiker bepaald, niveau van strengheid. Als zodanig wordt deze methode gekarakteriseerd als half-zacht/hard. Tenslotte, in de tot dusver gepresenteerde methoden ligt de primaire focus op het vinden van specifieke componenten, terwijl de gemeenschappelijke componenten eerder een residuele status hebben. Soms is het echter erg belangrijk om gemeenschappelijke componenten op te sporen. Daarom presenteren we in Hoofdstuk 5 een derde methode die het vinden van gemeenschappelijke mechanismen als primaire focus heeft. Hiervoor maken we gedeeltelijk gebruik van ideeën uit een regressiecontext.
Publication status: published
KU Leuven publication type: TH
Appears in Collections:Quantitative Psychology and Individual Differences

Files in This Item:
File Status SizeFormat
Thesis.pdf Published 1449KbAdobe PDFView/Open Request a copy

These files are only available to some KU Leuven Association staff members

 
All items in Lirias are protected by copyright, with all rights reserved.