Modèle linéaire mixte sous r

Maintenant que nous avons les résultats de bootstrap, nous pouvons les résumer. Tout d`abord, nous calculons le nombre de modèles qui ont réussi à converger. Nous le faisons en vérifiant si un résultat particulier est numérique ou non. Les erreurs ne sont pas numériques, donc elles seront ignorées. Nous pouvons calculer la moyenne des succès pour voir la proportion de répliques qui convergent et que nous avons des résultats pour. Si cela semble déroutant, ne pas s`inquiéter-lme4 poignées partiellement et complètement croisé des facteurs bien. Ils n`ont pas à être hiérarchiques ou «multiniveau» par la conception. Toutefois, la même spécification de modèle peut être utilisée pour représenter les facteurs (partiellement) croisés ou imbriqués de sorte que vous ne pouvez pas utiliser les spécifications du modèle pour vous dire ce qui se passe avec les facteurs aléatoires: vous devez examiner la structure des facteurs dans les données. Pour simplifier les choses, coder correctement vos données et éviter l`imbrication implicite. Vous ne savez pas quelle imbrication implicite est? Lisez la suite. construit un modèle linéaire de y en utilisant, et l`interaction entre et.

Si vous souhaitez effectuer des opérations arithmétiques à l`intérieur de la formule, utilisez la fonction I. Vous pouvez également introduire des termes polynomiaux avec la fonction poly. Une astuce pratique que j`utilise pour développer toutes les interactions par paires entre les prédicteurs est ensuite, nous remettons le modèle sur les données rééchantillonnées. Tout d`abord, nous stockons les estimations de notre modèle d`origine, que nous utiliserons comme valeurs de départ pour les modèles bootstrap. Ensuite, nous faisons un cluster local avec 4 noeuds (le nombre de processeurs sur notre machine; défini sur le nombre de processeurs que vous avez sur le vôtre). Ensuite, nous exportons les données et charger le package lme4 sur le cluster. Enfin, nous écrivons une fonction pour adapter le modèle et renvoyer les estimations. L`appel à glmer () est enveloppé dans l`essai parce que tous les modèles ne peuvent pas converger sur les données rééchantillonnées. Cela intercepte l`erreur et le renvoie, plutôt que d`arrêter le traitement. Entrez lme4. Bien que toutes les techniques ci-dessus soient des approches valides de ce problème, elles ne sont pas nécessairement la meilleure approche lorsque nous nous intéressons explicitement aux variations entre et par groupes. C`est là qu`un cadre de modélisation à effet mixte est utile.

Maintenant, nous utilisons la fonction de la ligne de compte avec l`interface de formule familière, mais maintenant les variables de niveau de groupe sont spécifiées à l`aide d`une syntaxe spéciale: (1 | School) indique à l`établissement de l`ajustement d`un modèle linéaire avec un effet de groupe à interception variable à l`aide de l`école à variables. Quand il s`agit de tels effets aléatoires, vous pouvez utiliser la sélection de modèle pour vous aider à décider ce qu`il faut garder. Suivant les conseils de zuur, nous utilisons des estimateurs REML pour la comparaison des modèles avec des effets aléatoires différents (nous gardons des effets fixes constants). (Zuur: “deux modèles avec des structures aléatoires imbriquées ne peuvent pas être faits avec le ML parce que les estimateurs pour les termes d`écart sont biaisés.”) Dans cet exemple simple, on obtient à peu près les mêmes résultats, indépendamment du paquet utilisé (ce qui est certainement réconfortant). Je vais bientôt couvrir un autre modèle simple, mais avec beaucoup plus grand jeu de données, pour mettre en évidence certaines différences de performances entre les packages. C`est pourquoi des modèles mixtes ont été développés, pour traiter de telles données salissantes et pour nous permettre d`utiliser toutes nos données, même lorsque nous avons des tailles d`échantillon faibles, des données structurées et de nombreuses covariables pour s`adapter. Oh, et au-dessus de tout cela, les modèles mixtes nous permettent d`économiser des degrés de liberté par rapport à l`exécution de modèles linéaires standard! Ça sonne bien, n`est-ce pas? Adaptele modèle avec testScore comme réponse et bodyLength2 comme prédicteur et regardez la sortie: les données écologiques et biologiques sont souvent complexes et salissantes.