Lexicostatistics

Le Lexicostatistics est une approche à la linguistique comparative qui comporte la comparaison quantitative du lexicologique Cognates . Lexicostatistics est lié à la méthode comparative mais ne reconstruit pas une protolangue . Il doit être distingué du Glottochronology , qui essaye d'employer des méthodes lexicostatistical pour estimer la durée puisque deux langues ou plus ont divergé d'une protolangue plus tôt de terrain communal. C'est simplement une application de lexicostatistics, cependant, et d'autres applications de elle peuvent ne pas partager l'acceptation d'un taux de changement constant pour les éléments lexicaux de base.

Le " de limite ; lexicostatistics" ; est fallacieux du fait des équations mathématiques ne sont employées mais pas des statistiques. D'autres dispositifs d'une langue peuvent être employés autre que le lexique, bien que ce ne soit pas habituel. Considérant que la méthode comparative a employé les innovations identifiées partagées pour déterminer des sous-groupes, le lexicostatistics n'identifie pas ces derniers. Ce dernier est une méthode basée par distance mais la méthode comparative considère des caractères de langue directement. La méthode de lexicostatistics est une technique simple et rapide relativement à la méthode comparative mais a les limitations qui sont discutées ci-dessous. Elle peut être validée en contre-vérifiant les arbres produits par les deux méthodes.

Histoire

Lexicostatistics a été développé par le Morris Swadesh dans une série d'articles dans les années 50, basées sur de premières idées. Le concept semble avoir été lancé par le d'Urville de Dumont en 1834 qui a comparé le divers " ; Oceanic" ; langues et proposé une méthode pour calculer un coefficient du rapport. Hymes (1960) et Embleton (1986) les deux revue l'histoire du lexicostatistics.

Méthode

Créer la liste de mots

Le but est de produire d'une liste de significations culture-libres universelles. Des mots sont alors rassemblés pour ces fentes de signification pour chaque langue étant considérée. Swadesh a ramené un plus grand ensemble de significations vers le bas à 200 à l'origine. Il plus tard a constaté qu'il était nécessaire de le réduire plus loin mais qu'il pourrait inclure quelques significations qui n'étaient pas dans sa liste originale, donnant sa liste postérieure de 100 articles. La liste de Swadesh de dans Wikitionary donne au total 207 significations dans un certain nombre de langues. Les listes alternatives pour des buts particuliers ont été par exemple Dyen produit, Krustal et le noir ont 200 significations pour 84 langues indo-européennes en forme numérique.

Déterminer les cognacies

Des décisions de Cognacy doivent être prises par un linguiste qualifié et expérimenté. Cependant il convient noter que les décisions peuvent devoir être raffinées comme état d'augmentations de la connaissance. Cependant, le lexicostatistics ne se fonde pas sur toutes les décisions étant correctes. Pour chaque paire de listes le cognacy d'une forme a pu être positif, négatif ou indéterminé. Parfois une langue a deux mots pour la signification un, par exemple le petit et le peu de pour le non grand.

Calculer les pourcentages lexicostatistic

Ce pourcentage est lié à la proportion de significations pour un couple de langues particulier qui sont apparenté, IE relativement au total sans indeterminacy. Cette valeur est écrite dans N x table de N des distances, où N est le nombre de langues étant comparées. Si complète cette table est à moitié pleine dans triangulaire forment. Plus la proportion est haute de cognacy plus les langues sont connexe étroites.

Créer l'arbre généalogique

La création de l'arbre de langue est basée seulement sur la table trouvée ci-dessus. De diverses méthodes de sous-groupement peuvent être employées mais c'adopté par Dyen, Krustal et noir était : -
toutes les listes sont placées dans une piscine
les deux membres les plus étroits sont enlevés et forment un noyau qui est placé dans la piscine
cette étape est répétée
dans certaines conditions un noyau devient un groupe
ceci est répété jusqu'à ce que la piscine contienne seulement un groupe.

Des calculs doivent être effectués des pourcentages lexicologiques de noyau et de groupe.

Applications

Un principal exposant d'application de lexicostatistics a été Isadore Dyen . Il avait l'habitude le lexicostatistics pour classifier des langues Austronesian aussi bien que les indo-européennes. Une étude importante de ce dernier a été rapportée par Dyen, Krustal et Black (1992). Des études ont été également effectuées de l'Amerindian et des langues africaines.

Critiques

Les gens tels que Hoijer (1956) ont prouvé qu'il y avait des difficultés en trouvant des équivalents aux articles de signification tandis que beaucoup l'ont trouvé nécessaire de modifier les listes de Swadesh. Gudschinsky (1956) a douté qu'il était possible d'obtenir une liste universelle.

Les facteurs tels que l'emprunt, la tradition et le tabou peuvent biaiser les résultats, comme avec d'autres méthodes. Parfois le lexicostatistics a été employé avec la similitude lexicologique étant employée plutôt que le cognacy pour trouver des ressemblances. C'est alors équivalent à la comparaison de la masse de .

Le choix des fentes de signification est subjectif de même que le choix des synonymes.

Méthodes améliorées

Certaines des méthodes d'essai informatiques modernes d'hypothèse statistique peuvent être considérées comme des améliorations de lexicostatistics du fait elles emploient les listes de mots et les mesures semblables de distance.
Random links:Gayle McKeachnie | Marianne Jean-Baptiste | Heze | Partido Cristiano populaire (Pérou) | Prince George Cougars | Lexicostatistics