Responder

Exploitation des relatives - méthode possible

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
Bonsoir à toutes et tous intéressés par la généalogie génétique et désireux d'apprendre.
Me revoici pour vous présenter un exemple de démarche à entreprendre pour tenter de percer le mystère de nos origines proches.
J'ai vu bon nombre d'entre vous rester perplexes face à la longue liste de cousins américains obtenus sur 23andMe, pour ma part à ce jour 1228 à 99% américains dont 8 X matchs.
Sur mon arbre à dix générations, je ne possède pas d'ancêtres anglo-saxons mais cependant quatre énigmes d'enfants abandonnés entre 1799 à 1854 dans la ville de Bordeaux (33).
Parmi tous mes efforts de communication pour en apprendre plus sur nos généalogies respectives, je suis navré de constater que mes seules difficultés l'ont été avec mes compatriotes et non avec mes cousins américains.
La première étape a consisté à downloader au format csv l'entière liste de mes relatives.
La seconde étape a consisté à classer les données suivant cet ordre croissant à l'aide de mon tableur préféré (LibreOffice Calc pour ce qui me concerne) :
- 1 - chromosome number
- 2 - chromosome start
- 3 - SNPs
Ce qui donne à titre d'exemple ceci (exemple d'une portion de mon chromosome 7):
Une fois les relatives classés, on constate qu'un certain nombre d'entre eux partagent des portions complètes allant de 1500 à 2700 SNPs pour lesquels je partage de 0.10 à 0.16% en commun. (portion 105907311 à 121890781 )

- Suite dans le post suivant -
Anexos
chromosome_7_cousins bis.jpg
Última edição por pthobie em 05 maio 2019, 23:58, editado 5 vezes no total.

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
J'ai donc recherché les pourcentages qu'ils avaient entre eux en commun, ce qui donne la matrice suivante :
Parmi les relations découvertes, des mères et fils, des sœurs et frères, des demi-sœurs et demi-frères, des cousins premiers, etc... etc...et surtout certaines relations de 0.12% inférieures aux miennes à 0.16%.
chr7bis.jpg
- suite au post suivant -

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
Ici débute l'étape la plus difficile, tenter de communiquer en anglais avec le groupe de cousins sélectionnés pour obtenir leur informations généalogiques.
J'ai appris ici qu'il ne fallait pas perdre une minute car certains étaient âgés et d'autres sont déjà disparus à ce jour en fin d'année 2018 ou au début de cette année 2019.
Il faut penser à télécharger de temps en temps la liste complète, car celle-ci évolue au fur et à mesure que le temps passe.
Attendre devant votre liste qu'un miracle apparaisse par un cousin à fort pourcentage n'est pas la solution.
Après bien des efforts de généalogie outre-atlantique, j'ai pu bâtir cet exemple d'arbre relationnel entre 9 de mes cousins parmi une liste de 19 descendant visiblement de la même lignée commune qui ne se connaissaient pas.
Les 10 autres cousins appartiennent à la même matrice avec des pourcentages identiques, travaux qui restent encore à accomplir pour parfaire mon étude.
Il apparaît que le couple américain de William WISE (1755-1816) et Sarah Margareth DENMARK (1757-1821) vivant aux états-unis lors de la période de la guerre d'indépendance de 1776 sont le MRCA de mes 9 cousins déjà inventoriés, et probablement des 10 autres restants à faire.
Reste à savoir où je me place vis-à-vis de ce couple, par rapport à mes pourcentages, mon analyse me porte sur le couple de Bridger JONES (1814-1894) et Susan DENMARK (1821-1856) ce qui me place plus proche d'un groupe de 4 cousins vis-à-vis des autres mais restant cohérent vis-à-vis des pourcentages avec l'ensemble.
A titre d'exemple le rapport entre le cousin de la case jaune du haut du diagramme et celui du bas du diagramme est de 0.12%, je suis à 0.13% avec celui du haut, et 0.16% avec celui du bas.
Anexos
MRCA.jpg
Última edição por pthobie em 06 maio 2019, 00:08, editado 1 vez no total.

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
Pour finir, voici la liste des outils tous "gratuits" fort utiles qui ont été utilisé au delà des échanges avec mes cousins :
- Google (legacy, obituaries)
- Fastpeoplesearch (localisation, âge et relatives)
- Find a Grave (cimetières, relatives, obituaries)
- Familysearch
- Geneanet ( dans une moindre mesure, mais tout de même un peu, geneastar)
Je vais appliquer la même méthode à d'autres groupes de cousins que j'ai repérés sur d'autres chromosomes.
Voilà donc la voie à suivre pour exploiter au mieux votre longue liste de cousins.

J'ai en cours un gros travail sur la Louisiane, Georgie et Acadie avec moult cousins Thibodaux, Boudreaux etc.. très complexes tant ils sont nombreux à ce jour. J'ai bon espoir de trouver un MRCA qui me permet de comprendre la présence des régions Bretagne et Normandie sur ma carte French & German.

Patrice

lilou8391
female
Mensagens: 161
Árvore : Gráfico
Ver a árvore genealógica
Super intéressant, merci du partage. J'avais aussi commencé à faire un travail comme ça, mais je me suis arrêter au tableau avec les chromosomes. J'avais regroupé ceux qui partagent les mêmes segments mais après je ne savais pas trop comment exploiter tout ça. Vous avez donc fait des recherches via les arbres généalogiques de vos potentiels cousins et/ou en les interrogeant pour retrouver les ancêtres communs je suppose?

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
lilou8391 Escreveu:
06 maio 2019, 08:27
Super intéressant, merci du partage. J'avais aussi commencé à faire un travail comme ça, mais je me suis arrêter au tableau avec les chromosomes. J'avais regroupé ceux qui partagent les mêmes segments mais après je ne savais pas trop comment exploiter tout ça. Vous avez donc fait des recherches via les arbres généalogiques de vos potentiels cousins et/ou en les interrogeant pour retrouver les ancêtres communs je suppose?
Bonjour Lilou8391n effectivement c'est ce que je décris comme la "partie difficile".
L'anglais est de rigueur, mais ne me pose pas de problème particulier et mes cousins sont ravis de pouvoir échanger avec un gars de l'autre coté de l'Océan.
Plusieurs cas de figure se présentent à nous :
-1- Le cousin a donné son âge et sa localisation sur la page principale de 23andMe, ainsi que les localisations des naissances des 4 grand-parents comme 23andMe nous invite à le faire, et cela est fort pratique, ainsi que les noms de familles,
-2- Le cousin n'a donné aucune information.
Dans le second cas, tout repose sur la bonne volonté du cousin à échanger avec vous pour avancer de concert vers la découverte du MRCA.
Dans le premier cas, il est plus facile d'avancer, en effet, à l'aide Fastpeoplesearch, on peut retrouver les personnes avec leurs prénoms, noms et localisation, l'outil donnera par la suite l'âge et les relatives.
A l'aide des relatives et de leur âges et localisations, il va falloir fouiller les obituaries à la recherche de ceux qui sont le plus documentés, et ils s'en trouvent où figurent jusqu'aux arrières petits enfants, ce qui permet de bien localiser une famille.
Mes cousins sont parfois surpris de la quantité d'informations que je peux posséder sur eux sans qu'ils n'aient eu à me le dire.
Pour l'instant, en ce qui concerne mes cousins, ils sont peu nombreux à disposer d'un arbre à 10 générations, tout au plus jusqu'aux arrières grand-parents, mais ils sont très content des productions en éventails de Geneanet ou l'arbre sur parchemin que je peux leur envoyer.
Encore une fois, par le passé, la peur que suscitait Internet quand au renferment des gens est infondée, puisque la recherche des MRCA nous demande un effort de communication outre-atlantique dans une langue différente et un grand partage avec mes cousins.
C'est sûr, un jour, j'irais manger un Jambalaya en Louisiane avec mes cousins.

Une forme de complexité est liée au fait que les cousins féminins, présentent bien souvent leur "husband name" et non leur "maiden name", de ce fait, il faut leur demander poliment leur nom de jeune fille, et j'ai été confronté à un grand nombre de divorces et remariages ce qui rends les recherches difficiles, car sur les obituaries/obituary figurent bien souvent le ou la dernière épouse et non celle ayant donné naissance aux enfants mentionnés, idem pour les problèmes de changement de région, floride ou californie etc....

La présentation d'un diagramme de relations semble évident quand on l'a sous les yeux, mais on n'imagine pas la somme de travail et d'échanges pour en arriver là.

Quand j'ai débuté la généalogie, il y a bien fort longtemps maintenant, mon histoire familiale m'imposait l'Océan Indien et je ne pensais pas qu'un jour je dusse étudier l'Acadie, la Louisiane et les Amériques. Mais je n'y échappe pas, idem quand à l'histoire de la révolte Irlandaise de 1798 à 1801 où les français sont allé prêter main forte pour combattre l’oppresseur à "dos-rouge" mais sans succès. Ma généalogie était déjà compliquée, mais là, ça se corse bigrement.
Patrice
Última edição por pthobie em 06 maio 2019, 16:38, editado 1 vez no total.

mosaique
mosaique
Mensagens: 27
Árvore : Não gráfico
Ver a árvore genealógica
Même cas que vous, grâce (à cause? :D ) de ma grand-mère Ashkénaze. Beaucoup de cousins US, beaucoup de triangulations mais jusqu'à présent, aucun lien de parenté mis en évidence soit par ignorance des concernés, soit pas manque de motivation à me répondre et les tableaux de correspondance que j'ai dressés pour chaque labo, n'y a rien changé.
Je vais donc profiter de vos recherches, je pense, donc merci.
Par contre, vos indications pour télécharger les fichiers et faire ces tableaux, dépassent largement mes compétences techniques, pourriez-vous vulgariser un peu plus? :)

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
Bonjour,
Pour une fois MyHeritage n'est pas en reste, je viens de découvrir l'outil "Auto-Cluster" qui fourni un rapport "Auto-group", qui en final fait ce que j'ai fait manuellement avec ma matrice de correspondance, mais à la main c'est galère, par ailleurs, je m'étais interrogé sur le pourquoi 23andMe bien que fournissant l'ensemble des pourcentages entre mes relatives ne faisait pas tout simplement ce petit croisement de données fort pratique, mais bon... pour une fois c'est MyHeritage qui obtient l'étoile ( cet outil est intéressant, mais ce n'est qu'un outil).

Pour télécharger ses fichiers de relatives, c'est simple, la seule compétence nécessaire est de savoir lire, pour 23andMe, c'est un lien en bas de la page des Relatives, on clique et on download le csv. Pour MyHeritage, c'est aussi simple, c'est en haut à droite de la page des relatives, sauf que là, il y a 2 fichiers, un avec les relatives, et l'autre avec les segments partagés, mais cela revient au même. Pour ceux qui ne savent pas utiliser un tableur, il se trouve beaucoup de tutto sur le net, mais il est vrai que l'idéal est d'avoir quelqu'un à coté de soit capable de vous montrer "how to do that".

Grosso-modo, vos données sont fournies au format "csv" (Comma-separated values), c'est à dire que l'élément permettant de reconnaître les blocs de données est une virgule, de ce fait, lorsque vous ouvrez le fichier avec le tableur, ce dernier vous organise proprement les données en colonnes.

C'était la première étape, la seconde consiste à faire le "tri", là, le tableur dispose de fonctions "trie" dans son menu, selon les tableur il faut chercher un peu dans la barre de menu. Cette fonction vous demande si vos données disposent d'une "étiquette", ce qui est le cas pour 23andMe comme pour MyHeritage, l'étiquette est l'information qui décrie le contenu de la colonne de donnée. Votre tri doit donc s'effectuer avec "étiquette", puis vous choisissez l'ordre du tri, croissant ou décroissant, et enfin sur quelles colonnes portera votre tri, dans notre cas, il faut trier sur 3 colonnes, la colonne "Chromosome number", ou chose approchante qui représente le numéro du chromosome, la seconde colonne sera le "starting point", ou point de départ du segment dans le chromosome, et la troisième sera le nombre de SNPs ou la distance génétique selon les goûts de chacun.

A partir de là, vous obtenez un tableau trié par chromosomes et par segment. Pour plus de facilité d'exploitation, j'ai découpé mon fichier en copier/coller sur 23 fiches correspondantes à chacun des chromosomes de 1 à 22 et le X, cela évite de parcourir mes 1228 lignes d'un seul tenant.

Après, c'est à vous de colorier les groupes que vous repérez pour bien les faire ressortir et arrive la phase la plus compliquée : contacter un par un chacun des relatives à la recherche de leur arbre généalogique ou du moins du maximum d'informations pour le construire s'il ne l'était pas déjà.

C'est une joie indescriptible qui vous submerge quand entre deux cousins proches, vous arrivez à déterminer le MRCA, puis 3, puis 4 et ainsi de suite, et surtout quand une de vos cousines, après réflexion fini par vous dire, mais si, c'est normal, car Mme X est la demi-sœur de Mr Y, et suite au mariage de W, etc... etc... vous tenez enfin le fil de la pelote de laine, reste à démêler le tout et surtout à trouver votre place sur l'échiquier.

Un investissement en temps et une bonne plasticité cérébrale sont nécessaires pour qui veux pénétrer le domaine de la généalogie génétique, et rien ne vaut les contacts humains avec ses relatives, partager, partager et encore partager sans idée de profit sur autrui, cependant Time is money.

Patrice
Anexos
auto_cluster.jpg

mosaique
mosaique
Mensagens: 27
Árvore : Não gráfico
Ver a árvore genealógica
Merci pour vos explications.
Je reviens vers vous car j'ai téléchargé mes données csv et j'essaie de créer un fichier sur LibreOffice Calc mais il me mets toutes les données sur une seule colonne. Quand je suis ce tuto, il ne fait pourtant aucun réglage préalable. https://www.youtube.com/watch?v=lSNTSR3ppxU

Imagem

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
Bonjour Mosaique,
C'est tout à fait normal.
Lorsque vous souhaitez ouvrir un fichier "csv", il faut faire le choix du type de séparateur de texte pour pouvoir construire les colonnes.
Comme vous pouvez le voir sur votre image, les champs entre guillemets sont séparés par des virgules.
oubliez le tutto que vous citez qui par ailleurs ne décrit pas l'ouverture d'un fichier csv et concentrez vous sur le raisonnement :
- vous avez un fichier structuré dont les données sont séparées par des virgules,
- la fin de ligne de données est représentée par les caractères \r\n qui correspondent au bon vieux "retour charriot" des machines à taper Antiques et "saut de ligne" pour ne pas écrire sur la ligne précédente, c'est ce qui se faisait autrefois avec les machines à écrire et qui a été reproduit au niveau informatique dès les prémices de l'informatique dans le codage du texte.
Votre tableur sait interpréter les "fin de ligne", mais ne sait pas par nature délimiter les blocs de données, il faut donc lui indiquer si les colonne à construire sont de taille "fixes", ou si les colonnes sont symbolisées par autre chose, et dans notre cas, c'est autre chose, une "virgule".
Voir l'image ci-jointe pour la sélection de la virgule.
De plus dans votre cas, les données sont placées entre guillemets, il est alors aussi possible de dire que le délimiteur de texte est un guillemet.

Exemple de structure de données :
tititututototatatetemememimimomo sous cette forme les données sont collées les unes aux autres, le découpage ne sera connu que du logiciel du concepteur pour pouvoir les exploiter;
"titi","tutu","toto","tete","meme","mimi","momo", déjà c'est plus clair
la virgule peut être remplacée par n'importe quel caractère du moment que celui-ci ne peut pas être confondu avec une donnée.
Si mes données sont des chiffres avec virgules, là, c'est plus compliqu2, et il vaudra mieux disposer de séparateur nommés "tabulation" ( \t ) ou toujours les guillemets, ce qui donne 12,4\t12,5\t11,7\t, le tableur convertira alors en 12,4 12,5 11,7
Dans l'image mise en exemple, on remarquera que les nombres sont au format anglo-saxon, c'est à dire que la virgule est représentée par un point, il est alors possible de convertir cette colonne directement à ce stade, la colonne est indiquée comme étant "standard", il est possible de choisir "anglais US", ce qui aura pour effet de remplacer à l'extraction, les points par des virgules sans affecter les colonnes.
Anexos
tableur.jpg

mosaique
mosaique
Mensagens: 27
Árvore : Não gráfico
Ver a árvore genealógica
Vous êtes un bon pédagogue mais je n'y arrive pas. Je n'utilise jamais Excel ni aucun programme de ce genre et le codage m'est tout à fait étranger. Bref, voici tout ce que j'arrive à avoir, j'imagine que le souci vient du fichier csv puisque même en suivant votre exemple et les tutos que j'ai trouvés, je n'ai pas du tout le même résultat.
Imagem

Imagem

Imagem

pthobie
pthobie
Mensagens: 214
Árvore : Não gráfico
Ver a árvore genealógica
le codage UTF8 semble correct, peut-être la langue, essayez de passer de "Français (Belgique)" à "Français (France)", pour voir si cela change quelque chose, sinon, décochez la case "virgule" et recochez là.

Une autre possibilité, sera de cocher la case "autre", et de mettre une virgule telle que vous la tapez sur votre clavier, pour voir, aussi si cela change quelque chose.

Autre possibilité offerte serait d'ouvrir le fichier avec Notepad ou Notepad++ ou n'importe quel éditeur de texte, et de remplacer les "," virgules, par des "," virgules, mais des vrais, celles de votre clavier, ou n'importe quoi d'autre qui servira de balise, de séparateur de texte, et de ré-ouvrir le fichier csv avec le tableur en sélectionnant la nouvelle balise/séparateur.

A la fin, si malgré tous ces efforts, rien n'y fait, plus qu'une possibilité, vous m'envoyez votre fichier, je vous le converti et vous le renvoie, c'est idiot, mais cela fera gagner du temps.

L'entrée dans cet univers nécessite de bonne compétence en mathématiques pour ce qui relève des matrices, du clustering et par la suite des dendrogrammes, matière où bien avant les outils, il s'agit de comprendre ce que l'on va faire pour savoir comment on va le faire à l'aide des outils que sont les mathématiques, c'est comme un simple tournevis cruciforme, cela ne fonctionne pas avec une vis à tête plate, encore que, mis sur le coté... mais bon, tout petit, j'étais du genre à enfoncer un triangle à coup de marteau dans un trou rond, et à la fin, ça passe :lol:

Pour l'instant, là n'est pas la propos, il s'agira simplement par un bon classement des relatives d'isoler un groupe de cousins prometteurs bien reliés les uns aux autres par de forts pourcentage, et d'étudier leurs arbres généalogiques respectifs, bien que la matrice nous permettra de bâtir un arbre prédictif qui se visualisera par le dendrogramme et correspondra en tout point à l'arbre généalogique global.

houdinil
houdinil
Mensagens: 288
Árvore : Não gráfico
Ver a árvore genealógica
Bonjour,

Un autre outil qui intègre toutes les informations glanées sur les sites des fournisseurs est Genome Mate Pro (gratuit). Il est malheureusement en anglais pour ceux qui ne connaissent pas la langue de Shakespeare.
Il faut ensuite récupérer les infos comme pthobie l'a indiqué dans le début du fil.
J'utilise l'extension Pedigree Thief (gratuit) sur Google Chrome pour récupérer toutes ces infos de MyHeritage, le site sur lequel j'ai le plus de correspondances intéressantes. On peut aussi importer les arbres s'ils existent pour chaque correspondance avec cette extension. Pour GedMatch (gratuit et payant pour les triangulations 10$) j'utilise le logiciel DNAGedcom (payant 5$) occasionnellement car il est possible de prendre un abonnement mensuel.

Laurent (houdinil)

mosaique
mosaique
Mensagens: 27
Árvore : Não gráfico
Ver a árvore genealógica
Bingo! Je suis loin d'être au bout de mes peines mais cette étape est réussie, c'est déja miraculeux.
Merci!
Imagem

treb15
male
Mensagens: 1516
Árvore : Gráfico
Ver a árvore genealógica
Un autre outil qui intègre toutes les informations glanées sur les sites des fournisseurs est Genome Mate Pro (gratuit).
Le fil en question : https://www.geneanet.org/forum/viewtopic.php?f=77580&t=623548

Pour ma part, je resterais sur ma position vis à vis des correspondances faibles et non significatives ... et sur le fait d'être assez déçu pour retrouver et essayer de combler des "nés d'inconnus" ...




mosaique Escreveu:
07 maio 2019, 15:27
Bingo! Je suis loin d'être au bout de mes peines mais cette étape est réussie, c'est déja miraculeux.
Merci!
Pas tout à fait car vous êtes avec les guillemets et non seulement les valeurs...

Responder

Voltar para “Généalogie génétique”