New Publication – Science

Todd E.T., Tonasso-Calvière L., Chauvey L., Schiavinato S., Fages A. […] Orlando L. 2022. The genomic history and global expansion of domestic donkeys. Science 377, 1172-1180

We teamed up with archaeologists, conservation and evolutionary biologists to sequence an extensive worldwide panel of modern and ancient donkey genomes.

The population structure supports domestication origins 7000 ya in Africa, with those modern populations from Horn and Kenya closest to the original source.

It also supports an expansion towards Western Africa around 5000 ya, and soon after Out-of-Africa, then differentiating into Europe and Asia, with back migrations into Africa… ” [L. Orlando]

COVER A donkey from Petra, Jordan, carries goods through the rugged landscape, as millions of others have done for millennia. Genetic analysis tracks their journey from a single domestic origin in Africa as early as 7000 years ago to rapid expansions through Eurasia 2500 years later. Ancient genomes also reveal trans-Mediterranean exchange, giant Roman beasts, and previously unknown diversity in the Levant. See page 1172.
Photo: Brit Büchner/EyeEm via Getty Images

Soutenance de thèse – Antoine Galibourg

Antoine Galibourg soutiendra sa thèse intitulée « Estimation de l’âge dentaire chez le sujet vivant : application des méthodes d’apprentissage machine chez les enfants et les jeunes adultes » le lundi 20 juin 2022.

La soutenance se tiendra à 14h en salle des actes, faculté de santé – département de chirurgie dentaire 3, Chemin des Maraichers 31062 Toulouse.

Composition du Jury :

Mme Delphine TARDIVO, Rapporteure

Mme Véronique ALUNNI, Examinatrice

M. Norbert TELMON, Directeur de thèse

Mme Delphine MARET-COMTESSE, Co-directrice de thèse

M. Paul MONSARRAT, Co-directeur de thèse

Résumé [FR]

Exposé du problème : Chez l’individu vivant, l’estimation de l’âge dentaire est un paramètre utilisé en orthopédie ou en orthodontie dentofaciale, ou en pédiatrie pour situer l’individu sur sa courbe de croissance. En médecine légale l’estimation de l’âge dentaire permet d’inférer l’âge chronologique sous forme d’une régression ou d’une classification par rapport à un âge clé. Il existe des méthodes physiques et radiologiques. Si ces dernières sont plus précises, il n’existe pas de méthode universelle. Demirjian a créé il y a presque 50 ans la méthode radiologique la plus utilisée, mais elle est critiquée pour sa précision et pour l’utilisation de tables de références basées sur un échantillon de population franco-canadien.

Objectif : L’intelligence artificielle et plus particulièrement l’apprentissage machine a permis le développement de différents outils ayant une capacité d’apprentissage sur une base de données annotées. L’objectif de cette thèse a été de comparer la performance de différents algorithmes d’apprentissage machine; dans un premier temps par rapport à deux méthodes classiques d’estimation de l’âge dentaire, puis entre elles en ajoutant des prédicteurs supplémentaires.

Matériel et méthode : Dans une première partie, les différentes méthodes d’estimation de l’âge dentaire sur des individus vivants enfants et jeunes adultes sont présentées. Les limites de ces méthodes sont exposées et les possibilités d’y répondre avec l’utilisation de l’apprentissage machine sont proposées. A partir d’une base de données de 3605 radiographies panoramiques d’individus âgés de 2 à 24 ans (1734 filles et 1871 garçons), différentes méthodes d’apprentissage machine ont été testées pour estimer l’âge dentaire. Les précisions de ces méthodes ont été comparées entre elles et par rapport à deux méthodes classiques de Demirjian et Willems. Ce travail a abouti à la parution d’un article dans l’International Journal of Legal Medicine. Dans une deuxième partie, les différentes méthodes d’apprentissage machine sont décrites et discutées. Puis les résultats obtenus dans l’article sont remis en perspective avec les publications sur le sujet en 2021. Enfin une mise en perspective des résultats des méthodes d’apprentissage machine par rapport à leur utilisation dans l’estimation de l’âge dentaire est réalisée.

Résultats : Les résultats montrent que toutes les méthodes d’apprentissage machine présentent une meilleure précision que les méthodes classiques testées pour l’estimation de l’âge dentaire dans les conditions d’utilisation de ces dernières. Elles montrent également que l’utilisation du stade de maturation des troisièmes molaires sur une plage d’utilisation étendue à 24 ans ne permet pas l’estimation de l’âge dentaire pour une question légale.

Conclusion : Les méthodes d’apprentissage machine s’intègrent dans le processus global d’automatisation de la détermination de l’âge dentaire. La partie spécifique d’apprentissage profond semble intéressante à investiguer pour des tâches de classification de l’âge dentaire.

Abstract [EN]

Statement of the problem: In the living individual, the estimation of dental age is a parameter used in orthopedics or dentofacial orthodontics or in pediatrics to locate the individual on its growth curve. In forensic medicine, the estimation of dental age allows to infer the chronological age for a regression or a classification task. There are physical and radiological methods. While the latter are more accurate, there is no universal method. Demirjian created the most widely used radiological method almost 50 years ago, but it is criticized for its accuracy and for using reference tables based on a French-Canadian population sample. Objective: Artificial intelligence, and more particularly machine learning, has allowed the development of various tools with a learning capacity on an annotated database.

The objective of this thesis was to compare the performance of different machine learning algorithms first against two classical methods of dental age estimation, and then between them by adding additional predictors.Material and method: In a first part, the different methods of dental age estimation on living children and young adults are presented. The limitations of these methods are exposed and the possibilities to address them with the use of machine learning are proposed. Using a database of 3605 panoramic radiographs of individuals aged 2 to 24 years (1734 girls and 1871 boys), different machine learning methods were tested to estimate dental age. The accuracies of these methods were compared with each other and with two classical methods by Demirjian and Willems. This work resulted in an article published in the International Journal of Legal Medicine. In a second part, the different machine learning methods are described and discussed. Then, the results obtained in the article are put in perspective with the publications on the subject in 2021. Finally, a perspective of the results of the machine learning methods in relation to their use in dental age estimation is made.

Results: The results show that all machine learning methods have better accuracy than the conventional methods tested for dental age estimation under the conditions of their use. They also show that the use of the maturation stage of third molars over an extended range of use to 24 years does not allow the estimation of dental age for a legal issue.

Conclusion: Machine learning methods fit into the overall process of automating dental age determination. The specific part of deep learning seems interesting to investigate for dental age classification tasks.

Soutenance de Thèse – Noursen Ntoucha Ali (10 mars 2022)

Noursen Ntoucha Ali soutiendra sa thèse intitulée “Suivi des modèles de domestication et de gestion des chevaux chez les mâles et les femelles à l’aide de séries chronologiques d’ADN ancien” le Jeudi 10 mars 2022

La soutenance se tiendra à 9.00 en “salle des thèses”, Faculté de médecine de Purpan au 37 allées Jules Guesde, 31 000 Toulouse

Composition du Jury

  • M. Eric Barray, Rapporteur
  • M. Pierre Pontarotti, Rapporteur
  • M. Gabriel Marais, Rapporteur
  • M. Eric Crubezy, Examinateur
  • Mme Morgane Gibert, Examinatrice
  • M. Ludovic Orlando, Directeur de thèse

Résumé:

La domestication des chevaux a commencé il y a environ 5,500 ans dans les steppes d’Asie
Centrale. Ce processus a eu un impact profond sur l’histoire de l’humanité, car les chevaux
nous fournissent un transport rapide et facilitent la propagation de nos biens, de nos maladies et de nos cultures. Une fois la domestication lancée, les humains n’ont eu de cesse que de façonner l’histoire évolutive des chevaux, pour aboutir, au moyen de la sélection artificielle et de mélanges savants, à la formation des centaines de races domestiques vivant aujourd’hui sur terre, mais aussi à l’extinction de toutes les populations sauvages. Depuis quelques siècles, le rôle des mâles et des femelles dans la reproduction équine s’est considérablement déséquilibré, puisque très souvent, et en particulier chez les races à haute valeur économique ajoutée, les étalons sont soumis à une sélection particulièrement intensive, donnant à quelques poignées d’individus un immense pouvoir reproducteur. Il n’est cependant pas certain que des stratégies de gestion similaires furent déjà mises en place dès les premiers stades de la domestication du cheval. Cette thèse de doctorat vise à éclairer la question de la contribution des mâles et des femelles dans le processus d’élevage des chevaux, depuis leur domestication initiale à nos jours. Pour se faire, des analyses paléogénétiques se sont attachées, dans un premier temps, à suivre les patrons de variation de l’ADN mitochondrial et du chromosome Y dans l’espace et le temps. L’analyse en parallèle de 266 génomes mitochondriaux complets et de 76 chromosomes Y partiels de chevaux anciens par la méthode de modélisation bayésienne Skyline, directement calibrée par datation radiocarbone, nous a permis de reconstituer les trajectoires démographiques des deux sexes au cours des dix derniers milliers d’années. Nos résultats suggèrent que les lignées maternelles et paternelles qui ont conduit à l’essor du cheval domestique moderne ont connu une expansion démographique massive et parallèle à partir de la fin du 3ème millénaire avant notre ère. Les profils démographiques des lignées maternelles et paternelles s’épousent l’un l’autre, ce qui semble indiquer que des logiques de production balancées entre mâles et femelles à l’époque. Au-delà des chevaux, cette thèse s’est ensuite attachée à évaluer les stratégies de gestion d’autres ressources équines, comme les ânes et leurs hybrides de première génération, les mules, qui sont connus pour leur force de travail et pour avoir joué des rôles économiques et symboliques de premier plan en France. Ce sont ici des données de séquençage d’ADN ancien peu profondes qui nous ont permis, par analyse bioinformatique via le programme Zonkey, de révéler que si les chevaux sont restés l’espèce équine la plus populaire depuis l’Âge du Fer, les ânes et les mules, tantôt d’un sexe, tantôt de l’autre, ont pu occuper les devants de la scène selon les c ontextes sociaux, géographiques et temporels.

Abstract:

Horse domestication started ~5.5 thousand years ago in the steppes of Central Asia. This
process has had a far-reaching impact on human history, as horses provided humans with
rapid transportation and facilitated the spread of goods, diseases and cultures. Following
domestication, the evolutionary history of horses was shaped by humans, which resulted in
the formation of hundreds of domestic breeds by means of artificial selection and admixture, while ultimately leading to the extinction of all truly wild populations. Today, males and females do not contribute symmetrically to the breeding process, with most economically important bloodlines facing extensive selection through stallions. The extent to which management strategies based on such a skewed male reproductive bias were already in place in the early stages of horse domestication remains contentious. This PhD thesis set out to answer this question, by tracking the contribution of males and females in the horse breeding process by following temporal patterns of mitochondrial DNA and Y chromosome variation through space and time using ancient DNA evidence and tip-calibrated Bayesian Skyline modeling. We analyzed 266 complete mtDNA genomes and 76 partial Y chromosomes from ancient horses, all radiocarbon dated and belonging to the modern domestic lineage. This allowed us to reconstruct the demographic trajectories for both sexes through time over the last 10,000 years. Our results suggested that both maternal and paternal DOM2 lineages experienced a massive, parallel demographic expansion from the late 3rd millennium BCE (Before Common Era), indicating that no sex biased reproduction at the time. In addition to horses, this PhD thesis set out to assess management strategies of other equine resources, such as donkeys and their first-generation hybrids – the mules, which are notorious for their economic and symbolic importance. Here, shallow ancient DNA sequencing data processed through the Zonkey computational pipeline revealed horses as the dominant species throughout all time periods, but also dynamic shifts in the relative importance of other species and sex balances in various social, geographic and temporal contexts.

Soutenance de Thèse – Marine Poullet (9 mars 2022)

Marine Poullet soutiendra sa thèse intitulée “Etude épigénomique sur la domestication du cheval à l’aide d’ADN ancien” le mercredi 9 mars 2022

La soutenance se tiendra à 9.00 en “salle des thèses”, Faculté de médecine de Purpan au 37 allées Jules Guesde, 31 000 Toulouse

Composition du Jury

  • M. Gianni Liti, Université de Nice Sophia Antipolis, Rapporteur
  • M. Pierre Pontarotti, UMR MEPHI, IHU Méditerranée Infection, Marseille, Rapporteur
  • M. Gabriel Marais, CIBIO, Université de Porto, Examinateur
  • M. Eric Crubezy, Université Toulouse 3 Paul Sabatier, Examinateur
  • Mme Clio Der Sarkissian, Université Toulouse 3 Paul Sabatier, Examinatrice
  • M. Ludovic Orlando, Université Toulouse 3 Paul Sabatier, Directeur de thèse

Résumé:

L’émergence du séquençage de nouvelle génération (NGS) au début des années 2000 a été l’une des étapes marquantes dans l’histoire récente de la recherche. Cela a révolutionné non seulement le monde de la biologie moléculaire mais aussi celui des sciences en général, en permettant des avancées tant en archéologie qu’en cancérologie. Muni d’une technologie de séquençage d’ADN à très haut débit, les chercheurs ont pu caractériser des milliers de génomes anciens à ce jour, y compris parmi des lignées aujourd’hui éteintes. Cette avancée technologique majeure a également révélé qu’au-delà des séquences des génomes elles-mêmes, il est possible de recouvrer des marques épigénétiques anciennes à partir des traces ADN préservée dans le matériel archéologique. Cela a permis ainsi d’envisager étudier l’évolution possible des modifications épigénétiques portées par des individus ayant traversé de grands changements dans leurs conditions de vie, comme la domestication pour les animaux. Dans le cadre de ce doctorat, nous avons voulu évaluer et contribuer à résoudre certains des différents verrous technologiques et méthodologiques qui rendent la production d’estimations fiables des marques épigénétiques anciennes particulièrement difficile. Parmi les différentes marques épigénétiques accessibles par l’ADN ancien, nous ne nous sommes concentrés que sur la méthylation de l’ADN présente au niveau des dinucléotides CpG. Les méthodes développées nous ont permis d’aborder la question des modifications épigénétiques qui ont accompagné la domestication du cheval depuis ses origines, il y a environ 5 500 ans, jusqu’à nos jours, période au cours de laquelle plusieurs centaines de races distinctes ont été développées. S’ils ont contribué à améliorer certains aspects de l’inférence épigénétique de données anciennes, nos travaux ont néanmoins révélé des limites à la fois expérimentales et analytiques importantes. Les procédures actuelles permettant l’analyse de données épigénétiques modernes ne se révèlent malheureusement pas toujours compatibles avec l’utilisation de données anciennes. Par ailleurs, ce travail de thèse a donné plusieurs pistes d’améliorations futures concernant notre capacité à manipuler les molécules d’ADN ancien et obtenir des alignements plus fiables sur les génomes de référence.

Abstract:

The emergence of Next Generation Sequencing (NGS) in the early 2000s was one of the milestones in the recent history of research. This technology revolutionised not only the world of molecular biology but also that of science in general, allowing advances in both archaeology and cancerology. Using ultra-high-throughput DNA sequencing technology, researchers have characterised thousands of ancient genomes to date, including some now extinct lines. This major technological breakthrough has also revealed that beyond the genome sequences themselves, it is possible to recover ancient epigenetic marks from DNA traces preserved in archaeological material. This made it possible to consider studying the potential evolution of epigenetic modifications carried by individuals who have gone through significant changes in their living conditions, such as domestication for animals. As part of this PhD, we wanted to assess and help resolve some of the various technological and methodological obstacles that make producing reliable estimates of ancient epigenetic marks particularly difficult. Among the various epigenetic marks accessible by ancient DNA, we have only focused on the methylation of DNA present at the level of CpG dinucleotides. The methods developed have enabled us to tackle the question of the epigenetic modifications that have accompanied the domestication of the horse from its origins, around 5,500 years ago, to the present day, a period during which several hundred distinct breeds have been developed. While helping to improve certain aspects of epigenetic inference from ancient data, our work nonetheless revealed significant experimental and analytical limitations. Current procedures for analysing modern epigenetic data are unfortunately not always compatible with the use of ancient data. In addition, this thesis work has provided several avenues for future improvements concerning our ability to manipulate ancient DNA molecules and obtain more reliable alignments on the reference genomes.