génotypage basé sur le séquençage ddRAD de six races de bovins laitiers indigènes de l'Inde pour déduire la diversité génétique existante et la structure de la population

Nouvelles

MaisonMaison / Nouvelles / génotypage basé sur le séquençage ddRAD de six races de bovins laitiers indigènes de l'Inde pour déduire la diversité génétique existante et la structure de la population

May 30, 2023

génotypage basé sur le séquençage ddRAD de six races de bovins laitiers indigènes de l'Inde pour déduire la diversité génétique existante et la structure de la population

Rapports scientifiques volume 13,

Rapports scientifiques volume 13, Numéro d'article : 9379 (2023) Citer cet article

Détails des métriques

La présente enquête visait à identifier les SNP à l'échelle du génome et à mener une étude sur la diversité et la structure de la population à l'aide du génotypage basé sur ddRAD-seq de 58 individus de six races indigènes de bovins laitiers (Bos indicus) telles que Sahiwal, Gir, Rathi, Tharparkar, Red Sindhi et Kankrej de l'Inde. Un pourcentage élevé de lectures (94,53 %) ont été cartographiés sur l'assemblage du génome de référence du Bos taurus (ARS-UCD1.2). Selon les critères de filtration, un total de 84 027 SNP de haute qualité ont été identifiés dans le génome de 6 races bovines avec le plus grand nombre de SNP observés à Gir (34 743), suivi de Red Sindhi (13 092), Kankrej (12 812), Sahiwal (8956) , Tharparkar (7356) et Rathi (7068). La plupart de ces SNP étaient distribués dans les régions introniques (53,87 %) suivies des régions intergéniques (34,94 %) tandis que seulement 1,23 % étaient situés dans les régions exoniques. Avec l'analyse de la diversité des nucléotides (π = 0,373), le D de Tajima (valeur D allant de − 0,295 à 0,214), l'hétérozygotie observée (HO allant de 0,464 à 0,551), le coefficient de consanguinité (FIS allant de − 0,253 à 0,0513) suggéré pour le présence d'une diversité de races suffisante dans les 6 principales races laitières de l'Inde. La structuration basée sur la phylogénétique, l'analyse des composants principaux et des mélanges a révélé la distinction génétique ainsi que la pureté de presque toutes les 6 races bovines. Dans l'ensemble, notre stratégie a identifié avec succès des milliers de SNP de haute qualité à l'échelle du génome qui enrichiront davantage les informations de base sur la représentation de Bos indicus sur la diversité génétique et la structure de 6 principales races indiennes de bovins laitiers, ce qui devrait avoir des implications pour une meilleure gestion et conservation de précieux bovins indicine. diversité.

Le sous-continent indien abrite une méga diversité de races bovines Bos indicus du monde1. On pense que le zébu indien (Bos Indicus) est issu d'aurochs sauvages Bos primigenius nomadicus2,3 et des études basées sur l'analyse de marqueurs d'ADN mitochondrial ont indiqué que Bos indicus s'est séparé de Bos taurus il y a entre 110 000 et 850 000 ans4,5. Dans le monde, I1 et I2 sont les deux principaux haplogroupes d'ADN mitochondrial (ADNmt) qui ont été signalés pour Bos indicus. On pense que l'I1, qui est l'haplogroupe prédominant, est originaire de l'Inde et du Pakistan, tandis que l'haplogroupe I2 présente un schéma de diversité complexe, ce qui rend difficile la détermination de son origine6,7,8. Bien que des découvertes récentes aient identifié un nouveau sous-haplogroupe I1a, dans l'haplogroupe I1 au sein de la lignée Bos indicus9. D'autre part, la diversité du chromosome Y trouvée chez les bovins Bos indicus est caractérisée par un seul haplogroupe Y3, contrairement à deux haplogroupes différents Y1 et Y2 trouvés chez Bos taurus. De plus, deux sous-haplogroupes distincts au sein de chacun des haplogroupes Y2 (Y2a et Y2b) et Y3 (Y3a et Y3b) ont été identifiés. L'haplogroupe Y3 a été observé comme étant inimitable à Bos indicus et les résultats ont montré que le sous-haplogroupe Y3a dominait les bovins du sud de la Chine, alors que le sous-haplotype Y3b était présent dans les races Bos indicus d'origine indienne10. Avec une population de 192,49 millions de bovins, l'Inde compte 13,1 % de la population bovine mondiale11. De plus, l'Inde occupe le premier rang mondial de la production laitière avec une production totale de 198,4 millions de tonnes de production laitière au cours de la période 2019-202012. Le zébu indien est un membre important de la famille des bovidés et est une ressource majeure pour le lait et la sécheresse dans le sous-continent indien. À l'heure actuelle, il existe 53 races bovines indigènes bien définies en Inde qui peuvent être différenciées en races laitières, à double usage ou de trait sur la base de leur utilité. Les races bovines laitières ont produit en moyenne plus de 1600 kg de lait par lactation, les races à double usage produisent environ 150 à 500 kg par lactation tandis que les races de trait sont principalement utilisées pour les travaux agricoles. Les principales races laitières de l'Inde comprennent Gir (GIC), Rathi (RAC), Red Sindhi (RSC), Sahiwal (SAC) et Tharparkar (THC), les races à double usage comprennent Badri, Belahi, Deoni, Gaolao, Hariana, Kankrej, Konkani, Ladakhi, Malnad Gidda, Mewati, Ongole tandis que les races restantes sont classées comme races de trait.

Les races bovines indigènes indiennes (Bos indicus) sont bien adaptées pour résister au climat rigoureux tout en restant efficaces. En outre, ils sont adaptés aux systèmes de production à faibles intrants avec des exigences de maintenance et de gestion réduites. Cependant, dans le cadre du système de production actuel, qui se concentre principalement sur l'augmentation de la production laitière, la taille de la population de bovins indigènes est en phase de déclin en raison de (1) la modernisation de l'agriculture et (2) le croisement avec des races exotiques pour maximiser la production globale et profit économique. La négligence des caractères supérieurs du bétail indien, comme l'adaptation au climat diversifié et la survie avec un système à faibles intrants par rapport à la production, entraîne la perte de races ou de diversité génétique globale. Par conséquent, les mesures d'atténuation visant à caractériser et à conserver la diversité génétique sont essentielles pour éviter une perte supplémentaire d'importants gènes/pool de gènes et une perte de variabilité, ce qui est très important pour obtenir un gain génétique plus élevé dans les caractéristiques économiques des races bovines laitières indigènes. La caractérisation et l'évaluation approfondies de la diversité génétique des races bovines sont d'une grande importance pour assurer une amélioration génétique à long terme, faciliter une adaptation rapide au changement climatique et pour une gestion et une conservation efficaces des ressources génétiques animales13,14.

Les études à l'échelle du génome axées sur la génétique des populations, la phylogéographie et la biologie de la conservation ont été grandement facilitées par les progrès rapides des technologies de séquençage à haut débit15. Ces dernières années, les méthodes de séquençage à représentation réduite telles que les approches d'ADN associé au site de restriction à double digestion (ddRAD) ont reçu une attention mondiale en raison de leur capacité à identifier les variations à l'échelle du génome à un coût relativement faible. L'analyse de la diversité et de la structure de la population basée sur les SNP à l'échelle du génome à l'aide de ddRAD a été réalisée chez différentes espèces de bétail comme le buffle, le yack, le cheval et le chameau16,17,18,19. ddRAD étant une représentation réduite basée sur la digestion de restriction La méthode de séquençage de nouvelle génération fragmente un génome cible avec des enzymes de restriction de coupe fréquentes et rares et une telle stratégie minimise les tracas des séquences non informatives et répétitives, l'assemblage de séquences et l'appel SNP qui accompagne le séquençage du génome entier (WGS ). De toute évidence, ddRAD a été utilisé pour la découverte de SNP à l'échelle du génome spécifiques à l'espèce dans les gènes candidats liés aux traits économiques, de production et d'adaptation20,21,22. De plus, les méthodes de représentation réduite basées sur le séquençage du génome entier d'individus uniques résolvent le problème du biais de détermination23. Auparavant, les puces SNP basées sur des matrices étaient largement utilisées dans les études génétiques du bétail, y compris les études d'association à l'échelle du génome (GWAS)24,25, les études de signature de sélection26,27, la diversité et l'analyse de la structure de la population28,29,30. Cependant, les puces SNP incluent généralement des SNP qui ont été précédemment découverts par séquençage d'ADN. Ces SNP peuvent ne pas être géographiquement représentatifs et ont tendance à être plus fréquents que les SNP aléatoires et, surtout, nuisent à l'identification des mutations occasionnelles. Par conséquent, les paramètres génétiques de la population tels que la diversité, la structure de la population et les estimations de recombinaison peuvent être biaisés23,31. Par conséquent, dans cette étude, nous avons appliqué l'approche de séquençage ddRAD, afin de surmonter le biais de détermination pour la découverte de SNP à l'échelle du génome et d'entreprendre des études de diversité chez les bovins indicine.

Compte tenu de la précieuse contribution des bovins laitiers indigènes au soutien des moyens de subsistance de nombreux Indiens pendant de nombreuses générations, peu d'efforts ont été déployés pour évaluer la diversité génétique et la relation chez les bovins indiens à l'aide de SNP à l'échelle du génome. Une caractérisation complète de la diversité génétique intra et interraciale des races bovines indigènes indiennes pour faciliter une gestion efficace et rationnelle fait défaut. L'exploration de la diversité génétique, y compris la structure de la population et le mélange, peut accélérer les programmes de conservation appropriés. Une compréhension approfondie et approfondie des gènes/du pool de gènes indigènes aidera à comprendre le mécanisme sous-jacent à d'importants traits fonctionnels et aidera à répondre aux futures demandes de production des populations locales. La présente enquête a été entreprise pour identifier les SNP à l'échelle du génome et évaluer la diversité génomique intra et interraciale, établir des relations interraciales et évaluer leur structure de population.

Le séquençage ddRAD a basé le génotypage de 58 individus appartenant à six races bovines indigènes ; Les bovins Gir, Sahiwal, Tharparkar, Rathi, Red Sindhi et Kankrej avec leur répartition géographique et écologique (Fig. 1) y compris le but productif, la couleur du pelage, la zone agroclimatique représentative, l'aire d'élevage, la coordonnée géographique de chaque aire d'élevage ainsi que ID de l'animal et sexe de chaque individu présentés dans le tableau supplémentaire S1 ; a abouti à 138,59 millions de lectures brutes correspondant à 23 millions de lectures par race et 2,2 millions de lectures par animal. Après un filtrage initial sur la base de la qualité de lecture et de la suppression de l'adaptateur, la majorité des lectures (138,58 millions de lectures ; 99,9 %) ont été conservées (tableau supplémentaire S2). Un pourcentage élevé de lectures (94, 53%) ont été mappées à l'assemblage de référence Bos taurus (ARS-UCD1.2) (tableau supplémentaire S2). Dans cette étude, l'effort a été fait pour analyser uniquement les SNP de différentes races bovines, par conséquent, toutes les autres variantes n'ont pas été prises en compte dans l'analyse ultérieure. Le nombre de SNP dans 6 races bovines variait entre 8, 42, 768 et 3, 81, 966 après l'appel de la variante individuelle. Le nombre maximum de SNP a été observé dans SAC (8,42,768), suivi de GIC (8,34,780), KAC (8,10,279), RAC (8,05,020), RSC (6,72,632) et THC (3,81,966) (Tableau 1). L'ensemble de données combiné sur 6 races bovines a produit un total de 43,47,445 SNP. Par la suite, le fichier VCF a été traité de manière progressive pour filtrer les SNP de faible qualité. Premièrement, les SNP ont été filtrés à une profondeur de lecture de 2 (RD 2), une profondeur de lecture de 5 (RD 5) et une profondeur de lecture de 10 (RD 10). Pour une analyse plus approfondie, l'ensemble de données de 9 82 174 SNP identifiés à RD de 5 a été utilisé pour une analyse ultérieure (tableau 1). Tous les SNP qui étaient présents à faible couverture (RD < 5) ont été supprimés de l'ensemble de données. Les SNP qui ont été identifiés à RD de 5 ont ensuite été filtrés à l'aide de divers critères tels que la proportion de génotypes manquants, la fréquence des allèles mineurs et l'équilibre de Hardy Weinberg (HWE). La série de filtrage a abouti à un total de 84 027 SNP de haute qualité. Après le filtrage, le nombre de SNP d'une race à l'autre variait considérablement. Le plus grand nombre de SNP a été observé dans le GIC (34 743), suivi du RSC (13 092), du KAC (12 812), du SAC (8 956), du THC (7 356) et du RAC (7 068) (tableau 2).

Répartition géographique des six races bovines incluses dans cette étude (la carte a été générée à l'aide des sites Web Map Chart https://www.mapchart.net/ et Paint Maps https://paintmaps.com/).

L'ensemble de données fusionnées de SNP de haute qualité de toutes les 6 races laitières a été annoté au génome de référence de Bos taurus (ARS-UCD1.2). En ce qui concerne leur distribution dans le génome, il a été prédit qu'un grand nombre de SNP annotés se trouveraient dans la région intronique (41 372 SNP, 53,87 %), suivie des régions intergéniques (26 834 SNP, 34,94 %). Il n'y avait que 948 SNP (1,23%) qui étaient distribués dans les régions exoniques. De plus, il y avait 3497 SNP (4,55%) situés dans la région de 5 Kb en amont et 3661 SNP (4,77%) en aval du site de début de transcription. L'analyse a également abouti à 93 SNP (0,121 %) situés dans la région 5'UTR, 293 SNP (0,38 %) dans la région 3'UTR. Un total de 8 SNP (0, 01%) censés provoquer un codon d'arrêt prématuré ont également été identifiés (Fig. 2).

Partitionnement global des SNP par rapport à la distribution génomique pour toutes les races.

Sur la base de l'impact des SNP sur les gènes codant pour les protéines, les SNP ont été classés comme ayant un impact élevé (10 SNP ; 0,01 %), un impact modéré (298 SNP ; 0,39 %) et un impact faible (697 SNP ; 0,91 %) . La majorité des SNP (75 801 ; 98,69 %) ont été identifiés comme modificateurs (tableau supplémentaire S3). De plus, une forte proportion de SNP (65,74 %) étaient de nature silencieuse, suivis du faux-sens (33,37 %) et du non-sens (0,89 %), avec un rapport moyen faux-sens/silencieux de 0,507 (tableau supplémentaire S4). De plus, parmi tous les génotypes substitués identifiés dans la présente étude, les génotypes C/T et G/A se sont avérés prédominants, tandis que le génotype A/T s'est avéré être dans les proportions les plus faibles (tableau supplémentaire S5). Pour chaque race, les résultats d'annotation sont résumés à la Fig. 3 et au tableau supplémentaire S6. Dans GIC, le nombre le plus élevé de SNP 32 283 (53,96 %) devait se trouver dans la région intronique suivie de la région intergénique 20 395 (34,09 %). Seuls 777 (1,3%) ont été détectés dans la région exonique. Semblable au GIC, le plus grand nombre de SNP a été distribué dans la région intronique suivie de la région intergénique et exonique dans toutes les autres races bovines. Par exemple, dans SAC, 53,87 % des SNP (8429) ont été prédits dans la région intronique, suivis de la région intergénique 33 % (5163 SNP) et seulement 1,75 % (273 SNP) dans la région exonique. Une tendance similaire a été observée pour les races bovines RAC, RSC, KAC et THC avec 6834 (55,63%), 11 147 (52,12%), 8429 (53,87%), 6374 (52,58%) SNP, respectivement dans la région intronique, 4186 (34,08 %), 8192 (38,30%), 5163 (33%), 4507 (37,18%) SNP respectivement, dans la région intergénique et seulement 142 (1,16%), 266 (1,24%), 273 (1,75%), 123 (1,02 %) ont été prédits dans les régions exoniques (Fig. 3). Le nombre de variants synonymes identifiés dans GIC, KAC, RAC, RSC, SAC et THC était respectivement de 570, 190, 101, 172, 213 et 87. En revanche, le nombre de variants non synonymes détectés pour les 6 races bovines était respectivement de 165, 64, 31, 82, 53 et 30. Le rapport TS/TV observé dans GIC, KAC, RAC RSC SAC et THC était respectivement de 2,55, 2,64, 2,33, 2,43, 2,51 et 2,19 (tableau supplémentaire S6).

Distribution génomique des SNP dans le génome de six races indiennes de bovins laitiers.

Le nombre de SNP intergéniques était de 4 639 873 (68,1 %) et 1 676 710 (24,6 %) étaient introniques. Il y avait 230 365 (3,4 %) SNP situés à moins de 5 kb en amont et 197 827 (2,9 %) en aval d'un site de début de transcription ; 12 428 SNP étaient localisés dans le 5′ UTR et 2613 dans le 3′ UTR. Un total de 4356 SNP ont été localisés dans des sites d'épissage de 2966 gènes : 142 étaient dans des sites donneurs d'épissage, 142 étaient des sites accepteurs d'épissage et 4072 étaient dans la région du site d'épissage. Nous avons identifié 45 776 SNP affectant les séquences codantes de 11 538 gènes. Il y avait 221 SNP prédits pour provoquer un codon stop prématuré et 17 pour provoquer un gain dans la séquence codante. Le nombre de SNP prédits comme non synonymes était de 20 828. Le nombre de SNP intergéniques était de 4 639 873 (68,1 %) et 1 676 710 (24,6 %) étaient introniques. Il y avait 230 365 (3,4 %) SNP situés à moins de 5 kb en amont et 197 827 (2,9 %) en aval d'un site de début de transcription ; 12 428 SNP étaient localisés dans le 5′ UTR et 2613 dans le 3′ UTR. Un total de 4356 SNP ont été localisés dans des sites d'épissage de 2966 gènes : 142 étaient dans des sites donneurs d'épissage, 142 étaient des sites accepteurs d'épissage et 4072 étaient dans la région du site d'épissage. Le nombre de SNP intergéniques était de 4 639 873 (68,1 %) et 1 676 710 (24,6 %) étaient introniques. Il y avait 230 365 (3,4 %) SNP situés à moins de 5 kb en amont et 197 827 (2,9 %) en aval d'un site de début de transcription ; 12 428 SNP étaient localisés dans le 5′ UTR et 2613 dans le 3′ UTR. Un total de 4356 SNP ont été localisés dans des sites d'épissage de 2966 gènes : 142 étaient dans des sites donneurs d'épissage, 142 étaient des sites accepteurs d'épissage et 4072 étaient dans la région du site d'épissage. Nous avons identifié 45 776 SNP affectant les séquences codantes de 11 538 gènes. Il y avait 221 SNP prédits pour provoquer un codon stop prématuré et 17 pour provoquer un gain dans la séquence codante. Le nombre de SNP prédits comme non synonymes était de 20 828. Le nombre de SNP intergéniques était de 4 639 873 (68,1 %) et 1 676 710 (24,6 %) étaient introniques. Il y avait 230 365 (3,4 %) SNP situés à moins de 5 kb en amont et 197 827 (2,9 %) en aval d'un site de début de transcription ; 12 428 SNP étaient situés dans le 5 'UTR et 2613 dans le 3' UTR. Au total, 4 356 SNP étaient situés dans des sites d'épissage de 2 966 gènes : 142 se trouvaient dans des sites donneurs d'épissage, 142 étaient des sites accepteurs d'épissage et 4 072 se trouvaient dans la région du site d'épissage. Nous avons identifié 45 776 SNP affectant les séquences codantes de 11 538 gènes. Il y avait 221 SNP prédits pour provoquer un codon stop prématuré et 17 pour provoquer un gain dans la séquence codante. Le nombre de SNP prédits comme non synonymes était de 20 828.

La diversité nucléotidique (π) était la plus élevée dans le THC (π = 0,458) suivi de RSC (π = 0,364), SAC (π = 0,363), GIC (π = 0,356), KAC (π = 0,348) et RAC (π = 0,347 ). La valeur moyenne de la diversité des nucléotides était de 0,373 (tableau 3). Les valeurs D de Tajima étaient négatives pour 4 races bovines, à savoir RSC, RAC, SAC et THC, sauf pour GIC et SAC où des valeurs D positives ont été observées. La valeur D négative de Tajima la plus élevée a été observée dans le THC (-1,194), suivi du RSC (− 1,088), du RAC (− 0,295) et du KAC (− 0,279).

Les valeurs d'hétérozygotie (HO) observées variaient de 0,464 à 0,551 tandis que l'hétérozygotie attendue (HE) variait de 0,448 à 0,535. Les valeurs d'hétérozygotie observées les plus élevées ont été observées dans le THC (HO = 0,551) suivi de RAC (HO = 0,523), RSC (HO = 0,5184), SAC (HO = 0,5180), GIC (HO = 0,499) et KAC (HO = 0,464) (Tableau 4). Le FIS moyen (coefficient de consanguinité) varie de -0,253 en THC à 0,0513 en KAC. L'estimation FIS parmi les six races bovines était la plus élevée pour le THC (FIS = − 0,253) suivi de RAC (FIS = − 0,105), tandis que l'estimation FIS la plus faible a été observée pour KAC (FIS = 0,0513) suivi de GIC (FIS = − 0,00063 ). L'analyse FIS globale a révélé un excès d'hétérozygotie pour toutes les races bovines à l'exception de KAC (tableau 4). Les estimations de l'hétérozygotie et du FIS ont indiqué la présence d'une diversité suffisante au sein des six races bovines.

La différenciation génétique sur la base de l'indice de fixation (FST) variait de 0,2840 à 0,3905, indiquant une diversité suffisante entre les races. La divergence la plus élevée a été observée entre la paire RAC-SAC (FST = 0,3905), suivie de la paire de race RSC-RAC (FST = 0,3790), la paire de race RSC-SAC (FST = 0,3751). La moindre divergence a été observée pour la paire de race KAC-THC (FST = 0,2840) (tableau 5). L'arbre basé sur Neighbor Joining (NJ) a regroupé les animaux individuels de 6 races bovines en fonction de leurs affiliations raciales, GIC et RSC étant la race la plus diversifiée parmi les 6 races bovines étudiées. La relation phylogénétique au niveau individuel est illustrée à la Fig. 4. L'arbre NJ par race représenté à la Fig. 5, plus ou moins corroboré avec l'arbre au niveau individuel. De plus, un arbre phylogénétique basé sur UPGMA a été construit au niveau de la race à l'aide du package "phangorn" dans la plate-forme R avec 100 valeurs bootstrap. Les valeurs bootstrap de chaque nœud étaient proches de 100 %, ce qui indique une grande robustesse de l'arbre construit. L'arbre phylogénétique basé sur l'UPGMA reflétait une relation génétique similaire, comme l'a révélé la différenciation génétique basée sur le NJ (au niveau individuel et au niveau de la race) où GIC et RSC apparaissaient comme les races les plus distinctes. Le GIC est apparu sur le nœud principal et s'est regroupé en un seul groupe tandis que les autres populations formaient deux groupes avec le RSC regroupé sur un nœud et le RAC, le THC, le SAC et le KAC formaient d'autres sous-groupes (Fig. 6).

Regroupement phylogénétique basé sur Neighbour-Joining de 58 animaux de six races bovines laitières indiennes à l'aide du logiciel Tassel.

Regroupement basé sur le Neighbour-Joining de 6 races bovines laitières indiennes utilisant le package "phangorn" de la plate-forme R.

Regroupement phylogénétique basé sur UPGMA de six races laitières indiennes utilisant le package "phangorn" de la plate-forme R.

L'analyse des mélanges a été réalisée en partitionnant le génome de chaque individu en un cluster prédéfini. L'analyse a été réalisée à K = 3, 4, 5 et 6 (Fig. 7). Les individus n'ont pas pu être regroupés à K = 3 selon leur race respective. Seul le GIC peut être différencié distinctement tandis que les individus de KAC et SAC apparaissent comme un seul groupe et RAC, THC et RSC sont regroupés indiquant leur ascendance commune. À K = 4, et même à K = 5, THC, RAC et RSC se sont regroupés, indiquant leur forte ascendance commune, tandis que tous les autres individus se sont regroupés dans leur propre race respective. Le meilleur K dans l'analyse de la structure de la population est K = 6, où presque tous les animaux ont été regroupés dans leur race respective, indiquant clairement leur ascendance séparée, à l'exception du RSC et du THC qui sont toujours regroupés. La proximité génétique entre le RSC et le THC pourrait être dévoilée par des études plus approfondies et en augmentant le nombre d'échantillons.

Analyse des mélanges en supposant que 3 ≤ K ≤ 6.

L'analyse basée sur l'ACP a également regroupé 6 races bovines séparément et renforce le fait qu'il s'agit de races bovines distinctes (Fig. S1 supplémentaire). Les individus de KAC ont été regroupés dans un quadrant, tandis que les individus des races bovines SAC RAC, THC et RSC tombent dans un quadrant différent. Les individus de race bovine GIC sont apparus comme une population distincte.

Le sous-continent indien est doté d'une immense richesse de races bovines zébus (Bos indicus). L'isolement géographique au fil du temps a créé une pléthore de types/races génétiques, mais l'ampleur de la différenciation génétique n'a pas été bien quantifiée. La variabilité génétique des races indigènes est une préoccupation majeure compte tenu de la nécessité de préserver ce qui peut être une richesse précieuse et irremplaçable développée à la suite d'interactions complexes entre le génotype et l'environnement. Par conséquent, l'information moléculaire est cruciale pour préserver la diversité génétique ainsi que pour prévenir la perte indésirable d'allèles. Dans cette étude, la diversité génétique et la structure de la population de 6 principales races bovines laitières indiennes ont été estimées à l'aide d'un grand nombre de SNP à l'échelle du génome générés par séquençage ddRAD.

Dans la présente étude, une moyenne de 2,2 millions de lectures par animal ont été obtenues avec un taux de cartographie élevé de 94,53 % sur le génome de référence de Bos taurus (ARS-UCD1.2). Le nombre total de SNP identifiés dans la présente étude varie par rapport aux rapports précédents. Gurgul et al.32 ont rapporté 8065 SNP de haute confiance chez 48 individus de différentes races bovines taurines par une seule approche de digestion par restriction enzymatique GBS. De même, en utilisant la même approche, Malik et al.33 ont identifié 1 07 488 SNP chez 24 animaux appartenant à sept races bovines indiennes, à savoir Gangatiri, Hariana, Kankrej, Ongole, Sahiwal, Siri et Tharparkar. De plus, De Donato et al.34 ont identifié 63 697 SNP chez 47 animaux de races taurine et indicine en utilisant une seule méthode GBS enzymatique. D'autre part, en utilisant le protocole GBS à 2 enzymes, Brouard et al.35 ont rapporté un total de 2,72,103 variants chez 48 bovins laitiers canadiens. De même, le séquençage RAD a été utilisé pour identifier 2, 38 725 et 84 854 SNP de haute confiance dans les races bovines indigènes du Sichuan et de Liangshan en Chine, respectivement 36, 37. Récemment, des études menées à l'aide de ddRAD chez la race bovine indienne Sahiwal ont rapporté un total de 258 231 SNP à l'échelle du génome avec une profondeur de lecture minimale de 2, 10, 232 570 SNP à une profondeur de lecture de 5 et 193 803 SNP ont été identifiés respectivement21. Le nombre de SNP de confiance élevée identifiés dans la présente étude et d'autres études antérieures pourrait être attribué aux niveaux et à la rigueur des paramètres de filtrage appliqués lors de l'appel de SNP.

Le rapport Ts/Tv moyen était de 2,53. Le rapport Ts/Tv observé dans la présente étude était similaire à de nombreuses autres études de séquençage à représentation réduite réalisées chez le yak, les buffles et les bovins17,38,39. Un grand nombre de SNP détectés se trouvaient dans les régions introniques et intergéniques, ce qui avait été observé de la même manière dans des études précédentes16,22. L'annotation des SNP dans cette étude a également révélé que les génotypes substitués G/A et C/T étaient principalement trouvés, alors que le génotype AT était le moins présent. Cette observation était similaire aux études menées par Kumar et al.11 et Wang et al.36.

La diversité nucléotidique (π) avec une valeur globale de 0,373 était significativement plus élevée dans les 6 races laitières indigènes indiennes par rapport à la diversité nucléotidique moyenne (π = 0,18 et π = 0,227) rapportée pour les bovins chinois utilisant le séquençage RAD36,37. En outre, la diversité des nucléotides dans les races bovines étudiées était également relativement élevée par rapport à la diversité des nucléotides signalée pour les bovins de l'est de la Finlande, les bovins de l'ouest de la Finlande et les bovins de Yakoutie avec des valeurs de π de 1,559 × 10–3, 1,512 × 10–3, et 1,728 × 10–3, respectivement40. De même, d'autres races taurines telles que les bovins Braunvieh de Suisse ont également montré une diversité nucléotidique relativement plus faible41. Les résultats de la diversité des nucléotides suggèrent fortement que les 6 principales races laitières de l'Inde maintiennent un degré suffisant de variation génétique intra-race.

Les valeurs D négatives de Tajima observées pour les 4 races bovines indiennes, à savoir RSC, RAC, KAC et THC, à l'exception de GIC et SAC, signifient l'expansion de la taille de la population et la présence d'un excès d'allèles rares. En outre, les valeurs D négatives de Tajima signifient également l'apparition d'une sélection positive récente dans ces races bovines indigènes indiennes. Cette observation était également cohérente avec les signaux de sélection détectés dans certaines des autres études basées sur le réseau SNP impliquant des races indigènes indiennes26. Au contraire, les valeurs D positives de Tajima détectées pour Gir et Sahiwal indiquent des signaux de sélection équilibrée dans ces races. Une observation similaire a également été signalée, selon laquelle un signal de sélection plus faible dans 7 races indigènes indiennes telles que Gir, Hariana, Kankrej Ongole, Red Sindhi, Sahiwal et Tharpakar à l'aide de données SNPchip bovines de 50 K a été identifié22.

Les valeurs d'hétérozygotie observées (HO) et attendues (HE) pour les 6 races bovines variaient de 0,464 à 0,551 (HO) et de 0,448 à 0,535 (HE), respectivement. La valeur d'hétérozygotie maximale a été observée dans le THC (HO = 0,551) suivi de RAC (HO = 0,523), RSC (HO = 0,5184), SAC (HO = 0,5180), GIC (HO = 0,499), tandis que le niveau le plus bas d'hétérozygotie était observé dans KAC (HO = 0,464). Les estimations de la diversité dans la présente étude étaient beaucoup plus élevées que ce qui a été rapporté dans sept races bovines taurines et indicines (0,064 à 0,197) des États-Unis et d'Afrique en utilisant l'approche GBS34. De plus, une valeur d'hétérozygotie plus faible (0,22) a également été signalée chez les bovins chinois utilisant le séquençage d'ADN associé au site de restriction (RADSeq)37. D'autres faibles valeurs de diversité ont également été signalées par Malik et al.33 pour deux races bovines indiennes Bos indicus ; Sahiwal (HO = 0,084) et Kankrej (HO = 0,086) ainsi que Bos taurus Holstein Frisian bovins33 utilisant l'approche GBS. L'explication de l'hétérozygotie plus faible dans les études susmentionnées pourrait être due à l'utilisation d'une digestion enzymatique unique dans les approches RADSeq et GBS.

L'analyse globale du FIS a révélé un déficit important des niveaux de consanguinité dans toutes les races bovines étudiées (le FIS varie de -0,253 en THC à 0,0513) car des estimations élevées du FIS sont liées à un degré élevé de consanguinité. Les valeurs FIS négatives élevées obtenues dans l'étude sont similaires à l'étude réalisée par Strucken et al. (2021)28 dans 13 races bovines indiennes utilisant 777 k SNP BovineHD Beadchip à l'exception de Sahiwal où des signes de consanguinité sont observés.

Sahiwal est une importante et de loin la meilleure race bovine laitière de l'Inde, d'où la course à l'élevage d'animaux de lignée pure avec les caractéristiques économiques souhaitées aurait pu entraîner une légère augmentation de l'estimation FIS. Cependant, les estimations globales du FIS observées contrastent avec celles identifiées pour les bovins indigènes indiens par les marqueurs microsatellites42,43,44 qui ont signalé des valeurs élevées du FIS. La dépression de l'estimation FIS dans la présente enquête démontre la présence d'un excès d'hétérozygotes dans les races bovines indigènes indiennes.

Les valeurs de l'indice de fixation (FST) qui variaient de 0,2840 à 0,3905 suggéraient une différenciation génétique modérée à substantielle entre les 6 races bovines. La divergence maximale a été observée entre le couple RAC-SAC (FST = 0,3905), suivi du couple de race RSC-RAC (FST = 0,3790), le couple de race RSC-SAC (FST = 0,3751). La moindre divergence a été observée pour le couple de races KAC-THC (FST = 0,2840). Dans quelques autres études basées sur des puces SNP bovines 50 K et 770 K, les auteurs ont rapporté des valeurs FST relativement inférieures pour les races bovines indiennes28,29. La différenciation génétique élevée entre les races dans la présente enquête pourrait être attribuée au fait que les échantillons de sang ont été obtenus à partir d'individus fidèles à la race et que les populations étudiées sont génétiquement distinctes les unes des autres.

L'analyse du dendogramme sur la base de la distance génétique et de la longueur des branches a révélé que les 6 races bovines indigènes regroupées séparément avec les races GIC et RSC semblaient être les races les plus distinctes. Nos résultats sont similaires à ceux de Nayee et al.29 et Strucken et al.28, dans lesquels ils ont rapporté une distinction génétique entre Gir et Red Sindhi des autres races indigènes indiennes. De plus, des regroupements étroits de RAC, THC, SAC et KAC ont été observés dans la présente étude, dans laquelle le RAC et le THC semblaient partager une histoire évolutive commune.

L'analyse des mélanges a montré que presque toutes les 6 races bovines indigènes ont conservé leur pureté génétique avec peu de traces de mélange. Aux sous-populations K = 6, bien que peu d'individus de KAC et de SAC aient été observés comme ayant peu de mélange avec le THC. La zone géographique partagée et commune de ces races et le manque d'informations généalogiques dans les conditions de terrain pourraient avoir contribué dans une faible mesure au mélange. Fait intéressant, à K = 6, une ascendance partagée a été observée entre THC et RSC. Bien que dans les études précédentes, aucune analyse de mélange n'ait été effectuée à la fois dans le Tharparkar et le Red Sindhi, notre observation de la proximité génétique entre ces races peut être dévoilée par une analyse plus approfondie car des origines géographiques proches existent entre les deux races. Dans l'ensemble, l'analyse des mélanges dans la présente étude était en accord avec l'une de nos précédentes études de génotypage basées sur des microsatellites où des proportions élevées d'individus de bovins indigènes ont été assignés à leurs races respectives45. Récemment, Nayee et al.29 utilisant des puces SNP HD bovines 50 K et 770 K ont également montré l'attribution de la majorité des animaux de Sahiwal, Gir, Kankrej à leurs races respectives avec une ascendance mixte minimale. La pureté génétique de Gir était également en accord avec l'une des études récentes menées par Strucken et al.28 à l'aide d'une puce bovine HD 770 K SNP. De même, Dixit et al.26 ont montré que le génotypage avec la puce Illumina 50 K SNP entraînait le regroupement de la plupart des animaux (> 76 %) de Gir, Sahiwal, Hariana, Ongole, Kangyam, dans leurs races respectives.

La séparation génétique de ces 6 races bovines indigènes a également été étayée par une analyse en composantes principales. À l'exception d'un individu de KAC, tous les animaux de GIC, KAC et SAC ont été regroupés selon leurs affiliations raciales et largement séparés les uns des autres. De même, les individus de THC, RAC et RSC ont également été regroupés selon leur race mais ont été placés à proximité les uns des autres. L'analyse phylogénétique, des mélanges et de l'ACP a donc suggéré une distinction génétique substantielle entre les races des 6 principales races laitières de l'Inde. Le résultat de la présente étude présente de nombreuses similitudes avec de nombreux autres rapports antérieurs sur le bétail indigène indien publiés à l'aide de marqueurs microsatellites ou de puces SNP26,28,29,43,45.

La présente étude a montré l'utilité de la stratégie de séquençage ddRAD dans l'identification de milliers de SNP de haute qualité chez les races bovines laitières indigènes de l'Inde. L'étude a également fourni l'occasion d'établir une méthodologie robuste ainsi qu'un pipeline bioinformatique pour générer et caractériser des SNP à l'échelle du génome. Les SNP dérivés du génome de bovins indigènes pourraient également contribuer à enrichir la base de données du génome de Bos indicus pour une exploitation future dans la diversité et le génotype : études d'association de phénotypes. En outre, l'ensemble de données SNP à l'échelle du génome a fourni un indice solide que chacune des 6 principales races de bovins laitiers de l'Inde a une diversité de races suffisante. L'analyse entre les races ainsi que l'analyse phylogénétique, des mélanges et de l'ACP ont montré un niveau élevé de distinction génétique et de pureté de chacune des 6 races bovines. À l'avenir, une approche similaire pourrait être étendue au reste des races bovines indigènes (Bos indicus) pour définir la structure de la population ainsi que leurs relations évolutives. De plus, comme les races bovines indigènes indiennes sont connues pour leur meilleure qualité de lait, leur tolérance à la chaleur et leur résistance aux maladies, un tel ensemble de données pourrait également être exploité pour comprendre les signatures de sélection par rapport à ces traits. Ces informations seront très utiles pour réaliser le potentiel de ces ressources génétiques indigènes adaptées aux conditions tropicales, en particulier à l'ère du changement climatique et du réchauffement climatique.

Pour identifier les SNP à l'échelle du génome, les échantillons de sang de 58 animaux non apparentés appartenant à Gir (GIC, n = 12), Sahiwal (SAC, n = 12), Kankrej (KAC, n = 12), Rathi (RAC, n = 11 ), Red Sindhi (RSC, n = 7) et Tharparkar (THC, n = 4) ont été recueillies en visitant leurs parcs d'élevage respectifs. Cependant, les échantillons d'animaux Red Sindhi ont été collectés dans la ferme Hosur du district de Krishnagiri dans l'État du Tamil Nadu, car cette race n'est disponible que dans les fermes d'élevage organisées. Les échantillons de sang ont été prélevés conformément aux directives du Comité institutionnel d'éthique animale (IAEC). De plus, tous les détails liés aux expériences sur les animaux étaient conformes aux directives ARRIVE et toutes les procédures ont été approuvées par le comité d'éthique animale de l'ICAR-NBAGR, Karnal. La répartition géographique et écologique des races bovines est illustrée à la Fig. 1. Le type d'utilité, la couleur du pelage, la zone agroclimatique représentative, le domaine de reproduction et les coordonnées géographiques de chaque domaine de reproduction sont présentés dans le tableau supplémentaire S1. Des échantillons de sang frais (8 à 9 ml) prélevés dans des tubes sous vide EDTA par ponction de la veine jugulaire ont été conservés à - 20 ° C jusqu'à l'extraction de l'ADN génomique. L'ADN génomique a été isolé du sang total à l'aide de la méthode d'extraction au phénol-chloroforme46, suivie d'une purification par traitement à la RNAse et du kit d'élimination de la nucléase Qiaquick (Qiagen, Valencia, CA) pour éliminer toutes les impuretés liées à l'ARN. La qualité de l'ADN a été vérifiée par électrophorèse sur gel d'agarose (1%) et la quantité d'ADN a été mesurée à l'aide d'un spectrophotomètre Nanodrop (Nanodrop ND-1000).

Pour la préparation de la bibliothèque d'ADN, chaque échantillon a été digéré avec deux enzymes de restriction (ER) ; un EcoR1 à 6 coupeurs (G/AATTC) et un Mse1 à 4 coupeurs (T/TAA) (New England Biolabs, Ipswich, MA, États-Unis) tels que déterminés par simulation in silico à l'aide du package SimRAD47. En bref, 0, 3 à 0, 6 μg d'ADN génomique de chaque animal ont été digérés avec l'ensemble d'enzymes de restriction optimisé. Après digestion, chaque extrémité du fragment digéré a été ligaturée à P1 spécifique à EcoRI et aux adaptateurs à code-barres P2 spécifiques à Msel avec une ADN Ligase T4 (New England Biolabs, Ipswich, MA, USA). La réaction de ligation consistait en une incubation d'une nuit (> 12 h) à température ambiante (environ 21 °C) et une désactivation thermique de l'enzyme à 65 °C pendant 10 min. Afin d'éliminer les adaptateurs non incorporés et les petits fragments d'ADN, les réactions de ligature ont été purifiées à l'aide d'un volume 0,8X de billes magnétiques Agencourt AMPure XP SPRI (Beckman Coulter Life Sciences, Indianapolis, États-Unis). Une combinaison unique de codes-barres à double index a été attachée à des fragments purifiés avec 14 cycles de PCR. Les produits de PCR indexés ont été regroupés en volumes et tailles égaux sélectionnés à l'aide de billes magnétiques Agencourt AMPure XP SPRI. Le protocole d'amplification impliquait une dénaturation initiale à 95 °C pendant 3 min ; 25 cycles de dénaturation à 95 °C pendant 30 s, recuit à 55 °C pendant 30 s et extension à 72 °C pendant 30 s ; suivi d'une extension finale à 72°C pendant 5 min.

Dans la présente étude, un total de 2 bibliothèques de séquençage, à savoir FGBS20H000717-1a, FGBS20H000718-1a, qui comprenaient tous les échantillons de différentes races bovines, ont été construites pour le séquençage sur la plate-forme de séquençage Illumina HiSeq™ 2000. La concentration de chaque bibliothèque a été vérifiée à l'aide du fluorimètre Qubit® 2.0 (Thermo Fisher, Waltham, MA, USA). Chaque bibliothèque a été diluée à 1 ng/ul et la taille de l'insert a été évaluée et quantifiée à l'aide du kit d'ADN haute sensibilité Agilent dans un bioanalyseur 2100 (Agilent Technologies, CA, USA). Une PCR quantitative en temps réel (qPCR) a été réalisée pour détecter la concentration effective de chaque bibliothèque. Enfin, les bibliothèques avec une taille d'insert appropriée et une concentration efficace de plus de 2 nM ont été séquencées sur Illumina HiSeq™ 2000 et plus de 100 bp end reads ont été générés.

La qualité des fichiers de séquençage FASTQ appariés bruts a été vérifiée à l'aide du logiciel FASTQC48. Les lectures brutes avec moins de Q20 ont été supprimées de l'ensemble de données à l'aide du logiciel PRINSEQ49. Les deux adaptateurs ont été supprimés à l'aide de Cutadapt 1.1550. Enfin, les lectures filtrées avec une longueur de lecture de 144 pb ont été conservées pour une analyse ultérieure. Les lectures filtrées ont été alignées sur le génome de référence de Bos taurus ARS-UCD1.2 à l'aide de l'outil Bowtie251,52. Les fichiers SAM alignés ont été convertis en fichiers BAM à l'aide de SAMtools53, puis triés à l'aide de l'outil Picard. Toutes les lectures en double ont été signalées et étiquetées à l'aide du module MarkDuplicatesWithMateCigar des outils Picard 54. Les lectures ont été recalibrées à l'aide de l'outil GATK-BQSR avec les paramètres par défaut54. Afin de découvrir des SNP à l'échelle du génome chez chaque animal, GATK Haplotypecaller a été exécuté en mode ERC GVCF54. Le fichier GVCF de cohorte par race a été créé en combinant tous les fichiers GVCF individuels à l'aide des CombinedGVFs de l'outil GATK. Les fichiers GVCF de la cohorte ont été convertis en VCF à l'aide de la commande GenotypeGVCF de l'outil GATK. Les insertions et les suppressions (INDELS) ont été rejetées à l'aide des variantes GATKSelect. Les SNP ont été annotés en référence à 1000 données du génome de Bull à l'aide de BCFTools 55. Après annotation, tous les SNP situés sur les chromosomes X, Y ainsi que l'ADN mitochondrial ont été supprimés à l'aide de VCFtools56 et seuls les SNP présents dans les autosomes ont été retenus pour une analyse plus approfondie. . Les SNP ont également été filtrés à un niveau de profondeur de lecture minimum de 2, 5 et 10 (RD) et les SNP identifiés à RD de 5 ont été filtrés davantage avec un score de qualité minimum de GQ30 à l'aide de VCFtools56. Enfin, trois cycles de filtrage pour la fréquence des allèles mineurs (MAF <0,05), les génotypes manquants (0,8) et la déviation HWE (P <0,001) ont été effectués à l'aide de PLINK 1.9 57 pour conserver les SNP de haute qualité pour l'analyse en aval.

Les SNP de haute qualité identifiés dans chaque race ont été annotés à l'aide de SnpEff Ver. 4.3 logiciel58. Le fichier VCF et les données d'annotation du génome de référence de Bos taurus ont été utilisés pour partitionner les SNP en fonction de leur emplacement génomique, tels que les régions exoniques, introniques, en amont/aval, les sites d'épissage et les régions intergéniques. Les SNP ont également été classés en fonction de leur impact fonctionnel sur les gènes codant pour les protéines tels que élevé, modéré, modificateur, faux-sens, absurde et silencieux.

La diversité nucléotidique (π), TajimaD dans chacune des 6 races bovines a été calculée à l'aide du logiciel TASSEL (v. 5.0)59 en sélectionnant une fenêtre glissante de 500-SNP avec une taille de pas de 100-SNP. Les outils VCF ont été utilisés pour calculer l'hétérozygotie observée (HO), l'hétérozygotie attendue (HE), le coefficient de consanguinité (FIS) et les estimations FST de Wright. Pour la relation phylogénétique, parmi les populations bovines étudiées, les logiciels TASSEL (v. 5.0)59 et phangorn60 disponibles en langage R ont été utilisés. Une valeur bootstrap de 100 a été utilisée pour dessiner l'arbre basé sur les algorithmes UPGMA et Neighbor Joining (NJ). Les SNP qui étaient en fort déséquilibre de liaison (LD) (r2> 0,5) dans une fenêtre glissante de 5000 Ko avec 50 SNP ont été élagués à l'aide de PLINK v.1.957. L'analyse des mélanges a été effectuée à l'aide des données SNP élaguées en appliquant les ADMIXTOOLS du package admixr-R61. L'analyse des mélanges a été effectuée en supposant différents nombres de sous-populations K = 6 afin d'identifier le nombre optimal de populations ancestrales en détectant la valeur la plus faible d'erreur de validation croisée. De même, l'analyse en composantes principales (ACP) a été réalisée à l'aide de données élaguées en utilisant un logiciel "adegent" et les résultats ont été tracés à l'aide de ggplot.

Toute la procédure expérimentale a été effectuée conformément aux directives et réglementations ARRIVE du Comité institutionnel d'éthique animale (IAEC), ICAR-Bureau national des ressources génétiques animales (ICAR-NBAGR), Karnal, Haryana, Inde.

Loftus, RT, MacHugh, DE, Bradley, DG, Sharp, PM et Cunningham, P. Preuve de deux domestications indépendantes du bétail. Proc. Natl. Acad. Sci. 91(7), 2757–2761 (1994).

Article ADS CAS PubMed PubMed Central Google Scholar

Jarrige, JF & Meadow, RH Les antécédents de la civilisation dans la vallée de l'Indus. Sci. Suis. 243(2), 122–137 (1980).

Article Google Scholar

Meadow, RH Les origines et la propagation de l'agriculture et du pastoralisme dans le nord-ouest de l'Asie du Sud. Les origines et la diffusion de l'agriculture et du pastoralisme en Eurasie, pp. 390–412 (1996).

Bradley, DG, MacHugh, DE, Cunningham, P. & Loftus, RT Diversité mitochondriale et origines des bovins africains et européens. Proc. Natl. Acad. Sci. 93(10), 5131–5135 (1996).

Article ADS CAS PubMed PubMed Central Google Scholar

MacHugh, DE, Shriver, MD, Loftus, RT, Cunningham, P. & Bradley, DG Variation de l'ADN microsatellite et évolution, domestication et phylogéographie des bovins taurins et zébus (Bos taurus et Bos indicus). Génétique 146(3), 1071–1086 (1997).

Article CAS PubMed PubMed Central Google Scholar

Chen, S. et al. Les zébus sont un héritage exclusif du néolithique d'Asie du Sud. Mol. Biol. Évol. 27(1), 1–6 (2010).

Article PubMed Google Scholar

Jia, S. et al. Un nouvel éclairage sur l'origine maternelle des bovins dans six pays asiatiques. J. Genet. Génome. 37(3), 173-180 (2010).

Article CAS Google Scholar

Manomohan, V. et al. Héritage des races de bétail de trait du sud de l'Inde : aperçu de la structure de la population, du mélange génétique et de l'origine maternelle. PLoS ONE 16(5), e0246497 (2021).

Article CAS PubMed PubMed Central Google Scholar

Xia, X. et al. Diversité génétique abondante des bovins Yunling basée sur le génome mitochondrial. Animaux 9(9), 641 (2019).

Article PubMed PubMed Central Google Scholar

Chen, N. et al. Le reséquençage du génome entier révèle une ascendance mondiale et des événements d'introgression adaptative de bovins domestiques en Asie de l'Est. Nat. Commun. 9(1), 1–13 (2018).

Annonces Google Scholar

Ganguly, I. et al. Diversité génétique du chromosome Y des bovins Bos indicus à proximité immédiate du centre de domestication. Sci. Rep. 10(1), 1–9 (2020).

Article Google Scholar

20e recensement du bétail. Rapport pour toute l'Inde : ministère de l'agriculture, département de l'élevage, de l'industrie laitière et de la pêche, Krishi Bhawan, New Delhi, Inde. 2019. [Cité le 13 mai 2020]. https://dahd.nic.in/sites/default/filess/20th%20Livestock%20census-2019%20All%20India%20Report_0.pdf.

Rapport annuel 2020–21. Gouvernement d'Inde. Ministère de la pêche, de l'élevage et de la laiterie. Département de l'élevage, laiterie : Krishi Bhavan ; New Delhi 2021. https://dahd.nic.in/sites/default/filess/Annual%20Report%20English.pdf

Hanotte, O., Dessie, T. & Kemp, S. Il est temps d'exploiter les génomes du bétail africain. Sciences 328 (5986), 1640-1641 (2010).

Article CAS PubMed Google Scholar

Groeneveld, LF et al. Diversité génétique chez les animaux de ferme - une revue. Anim. Genet. 41, 6-31 (2010).

Article PubMed Google Scholar

Van Dijk, EL, Auger, H., Jaszczyszyn, Y. & Thermes, C. Dix ans de technologie de séquençage de nouvelle génération. Tendances Genet. 30(9), 418–426 (2014).

Article PubMed Google Scholar

Kumar, DR et al. La diversité génomique et les balayages de sélection identifiés chez les buffles des marais indiens révèlent son caractère unique avec les buffles riverains. Génomique 112(3), 2385–2392 (2020).

Article Google Scholar

Sivalingam, J. et al. La divergence génomique révèle des populations uniques parmi les yacks indiens. Sci. Rep. 10(1), 1–7 (2020).

Article Google Scholar

Tezuka, A., Takasu, M., Tozaki, T. & Nagano, AJ La capacité de ddRAD-Seq à estimer la diversité génétique et l'introgression génétique chez le bétail indigène en voie de disparition. bioRxiv, p. 454108 (2018).

Liu, C., Chen, H., Yang, X., Zhang, C. & Ren, Z. Exploration des ressources génomiques de sept populations domestiques de chameaux de Bactriane en Chine grâce au séquençage d'ADN associé au site de restriction. PLoS ONE 16(4), e0250168 (2021).

Article CAS PubMed PubMed Central Google Scholar

Devadasan, MJ et al. Approche de représentation réduite pour l'identification des SNP à l'échelle du génome et leur annotation pour les traits économiquement importants chez les bovins indiens Tharparkar. 3 Biotech 10(7), 1–6 (2020).

Article Google Scholar

Vineeth, MR et al. Découverte à l'échelle du génome de SNP dans des gènes candidats liés aux traits de production et de fertilité chez les bovins Sahiwal. Trop. Anim. produits de santé 52(4), 1707-1715 (2020).

Article CAS PubMed Google Scholar

Mishra, DC et al. Identification et caractérisation de SNP spécifiques à un trait à l'aide du séquençage ddRAD chez le buffle d'eau. Génomique 112(5), 3571–3578 (2020).

Article CAS PubMed Google Scholar

Zhan, B. et al. Évaluation globale de la variation génomique chez les bovins par reséquençage du génome et génotypage à haut débit. BMC Génom. 12(1), 1–20 (2011).

Article Google Scholar

Xiang, R. et al. La cartographie fine à l'échelle du génome identifie les variantes pléiotropes et fonctionnelles qui prédisent de nombreux traits dans les populations bovines mondiales. Nat. Commun. 12(1), 1–13 (2021).

Article Google Scholar

Liu, L. et al. Identification basée sur GWAS de nouveaux loci pour le rendement laitier, la graisse et les protéines chez les bovins Holstein. Animaux 10(11), 2048 (2020).

Article PubMed PubMed Central Google Scholar

Dixit, SP et al. Les analyses du génome ont révélé des signatures génétiques de mélange et de sélection chez Bos indicus. Sci. Rep. 11(1), 1–11 (2021).

Article Google Scholar

Saravanan, KA et al. Des scans génomiques pour les signatures de sélection ont révélé des gènes candidats pour les traits d'adaptation et de production dans une variété de races bovines. Génomique 113(3), 955–963 (2021).

Article CAS PubMed Google Scholar

Frappé, EM et al. Diversité génétique et taille effective des populations de treize races bovines indiennes. Genet. Sél. Évol. 53(1), 1–17 (2021).

Article Google Scholar

Nayee, N. et al. Adéquation des puces de polymorphisme mononucléotidique commerciales existantes pour les études génomiques sur les races bovines Bos indicus et leurs croisements Bos taurus. J. Anim. Race. Genet. 135(6), 432–441 (2018).

Article CAS PubMed Google Scholar

Dash, S. et al. Évaluation de la matrice de génotypage SNP bovin à haute densité dans les races bovines laitières indigènes. Anim. Biotechnol. 29(2), 129-135 (2018).

Article CAS PubMed Google Scholar

Pérez-Enciso, M. & Ferretti, L. Séquençage parallèle massif en génétique animale : d'où et où. Anim. Genet. 41(6), 561–569 (2010).

Article PubMed Google Scholar

Gurgul, A. et al. Performances du génotypage par séquençage chez certaines espèces animales. Génomique 111(2), 186–195 (2019).

Article CAS PubMed Google Scholar

Malik, AA et al. Analyse de la parenté génétique chez les bovins indiens (Bos indicus) à l'aide de marqueurs de génotypage par séquençage. Anim. Genet. 49(3), 242–245 (2018).

Article CAS PubMed Google Scholar

De Donato, M., Peters, SO, Mitchell, SE, Hussain, T. & Imumorin, IG Génotypage par séquençage (GBS) : une nouvelle méthode de génotypage efficace et rentable pour les bovins utilisant le séquençage de nouvelle génération. PLoS ONE 8(5), e62137 (2013).

Article ADS PubMed PubMed Central Google Scholar

Brouard, JS, Boyle, B., Ibeagha-Awemu, EM & Bissonnette, N. Génotypage par séquençage (GBS) à faible profondeur dans une population bovine : stratégies pour maximiser la sélection de génotypes de haute qualité et la précision de l'imputation. BMC Genet. 18(1), 1–14 (2017).

Article Google Scholar

Wang, W. et al. Découverte de SNP à l'échelle du génome et évaluation de la diversité génétique parmi six races bovines indigènes chinoises du Sichuan. PLoS ONE 13(8), e0201534 (2018).

Article PubMed PubMed Central Google Scholar

Mao, C. et al. Découverte de SNP à l'échelle du génome et évaluation de la diversité génétique des bovins Liangshan en Chine. Anim. Biotechnol. 32(6), 671–675 (2021).

Article CAS PubMed Google Scholar

Surya, T. et al. Identification et annotation à l'échelle du génome des SNP chez Bubalus bubalis. Génomique 111(6), 1695–1698 (2019).

Article CAS PubMed Google Scholar

Iqbal, N. et al. Variantes génomiques identifiées à partir du reséquençage du génome entier de races bovines indicines du Pakistan. PLoS ONE 14(4), e0215065 (2019).

Article CAS PubMed PubMed Central Google Scholar

Weldenegodguad, M. et al. Séquençage du génome entier de trois races bovines indigènes originaires des régions d'élevage bovin les plus septentrionales. Devant. Genet. 9, 728 (2019).

Article PubMed PubMed Central Google Scholar

Bhati, M., Kadri, NK, Crysnanto, D. & Pausch, H. Évaluation de la diversité génomique et des signatures de sélection chez les bovins Braunvieh originaux à l'aide de données de séquençage du génome entier. BMC Génom. 21(1), 1–14 (2020).

Article Google Scholar

Mukesh, M., Sodhi, M., Bhatia, S. & Mishra, BP Diversité génétique des races bovines indigènes indiennes analysée avec 20 locus microsatellites. J. Anim. Race. Genet. 121(6), 416–424 (2004).

Article CAS Google Scholar

Sharma, R. et al. Diversité génétique et relation des bovins indiens déduites à partir de marqueurs d'ADN microsatellites et mitochondriaux. BMC Genet. 16(1), 1–12 (2015).

Article Google Scholar

Purva, M., Suthar, MK, Bishnoi, J., Maherchandani, S. & Kashyap, SK Diversité génétique et parenté entre quatre races de bovins élevées au Rajasthan. Int. J. Livest. Rés. 8(12), 93–104. https://doi.org/10.5455/ijlr.20180131043854 (2018).

Google Scholar

Sambrook, J., Fritsch, EF & Maniatis, T. Molecular Cloning: A Laboratory Manual 2nd edn. (Presses de laboratoire de Cold Spring Harbor, 1989).

Google Scholar

Lepais, O. & Weir, JT Sim RAD : un package R pour la prédiction basée sur la simulation du nombre de locus attendus dans RAD seq et un génotypage similaire par des approches de séquençage. Mol. Écol. Resour. 14(6), 1314–1321 (2014).

Article CAS PubMed Google Scholar

Andrews, S. FastQC : un outil de contrôle de la qualité pour les données de séquence à haut débit [document WWW]. http://www.bioinformatics.babraham.ac.uk/projects/fastqc. (2010)

Schmieder, R. & Edwards, R. Contrôle de la qualité et prétraitement des ensembles de données métagénomiques. Bioinformatique 27(6), 863–864 (2011).

Langmead, B., Wilks, C., Antonescu, V. et Charles, R. Scaling lisent les aligneurs sur des centaines de threads sur des processeurs à usage général. Bioinformatique 35(3), 421–432 (2019).

Article CAS PubMed Google Scholar

Martin, M. Cutadapt supprime les séquences d'adaptateur des lectures de séquençage à haut débit. EMBnet. J. 17(1), 10–12 (2011).

Article Google Scholar

Li, H. et al. Sous-groupe de traitement des données du projet 1000 génomes. Le format d'alignement/carte de séquence (SAM) et SAMtools. Bioinformatique 25(16), 2078-2079 (2009).

Article PubMed PubMed Central Google Scholar

Van der Auwera, GA & O'Connor, BD Genomics in the Cloud : Utilisation de Docker, GATK et WDL dans Terra (O'Reilly Media, 2020).

Google Scholar

Li, H. Un cadre statistique pour l'appel de SNP, la découverte de mutations, la cartographie d'association et l'estimation des paramètres génétiques de la population à partir de données de séquençage. Bioinformatique 27(21), 2987–2993 (2011).

Article CAS PubMed PubMed Central Google Scholar

Danecek, P. et al. Le format d'appel de variante et VCFtools. Bioinformatique 27(15), 2156–2158 (2011).

Article CAS PubMed PubMed Central Google Scholar

Purcell, S. et al. PLINK : Un ensemble d'outils pour l'association du génome entier et les analyses de liaison basées sur la population. Suis. J. Hum. Genet. 81(3), 559–575 (2007).

Article CAS PubMed PubMed Central Google Scholar

Cingolani, P. et al. Un programme pour annoter et prédire les effets des polymorphismes mononucléotidiques, SnpEff : SNP dans le génome de la souche w1118 de Drosophila melanogaster ; iso-2; iso-3. Fly 6 (2), 80–92 (2012).

Article CAS PubMed PubMed Central Google Scholar

Bradbury, PJ et al. TASSEL : Logiciel de cartographie d'association de traits complexes dans divers échantillons. Bioinformatique 23(19), 2633–2635 (2007).

Article CAS PubMed Google Scholar

Schliep, KP phangorn : Analyse phylogénétique dans R. Bioinformatics 27(4), 592–593 (2011).

Article MathSciNet CAS PubMed Google Scholar

Petr, M., Vernot, B. & Kelso, J. package admixr—R pour des analyses reproductibles à l'aide d'ADMIXTOOLS. Bioinformatique 35(17), 3194–3195 (2019).

Article CAS PubMed PubMed Central Google Scholar

Wickham, H. ggplot2 : Graphiques élégants pour l'analyse de données (Springer, 2016).

Livre MATH Google Scholar

Télécharger les références

Les auteurs reconnaissent dûment le soutien financier fourni par le Conseil indien de la recherche agricole, New Delhi, dans le cadre du National Fellow Scheme (Numéro de subvention : 27(3)/2010-HRD).

Division de la biotechnologie animale, ICAR-Bureau national des ressources génétiques animales, Karnal, Haryana, Inde

Nampher Masharing, Monika Sodhi, Divya Chanda, Inderpal Singh, Prince Vivek, Manish Tiwari, Parvesh Kumari et Manishi Mukesh

Centre de biotechnologie animale, ICAR-Institut national de recherche laitière, Karnal, Haryana, Inde

Nampher Massharing & Manish Tiwari

ICAR-NBAGR, Karnal, Haryana, 132001, Inde

Manishi Mukesh

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

MM, MS a conçu, conçu l'étude, fourni des contributions critiques lors de l'analyse des données et de la préparation du manuscrit et édité le manuscrit. NM a effectué une analyse bioinformatique, rédigé le manuscrit. DC, IP a mené des analyses bioinformatiques, visualisation de données. PV, MT ont prélevé des échantillons de sang. PK a isolé et préparé des échantillons d'ADN génomique.

Correspondance à Manishi Mukesh.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Massharing, N., Sodhi, M., Chanda, D. et al. génotypage basé sur le séquençage ddRAD de six races bovines laitières indigènes de l'Inde pour déduire la diversité génétique existante et la structure de la population. Sci Rep 13, 9379 (2023). https://doi.org/10.1038/s41598-023-32418-6

Télécharger la citation

Reçu : 02 septembre 2022

Accepté : 27 mars 2023

Publié: 09 juin 2023

DOI : https://doi.org/10.1038/s41598-023-32418-6

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.