Abstract
In an effort to expand the Gossypium hirsutum L. (cotton) expressed sequence tag (EST) database, ESTs representing a variety of tissues and treatments were sequenced. Assembly of these sequences with ESTs already in the EST database (dbEST, GenBank) identified 9675 cotton sequences not present in GenBank. Statistical analysis of a subset of these ESTs identified genes likely differentially expressed in stems, cotyledons, and drought-stressed tissues. Annotation of the differentially expressed cDNAs tentatively identified genes involved in lignin metabolism, starch biosynthesis and stress response, consistent with pathways likely to be active in the tissues under investigation. Simple sequence repeats (SSRs) were identified among these ESTs, and an inexpensive method was developed to screen genomic DNA for the presence of these SSRs. At least 69 SSRs potentially useful in mapping were identified. Selected amplified SSRs were isolated and sequenced. The sequences corresponded to the EST containing the SSRs, confirming that these SSRs will potentially map the gene represented by the EST. The ESTs containing SSRs were annotated to help identify the genes that may be mapped using these markers.Key words: drought stress, gene annotation, gene mapping, tentative consensus sequence (TC), Xanthomonas campestris.Afin d'accroître la collection d'EST du Gossypium hirsutum L. (cotonnier), des marquers des séquences exprimées (« ESTs ») provenant de divers tissus et suite à différents traitements ont été séquencés. L'assemblage de ces séquences avec les EST déjà présents au sein de dbEST (GenBank) a permis d'identifier 9675 séquences du cotonnier qui n'étaient pas représentées au sein de GenBank. Une analyse statistique d'un sous-ensemble de ces EST a permis d'identifier des gènes qui sont vraisemblablement exprimés de manière différentielle dans les tiges, les cotylédons et les tissus sous stress hydrique. Une annotation des ADNc exprimés de manière différentielle a permis d'identifier des gènes potentiellement impliqués dans le métabolisme de la lignine, la synthèse de l'amidon et la réponse aux stress; des sentiers qui sont sujets à induction dans les tissus à l'étude. Des microsatellites (SSR) ont été identifiés au sein de ces EST et une méthode peu coûteuse a été développée pour cribler l'ADN génomique pour la présence de ces microsatellites. Au moins 69 microsatellites potentiellement utiles en cartographie ont été identifiés. Des microsatellites choisis ont été clonés et séquencés. Ces séquences correspondaient bien aux EST contenant ces microsatellites ce qui confirme que ces microsatellites permettront de localiser les gènes représentés par ces EST. Les EST contenant un microsatellite ont été annotés afin de faciliter l'identification des gènes dont on pourra déterminer la position sur la carte génétique grâce à ces microsatellites.Mots clés : stress hydrique, annotation de gènes, cartographie génétique, séquence consensuelle (TC), Xanthomonas campestris.[Traduit par la Rédaction]