Method Article
* Ces auteurs ont contribué à parts égales
Les systèmes CRISPR-Cas et les protéines anti-CRISPR ont été intégrés dans le schéma des portes booléennes chez Saccharomyces cerevisiae. Les nouveaux petits circuits logiques ont montré de bonnes performances et approfondi la compréhension des facteurs de transcription basés sur dCas9 / dCas12a et des propriétés des protéines anti-CRISPR.
Les portes booléennes géniques synthétiques et les circuits numériques ont un large éventail d’applications, du diagnostic médical à la protection de l’environnement. La découverte des systèmes CRISPR-Cas et de leurs inhibiteurs naturels, les protéines anti-CRISPR (Acrs), fournit un nouvel outil pour concevoir et mettre en œuvre des circuits numériques géniques in vivo . Ici, nous décrivons un protocole qui suit l’idée du cycle de génie biologique « Design-Build-Test-Learn » et utilise dCas9 / dCas12a avec leurs Acrs correspondants pour établir de petits réseaux transcriptionnels, dont certains se comportent comme des portes booléennes, chez Saccharomyces cerevisiae. Ces résultats soulignent les propriétés de dCas9/dCas12a comme facteurs de transcription. En particulier, pour obtenir une activation maximale de l’expression génique, dSpCas9 doit interagir avec un ARN d’échafaudage modifié qui collecte plusieurs copies du domaine d’activation (AD) VP64. En revanche, dCas12a doit être fusionné, à l’extrémité C, avec le puissant VP64-p65-Rta (VPR) AD. De plus, l’activité des deux protéines Cas n’est pas améliorée par l’augmentation de la quantité d’ARNg / ARNcr dans la cellule. Cet article explique également comment construire des portes booléennes basées sur l’interaction CRISPR-dCas-Acr. Le domaine de liaison hormonale fusionné AcrIIA4 du récepteur humain des œstrogènes est le cœur d’une porte NOT sensible au β-estradiol, tandis que les AcrVAs synthétisés par le promoteur GAL1 inductible permettent d’imiter les portes YES et NOT avec le galactose comme entrée. Dans ces derniers circuits, AcrVA5, avec dLbCas12a, a montré le meilleur comportement logique.
En 2011, des chercheurs ont proposé une méthode de calcul et développé un logiciel correspondant pour la conception automatique de circuits génétiques synthétiques numériques1. Un utilisateur devait spécifier le nombre d’entrées (trois ou quatre) et remplir la table de vérité du circuit; Cela a fourni toutes les informations nécessaires pour dériver la structure du circuit en utilisant des techniques de l’électronique. La table de vérité a été traduite en deux formules booléennes via la méthode2 de la carte de Karnaugh. Chaque formule booléenne est constituée de clauses qui décrivent des opérations logiques (somme ou multiplication) entre (partie de) les entrées du circuit et leurs négations (les littéraux). Les clauses, à leur tour, sont soit additionnées (OR) ou multipliées (ET) pour calculer la sortie du circuit. Chaque circuit peut être réalisé selon l’une de ses deux formules correspondantes : l’une écrite sous forme POS (produit des sommes) et l’autre en SOP (somme des produits). Le premier consiste en une multiplication de clauses (c’est-à-dire des portes booléennes) qui contiennent une somme logique des littéraux. Ce dernier, en revanche, est une somme de clauses où les littéraux sont multipliés.
Les circuits électriques peuvent être réalisés, sur une planche à pain, en câblant physiquement différentes portes ensemble. Le courant électrique permet l’échange de signaux entre les portes, ce qui conduit au calcul de la sortie.
En biologie, la situation est plus complexe. Une porte booléenne peut être réalisée comme une unité de transcription (TU; c’est-à-dire la séquence « promoteur-codant région-terminateur » à l’intérieur des cellules eucaryotes), où la transcription ou la traduction (ou les deux) sont régulées. Ainsi, au moins deux sortes de molécules établissent un câblage biologique : les protéines du facteur de transcription et les ARN antisens non codants1.
Un circuit numérique génétique est organisé en deux ou trois couches de portes, à savoir: 1) la couche d’entrée, qui est faite de portes YES (tampon) et NOT et convertit les produits chimiques d’entrée en molécules de câblage; 2) la couche interne, qui se compose d’autant de TU qu’il y a de clauses dans la formule booléenne correspondante. Si le circuit est conçu selon la formule SOP, chaque clause de la couche interne produira la sortie du circuit (par exemple, la fluorescence) dans une architecture dite de sortie distribuée. Si la formule du produit de somme (POS) est utilisée, alors une couche finale 3) est nécessaire, qui contiendra une seule porte multiplicative collectant les molécules de câblage de la couche interne.
Dans l’ensemble, en biologie synthétique, de nombreux schémas différents peuvent être conçus pour le même circuit. Ils diffèrent par le nombre et le type de TU et de molécules de câblage. Afin de choisir la solution la plus simple à mettre en œuvre dans les cellules de levure, chaque conception de circuit est associée à un score de complexité S, défini par
où A représente le nombre d’activateurs, R représente le nombre de répresseurs et a est la quantité de molécules d’ARN antisens. Si les activateurs ou les répresseurs sont absents du circuit, leur contribution à S est nulle. Par conséquent, il est plus difficile de réaliser un schéma de circuit en laboratoire (S élevé) lorsqu’il nécessite un nombre élevé de facteurs de transcription orthogonaux. Cela signifie que de nouveaux activateurs et répresseurs doivent être conçus de novo afin de réaliser le câblage complet à l’intérieur des circuits numériques. En principe, de nouvelles protéines de liaison à l’ADN peuvent être assemblées en utilisant les protéines Zinc Finger3 et les effecteurs TAL4 comme modèles. Cependant, cette option semble trop ardue et prend trop de temps; par conséquent, il faut s’appuyer principalement sur les petits ARN et la régulation de la traduction pour finaliser des circuits génétiques complexes.
À l’origine, cette méthode a été développée pour fabriquer des circuits numériques dans des bactéries. En effet, dans les cellules eucaryotes, au lieu d’ARN antisens, il est plus approprié de parler de microARN (miARN) ou de petits ARN interférents (siRNAs)5. Cependant, la voie ARNi n’est pas présente dans la levure S. cerevisiae. Par conséquent, il faut opter pour des réseaux entièrement transcriptionnels. Supposons qu’un circuit ait besoin de cinq activateurs et de cinq répresseurs; son score de complexité serait S = 32. La complexité du circuit peut être réduite en remplaçant les 10 facteurs de transcription par un seul dCas96 (Cas9 déficient en nucléase) fusionné à un domaine d’activation (AD). Comme le montrele point 7, dCas9-AD fonctionne comme un répresseur dans la levure lors de la liaison d’un promoteur entre la boîte TATA et le TSS (site de début de transcription) et comme activateur lors de la liaison bien en amont de la boîte TATA. Ainsi, on peut remplacer 10 facteurs de transcription par une seule protéine de fusion dCas9-AD et 10 sgRNA (ARN guides uniques) pour un score de complexité totale de S = 11. Il est rapide et facile de synthétiser dix ARNg, alors que, comme indiqué précédemment, l’assemblage de 10 protéines nécessiterait un travail beaucoup plus long et plus compliqué.
Alternativement, on peut utiliser deux protéines orthogonales dCas (par exemple, dCas9 et dCas12a): l’une pour fusionner avec une AD, et l’autre nue ou en combinaison avec un domaine de répression. Le score de complexité n’augmenterait que d’une unité (S = 12). Par conséquent, les systèmes CRISPR-dCas sont la clé de la construction de circuits numériques de gènes très complexes chez S. cerevisiae.
Cet article caractérise en profondeur l’efficacité des répresseurs et des activateurs à base de dCas9 et dCas12a chez la levure. Les résultats montrent qu’ils ne nécessitent pas une grande quantité d’ARNg pour optimiser leur activité, de sorte que les plasmides épisomiques sont préférentiellement évités. De plus, les activateurs basés sur dCas9 sont beaucoup plus efficaces lorsqu’ils utilisent un ARN d’échafaudage (scRNA) qui recrute des copies du VP64 AD. En revanche, dCas12a fonctionne bien lorsqu’il est fusionné directement avec le puissant VPR AD. De plus, un promoteur activé synthétique exige un nombre variable de sites cibles, en fonction de la configuration de l’activateur (par exemple, trois lors de l’utilisation de dCas12a-VPR, six pour dCas9-VP64 et un seul avec dCas9 et un scRNA). En tant que répresseur, dCas12a apparaît plus incisif lors de la liaison de la région de codage plutôt que du promoteur.
Cependant, CRISPR-dCas9 / dCas12a n’interagissent pas directement avec les produits chimiques. Par conséquent, ils peuvent ne pas être utiles dans la couche d’entrée. Pour cette raison, d’autres conceptions de portes booléennes contenant des protéines anti-CRISPR (Acrs) ont été étudiées. Les ACRS agissent sur les protéines (d)Cas et inhibent leur fonctionnement8. Par conséquent, ils sont un moyen de moduler l’activité des systèmes CRISPR-(d)Cas. Cet article analyse en profondeur les interactions entre les Acrs de type II et (d)Cas9, ainsi que les Acrs de type V et (d)Cas12a chez S. cerevisiae. Étant donné que les Acr sont beaucoup plus petits que les protéines Cas, une porte NOT sensible à l’œstrogène β-estradiol a été construite en fusionnant le domaine de liaison hormonale du récepteur humaindes œstrogènes 9-HBD(hER)-à AcrIIA4. En outre, une poignée de portes YES et NOT qui exprimaient dCas12a (-AD) de manière constitutive et AcrVAs lors de l’induction avec du galactose ont été réalisées. À l’heure actuelle, ces portes ne servent que de preuve de concept. Cependant, ils représentent également la première étape vers une refonte profonde de l’algorithme pour réaliser la conception automatique computationnelle de circuits numériques de gènes synthétiques dans les cellules de levure.
1. Conception et construction de la cassette d’expression sgRNA/ARNcr
NOTE: Il existe deux types de cassettes d’expression sgRNA/ARNcr : SNR5210-est composé du promoteur SNR52 dépendant de l’ARN polymérase III, de la séquence sgRNA/ARNcr et du terminateur SUP4 ; un autre, abrégé en RGR11, se compose du promoteur ADH1 dépendant de l’ARN polymérase II, de la structure RGR (ribozyme-guide RNA-ribozyme) qui contient deux ribozymes (un ribozyme-HH à tête de marteau et un ribozyme-HDV du virus de l’hépatite delta) et la séquence de l’ARNg / ARNcr entre les deux, et le terminateur ADH1. Les homologues d’ARNg guidant Cas9 sont constitués d’une séquence d’espacement et de la répétition directe caractéristique12, tandis que l’ARNcr pour les protéines Cas12a comprend la répétition directe suivie de la séquence d’espacement13,14 (voir le tableau supplémentaire 1 pour toutes les séquences d’ADN utilisées dans cette étude).
2. Conception et construction de la cassette d’expression de l’ARN de l’échafaudage
NOTE: L’ARN guide de l’échafaudage (scRNA) est composé de la séquence sgRNA et des structures en épingle à cheveux MS225. Deux types de structures en épingle à cheveux MS2 sont utilisés dans ce travail : l’épingle à cheveux MS2 de type sauvage et l’aptamère f6 MS2 coat protein (MCP) f6.
3. Ingénierie dSpCas9 et construction plasmidique d’expression
4. dCas12a ingénierie et construction plasmidique
5. Ingénierie des protéines anti-CRISPR et construction plasmidique
REMARQUE: Trois types de promoteurs ont été utilisés pour stimuler l’expression Acrs: un promoteur inductible-pGAL1, quatre promoteurs constitutifs de levure-pGPD, pACT1, pTEF1 et pTEF2, et un promoteur constitutif synthétique-genCYC1t_pCYC1noTATA26.
6. Détection de l’ARNcr : RT-qPCR et conception des amorces
REMARQUE: La détection de l’ARNcr a été réalisée via RT-qPCR, qui est organisée en trois étapes.
7. Immunofluorescence pour détecter les protéines Cas
REMARQUE: Les protéines Cas (CasP) sont fusionnées à une His_tag.
8. Acquisition de données : FACS
REMARQUE : La fluorescence verte est détectée par cytométrie en flux (c.-à-d. mesures de tri cellulaire activées par fluorescence [FACS]). Les cellules de levure sont cultivées, en général, à 30 °C et 240 rpm pour exécuter des expériences FACS. Cependant, les cellules peuvent exiger certaines précautions en fonction de leur contenu génétique. Les cellules qui contiennent le gène dCas12a-VPR (contrôlé par le promoteur constitutif GPD ) doivent être cultivées pendant 24 h dans la solution SDC. Ensuite, les cellules sont diluées dans un rapport de 1:100 dans du SDC frais et cultivées pendant 12 heures supplémentaires avant de mesurer l’intensité de fluorescence. Les cellules modifiées avec le gène AcrIIA4-HBD(hER) exigent également une dilution. En outre, la DO600 doit être contrôlée. Tout d’abord, les cellules sont autorisées à se développer en SDC pendant la nuit (plus de 14 h). Le matin, OD600 est mesuré. Ensuite, la culture est diluée dans du SDC, fourni avec une concentration variée de β-estradiol, jusqu’àOD 600 = 0,1. Avant les expériences FACS, les cellules sont cultivées pendant encore 7 heures de sorte que OD600 atteigne 0,8-1,0. Les cellules exprimant dCas9-VP64 ou dCas12a-VP64 sont cultivées en SDC pendant 20-24 h sans dilution ni croissance supplémentaire avant les mesures à la machine FACS.
9. Analyse des données
REMARQUE: Utilisez le package Flowcore R Bioconductor 32 dans R studio. Les fichiers FCS ont été analysés à l’aide d’un script écrit en langage R.
Expression d’ARNg/ARNcr par un promoteur de type ARN polymérase III
Tout d’abord, ces travaux ont porté sur l’ingénierie du circuit d’activation transcriptionnelle (circuit 1) illustré à la figure 1A. Il contenait trois composants de base: 1) le gène codant pour yEGFP (le rapporteur), qui a été précédé par une série de promoteurs synthétiques différents qui ont fourni des sites cibles pour dCas9 / dCas12a-AD; 2) une version optimisée pour les codons de levure de dCas9 ou dCas12a fusionnée à un domaine d’activation (VP64 et VPR, respectivement) et contenant une ou deux séquences de localisation nucléaire (NLS). Les deux protéines dCas ont été produites par un puissant promoteur constitutif, le pGPD; et 3) une séquence d’ARNg/ARNcr qui a guidé dCas9/dCas12a-AD vers les sites cibles. L’efficacité d’activation des activateurs basés sur dCas9/dCas12a a été visualisée et reflétée par l’intensité de fluorescence du rapporteur (mesurée par des expériences FACS).
Une protéine dCas9 (dSpCas9) et deux protéines dCas12a (denAsCas12a et dLbCas12a) ont été testées. Une activation de 3,36 fois a été obtenue avec dSpCas9 étendu, à son extrémité C, avec le VP64 AD et liant un promoteur synthétique en amont de yEGFP contenant six copies du site cible lexOp. L’ARNg a été placé dans un vecteur navette intégratif et transcrit par le promoteur SNR52 dépendant de l’ARN polymérase III (configuration SNR52i , voir Figure 1B). Dans le cas de dCas12a, denAsCas12a-VPR a renvoyé l’activation la plus élevée (4,45 fois) d’un promoteur synthétique avec trois opérateurs lorsque l’ARNcr était exprimé via la configuration SNR52i (Figure 1C). Dans les mêmes conditions, dLbCas12a-VPR a obtenu sa meilleure amélioration de fluorescence (3,21 fois) (Figure 1D). Il convient de noter que le terme de comparaison, dans chaque expérience, était un circuit dont l’ARNg/ARNcr ne pouvait pas lier les opérateurs de la lex.
Les plasmides multicopies ne sont pas nécessaires
La cassette d’expression de l’ARNg SNR52i a été remplacée par une structure RGR exprimée par un promoteur modérément fort-pADH1. Cependant, dans les cas dCas9 et dCas12a, l’activation en présence d’un sgRNA/ARNcr généré par l’auto-clivage de RGR semblait comparable ou même inférieure à celle obtenue avec un sgRNA/ARNcr produit via SNR52i, malgré le fait que pSNR52 était considéré comme un promoteur faible (voir Figure 1C,D pour les premiers résultats obtenus avec dCas12a).
Pour explorer davantage le lien entre la quantité d’ARNg/ARNcr et l’efficacité d’activation, les deux systèmes d’expression de l’ARNg/ARNcr ont été insérés dans un plasmide épisomal, qui peut être absorbé par la cellule en 10 à 40 copies et générer une plus grande quantité d’ARNg/ARNcr. Comme le montre la figure 2A, l’activation par l’ARNcr situé sur un plasmide intégratif (SNR52i ou RGRi) était de 1,4 à 2,4 fois supérieure à celle obtenue lorsque le même ARNcr était exprimé par un plasmide épisomique (SNR52m ou RGRm). La tendance a été confirmée par le sgRNA. Dans ce cas, le plasmide intégratif garantissait une activation 1,1 à 1,5 fois plus élevée (Figure 2B). Pour exclure que les résultats aient été causés par une perte des plasmides épisomiques, la RT-qPCR a été réalisée pour quantifier l’abondance relative de l’ARNg/ARNcr in vivo. Les résultats, dans la figure 2C,D, ont vérifié que le vecteur épisomique produisait un niveau beaucoup plus élevé d’ARNg/ARNcr que le vecteur intégratif, quel que soit le système d’expression (RGR ou SNR52). Ces résultats ont montré que le système SNR52 pouvait fonctionner encore mieux que le système RGR, et une plus grande quantité d’ARNg/ARNcr dans la cellule ne garantissait pas une activation plus élevée par le système CRISPR-Cas. Par conséquent, les plasmides épisomiques ne devraient pas être utilisés dans la construction de circuits numériques géniques où dCas9/dCas12a-AD sont utilisés.
Ingénierie de l’ARN d’échafaudage
Un scRNA a été conçu en étendant la séquence d’un sgRNA avec des structures en épingle à cheveux MS2 qui ont permis de recruter VP64 AD lorsqu’il est fusionné à la protéine de couche MS2 (MCP, voir Figure 3A). De cette façon, aucune ingénierie ni modification de dCas9 n’a été nécessaire. Deux variantes MS2 ont été essayées : wt et f6. L’ARNc contenant l’épingle à cheveux MS2 unique - 1×MS2 (wt) et 1×MS2 (f6) - a donné une activation de 5,27 fois et 4,34 fois, respectivement. Cependant, le scRNA avec une combinaison des deux épingles à cheveux - 2×MS2 (wt + f6) - a renvoyé l’activation globale la plus élevée dans cette étude (7,54 fois, voir Figure 3B). Ces résultats ont démontré que l’ingénierie d’un scRNA était beaucoup plus efficace que la fusion directe de tout domaine d’activation avec dSpCas9.
Porte booléenne à base de protéines Acr
Pour mieux contrôler et ajuster l’activation transcriptionnelle par les systèmes CRISPR-Cas, le circuit 1 a été modifié avec l’insertion d’un quatrième TU pour l’expression des protéines anti-CRISPR (voir Figure 4A pour les AcrIIA et Figure 5A pour les AcrVA). Après avoir montré que les Acrs étaient efficaces, chez S. cerevisiae, pour contraster l’activation due à dCas9/dCas12a-AD, un nouveau circuit a été construit (voir Figure 5D) pour tester l’action de l’AcrVA sur les répresseurs à base de dCas12a (un travail antérieur33 avait déjà montré que les AcrIIA pouvaient inhiber la régulation négative des gènes à base de dCas9). Les nouveaux petits réseaux contenant de l’Acr fonctionnaient comme de simples portes booléennes (OUI et PAS), ce qui pourrait conduire à un restyling de la couche d’entrée de circuits numériques de gènes synthétiques plus complexes.
AcrIIA4 est un inhibiteur puissant de dSpCas9
Quatre promoteurs différents avec des forces diverses ont été utilisés pour conduire l’expression de trois types d’AcrIIs-AcrIIA2, AcrIIA4 et AcrIIA5. Les résultats ont montré que les trois AcrII fonctionnaient de manière dose-dépendante chez S. cerevisiae. Lorsqu’ils sont exprimés par un promoteur fort, le pGPD, ils réduisent le niveau de fluorescence atteint par dSpCas9:scRNA_2×MS2(wt+f6)-MCP-VP64 à 0,21, 0,11 et 0,13 de sa valeur, respectivement (Figure 4B). Étant donné que l’AcrIIA4 était le seul à provoquer une forte inhibition de l’expression de la fluorescence, même lorsqu’il était produit par un promoteur synthétique faible, genCYC1t_pCYC1noTATA, nous pouvions en déduire que l’AcrIIA4 était l’inhibiteur le plus puissant parmi les trois AcrII. Ensuite, le HBD(ER) a été fusionné à l’extrémité C d’AcrIIA4 pour construire un dispositif de détection de β-estradiol (voir Figure 4C). En présence de l’œstrogène β-estradiol, AcrIIA4-HBD(ER) pourrait se déplacer dans le noyau puis neutraliser la fonction de l’activateur basé sur dSpCas9. La courbe de titrage de la figure 4D montre que le circuit se comporte comme une porte NOT avec un rapport ON/OFF proche de 2,3.
Les AcrVA sont des répresseurs des protéines dCas12a
Une porte NOT a été conçue et construite en insérant la cassette d’expression AcrVA pilotant pGAL1 dans le circuit 1. De cette façon, la synthèse de l’AcrVA, et la répression conséquente de dCas12a-AD, pourraient être induites par le galactose (Figure 5A). Comme le montre la figure 5B,C, AcrVA1 a entravé à la fois denAsCas12a et dLbCas12a en tant qu’activateurs en réduisant l’expression de fluorescence de 19% à 71%, selon le schéma du circuit. AcrVA4 et AcrVA5 ne peuvent exercer aucune action sur denAsCas12a34. Cependant, ils ont effectué une forte inhibition des activateurs à base de dLbCas12a en réduisant l’expression de fluorescence jusqu’à 84% (AcrVA5) et 82% (AcrVA4). Dans l’ensemble, AcrVA5 s’est avéré être le plus fiable, parmi ces trois AcrVA, pour inhiber les activateurs à base de dLbCas12a car il garantissait, dans différents circuits, une répression supérieure à 70%.
L’action de l’AcrVA1 dépend de la concentration
La relation entre la concentration in vivo des AcrVA et leurs effets inhibiteurs sur les activateurs et les répresseurs à base de denAs/dLbCas12a a également été étudiée. À cette fin, chaque AcrVA a été exprimée sous différents promoteurs: le pGAL1 fort, le pTEF1 de force moyenne et le faible genCYC1t_pCYC1noTATA. Comme l’illustre la figure 5E, AcrVA1 a montré de grandes fluctuations de ses performances en fonction du promoteur qui a conduit sa synthèse. AcrVA1 n’a fonctionné raisonnablement bien que lorsqu’il était produit par pGAL1. Sous pTEF1 et genCYC1t_pCYC1noTATA, AcrVA1 a montré une certaine répression sur le dLbCas12a nu seulement. AcrVA4 et AcrVA5, en revanche, semblaient moins sensibles à leur concentration, en particulier lorsqu’elles interagissaient avec les dLbCas12a nues.
Ces données ont montré que AcrVA4 et AcrVA5 ont généralement donné de meilleurs résultats qu’AcrVA1 dans l’inhibition des facteurs de transcription basés sur dLbCas12a chez S. cerevisiae. Il convient de noter que l’AcrVA5 a un mécanisme de fonctionnement particulier, car il agit comme une enzyme qui modifie LbCas12a de manière permanente. Cependant, comme mentionné ci-dessus, AcrVA5 (avec AcrVA4) ne peut pas interagir avec denAsCas12a.
Lorsque les AcrVA étaient exprimés sous pGAL1, les circuits devenaient soit des portes YES (dCas12a a été fusionné à une AD), soit des portes NOT (dCas12a nues). Les premiers semblaient tous très performants, tandis que les seconds semblaient mieux fonctionner en présence d’AcrVA4 ou d’AcrVA5.
Figure 1 : Activation transcriptionnelle médiée par dCas9/dCas12a-AD. A) Schéma du circuit 1. Les promoteurs synthétiques de yEGFP contenaient six (6x) et trois (3x) copies de sites cibles pour dCas9 ou dCas12a, respectivement. Après cela, dCas9 / dCas12a-AD se combine avec sgRNA / ARNcr; Le promoteur synthétique est ciblé et activé en raison de la présence des domaines d’activation. (B) La meilleure efficacité d’activation de dSpCas9-VP64 a été obtenue lorsqu’il y avait six sites cibles lexOp sur le promoteur synthétique, et que l’ARNg a été transcrit par SNR52i. (C, D) L’efficacité d’activation la plus élevée de dCas12a-VPR a été obtenue lorsque trois copies de lexOp ont été insérées dans le promoteur synthétique, et l’ARNcr a été généré par SNR52i. SNR52i signifie que le sgRNA/ARNcr a été produit par pSNR52, et la cassette d’expression a été placée à l’intérieur d’un vecteur navette intégratif. RGRi signifie qu’un plasmide intégratif hébergeant la cassette RGR pour exprimer l’ARNg/ARNcr a été utilisé. Le témoin négatif, « -« , représente un sgRNA/ARNcr contenant une séquence d’espacement brouillée qui ne correspond pas au site lexOp ni à aucune séquence le long du génome de la levure. « bA » indique que le sgRNA/crRNA se lie au brin antisens de l’ADN cible, tandis que « bS » signifie lier le brin sensoriel. Chaque niveau de fluorescence représente la valeur moyenne d’au moins trois expériences indépendantes (c.-à-d. effectuées à des jours différents). Les barres d’erreur sont l’écart-type de la moyenne. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 2 : Comparaison de l’ARNg/ARNcr integratif et épisomique producteur de plasmides. (A) Efficacité d’activation de dLbCas12a-VPR:crRNA lors du ciblage d’un seul site sur le promoteur en amont de yEGFP. (B) dSpCas9-VP64:promoteur synthétique n× activé par sgRNA (« n » signifie le nombre de sites cibles lexOp). (C, D) Niveau d’expression normalisé de l’ARNg/ARNcr15,16. « i » signifie que la cassette d’expression de l’ARNg/ARNcr a été placée dans un vecteur navette intégratif, tandis que « m » signifie plasmide multicopie (c.-à-d. épisomique). « bA"/"bS » indique que le sgRNA/crRNA se lie au brin antisens/sens de l’ADN. « ctrl » est un contrôle négatif, où un sgRNA/ARNcr brouillé a été exprimé. Chaque niveau de fluorescence représente la valeur moyenne d’au moins trois expériences indépendantes (c.-à-d. effectuées à des jours différents). Les barres d’erreur sont l’écart-type de la moyenne. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 3 : L’efficacité d’activation du dSpCas9 nu en complexe avec un scRNA. (A) Le diagramme schématique des interactions entre scRNA, MCP-VP64 et le dSpCas9 nu16. La structure en forme de coiffe en violet représente la protéine de m.c.p. (MS2). Une épingle à cheveux MS2 (la structure violette dans le scRNA) peut recruter et lier deux copies de MCP. Ainsi, un scRNA permet non seulement la liaison à l’ADN par dSpCas9 mais aussi l’activation de l’expression génique par le recrutement de MCP-VP64. (B) L’efficacité d’activation de dSpCas9:scRNA-MCP-VP64. Trois types d’ARNc ont été testés: l’un portant l’épingle à cheveux MS2 de type sauvage 1×MS2 (wt), un autre conçu avec l’aptamère MCP f6-1×MS2 (f6), et le dernier contenant les deux épingles à cheveux-2×MS2 (wt + f6), qui s’est avéré être le plus performant. Chaque niveau de fluorescence représente la valeur moyenne d’au moins trois expériences indépendantes (c.-à-d. effectuées à des jours différents). Les barres d’erreur sont l’écart-type de la moyenne. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 4 : Circuits et résultats liés à AcrIIA. (A) La cassette d’expression AcrIIA a été insérée dans le circuit 1. Cette TU supplémentaire inclut pGPD menant l’expression des AcrIIA pour contrer dSpCas9:scRNA_2×MS2(wt+f6)-MCP-VP64. (B) L’efficacité d’inhibition des AcrIIA sur le meilleur activateur basé sur dSpCas9 de la figure 3B. La ligne pointillée noire représente la fluorescence en présence de l’activateur basé sur dSpCas9. Les chiffres au-dessus de chaque colonne montrent l’efficacité d’inhibition calculée comme le rapport OFF/ON (c’est-à-dire le niveau de fluorescence en présence de l’AcrIIA divisé par la fluorescence en l’absence de tout AcrIIA). Dans la légende, la force des quatre promoteurs constitutifs augmente progressivement de haut en bas. (C) Schéma du dispositif de détection du β-estradiol (NOT gate) exprimant AcrIIA4-HBD(hER). (D) Courbe de titrage du circuit en (C)16. La courbe verte fait référence au changement de fluorescence dans le circuit fonctionnel. La courbe noire a été dérivée de la déformation sans l’expression d’AcrIIA4-HBD(hER)-le témoin négatif. La ligne pointillée en gris marquait le plateau de fluorescence à l’équilibre. Il a été calculé comme la moyenne des valeurs de fluorescence à des concentrations de β-estradiol non inférieures à 125 nM. Chaque niveau de fluorescence représente la valeur moyenne d’au moins trois expériences indépendantes (c.-à-d. effectuées à des jours différents). Les barres d’erreur sont l’écart-type de la moyenne. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 5 : Circuits liés à l’AcrVA et résultats. (A) La cassette d’expression AcrVA a été insérée dans le circuit 1. Le nouveau TU contient le promoteur inductible pGAL1 en amont des gènes AcrVA qui neutralisent le fonctionnement de dCas12a-AD. Le nouveau circuit est une porte NON régulée par le galactose. (B,C) Résultats de la porte NOT sensible au galactose en (A). Ici, pGAL1 pilote la synthèse des AcrVA, qui interagissent ensuite avec dCas12a-AD15. La fluorescence relative correspond au rapport OFF/ON. (D) Porte OUI sensible au galactose. Il utilise des AcrVAs sous le contrôle de pGAL1 et des dCas12as nues qui répriment la synthèse de yEGFP. (E) Comparaison des efficacités d’inhibition des AcrVA exprimées par des promoteurs de force différente15. Les groupes « AcrV effects on repression » et « dLb nu » se réfèrent au circuit en (D). Les groupes « AcrV effects on activation » et « dLb-VPR » sont les résultats de la porte NOT en (A). Chaque niveau de fluorescence représente la valeur moyenne d’au moins trois expériences indépendantes (c.-à-d. effectuées à des jours différents). Les barres d’erreur sont l’écart-type de la moyenne. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Tableau supplémentaire 1 : Une liste de toutes les séquences d’ADN utilisées dans cette étude. Veuillez cliquer ici pour télécharger ce fichier.
Tableau supplémentaire 2 : Liste des amorces utilisées dans cette étude. Veuillez cliquer ici pour télécharger ce fichier.
Fichiers de codage supplémentaires : Le script R studio pour analyser les fichiers FCS. Veuillez cliquer ici pour télécharger ce fichier.
Le protocole a montré un flux de travail complet possible pour les circuits numériques de gènes synthétiques, suivant le cycle de génie biologique « Design-Build-Test-Learn » (DBTL) et concernant à la fois des expériences de laboratoire sec et de laboratoire humide. Ici, nous nous sommes concentrés sur le système CRISPR-Cas, principalement dSpCas9, denAsCas12a, dLbCas12a et les protéines anti-CRISPR correspondantes, en concevant et en construisant dans S. cerevisiae de petits réseaux transcriptionnels. Certains d’entre eux imitaient les portes booléennes, qui sont les composants de base des circuits numériques. Tous les circuits décrits ici nous ont permis de décrire les propriétés et les caractéristiques des protéines associées et anti-CRISPR associées à CRISPR chez S. cerevisiae. Ces résultats sont essentiels pour inclure ces protéines dans le schéma des circuits numériques géniques.
Le concept DBTL fournit un cadre en biologie synthétique, tandis que de nombreuses optimisations et améliorations doivent être apportées après avoir testé un nouvel artefact. Par exemple, dans le circuit 1, il n’y avait initialement qu’un seul site cible (une copie de lexOp) pour dCas9/dCas12a-AD sur le promoteur synthétique en amont de yEGFP. Après avoir testé cette configuration de circuit, nous avons constaté qu’il ne pouvait pas atteindre plus d’une activation double15,16. Ensuite, nous avons supposé qu’en augmentant le nombre de copies de lexOp, comme dans7, nous pourrions atteindre une activation transcriptionnelle plus élevée. En effet, un niveau de fluorescence plus élevé a été obtenu en utilisant trois à six sites lexOp (Figure 1). De plus, nous avons encore amélioré les performances des circuits hébergeant dSpCas9 en concevant un scRNA, ce qui est plus facile que de fusionner un ou plusieurs AD en une grosse protéine comme dSpCas9 (Figure 3). De plus, en utilisant un promoteur de différentes forces pour produire les trois AcrIIA que nous avons choisis, nous avons conclu que AcrIIA4 était l’inhibiteur le plus puissant d’entre eux. Ainsi, nous avons construit une nouvelle porte NOT sensible au β-estradiol en fusionnant le HBD(ER) à AcrIIA4 et en exploitant la forte répression d’AcrIIA4 sur notre meilleur activateur basé sur dSpCas9 (Figure 4).
De même, nous avons profondément caractérisé à la fois le fonctionnement de denAsCas12a et dLbCas12a dans la levure et leurs interactions avec trois AcrVAs (Figure 5). Pour chaque paire dCas12a-AcrVA, nous avons construit une porte NOT (dCas12a a été fusionnée à un AD) et une porte YES (dCas12a nue) répondant au galactose. Dans l’ensemble, dLbCas12a, avec AcrVA5, a abouti au meilleur système pour calculer des fonctions logiques simples.
La méthode décrite ici présentait quelques étapes critiques. Toutes les séquences d’ADN protéique ont été optimisées pour les codons de levure afin d’assurer une expression plus élevée chez S. cerevisiae. Pour éviter des cibles non spécifiques de dSpCas9/denAsCas12a/dLbCas12a dans le génome de S. cerevisiae , nous avons sélectionné un opérateur bactérien tel que lexOp. De plus, les souches contenant le promoteur GAL1 ont montré un retard de croissance important qui pourrait limiter l’applicabilité de pGAL1 aux circuits géniques synthétiques15.
Certaines modifications pourraient également être apportées à certaines étapes de la méthode globale. Afin d’améliorer l’efficacité de la procédure de digestion-ligature, il est préférable de digérer 10 μg (pendant la nuit) du plasmide contenant l’insert et des vecteurs accepteurs, plutôt que seulement 5 μg en 1 h. De cette façon, une concentration d’ADN plus élevée est atteinte après l’étape d’élution. Le temps de ligature T4 doit être prolongé de 1 h (protocole du fabricant) à 8 h. Enfin, les souches contenant la protéine de fusion dCas12a-VPR doivent être diluées après une culture de 24 heures et cultivées pendant 12 heures supplémentaires avant d’exécuter une expérience FACS. Dans cette condition, la variabilité entre les niveaux de fluorescence des différentes cellules n’est plus trop élevée, et un écart-type acceptable accompagne la valeur moyenne de l’intensité de fluorescence sur une population cellulaire.
En résumé, ce protocole expliquait comment simplifier la conception des circuits numériques géniques en utilisant des protéines dCas et, éventuellement, des protéines anti-CRISPR. Plus important encore, nous avons montré en détail comment ces familles de protéines fonctionnent chez S. cerevisiae et lesquelles d’entre elles sont les plus prometteuses pour une utilisation future au sein des réseaux numériques. Un problème non résolu est le couplage des systèmes CRISPR-dCas/anti-CRISPR et des produits chimiques, qui représentent les entrées du circuit et ne peuvent pas lier directement les protéines dCas ou les anti-CRISPR. Ici, nous avons contourné le problème en utilisant soit le promoteur GAL1 inductible, soit le HBD(ER) attaché à AcrIIA4. Cependant, un moyen de généraliser l’architecture de la couche d’entrée du circuit est nécessaire pour concevoir des circuits numériques de gènes synthétiques pour différents domaines de la bio-ingénierie tels que l’ingénierie métabolique, la biosynthèse, la biodétection, le biodiagnostic et la bioremédiation.
Les auteurs ne déclarent aucun intérêt financier concurrent.
Nous tenons à remercier tous les étudiants du laboratoire de biologie synthétique SPST, TJU pour leur aide générale, ainsi que Zhi Li et Xiangyang Zhang pour leur aide dans les expériences FACS.
Name | Company | Catalog Number | Comments |
0.1 mL PCR 8-strip tubes | NEST | 403112 | |
0.2 mL PCR tubes | Axygen | PCR-02-C | |
1.5 mL Microtubes | Axygen | MCT-150-C | |
15 mL Centrifuge tubes | BIOFIL | CFT011150 | |
2 mL Microtubes | Axygen | MCT-200-C | |
50 mL Centrifuge tubes | BIOFIL | CFT011500 | |
Agarose-molecular biology grade | Invitrogen | 75510-019 | |
Ampicillin sodium salt | Solarbio | 69-52-3 | |
Applied biosystems veriti 96-well thermal cycler | Thermo Fisher Scientific | 4375786 | |
AxyPrep DNA gel extraction kit | Axygen | AP-GX-250 | |
BD FACSuite CS&T research beads | BD | 650621 | Fluorescent beads |
BD FACSVerse flow cytometer | BD | - | |
Centrifuge | Eppendorf | 5424 | |
Centrifuge Sorvall ST 16R | Thermo Fisher Scientific | 75004380 | |
E. coli competent cells (Strain DH5α) | Life Technologies | 18263-012 | |
ECL select Western Blotting detection reagent | GE Healthcare | RPN2235 | |
Electrophoresis apparatus | Beijing JUNYI Electrophoresis Co., Ltd | JY300C | |
Flat 8-strip caps | NEST | 406012 | |
Gene synthesis company | Azenta Life Sciences | https://web.azenta.com/zh-cn/azenta-life-sciences | |
Goat anti-Mouse IgG (H+L) cross-adsorbed secondary antibody Alexa Fluor 568 | Invitrogen | A-11004 | |
HiFiScript cDNA synthesis kit | CWBIO | CW2569M | Kit used in step 6.2.2.1 |
Lysate solution (Zymolyase) | zymoresearch | E1004-A | |
Nikon Eclipse 80i fluorescence microscope | Nikon | - | Fluorescence microscope |
Pipet tips—10 μL | Axygen | T-300-R-S | |
Pipet tips—1000 μL | Axygen | T-1000-B-R-S | |
Pipet tips—200 μL | Axygen | T-200-Y-R-S | |
pRSII403 | Addgene | 35436 | |
pRSII404 | Addgene | 35438 | |
pRSII405 | Addgene | 35440 | |
pRSII406 | Addgene | 35442 | |
pRSII424 | Addgene | 35466 | |
pTPGI_dSpCas9_VP64 | Addgene | 49013 | |
Q5 High-fidelity DNApolymerase | New England Biolabs | M0491 | |
Restriction enzyme-Acc65I | New England Biolabs | R0599 | |
Restriction enzyme-BamHI | New England Biolabs | R0136 | |
Restriction enzyme-SacI-HF | New England Biolabs | R3156 | |
Restriction enzyme-XhoI | New England Biolabs | R0146 | |
Roche LightCycler 96 | Roche | - | Real-Time PCR Instrument |
S. cerevisiae CEN.PK2-1C | - | - | The parent strain. The genotype is: MATa; his3D1; leu2-3_112; ura3-52; trp1-289; MAL2-8c; SUC2 |
Stem-Loop Kit | SparkJade | AG0502 | Kit used in step 6.2.1.3 |
T100 Thermal Cycler | BIO-RAD | 186-1096 | |
T4 DNA ligase | New England Biolabs | M0202 | |
T5 Exonuclease | New England Biolabs | M0363 | |
Taq DNA ligase | New England Biolabs | M0208 | |
Taq DNA polymerase | New England Biolabs | M0495 | |
TB Green Premix Ex Taq II (Tli RNaseH Plus)(2x) (SYBR Green I dye) | Takara | RR820Q | |
YeaStar RNA kit | Zymo Research | R1002 | |
β-estradiol | Sigma-Aldrich | E8875 |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon