Diss. ETH No. 21428 Application of Modern Enzyme Design Technologies and Strategies for their Refinement A dissertation submitted to ETH Zurich for the degree of Doctor of Sciences presented by NATHALIE PREISWERK M.Sc. in Chemistry, EPF Lausanne born on January 23rd, 1984 citizen of Switzerland and Bolivia Accepted on the recommendation of Prof. Dr. D. Hilvert, examiner Prof. Dr. D. Neri, co-examiner Zürich, 2013 Abstract ABSTRACT Enzymes are the most powerful catalysts. Their use as alternatives to small molecule and metal-based catalysts for industrial processes is very appealing but often limited by the narrow range of substrates they convert and their limited stability in industrial settings. Scientists have therefore developed strategies to generate artificial enzymes with tailored properties. This thesis describes the study of three artificial enzymes. In order to mimic natural enzymes efficiently, a precise understanding of the processes responsible for their remarkable activities is necessary. The cotranslational incorporation of selenocysteine in natural proteins is extremely costly and requires the expression of complex machineries. The higher nucleophilicity of selenium is often claimed to justify its insertion into proteins. In Chapter 2, we compare the reductive activity of an engineered dithiol oxidase DsbA variant in which the catalytic cysteine at position 30 was replaced by selenocysteine with that of its cysteine-containing counterpart. This system allows unbiased comparison of nucleophilicity between selenocysteine and cysteine since, in this protein environment, both side chains are in their deprotonated state under physiological conditions. We show that selenocysteine provides a 10-fold catalytic advantage over cysteine for the reduction of a variety of oxidants such as hydroperoxides, disulfides and diselenides. Although a 10-fold difference in nucleophilicity between selenols and thiols seems rather modest to justify the energy-demanding selenocysteine incorporation into proteins, its combination with the lower pKa of selenols which increases the ix Abstract concentration of deprotonated reactive species, together with the novel redox properties of the 21st proteinogenic amino acid, under physiological conditions apparently make this energy expense worthwhile. One enticing goal in enzyme design is the generation of proteins with catalytic activities unknown to Nature. In Chapter 3, we describe the optimization Diels-Alderase by directed that evolution catalyzes the of a computationally non-biological 4-carboxybenzyl-trans-1,3-butadiene-1-carbamate designed cycloaddition and of N,N- dimethylacrylamide. In order to evolve this Diels-Alderase, we have developed a medium throughput tandem-mass spectrometry screening assay consisting of three consecutive steps. First, the desired reaction is carried out in cell lysate. The product of the reaction is then extracted in a solvent compatible with electrospray ionization (ESI) and finally analyzed without further work-up by tandem mass spectrometry. By applying this assay to the laboratory evolution of the initial computational design and of a computationally refined version of the design, we have generated DA CE20, a Diels-Alderase variant with an effective molarity (kcat/kuncat) 100-fold higher than that of the initial computational design. The evolved DA CE20 is 100-fold more efficient at catalyzing the target DielsAlder reaction than the catalytic antibodies generated for the same reaction and has the same levels of activity than the best biocatalysts ever generated for any Diels-Alder reaction. Structural characterization of DA CE20 in complex with a product analog has allowed us to confirm that the catalytic machinery of the enzyme, consisting of two residues, a tyrosine and a glutamine, that interact with the diene and dienophile, respectively, is very similar to what was intended by design. Nevertheless, the catalytic activity of DA CE20 remains modest compared to other evolved computational designs and natural enzymes. The remarkable rigidity of its scaffold may have limited the extent to which it could be improved. It is also possible that the catalytic mechanism based on hydrogen x Abstract bond interactions chosen during computational design is not optimal. Future investigation of other protein scaffolds and alternative mechanisms, particularly metal ion catalysis, may yield highly efficient Diels-Alder biocatalysts. An alternative approach to the design of enzymes with novel activities relies on redesigning the substrate specificity of an existing enzyme while retaining its catalytic machinery. Applying this strategy to computationally redesign the substrate specificity of human guanine deaminase towards ammelide has yielded hGDA-des, a protein that hydrolyzes the new substrate, albeit seven orders of magnitude less efficiently than the native activity of wild-type guanine deaminase towards guanine. In Chapter 4, we describe our efforts to develop a medium-throughput screening assay for directed evolution of hGDA-des. We first attempted to adapt the mass spectrometry assay described in Chapter 3 but the strong similarities between the substrate, ammelide, and the product, cyanuric acid, in terms of solubility and molecular weight rendered the implementation of this mass spectrometry assay problematic. We therefore explored the utility of a glutamate dehydrogenasecoupled colorimetric assay for detecting the ammonium ions that are produced upon ammelide deamination. Glutamate dehydrogenase catalyzes the reductive amination of α‐ketoglutarate to glutamate in the presence of ammonium while simultaneously oxidizing NADH. Cofactor oxidation is easily monitored by a decrease in absorbance at 340 nm. Although the developed medium-throughput method is not yet fully optimal, it was successfully used to probe the validity of the computational approach. We found that while computational design succeeded at remodeling the flexible loop of guanine deaminase to recognize ammelide, it failed at predicting the orientation of one crucial side-chain with the atomic-level precision needed for high catalytic efficiency. Future improvements in the screening method and its application to the evolution of hGDA-des are expected to yield considerable improvements in activity and xi Abstract provide concrete suggestions for the refinement of the current computational approaches. In summary, this thesis has contributed clues for the refinement of several current strategies for enzyme design. Rational introduction of novel functionalities in enzymes will extend the range of transformations they catalyze. Iterations of computational design with ever-more sophisticated algorithms followed by directed evolution is a promising approach for the generation of highly efficient enzymes in the future. xii Résumé RÉSUMÉ Grâce à leur capacité à accélérer les nombreuses réactions nécessaires à la vie avec une efficacité et une spécificité spectaculaires, les enzymes sont les catalyseurs les plus puissants connus à ce jour. Leur application dans l’industrie en tant qu’alternatives aux catalyseurs organiques et organométalliques est attrayante mais souvent limitée par leur sélectivité pour un éventail restreint de substrats et par leur instabilité sous haute température, dans des solvants organiques et sous pH non-physiologiques. Par conséquent, de nouvelles stratégies visant à générer des enzymes artificiels aux propriétés adaptées ont été développées ces dernières décennies. Au cours de cette thèse de doctorat, nous avons étudié et optimisé trois enzymes artificiels. Afin d’imiter efficacement les enzymes naturels, il est nécessaire de comprendre avec précision les caractéristiques responsables de leurs impressionnantes efficacités. Par exemple, l’incorporation de sélénocystéine dans les protéines est un processus complexe qui requière beaucoup d’énergie. Malgré tout, de nombreuses sélénoprotéines ont été découvertes chez toutes les espèces sur Terre. Dans le Chapitre 2, nous étudions une caractéristique du sélénium souvent avancée pour justifier l’utilisation de la sélénocystéine dans les enzymes naturels : la nucléophilicité. Il s’agit d’une comparaison de l’activité réductrice d’une variante de l’oxydoréductase DsbA dans laquelle la cystéine catalytique à la position 30 a été remplacée par une sélénocystéine, avec celle de son homologue non-modifiée. Nous montrons que la sélénocystéine fourni une efficacité catalytique 10 fois supérieure à celle de la xiii Résumé cystéine pour la réduction d’une palette d’oxydants tels que des hydroperoxydes, disulfures et diséléniures. Bien qu’une différence de nucléophilicité de 10 fois entre sélénols et thiols puisse paraître modeste pour justifier l’incorporation couteuse de sélénocystéines dans les protéines, sa combinaison avec le faible pKa des sélénols qui augmente la concentration d’espèces déprotonées et réactives sous conditions physiologiques, semble justifier cette dépense énergétique. Un objectif ambitieux lors de la conception d’enzymes artificiel est la génération de protéines aux propriétés catalytiques absentes dans la nature. Dans le Chapitre 3, nous décrivons l’optimisation par évolution dirigée d’une Diels-Aldérase conçue par modélisation numérique catalysant la cycloaddition non-naturelle du 4-carboxybenzyl-trans-1,3-butadiene-1-carbamate et du N,Ndimethylacrylamide. Afin d’optimiser cette Diels-Aldérase par évolution dirigée, nous avons développé une procédure de sélection par spectrométrie de masse comportant trois étapes consécutives. Premièrement, la réaction catalytique est effectuée dans un lysat de cellules. Le produit de la réaction est ensuite extrait à l’aide d’un solvant compatible avec l’ionisation par électrospray (ESI) qui est directement injecté dans un spectromètre de masse sans étape de purification supplémentaire. Cette méthode fiable et rapide a permis l’évolution dirigée de la Diels-Aldérase générée in silico. Nous avons trouvé un mutant – DA CE20 – dont la molarité effective (kcat/kuncat) est 100 fois supérieure à celle de la Diels-Aldérase initiale. DA CE20 est par ailleurs 100 fois plus efficace que les anticorps catalytiques conçus pour catalyser la même réaction et a le même niveau d’activité que les meilleurs biocatalyseurs jamais générés pour une réaction de Diels-Alder. L’élucidation de la structure de DA CE20 en complexe avec un analogue du produit de la réaction nous a permis de confirmer que sa machinerie catalytique est très similaire à celle du modèle in silico. Néanmoins, l’activité catalytique de DA CE20 reste modeste xiv Résumé comparée à celle des enzymes naturels. Il est possible que la remarquable rigidité de son architecture globale ait limité l’évolution de son activité. Par ailleurs, le mécanisme catalytique (basé sur des liaisons hydrogènes) choisi lors de la conception numérique peut potentiellement être optimisé. L’investigation de structures protéiques alternatives ainsi que d’autres mécanismes catalytiques, basés par exemple sur l’utilisation d’ions métalliques, pourraient engendrer des biocatalyseur encore plus puissants pour la réaction de Diels-Alder. Une approche alternative pour la conception d'enzymes avec des activités catalytiques innovantes consiste à remodeler le site actif d’une protéine naturelle pour lui permettre d’accepter des substrats non-natifs tout en conservant sa machinerie catalytique. En appliquant cette stratégie, la guanine désaminase humaine a été remodelée in silico pour reconnaître l’ammélide comme substrat à la place de la guanine. Son activité envers l’ammélide est néanmoins sept ordres de grandeur inférieure à l'activité native de la guanine désaminase. Dans le Chapitre 4, nous décrivons le développement d’une procédure de sélection pour l’évolution dirigée de la guanine désaminase modifiée. Nous avons premièrement essayé d’adapter la méthode par spectrométrie de masse décrite dans le Chapitre 3 mais les grandes similarités entre le substrat, ammélide, et le produit, l’acide cyanurique, en termes de solubilité et de masse moléculaire ont rendu son application problématique. Nous avons donc développé une méthode colorimétrique utilisant la glutamate déshydrogénase pour détecter les ions ammonium produits lors de la désamination de l’ammélide. La glutamate déshydrogénase catalyse l’amination réductrice de l’ α-ketoglutarate en glutamate en présence d’ammonium en oxydant simultanément une molécule de NADH. L’oxydation de ce cofacteur est mesurée facilement par une diminution de l’absorbance à 340 nm. Bien que cette méthode ne soit pas encore optimale, elle a été utilisée pour tester la validité du design in silico. Cette recherche a démontré que la méthode xv Résumé informatique utilisée n’es pas encore capable de prédire l’orientation d’acides aminés cruciaux avec la précision nécessaire à assurer une efficacité catalytique importante. L’optimisation de la méthode de sélection et son application pour l'évolution de la guanine désaminase modifiée devraient permettre des améliorations considérables de son activité et fournir des suggestions concrètes pour l'amélioration des méthodes computationnelles actuelles. xvi