Chematica und Synthia™ – „The Future of Retro“

Du bist hier:

Chematica und dessen Weiterentwicklung Synthia™ sollen die Retrosynthesemodule der Zukunft sein. Wir zeigen Dir die Entwicklung, die Funktionsweise und ein Verwendungsbeispiel der Retrosynthesesoftware.

Mit Software zum Retrosynthese-Plan

Wo das Problem liegt

Einem Computer beizubringen, Synthesen zu planen, ist eine der größten Herausforderungen der modernen Chemie. Trotz jahrzehntelanger Forschung gelang es keinem Computerprogramm, einen vollständigen Syntheseweg zu entwerfen, der dann im Labor erfolgreich umgesetzt werden konnte. Die Unzulänglichkeiten von Computerprogrammen haben ihren Ursprung unter anderem in ihrer begrenzten Wissensbasis über chemische Transformationen, ihrer Unfähigkeit, durch höhere Logik sinnvoll zwischen verschiedenen Wegen zu unterscheiden und diese elegant zu kombinieren. [a, c]

Retrosynthesemodule der Zukunft

Vor einigen Jahren (2012) wurde dann ein de-novo-Retrosynthesemodul – Chematica – vorgestellt, das Netzwerktheorie, „modernes Hochleistungsrechnen“, „künstliche Intelligenz“ und chemisches Wissen vereint, um sinnvolle Synthesewege zu entwerfen. Obwohl Chematica auf großes Interesse gestoßen ist, wurden seine Vorhersagen bis zum Jahr 2018 nicht experimentell bestätigt. In dem Artikel „Efficient Syntheses of Diverse, Medicinally Relevant Targets Planned by Computer and Executed in the Laboratory“ von Kluczni et al. (2018, open source) wird beschrieben, wie mittels Chematica Synthesewege entworfen wurden, die dann im Labor erfolgreich durchgeführt werden konnten.

Im Mai 2017 wurde die Software von der Merck-Gruppe gekauft und 2018 veröffentlichte Merck die darauf basierende Synthia™ Software, welche die E-Commerce-Plattform und das Chemie-Portfolio der Merck-Gruppe um mehr als 400.000 Bausteine, Katalysatoren und Reagenzien für die chemische Synthese erweitert. Synthia wird als das Retrosynthesemodul der Zukunft beworben. [a, b, d]

Wer an ein wenig mehr Hintergrundgeschichte interessiert ist, kann diesem Bedürfnis im folgenden Artikel nachgehen: Chematica: A story of computer code that started to think like a chemist – Ein Artikel von Grzybowski et al.

Funktionsweise von Chematica

Wie genau Chematicas Weiterentwicklung Synthia™ arbeitet, können wir Dir leider nicht sagen, aber zu Chematica gibt es einige veröffentlichte Informationen:

Das Programm verwendet über 70.000 Regeln, die verschiedene Reaktionsklassen beschreiben, wobei jede Regel, die von synthetischen Experten kodiert wurde, mechanistische Überlegungen und Substitutionen, Reaktionsbedingungen, Reaktivitätskonflikte, notwendige Schutzgruppen, Selektivitätsprobleme usw. berücksichtigt. Diese Regeln sind die “grundlegenden Bewegungen“, die von den Suchalgorithmen verwendet werden, um in den riesigen Entscheidungsbäumen synthetischer Möglichkeiten auf intelligente Weise zu navigieren. [a]

Chematica wird parallelisiert und auf Multicore-Maschinen eingesetzt. Ein- und Ausgabe erfolgen durch eine grafische Benutzeroberfläche. [a, d]

Ein Verwendungsbeispiel zu Chematica

Im Folgenden wird ein Beispiel aus der Arbeit von Klucznik et al. (CC BY-NC-ND 4.0) gezeigt. Genauere Informationen und weitere (auch im Labor bestätigte) Beispiele können dem Artikel von Klucznik et al. entnommen werden. Dort stehen auch Videos des Arbeitsablaufs zum Download bereit.

Im Mittelpunkt jeder der über 70.000 Regeln von Chematica steht ein Entscheidungsbaum:

Mit Software zum Retrosyntheseplan - Erläuterung und Beispiel zum Retrosynthesemodul: Darstellung von Chematicas Entscheidungsbaum für die doppelte stereodifferenzierende Kondensation von Estern mit Aldehyden. (Abbildung: Klucznik et. al  (CC BY-NC-ND 4.0))
Abb. 1: Darstellung von Chematicas Entscheidungsbaum für die doppelte stereodifferenzierende Kondensation von Estern mit Aldehyden. (Abbildung: Klucznik et. al (CC BY-NC-ND 4.0)) [a]

Die verschiedenen Bedingungen innerhalb des Baumes (Teilgrafik (A)) legen den Bereich der zulässigen und auch der möglichen (nicht nur derjenigen, die in der Literatur beschriebenen wurden) Substituenten oder Atomtypen fest. Alle Regeln berücksichtigen die Stereo- und Regio-Selektivität und auch den „Kontext“ des Moleküls und der Synthese, d.h. Gruppen, die mit der Reaktion unvereinbar oder zu schützen sind, werden erkannt und die Entscheidungen entsprechend bewertet. [a]

Der Baum beginnt mit einer Bedingung, dass die Reaktion intermolekular ist. Um die Stereoinformationen (face selectivity) des Enolats zu erhalten, werden die richtigen Bedingungen für die Substituenten an den Positionen #8, #1 und #3 evaluiert. Die Bedingungen für die Positionen #12, #2, #11 und #14 werden als nächstes evaluiert, um die Stereoinformationen (face selectivity) des Aldehyds zu erhalten. Die nächsten Beiden Bedingungen sind für beide Substrate identisch. [a]

Die Substrate sollten azyklisch sein, da zyklische Strukturen die Konformität des Aldehyd-Titan-Chelats oder die Stereoselektivität (face selectivity) des Ester-Enolats zerstören können. Die andere Anforderung betrifft die Selektivität (consonant selectivity) an beiden Substraten, die die gewünschte Diastereoselektivität gewährleistet. [a]

Dabei werden mechanistische Gründe für jede Bedingung evaluiert. Außerdem werden die Äste des Baumes in die SMILES-Notation übersetzt. [a]

Im Abschnitt (B) der Abbildung 1 entspricht jeder Knoten einem Satz von Substraten. In einer typischen Syntheseplanung konstruiert und analysiert das Programm Netzwerke, die tausendfach größer sind als das dargestellte. [a]

Die Teilgrafik (C) zeigt nur die Zweige, die in kommerziell verfügbaren (rote Knoten) oder bekannten (grüne Knoten) Edukten enden. Sobald solche praktikablen Synthesen gefunden sind, extrahiert das Programm sie aus seiner internen Netzwerkdarstellung und zeigt sie in der grafischen Benutzeroberfläche an. [a]

Verweise

Synthia™ auf der Website von Merck.

Retrosynthese – Literatur und Didaktik

List of computer-assisted organic synthesis software

A retrosynthetic analysis algorithm implementation“ ein Artikel von Watson et al.

Efficient Syntheses of Diverse, Medicinally Relevant Targets Planned by Computer and Executed in the Laboratory“ ein Artikel von Klucznik et al.

Retrosynthesis: Here It Comes“ ein Artikel von Derek Lowe.

Parallel Optimization of Synthetic Pathways within the Network of Organic Chemistry“ ein Artikel von Kowalik et al.

Einzelnachweise

[a] Molga et al., Navigating around Patented Routes by Preserving Specific Motifs along Computer-Planned Ret-rosynthetic Pathways, Chem (2018), https://doi.org/10.1016/j.chempr.2018.12.00

[b] Merck-KGaA, Ankündigung, EUR 500,000,000 Subordinated Fixed to Reset Rate Notes due June 2079 with a First Call Date September 2024 and EUR 1,000,000,000 Subordinated Fixed to Reset Rate Notes due June 2079 with a First Call Date March 2029, 21.06.2019

[c] Chem 4, 390–398, March 8, 2018 – DOI: https://doi.org/10.1016/j.chempr.2018.02.024

[d] https://www.sigmaaldrich.com/chemistry/chemical-synthesis/synthesis-software.html (Abgerufen am 21.10.2019)

Mit Software zum Retrosyntheseplan, Ein Beispiel zum Retrosynthesemodul Mit Software zum Retrosyntheseplan Chematica und Synthia™ – Ein Verwendungsbeispiel zu Chematica Mit Software zum Retrosyntheseplan – Ein Beispiel zum Retrosynthesemodul Chematica Ein Beispiel zum Retrosynthesemodul Ein Beispiel zum Retrosynthesemodul Ein Verwendungsbeispiel zu Chematica