Quimio-Informática - Molecular Structures and Reactions Flashcards

1
Q

O que é quimioinformática?

A

Área da química computacional que recorre às técnicas de computador e informação, aplicadas a uma série de problemas no campo da química.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são as aplicações da quimioinformática? Quando começou a ser mais desenvolvida?

A

Estas técnicas in silico têm muitas vezes aplicação na indústria farmacêutica no processo de descoberta de fármacos e cada vez mais noutras áreas, como no desenvolvimento de baterias ou células fotovoltaicas. Nos EUA, a pesquisa de domínio público da Cheminformatics foi desenvolvida em 2006, criando seis Centros Exploratórios de Pesquisa de Quimomática (ECCRs) como parte da Iniciativa de Bibliotecas Moleculares do NIH.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

A que dimensão têm aumentado as estruturas moleculares no “chemical abstract”?

A

A dimensão do universo de estruturas moleculares registadas no chemical abstract tem vindo a aumentar exponencialmente:
◦ 2007, 30M compostos e 12M reações
◦ 2016, 108M compostos e 86M reações
◦ 2021, 178M compostos e 133M reações

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nas estruturas que a quimioinformática processa que tipos de informação estas podem conter?

A

◦ Estruturas moleculares (compostos);
◦ Propriedades (físicas, químicas, biológicas) a nível bidimensional como tridimensional:
→ Ponto de fusão
→ Viscosidade
→ Solubilidade
→ Espectros
→ Eletrofilicidade
→ Estabilidade
→ Toxicidade
→ Atividade farmacológica
◦ Reações químicas (transformação de estruturas)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quais os 2 tipos de aprendizagem de aplicações de quimioinformática?

A

Aprendizagem dedutiva e Aprendizagem indutiva.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Define aprendizagem dedutiva.

A

Aprendizagem dedutiva, mais relacionada com a física a partir de equações generalizadas que se aplicam aos sistemas para calculo das propriedades como aproximações à equação de Schrӧdinger para calcular a conformação mais estável de uma determinada molécula, envolvendo:
→ Métodos quânticos;
→ Mecânica molecular

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Define aprendizagem indutiva.

A

◦ Aprendizagem indutiva (construção de modelo a partir de dados experimentais) que é a aprendizagem básica da química orgânica onde através de um conjunto de dados se explicam a teoria que permitem fazer previsões em situações novas, baseando-se em:
→ Inteligência artificial
→ Machine learning
→ Estatística
→ Relações estrutura-propriedade (QSAR).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quanto à representação de estruturas moleculares em formatos eletrónicos (computador), esta apresenta uma hierarquia, desde: (A primeira sendo a menos importante e a última a mais importante)

A

◦ O seu nome
◦ A estrutura 2D, com determinadas convenções como a estereoquímica (ligação em cunha)
◦ A estrutura 3D, se tivermos um confórmero específico, sendo esta a estrutura real, manifestando as duas propriedades macroscópicas.
◦ A superfície molecular, que contabiliza o contacto entre a molécula e o exterior sendo responsável por muitas das propriedades em termos de interações.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Exemplos de editores moleculares.

A

ChemDraw e MarvinSketch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Os editores moleculares gravam só a imagem que vemos? Porque não?

A

Aqui, apesar de vermos uma imagem, o que fica gravado no programa em termos do formato molecular não é só a imagem, porque:
◦ Apresenta uma aplicabilidade/informação bastante reduzida, ao fazer a pesquisa na base de dados é provável que não seja possível encontrar – existem várias maneiras de desenhar uma estrutura!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Os editores moleculares gravam o quÊ?

A

O que se grava são os átomos, elementos químicos, entre outros, em formatos químicos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Em que formatos deve ser codificada a informação de editores moleculares?

A

É também muito importante que a informação seja codificada em formatos interconvertíveis, e que possam ser utilizados por software, com aplicações imediatas de visualização da estrutura, de comunicação (enviar ou processar o ficheiro), pesquisas em bases de dados (QSAR), estimação de propriedades, etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Ao codificar estruturas moleculares, podemos ter dois tipos de representações:

A

Representação não ambígua e outra é representação é única.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Define representação não ambígua.

A

Uma representação não ambígua, quando uma representação/nome/identificador apenas identifica uma só estrutura possível (por exemplo o orto-xileno).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Define o que é uma representação única

A

Uma representação é única se uma dada estrutura só puder ser representada de uma forma, ou seja, não é única se houver mais do que um nome a representar uma dada estrutura (pegando no mesmo exemplo, o orto-xileno também pode ser designado por 1,2-dimetilbenzeno).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

O que são notações lineares? Dá um exemplo.

A

As notações lineares representam estruturas moleculares por sequências de letras, números e caracteres ASCII. Um tipo de representação molecular a partir de uma notação linear bastante conhecido é a nomenclatura/notação IUPAC.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vantagens e desvantagens da nomenclatura IUPAC.

A

◦ Vantagens: sistema de classificação padrão, inclui estereoquímica, abrangível, não ambíguo, permite a reconstrução da estrutura a partir do nome;
◦ Desvantagens: regras extensas, não única (são permitidos nomes alternativos), nomes bastante complicados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Em que medidas outras notações linerares são melhores do que IUPAC?

A

Outras notações lineares podem ser usadas com vantagem por serem extremamente compactas e usarem códigos mais facilmente interpretáveis por uma máquina. São muito úteis para armazenar e manusear estruturas num computador. Permitem transmitir estruturas facilmente (por exemplo, no conteúdo de texto duma mensagem de correio eletrónico ou no campo de pesquisa dum motor de pesquisa web).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

O que é a SMILES notation?

A

A notação SMILES (Simplified Molecular Input Line Entry System) permite representar moléculas por sequências muito compactas e intuitivas através de caracteres ASCII.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Como é que são representados átomos na SMILES notation? (3 coisas)

A
  1. Os átomos são representados pelos seus símbolos atómicos, normalmente fechados em suportes quadrados ‘[]’, à exceção dos caracteres orgânicos ‘C, N, O, B, P, S, Cl, Br, I, etc.’
  2. Átomos de H são omitidos (ficam implícitos).
  3. Átomos vizinhos ficam um a seguir ao outro.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Como são representadas as ligações em SMILES notation?

A

As ligações simples, duplas, triplas e aromáticas representam-se por -, =, # e :, respetivamente, apesar de se omitirem as ligações simples e aromáticas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Como se especifíca a esteroquímica de uma ligação dupla em SMILES notation? E as ramificações?

A
  1. A estereoquímica em redor duma ligação dupla (estereoquímica cis/trans) é especificada com os caracteres ‘\’ e ‘/’.
  2. As ramificações representam-se por parênteses, por exemplo, a acetona é CC(=O)C.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quais são as regras de representação de aneis aromáticos em SMILES notations?

A
  1. Anéis são representados atribuindo dígitos aos dois átomos que fecham o anel, por exemplo, o benzeno é c1ccccc1.
  2. Os anéis aromáticos são indicados por letras minúsculas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Como se representa quiralidade em centros tetraédricos em SMILES notation?

A

A quiralidade num centro tetraédrico é especificada com os caracteres @ (sentido oposto ao do relógio) ou @@ (sentido do relógio). A caracterização é feita olhando para o centro de quiralidade a partir do primeiro ligando que aparece no SMILES, e observando em que sentido estão dispostos os outros três ligandos quando ordenados segundo a ordem de aparecimento no SMILES. É exemplificado como a estrutura de propan-1-ol pode ser representada por CCCO.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Representa o prop-2-yn-1-ylbenzene em SMILES notation.
C#CCc1ccccc1
26
Representa a SMILES notation do 3-chlorobutanenitrile.
CC(Cl)CC#N
27
Representa por SMILES notation o O-(2-fluorobutan-2-yl) O-methyl carbonothioate.
CCC(C)(F)OC(=S)OC
28
Mais Vantagens da SMILES notation...
◦ Não ambígua, visto que a notação SMILES representa uma só estrutura; ◦ No entanto, não é única para muitas estruturas, como é o caso da anilina, onde a sua estrutura pode ser representada pelas seguintes notações diferentes: Nc1ccccc1, c1ccccc1N, c1cc(N)ccc1.
29
Caracteriza a notação linear InChI. Qual a sua vantagem?
O formato InChI é uma notação linear desenvolvida pela IUPAC para ser o equivalente digital ao nome IUPAC para um composto. A representação InChI é composta por camadas, cada uma com uma classe especifica de informações estruturais, como: fórmula, conectividade, isótopos, estereoquímica, tautómeros e carga, todas estas separadas por barras ‘/’. Foi, deste modo, desenvolvido um algoritmo que gera uma notação não ambígua e única.
30
Na representação linear InChI o comprimento de um identificador é aproximadamente...
...proporcional ao número de átomos na substância. Os números dentro de uma camada geralmente representam a numeração canónica dos átomos da primeira camada (fórmula química), exceto H.
31
Porque pode ainda não existir a configuração InChI numa base de dados?
Onde, caso não exista a notação InChI procurada na base de dados, é porque a estrutura em questão ainda não existe. Este formato foi desenvolvido para ser compacto, não legível, mas pode ser interpretado manualmente
32
Uma estrutura molecular pode ser representada através de um grafo matemático em que cada átomo é um vértice e cada ligação é uma aresta. Porque é que esta estratégia é boa?
É uma estratégia poderosa porque permite processar estruturas e subestruturas moleculares matematicamente usando teoria de grafos.
33
O que são representações por matrizes?
Uma estrutura molecular com n átomos pode ser representada por uma matriz de tamanho n × n (por vezes os átomos de H são omitidos)
34
Quais são os trÊs os tipos de matrizes?
Matriz de adjacência, Matriz de distâncias:
35
Explica o que é possível deduzir por uma matriz de adjacência.
Matriz de adjacência: indica quais átomos estão ligados. Temos a matriz 6x6 em que, se os átomos estiverem ligados entre si aparece o nº1 e se não estiverem aparece o nº0. Pode ser simplificada se tirar os 0 para desocupar memória e ainda mais se eliminar a parte de cima/baixo (visto que são simétricas). (ver imagem slides)
36
Explica o que é possível deduzir por uma matriz de distâncias.
Matriz de distâncias: Representa distância através do número de ligações entre átomos, pelo caminho mais curto possível codifica as distâncias entre átomos. (ver imagens slides)
37
Explica o que é possível deduzir por uma matriz de ligacões.
Matriz de ligação: indica quais átomos estão ligados e as ordens de ligação correspondentes. Aqui já representa se uma ligação é simples, dupla ou tripla. (ver imagens slides)
38
Quais as desvantagens dos 3 tipos de matrizes faladas?
Esta tem desvantagens porque aumenta o seu tamanho com o quadrado do número dos átomos, podendo ser tanto mais complexa quanto o tamanho da molécula.
39
Uma maneira de contornar esta desvantagem das matrizes é a utilização de...
tabelas de conectividade.
40
Como funciona tabelas de conoctividade?
Estas apresentam uma lista dos átomos existentes na molécula, numerados, podendo ter, ou não, uma ordem aleatória (ex: pode ser 1,2,3,4 ou 2,3,1,4,…) e uma lista as ligações entre eles (pode incluir átomos de H ou não). Todas as ligações da molécula encontram-se descritas em termos de que átomos se encontram ligados e que ordem de ligação apresentam. Logo, é possível ter uma informação bastante útil sobre a conectividade da molécula.
41
Faz a tabela de conectividade do 3-chloropent-1-eno
resposta nos slides
42
Os formatos MDL Molfile e SDfile (.sdf) baseiam-se em quê? Como se os vizualiza?
Os formatos MDL Molfile e SDfile (.SDF) baseiam-se e utilizam tabelas de conectividade, observando-se a seguinte janela num ficheiro de texto: Ao abrir o ficheiro, observa-se desde já cada átomo distribuído por cada linha, acompanhado por uma série de colunas.
43
Que 5 zonas distintas podemos observar nos molfile ou sdfile?
Bloco do título, Linha de contagem, Bloco dos átomos, Bloco das ligações e Bloco de propriedades.
44
O Bloco do título...
...refere o nome do composto
45
A linha de contagem...
...em que descreve o número de átomos e de ligações, isto é, neste caso existem 6 átomos, logo tem 6 linhas na tabela de distribuição dos átomos. Por outro lado, temos 5 ligações, logo, tem 5 linhas na tabela de conectividade.
46
O bloco dos átomos...
...grupo referente à descrição de cada átomo. Pela linha e tabela seguintes, temos que vemos as coordenadas dos átomos (xyz), o simbolo (aaa), a diferença de massa(dd) no caso de isótopos, a carga(ccc) e a estereoparidade (sss).
47
O bloco de propriedades...
...especificam-se os átomos carregados e os isótopos.
48
Como definir ou ver a estereoparidade na terceira coluna do Bloco dos Átomos?
◦ Número dos átomos ao redor do centro estéreo com 1, 2, 3 e 4 por ordem do aumento do número atómico (posição bloco dos átomos). Por exemplo, um átomo de hidrogénio deve ser considerado átomo 4. ◦ Ver o centro a partir de uma posição de tal forma que a ligação que conecte o átomo de maior numeração (4) projeta atrás do plano formado pelos átomos 1, 2 e 3. ◦ A paridade é '1' se os átomos 1-3 forem dispostos no sentido horário em ordem numérica ascendente ou paridade '2' se no sentido anti-horário. Em SMILES usa-se o @ e @@.
49
Diferença entre molfile e sdfile?
O formato Molfile inclui um cabeçalho (header) e uma tabela de conectividade. O formato SDfile inclui informação estrutural (em formato Molfile) e dados associados, para um ou mais compostos. Existe uma variedade de software para a interconversão de formatos moleculares.
50
Bloco de ligações. Explica
Vai ao ppt
51
O que é um diagrama de estruturas de Markush?
Um diagrama de estruturas de Markush é um tipo de representação específica de uma série de compostos químicos. O diagrama não descreve apenas uma estrutura, mas várias famílias de compostos. Tem um esqueleto base e substituintes que são listados como texto, separadamente do diagrama. Estruturas de Markush são referidas por serem muito usadas em bases de dados de patentes.
52
O que são os fragmentos em Hashed Fingerprints?
Assim como um documento de texto pode ser indexado com base em palavras-chave especificadas, uma estrutura química pode ser indexada com base em características químicas específicas, geralmente fragmentos. ◦ Os fragmentos podem ser, por exemplo, pequenos grupos de átomos, grupos funcionais, anéis. Estes são definidos de antemão. Por exemplo: -OH, -COOH, >C=O, -NH2, -3-indole.
53
Diz-se que Hashed Fingerprints é uma representação...
...ambígua (estruturas diferentes podem ter fragmentos comuns). No entanto, muito útil para a pesquisa de semelhanças entre moléculas.
54
Como são codificados os Hashed Fingerprints?
Os Hashed Fingerprints, contrariamente aos métodos anteriores, codificam a presença de sub-estruturas (as quais podem, ou não, estar previamente definidas) através de um determinado número de valores binários (0/1).
55
Como é formado o Hashed Fingerprint?
◦ Começa por numerar as sequencias de átomos com determinados tamanhos, ou seja: → Por exemplo, sequências de 1 átomo (C, N, O), sequências de 2 átomos ligados entre si (C-C, C-N, C=O, C-O), etc. até ao número de sequências pré-definido na configuração do fingerprint (na linha de comandos). ◦ Depois, o algoritmo gera números a partir destas sequências que irão corresponder às posições do fingerprint a serem ativadas por essa sequência/padrão: C-N: posição 3 e 10 C-C-C: posição 5 e 10 ◦ Cada uma das posições do código que recebe um valor binário é designada por bit. Quando mudamos o tamanho da fingerprint as posições atribuídas dos bits ativados também mudam.!!!!!
56
Que desvantagem pode ocorrer nos Hashed Fingerprints?
Podem ocorrer colisões (onde dois padrões diferentes ativam o mesmo bit, por exemplo, C-N e C-C-C na posição 10), não sendo, deste modo, possível interpretar os fingerprints.
57
Na geração de hashed fingerprints os parâmetros a definir previamente são:
◦ O comprimento do fingerprint ◦ O tamanho máximo das sequências a ativar ◦ O número de bits ativados por cada sequência. Estes parâmetros influenciam a memória necessária assim como a capacidade dos fingerprints para distinguir moléculas diferentes.
58
Em termos de conclusão dos resultados das Hashed Fingerprints, estes podem ser influenciados por: (três coisas)
◦ Comprimento do fingerprint, onde, se for: → muito curto - quase todos os bits=1, má discriminação das moléculas. → muito grande - muitos bits=0, muito espaço em disco necessário. ◦ Tamanho máximo dos padrões, onde, se for: → muito curto - má discriminação de moléculas. → muito grande - capacidade de discriminar moléculas, mas muitos bits=1. ◦ Se o número de bits a ativar num padrão for: → Poucos - má capacidade de discriminar padrões. → Muitas - capacidade de discriminar entre padrões, mas muitos bits=1.
59
Qual é a principal aplicação de Hashed Fingerprints?
A principal aplicação de hashed fingerprints é na pesquisa de semelhanças entre moléculas em grandes bases de dados. Ou seja, se uma estrutura for parecida com outra deverão ter muitas sequencias em comum, apresentarem muitos bits ativados tanto numa para outra e o fingerprint global terá tendencialmente os mesmos bits (posições quase iguais ou até mesmo iguais).
60
Como se relacionam similiariadade e Hashed Fingerprints?
A semelhança entre dois compostos X e Y pode ser calculada com base na semelhança entre os seus hashed fingerprints. Definindo: a = nº de bits ‘1’ no composto X mas não no Y. b = nº de bits ‘1’ no composto Y mas não no X. c = nº de bits ‘1’ tanto no composto X como no Y. d = nº de bits ‘0’ tanto no composto X como no Y.
61
Calculam-se vários coeficientes que medem a distância (e inversamente a semelhança) entre fingerprints, apresentando:
Coeficiente Euclidiano: (medida total que soma os bits que são 0 num e 0 noutro, 1 num e 1 noutro, dividido pelo número total de bits/tamanho do fingerprint): (𝑐+𝑑)/𝑛 (quantos bits são iguais em X e Y) Coeficiente de Tanimoto: (distingue os bits que são 1 num caso e no outro dos bits que são 0 num caso e no outro): 𝑐/(𝑎+𝑏+𝑐)
62
O que são códigos de Hash? Caracteriza-os.
Os códigos de hash resultam de um algoritmo que transforma uma estrutura molecular em uma sequência de caracteres ou números que codificam a presença de fragmentos na molécula. Eles têm um comprimento fixo. Os códigos de hash não são interpretáveis. Eles são usados como identificadores únicos de estruturas, por exemplo em grandes bancos de dados de códigos de hash de compostos, permite a rápida perceção de uma correspondência exata entre duas moléculas. Os códigos de hash também podem ser definidos para átomos ou ligações.
63
A Representação de estruturas 3D mais habitual consiste...
...num sistema de coordenadas cartesianas, ou seja, nas coordenadas x, y e z de cada átomo. Para uma mesma conformação existem infinitas coordenadas possíveis, dependendo da orientação da estrutura relativamente aos eixos de referência.
64
Quais os dois métodos para apresentar estruturas 3D?
◦ Métodos teóricos (ab initio, semi-empiricos, mecânica molecular…) ◦ Métodos empíricos (através de fragmentos de geometrias pré-definidas, regras, bases de dados e otimizações) rápidos para a estimação → MarvinSketch → CORINA → Standerdizer (Jchem, ChemAxon), não sendo possível, posteriormente, transmitir em SMILES; → PDB (Protein Data Bank) foi pensado para o arquivo de estruturas tridimensionais de macromoléculas biológicas (principalmente proteínas, ácidos nucleicos e seus complexos). → MDL Molfile, que permite listar as coordenadas 3D no bloco dos átomos da tabela de conectividade
65
Explica o que é e caracteriza a superfície molecular.
A superfície molecular consiste, numa analogia, na “pele” do “esqueleto” de uma molécula, determinante das interações entre elas. É apresentada como dividindo o espaço 3D num volume interno e num volume externo. É enfatizado como esta definição é apenas uma analogia com objetos macroscópicos uma vez que as moléculas não podem ser tratadas simplesmente pelas leis da mecânica clássica. A densidade eletrónica é contínua e existem probabilidades de encontrar eletrões em qualquer ponto do espaço.
66
Há diversos modos de definir a superfície molecular, como:
Superfície de van der Waals, Superfície de Connolly e Superfície acessivel ao solvente.
67
Explica as características e como pode ser determinada a Superfície de Van der Waals.
É a superfície mais simples. Pode ser determinado a partir do raio de van der Waals de todos os átomos. Cada átomo é representado por uma esfera. As esferas de todos os átomos são fundidas - o volume total é o volume de van der Waals e o envelope define a superfície de van der Waals. É rápido de ser calculado.
68
Explica as características e como pode ser determinada a Superfície de Connolly.
É gerado simulando uma esfera rolando sobre a superfície de van der Waals. A esfera representa o solvente. O raio da esfera pode ser escolhido (normalmente é definido em 1,4 Å, o raio efetivo da água). A superfície de Connolly possui duas regiões: a superfície de contato convexa (é um segmento da superfície de van der Waals) e a superfície côncava (onde a esfera toca dois ou mais átomos). O caminho do centro da esfera que gera a superfície Connolly define a superfície acessível ao solvente.
69
Explica as características e como pode ser determinada a Superfície acessível ao solvente.
O caminho do centro da esfera que gera a superfície de Connolly define a superfície acessível ao solvente.
70
Como posso vizualizar superfícies moleculares em computadores?
É possível verificar e analisar estas superfícies com o programa MarvinSpace da ChemAxon em “Display>Draw Type>Surface” podendo ter várias opções de visualização como “Dot, Mesh, Solid, Transparent”.
71
Temos estruturas (átomos por ligações) com uma maneira própria de ser arquivada, ou seja, em ficheiros. Existem associadas a essas estruturas informação variada:
◦ Propriedades adimensionais, como o ponto de fusão e ponto de ebulição ◦ Propriedades em 2D, como espetros e cromatograma ◦ Propriedades 3D, como a técnica de GC-MS
72
O processamento de informação sobre reações químicas é necessário, apresentando as seguintes tarefas ou problemas típicos: (primeiras 4)
◦ Armazenamento de informações sobre reações químicas (base de dados), bastante útil para verificar se uma dada reação existe, ou não; ◦ Recuperação de informações sobre reações químicas; ◦ Comparação e análise de conjuntos de reações, ou seja, não é só importante a comparação de compostos, mas também de reações e até conjuntos de reações; ◦ Definição do scope e limitações de um tipo de reação, que serve para comparar reações do mesmo tipo;
73
O processamento de informação sobre reações químicas é necessário, apresentando as seguintes tarefas ou problemas típicos: (últimas 3)
◦ Desenvolvimento de modelos de reatividade química, importante para que esta informação seja pesquisável e fácil de encontrar; ◦ Previsão da extensão/caminho de reações químicas; ◦ Análise de redes de reações, por exemplo, áreas como, sínteses orgânicas, vias metabólicas, vias de degradação química na atmosfera e desenvolvimento de métodos para o design de sínteses. Estas precisam de ter um suporte de informação em termos de reações guardadas num computador.
74
Quais as 3 maneiras de esboçar reações químicas em computadores?
◦ Reações na notação SMILES. ◦ Reações no formato MDL RDF ◦ Especificação de centros de reação.
75
Como é que reações químicas são esboçadas num computador por notação smiles?
Reações na notação SMILES. Recorrendo à representação das reações com SMILES, a reação representa-se através dos SMILES dos reagentes e dos SMILES dos produtos. A seta de reação é representada por “>>” e o sinal “+” representa-se por “.”
76
Desenha esta reação: CC=O.CCCN>>CCC\N=C\C.O
ver slides
77
Desenha esta reação: CCC(=O)O.OCC>[H+].[CL-].OCC>CCC(=O)OCC.O
ver slides
78
Como esboçar reações químicas no formato MDL RDF? Aonde está a diferença em relação a ficheiros MDL "normais"?
De uma maneira bastante semelhante ao formato MDL Molfile, agora, no caso das reações, apresenta-se o MDL RXN, onde se arquiva a informação da reação. Agora, temos os vários Molfiles dos vários reagentes e os vários Molfiles dos vários produtos. A diferença consiste em: → Na linha de contagem, em vez de termos o número de átomos e número de ligações, temos o número de reagentes e o número de produtos. O primeiro Molfile será do primeiro reagente e assim sucessivamente.
79
Como esboçar reações químicas usando especificação de centros de reação?
A especificação de centros reacionais permite identificar reações idênticas com diferentes reagentes e permite caracterizar reações através de propriedades físico-químicas dos centros reacionais. Esta técnica ajuda-os a perceber qual é a reação e átomos envolvidos.
80
Qual a vantagem em existir a informação de centros reacionais em reações?
Caso esta informação não aparecesse, seria necessário procurar, individualmente, reações de aldeídos, carbonilos e aminas e depois filtrar, o que complicaria muito mais a pesquisa e seria muito mais indireta. Podemos imaginar o problema de identificar reações num conjunto de reações que sejam do mesmo tipo, apesar de ocorrerem em reagentes com estruturas muito variadas. A caracterização de uma reação é facilitada pela identificação do centro reacional – conjunto de átomos e ligações covalentes que são alterados com a reação.
81
O que faz parte de um centro reacional?
◦ Uma ligação pertence ao centro reacional se for estabelecida, quebrada ou tiver alterado a sua ordem. ◦ Um átomo pertence ao centro reacional se estiver envolvido numa ligação do centro reacional ou se for alterado na sua carga, número de eletrões, valência, ou ligações implícitas a átomos de hidrogénio.
82
Como se marca os grupos que sofrem reação (centros reacionários), no MOL file?
É possível marcar no ficheiro MDL RXN (formato RDF) quais os grupos que sofrem reações. No bloco das ligações, a última coluna pode ser usada para dizer se a ligação está ou não envolvida na reação. Mudar o número 0 para um número 4 indica que esta ligação foi estabelecida, quebrada ou alterou de ordem.
83
Outro problema que poderá surgir em reações esboçadas em computadores, é a dúvida de que átomos dos reagentes correspondem a que átomos dos produtos. O que fazer para resolver isto?
Através da técnica de mapeamento átomo a átomo. É, de facto, muito importante para representar reações, no entanto, complicado de automatizar, visto que é necessário o conhecimento químico para representar o mapeamento átomo a átomo. Esta é representada da seguinte maneira: ◦ Temos uma numeração continua nos reagentes e são correspondentes aos produtos, ou seja, sabemos que átomos dos reagentes se encontram nos produtos, assim como a sua localização exata nas moléculas. Esta informação pode-se verificar no bloco dos átomos do ficheiro MDL RXN, onde, na antepenúltima coluna (a rosa), que permite por a numeração do lado dos reagentes e a correspondente nos produtos, sendo assim possível realizar o mapeamento.
84
É possível fazer ao contrário, ou seja, passar da reação para o atom mapping. Como?
Recorre-se à representação estrutural no Marvinsketch através do símbolo “make or break”, clicando com o lado direito em cima de uma ligação. O mapeamento é efetuado em “structure”>“mapping”>“map atoms” e o programa aplica os números. Este logaritmo não é muito exato, por exemplo, numa hidrolise de um éster, o acido carboxílico que resulta pode ser o oxigénio da água ou do éster, ou seja, sem conhecer o mecanismo é possível atribuir números que façam sentido, podendo ou não, estar 100% corretos quimicamente. Apesar dos progressos no desenvolvimento de algoritmos e programas para o mapeamento átomo-a-átomo, este permanece um problema de grande complexidade que requer com frequência conhecimentos sobre mecanismos reacionais.