Quimio-Informática - Molecular Structures and Reactions Flashcards
O que é quimioinformática?
Área da química computacional que recorre às técnicas de computador e informação, aplicadas a uma série de problemas no campo da química.
Quais são as aplicações da quimioinformática? Quando começou a ser mais desenvolvida?
Estas técnicas in silico têm muitas vezes aplicação na indústria farmacêutica no processo de descoberta de fármacos e cada vez mais noutras áreas, como no desenvolvimento de baterias ou células fotovoltaicas. Nos EUA, a pesquisa de domínio público da Cheminformatics foi desenvolvida em 2006, criando seis Centros Exploratórios de Pesquisa de Quimomática (ECCRs) como parte da Iniciativa de Bibliotecas Moleculares do NIH.
A que dimensão têm aumentado as estruturas moleculares no “chemical abstract”?
A dimensão do universo de estruturas moleculares registadas no chemical abstract tem vindo a aumentar exponencialmente:
◦ 2007, 30M compostos e 12M reações
◦ 2016, 108M compostos e 86M reações
◦ 2021, 178M compostos e 133M reações
Nas estruturas que a quimioinformática processa que tipos de informação estas podem conter?
◦ Estruturas moleculares (compostos);
◦ Propriedades (físicas, químicas, biológicas) a nível bidimensional como tridimensional:
→ Ponto de fusão
→ Viscosidade
→ Solubilidade
→ Espectros
→ Eletrofilicidade
→ Estabilidade
→ Toxicidade
→ Atividade farmacológica
◦ Reações químicas (transformação de estruturas)
Quais os 2 tipos de aprendizagem de aplicações de quimioinformática?
Aprendizagem dedutiva e Aprendizagem indutiva.
Define aprendizagem dedutiva.
Aprendizagem dedutiva, mais relacionada com a física a partir de equações generalizadas que se aplicam aos sistemas para calculo das propriedades como aproximações à equação de Schrӧdinger para calcular a conformação mais estável de uma determinada molécula, envolvendo:
→ Métodos quânticos;
→ Mecânica molecular
Define aprendizagem indutiva.
◦ Aprendizagem indutiva (construção de modelo a partir de dados experimentais) que é a aprendizagem básica da química orgânica onde através de um conjunto de dados se explicam a teoria que permitem fazer previsões em situações novas, baseando-se em:
→ Inteligência artificial
→ Machine learning
→ Estatística
→ Relações estrutura-propriedade (QSAR).
Quanto à representação de estruturas moleculares em formatos eletrónicos (computador), esta apresenta uma hierarquia, desde: (A primeira sendo a menos importante e a última a mais importante)
◦ O seu nome
◦ A estrutura 2D, com determinadas convenções como a estereoquímica (ligação em cunha)
◦ A estrutura 3D, se tivermos um confórmero específico, sendo esta a estrutura real, manifestando as duas propriedades macroscópicas.
◦ A superfície molecular, que contabiliza o contacto entre a molécula e o exterior sendo responsável por muitas das propriedades em termos de interações.
Exemplos de editores moleculares.
ChemDraw e MarvinSketch
Os editores moleculares gravam só a imagem que vemos? Porque não?
Aqui, apesar de vermos uma imagem, o que fica gravado no programa em termos do formato molecular não é só a imagem, porque:
◦ Apresenta uma aplicabilidade/informação bastante reduzida, ao fazer a pesquisa na base de dados é provável que não seja possível encontrar – existem várias maneiras de desenhar uma estrutura!
Os editores moleculares gravam o quÊ?
O que se grava são os átomos, elementos químicos, entre outros, em formatos químicos.
Em que formatos deve ser codificada a informação de editores moleculares?
É também muito importante que a informação seja codificada em formatos interconvertíveis, e que possam ser utilizados por software, com aplicações imediatas de visualização da estrutura, de comunicação (enviar ou processar o ficheiro), pesquisas em bases de dados (QSAR), estimação de propriedades, etc
Ao codificar estruturas moleculares, podemos ter dois tipos de representações:
Representação não ambígua e outra é representação é única.
Define representação não ambígua.
Uma representação não ambígua, quando uma representação/nome/identificador apenas identifica uma só estrutura possível (por exemplo o orto-xileno).
Define o que é uma representação única
Uma representação é única se uma dada estrutura só puder ser representada de uma forma, ou seja, não é única se houver mais do que um nome a representar uma dada estrutura (pegando no mesmo exemplo, o orto-xileno também pode ser designado por 1,2-dimetilbenzeno).
O que são notações lineares? Dá um exemplo.
As notações lineares representam estruturas moleculares por sequências de letras, números e caracteres ASCII. Um tipo de representação molecular a partir de uma notação linear bastante conhecido é a nomenclatura/notação IUPAC.
Vantagens e desvantagens da nomenclatura IUPAC.
◦ Vantagens: sistema de classificação padrão, inclui estereoquímica, abrangível, não ambíguo, permite a reconstrução da estrutura a partir do nome;
◦ Desvantagens: regras extensas, não única (são permitidos nomes alternativos), nomes bastante complicados.
Em que medidas outras notações linerares são melhores do que IUPAC?
Outras notações lineares podem ser usadas com vantagem por serem extremamente compactas e usarem códigos mais facilmente interpretáveis por uma máquina. São muito úteis para armazenar e manusear estruturas num computador. Permitem transmitir estruturas facilmente (por exemplo, no conteúdo de texto duma mensagem de correio eletrónico ou no campo de pesquisa dum motor de pesquisa web).
O que é a SMILES notation?
A notação SMILES (Simplified Molecular Input Line Entry System) permite representar moléculas por sequências muito compactas e intuitivas através de caracteres ASCII.
Como é que são representados átomos na SMILES notation? (3 coisas)
- Os átomos são representados pelos seus símbolos atómicos, normalmente fechados em suportes quadrados ‘[]’, à exceção dos caracteres orgânicos ‘C, N, O, B, P, S, Cl, Br, I, etc.’
- Átomos de H são omitidos (ficam implícitos).
- Átomos vizinhos ficam um a seguir ao outro.
Como são representadas as ligações em SMILES notation?
As ligações simples, duplas, triplas e aromáticas representam-se por -, =, # e :, respetivamente, apesar de se omitirem as ligações simples e aromáticas.
Como se especifíca a esteroquímica de uma ligação dupla em SMILES notation? E as ramificações?
- A estereoquímica em redor duma ligação dupla (estereoquímica cis/trans) é especificada com os caracteres ‘\’ e ‘/’.
- As ramificações representam-se por parênteses, por exemplo, a acetona é CC(=O)C.
Quais são as regras de representação de aneis aromáticos em SMILES notations?
- Anéis são representados atribuindo dígitos aos dois átomos que fecham o anel, por exemplo, o benzeno é c1ccccc1.
- Os anéis aromáticos são indicados por letras minúsculas.
Como se representa quiralidade em centros tetraédricos em SMILES notation?
A quiralidade num centro tetraédrico é especificada com os caracteres @ (sentido oposto ao do relógio) ou @@ (sentido do relógio). A caracterização é feita olhando para o centro de quiralidade a partir do primeiro ligando que aparece no SMILES, e observando em que sentido estão dispostos os outros três ligandos quando ordenados segundo a ordem de aparecimento no SMILES. É exemplificado como a estrutura de propan-1-ol pode ser representada por CCCO.