dc.contributor.author | Silva, Rodney | |
dc.date.accessioned | 2024-01-16T14:34:40Z | |
dc.date.available | 2024-01-16T14:34:40Z | |
dc.date.issued | 2023-02-09 | |
dc.identifier.citation | SILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103. | * |
dc.identifier.uri | https://repositorio.ufscar.br/handle/ufscar/19103 | |
dc.description.abstract | One of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them. | por |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | por |
dc.language.iso | por | por |
dc.publisher | Universidade Federal de São Carlos | por |
dc.rights | Attribution 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | * |
dc.subject | Aprendizado de máquina | por |
dc.subject | Aprendizado de máquina construtivo | por |
dc.subject | Classificação hierárquica | por |
dc.subject | Criação de drogas | por |
dc.title | Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas | por |
dc.title.alternative | Constructive machine learning and hierarchical multi-label classification for molecules design | eng |
dc.type | Dissertação | por |
dc.contributor.advisor1 | Cerri, Ricardo | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6266519868438512 | por |
dc.description.resumo | Um dos objetivos da Química Medicinal é descobrir novas moléculas com características de
fármacos, o que é desafiador, pois o espaço de busca é discreto, não estruturado e enorme.
Nos últimos anos, a computação tem sido usada como ferramenta auxiliar na pesquisa química,
e um dos campos da ciência da computação que ganhou visibilidade e foi aplicado em diversas
áreas do conhecimento nos últimos anos é o Aprendizado de Máquina. O campo de Aprendizado
de Máquina pode ser dividido em várias áreas de estudo. Nesta pesquisa, são abordados dois
campos de Aprendizado de Máquina: Aprendizado de Máquina Construtivo e Classificação
Hierárquica Multirrótulo. Este trabalho explora como o Aprendizado de Máquina Construtivo
pode aprender as regras intrínsecas dos bancos de dados de moléculas e gerar instâncias com
características semelhantes a essas. Os métodos de Aprendizado de Máquina Construtivo
escolhidos para o estudo podem ser divididos em dois tipos: aqueles que usam a representação
molecular SMILES e aqueles que usam grafos para representar moléculas. Considerando as
diferentes possibilidades de avaliar os métodos e as moléculas geradas, este trabalho propõe o
uso de classificação hierárquica no processo de avaliação. Usando um classificador hierárquico
previamente treinado em conjuntos de dados de moléculas, as moléculas geradas são classificadas
em uma taxonomia. Dessa forma, a relevância das moléculas geradas para as taxonomias
existentes pode ser verificada. Este trabalho também propõe uma medida de dissimilaridade
entre dois grupos de moléculas, a distância hierárquica, que leva em consideração a taxonomia
das moléculas presentes nesses grupos para determinar a dissimilaridade entre eles. | por |
dc.publisher.initials | UFSCar | por |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação - PPGCC | por |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO | por |
dc.publisher.address | Câmpus São Carlos | por |
dc.contributor.authorlattes | http://lattes.cnpq.br/8041590543117912 | por |