Show simple item record

dc.contributor.authorSilva, Rodney
dc.date.accessioned2024-01-16T14:34:40Z
dc.date.available2024-01-16T14:34:40Z
dc.date.issued2023-02-09
dc.identifier.citationSILVA, Rodney. Aprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculas. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19103.*
dc.identifier.urihttps://repositorio.ufscar.br/handle/ufscar/19103
dc.description.abstractOne of the goals of Medicinal Chemistry is to discover new molecules with drug-like characteristics, which is challenging because the search space is discrete, unstructured, and enormous. In recent years, computation has been used as an auxiliary tool in chemical research, and one of the fields of computer science that has gained visibility and applied in various areas of knowledge in recent years is Machine Learning. The field of Machine Learning can be divided into several areas of study. In this research, two fields of Machine Learning are addressed: Constructive Machine Learning and Hierarchical Multi-label Classification. This work explores how Constructive Machine Learning can learn the intrinsic rules of molecule databases and generate instances with similar characteristics to these. The chosen Constructive Machine Learning methods for the study can be divided into two types, those that use the SMILES molecular representation and the methods that use graphs to represent molecules. Considering the different possibilities for evaluating methods and generated molecules, this work proposes the use of hierarchical classification in the evaluation process. Using a hierarchical classifier previously trained on molecule datasets, the generated molecules are classified into a taxonomy. In this way, the relevance of the generated molecules to existing taxonomies can be verified. This work also proposes a measure of dissimilarity between two groups of molecules, the hierarchical distance, which takes into account the taxonomy of the molecules present in these groups to determine the dissimilarity between them.por
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)por
dc.language.isoporpor
dc.publisherUniversidade Federal de São Carlospor
dc.rightsAttribution 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/*
dc.subjectAprendizado de máquinapor
dc.subjectAprendizado de máquina construtivopor
dc.subjectClassificação hierárquicapor
dc.subjectCriação de drogaspor
dc.titleAprendizado de máquina construtivo e classificação hierárquica multirrótulo aplicados à geração de moléculaspor
dc.title.alternativeConstructive machine learning and hierarchical multi-label classification for molecules designeng
dc.typeDissertaçãopor
dc.contributor.advisor1Cerri, Ricardo
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6266519868438512por
dc.description.resumoUm dos objetivos da Química Medicinal é descobrir novas moléculas com características de fármacos, o que é desafiador, pois o espaço de busca é discreto, não estruturado e enorme. Nos últimos anos, a computação tem sido usada como ferramenta auxiliar na pesquisa química, e um dos campos da ciência da computação que ganhou visibilidade e foi aplicado em diversas áreas do conhecimento nos últimos anos é o Aprendizado de Máquina. O campo de Aprendizado de Máquina pode ser dividido em várias áreas de estudo. Nesta pesquisa, são abordados dois campos de Aprendizado de Máquina: Aprendizado de Máquina Construtivo e Classificação Hierárquica Multirrótulo. Este trabalho explora como o Aprendizado de Máquina Construtivo pode aprender as regras intrínsecas dos bancos de dados de moléculas e gerar instâncias com características semelhantes a essas. Os métodos de Aprendizado de Máquina Construtivo escolhidos para o estudo podem ser divididos em dois tipos: aqueles que usam a representação molecular SMILES e aqueles que usam grafos para representar moléculas. Considerando as diferentes possibilidades de avaliar os métodos e as moléculas geradas, este trabalho propõe o uso de classificação hierárquica no processo de avaliação. Usando um classificador hierárquico previamente treinado em conjuntos de dados de moléculas, as moléculas geradas são classificadas em uma taxonomia. Dessa forma, a relevância das moléculas geradas para as taxonomias existentes pode ser verificada. Este trabalho também propõe uma medida de dissimilaridade entre dois grupos de moléculas, a distância hierárquica, que leva em consideração a taxonomia das moléculas presentes nesses grupos para determinar a dissimilaridade entre eles.por
dc.publisher.initialsUFSCarpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação - PPGCCpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpor
dc.publisher.addressCâmpus São Carlospor
dc.contributor.authorlatteshttp://lattes.cnpq.br/8041590543117912por


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution 3.0 Brazil
Except where otherwise noted, this item's license is described as Attribution 3.0 Brazil