UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE EDUCAÇÃO E CIÊNCIAS HUMANAS DEPARTAMENTO DE LETRAS CHATBOTS: A IMPORTÂNCIA DO PROCESSAMENTO DE LÍNGUA NATURAL PARA A EXPERIÊNCIA DO USUÁRIO Ester Gonçalves de Oliveira SÃO CARLOS 2022 ESTER GONÇALVES DE OLIVEIRA CHATBOTS: A IMPORTÂNCIA DO PROCESSAMENTO DE LÍNGUA NATURAL PARA A EXPERIÊNCIA DO USUÁRIO Trabalho de Conclusão de Curso submetido à Universidade Federal de São Carlos como parte dos requisitos necessários para a obtenção do grau de Bacharel em Linguística, sob a orientação do Prof. Dr. Oto Araújo Vale. SÃO CARLOS 2022 UNIVERSIDADE FEDERAL DE SÃO CARLOS DEPARTAMENTO DE LETRAS BACHARELADO EM LINGUÍSTICA Folha de aprovação Assinatura dos membros da comissão examinadora que avaliou e aprovou a Defesa de Trabalho de Conclusão de Curso da candidata Ester Gonçalves de Oliveira, realizada em __/__/____: ___________________________________________________________________ Prof. Dr. Oto Vale (UFSCar) - orientador ___________________________________________________________________ (UFSCar) - banca examinadora AGRADECIMENTOS Agradeço primeiramente a Deus que tem segurado minha mão durante toda minha jornada. Sem Ele nada seria possível. Aos meus pais, Anderson e Neuralucia, a minha irmãzinha, Débora, e a minha avó, Marilda, que me apoiaram durante toda a minha trajetória. Vocês são a rocha que me manteve segura até aqui. Ao Lucas Nascimento, por ter sido minha base de apoio em grande parte desse projeto e ter me dado forças para continuar. Aos meus amigos e aos integrantes do grupo LeGOS que tiveram grande influência na minha construção acadêmica. Por fim, agradeço ao Prof. Dr. pelo acompanhamento e produção desseOto Araujo Vale trabalho, além da orientação nos últimos anos. No amor não existe medo. (1 joão 4:18) SUMÁRIO INTRODUÇÃO 8 1. PROCESSAMENTO DE LÍNGUA NATURAL 11 1.1 DEFINIÇÃO DE PLN 12 1.2 REGEX 13 2. USER EXPERIENCE DESIGN 15 2.1 A HISTÓRIA DO UX DESIGN 17 2.2 AS SUB-ÁREAS DO UX DESIGN 18 3. CHATBOTS 23 3.1 HISTÓRIA DOS CHATBOTS 24 3.2 DEFINIÇÃO E TIPOS DE CHATBOT 29 3.3 CHATGPT -3 31 3.4 PLN E A EXPERIÊNCIA DO USUÁRIO 34 CONCLUSÃO 40 REFERÊNCIAS 41 RESUMO O mercado de chatbots vem apresentando um crescimento exponencial em território nacional nos últimos cinco anos, saindo de 8 mil chatbots criados em 2017 para 60 mil em 2019, 101 mil em 2020 e 216 mil em 2021. O crescimento do atendimento automatizado pelas empresas, acrescido ao contexto da pandemia da COVID-19, fez com que a maior parte dos ramos de trabalho fosse obrigada a se adaptar a uma nova realidade remota. Entendendo o cenário atual e o aumento exponencial da utilização de assistentes virtuais, faz-se necessário evidenciar a relação que o Processamento de Língua Natural (PLN) possui com a área de chatbots e, principalmente, destacar a importância dele durante a construção, desenvolvimento e garantia de uma boa experiência do usuário. Portanto, este trabalho visa explicar a atuação do PLN dentro do mercado de chatbots e UX design, além de contribuir com a área de linguística e linguística computacional. Palavras-chave: chatbot, design conversacional, PLN. ABSTRACT The chatbot market has been showing exponential growth in the Brazilian territory in the last five years, going from 8 thousand chatbots created in 2017 to 60 thousand in 2019, 101 thousand in 2020 and 216 thousand in 2021. The growth of the automated service, within the context of the COVID-19 pandemic, forced most branches of work to adapt to a new remote reality. Understanding the current scenario and the exponential increase in the use of virtual assistants, it’s necessary to highlight the relationship between NLP and the area of chatbots and its importance during construction, development and guarantee of a good user experience. Therefore, this work aims to explain the role of NLP within the chatbots and UX design market, as well as to contribute to the area of linguistics and computational linguistics. Keywords: chatbot, conversational design, NLP. INTRODUÇÃO O mercado de chatbots vem apresentando um crescimento exponencial em território nacional nos últimos cinco anos, saindo de 8 mil chatbots criados em 2017 para 60 mil em 2019, 101 mil em 2020 e 216 mil em 2021.1 Além disso, de acordo com relatório da Mobile Time2, o tráfego de mensageria feita por chatbots brasileiros teve um crescimento de 500 milhões para 1 bilhão entre 2017 e 2019, subindo para 2,2 bilhões em 2020 e 2,8 bilhões em 2021. É possível relacionar o crescimento do atendimento automatizado pelas empresas com o contexto da pandemia da COVID-19, que fez com que a maior parte dos ramos de trabalho fosse obrigada a se adaptar a uma nova realidade, a remota. Essa correlação fica clara pelos índices do MCC-ENET (desenvolvido pelo Comitê de Métricas da Câmara Brasileira da Economia Digital em parceria com o Neotrust) do ano de 2020 em relação a 2019, que expõem o aumento de 73,88% no número de e-commerces brasileiros.3 Desta forma, com o aumento do consumo on-line, as funcionalidades dos chatbots tornam-se cada vez mais necessárias às empresas que buscam manter-se relevantes para os seus compradores. Nesse contexto, os chatbots vêm suprindo duas necessidades do mercado: a redução de custos e a automatização de processos. Tais necessidades podem ser motivadas pelo gerenciamento de filas para transbordo de atendimento humano, pela execução de ações de vendas, FAQs ou por outras resoluções de problemas dentro dos fluxos conversacionais. Ao utilizarem um software conversacional, as empresas economizam tempo e dinheiro enquanto adquirem informações sobre seus clientes de maneira mais aprofundada. Assim, softwares que suprem essas necessidades vêm se tornando cada vez mais populares entre as empresas. Existem, no entanto, diferentes tipos de chatbots para esses propósitos, que variam nas suas funções e construções, seja com inteligência artificial (IA) ou não. Nas palavras de Haenlein e Kaplan, a IA pode ser entendida como a “habilidade que um sistema tem de interpretar dados corretamente, aprendendo com estes e usando-os para alcançar objetivos e tarefas específicas por meio de adaptações flexíveis”. (2019, p. 1, tradução nossa).4 Portanto, podemos entender que a 4A system’s ability to interpret external data correctly, to learn from such data, and to use those learnings to achieve specific goals and tasks through flexible adaptation. 3 Disponível em: https://www.ecommercebrasil.com.br/noticias/e-commerce-brasileiro-cresce-dezembro/. Acesso em: 26 abr. 2022. 2 Mobile Time se define como uma plataforma que realiza pesquisas sobre o comportamento do brasileiro no uso da tecnologia móvel com a parceria da Opinion Box. Todas as pesquisas têm validade estatística, com cerca de 2 mil pessoas entrevistadas a cada edição. 1 Pesquisa Panorama Mobile Time - Mapa do Ecossistema Brasileiro de Bots - Agosto de 2021. Disponível em: https://www.mobiletime.com.br/pesquisas/mapa-do-ecossistema-brasileiro-de-bots-2021/. Acesso em: 23 mar. 2023. inteligência artificial busca imitar o comportamento e a mente humana, efetivando a ideia de construção de um computador/programa que seja capaz de “pensar” e tomar decisões como um ser humano. Para a linguística, a inteligência artificial faz-se relevante pelo processamento de linguagem natural (PLN), isto é, pela capacidade da máquina de reconhecer a linguagem humana. Segundo João de Fernandes Teixeira, Para a linguística, a IA significava uma revolução: agora seria possível criar um programa de computador em que estivessem representadas as estruturas gramaticais das diversas línguas humanas. Se isso pudesse ser feito, um sonho muito antigo seria realizado: teríamos descoberto a raiz comum de todas as línguas humanas e uma máquina universal de tradução tornar-se-ia possível (TEIXEIRA, 2019, p. 3). Apesar de não termos chegado ao ideal comentado por ele, o autor está correto em afirmar que a IA faz parte de uma revolução dentro da linguística, pois é a partir dela que somos capazes de realizar diversas atividades antes impensáveis. É graças ao PLN que milhares de pessoas pelo mundo são capazes de acessar línguas diferentes pela internet com a tradução automática. Softwares como Word, Google Docs, Grammarly, entre outros, possuem funções como a correção gramatical de textos, que só é possível por causa dos avanços da linguística computacional e o PLN. Além disso, há, claro, a possibilidade de criação de softwares de conversação que interagem com os usuários, entendendo-os dentro das suas funcionalidades, ou seja, dentro do seu próprio contexto, podendo desenvolver conversas em diversos caminhos, mesmo que com limitações. É dentro das plataformas dos softwares de conversação que “a mágica acontece”, ou melhor, que conseguimos montar programas para corresponder às nossas expectativas e necessidades conversacionais. É aqui que damos vida aos chatbots. Dentro dessas plataformas desenhamos os fluxos conversacionais prevendo como os usuários ideais do robô interagiriam com ele, desde o primeiro contato até a despedida. Com um propósito em mente, nosso robô irá trabalhar dentro das suas possibilidades para entender, responder e corresponder às vontades daquele com quem interage. Indo um pouco mais a fundo nas possibilidades que o PLN já traz para os chatbots existem os “provedores de IA”, como exemplo o DialogFlow, da Google, o Watson Assistant, da IBM, e o LUIS, da Microsoft. Estes provedores de IA permitem chatbots se desprendam das ações booleanas - isso é, ações de valores predefinidos como verdadeiro ou falso, sem possibilidade de variação em seus resultados - “pensem por si próprios” por meio de cálculos feitos no que chamamos de intenções e entidades. Com os provedores de IA os chatbots passam a ser chamados de inteligentes, pois são capazes de realizar ações e tomar caminhos que seriam impossíveis dentro de cenários sim/não booleanos. Nosso principal objetivo neste trabalho é demonstrar não somente a importância do PLN na criação de chatbots, como também expor como o PLN é a base de todo o processo para que os usuários possam se comunicar, ser entendidos e ter uma experiência satisfatória. Desta forma, o objetivo do chatbot – que vai desde reter clientes a resolver problemas ou responder pesquisas – é conquistado de maneira mais eficaz, já que quando utilizamos o PLN o chatbot entende inputs, ou entradas de texto, de maneira mais completa. Para tanto, comentamos sobre Inteligência Artificial e PLN. Além disso, adentramos a área de user experience design (UX), sua história e suas subáreas para entender como se dá a construção de fluxos conversacionais em chatbots e como eles se envolvem com o PLN. 1. PROCESSAMENTO DE LÍNGUA NATURAL Durante a introdução vimos que para a linguística a inteligência artificial é de grande importância para a linguística, mas dizer somente isso não explica o que é o processamento de linguagem natural (PLN). Nunes et al. (1999) nos apontam algumas das principais perguntas que deram origem a essa área: sabemos que a linguagem dos computadores são “zeros” e “uns”, que não são nada compreensíveis para nós, então como poderíamos transformar (ou mascarar, usando o mesmo termo que Nunes et al.) essa linguagem? Para entendermos o PLN, no entanto, é preciso voltar ao momento de seu nascimento: em meados da década de 1940, quando o seu principal foco era a tradução automática de línguas em contexto de Guerra Fria. Freitas (2022) nos expõe que, durante essa primeira fase, o processamento acontecia de palavra em palavra e que isso foi necessário para que os linguistas da época percebessem a necessidade de descrições em níveis sintático e semântico: O reconhecimento de que a linguagem humana é ambígua nos níveis sintático e semântico motivou a incorporação da informação vinda de dicionários (dicionários legíveis por máquinas) e chamou a atenção para a necessidade de uma descrição sintática que fosse precisa o suficiente para guiar a aplicação de algoritmos. A ideia predominante na época era que para poder obter sucesso no PLN seria necessário, sobretudo, avançar com conhecimento linguístico, e não tanto com conhecimento computacional (FREITAS, 2022, s/p). Após essa fase, contudo, o foco do PLN se voltou para o desenvolvimento prático (e não teórico) de inteligências artificiais, acarretando em uma desaceleração nas pesquisas voltadas ao conhecimento linguístico da área. De acordo com Freitas (2022) essa mudança de foco deu-se pelo pouco avanço, ou melhor, a falta de grandes resultados de maneira rápida e que, portanto, o caminho deveria ser alterado. Desta maneira, nas décadas de 60 e 70 prevalecem os estudos voltados à descrição e representação de mundo. Em termos gerais, esperava-se que a partir da modelagem do mundo, isto é, de uma representação reduzida do mundo, as tarefas de linguagem seriam naturalmente resolvidas (FREITAS, 2022, s/p) Não muito tempo depois, essa visão acaba se demonstrando errônea e logo percebe-se que a criação de sistemas gerais não é eficiente em um mundo composto por particularidades e especificidades. Ainda sim, o desenvolvimento de frames e scripts foram um grande marco da segunda fase (FREITAS, 2022). A terceira e penúltima fase do PLN é descrito pela autora como: Um choque de realidade: o PLN é difícil, mesmo em domínios restritos. A linguagem é ambígua, altamente dependente de contexto e de conhecimento de mundo (...) As atenções desta fase vão para aspectos lógico-gramaticais, com o desenvolvimento de gramáticas (FREITAS, 2022, s/p). A autora opta por dizer que, mesmo com a ideia recorrente de que essa tenha sido a época de maior troca entre as teorias linguísticas e o PLN, estas não foram implementações das teorias linguísticas, mas inspiradas por elas. Apesar de a abordagem predominante da época ser gramatical, é no final da terceira fase (final dos anos 80) que nasce o processamento estatístico, método usado hoje em dia. O processamento estatístico, diferentemente do processamento gramatical, trabalha com probabilidades a partir do aprendizado de máquina. Com este método foi possível a criação de treebanks - definido como corpora anotada sintaticamente (FREITAS, 2022) - resultando em análises muito mais rápidas e com uma assertividade maior. A partir da década de 90 e com a consolidação do processamento estatístico em conjunto do aprendizado de máquina dá-se início a quarta fase - e fase atual - do PLN. Desde então, graças a grande quantidade de dados textuais disponíveis e os avanços algorítmicos e computacionais (FREITAS, 2022), o PLN possibilitou a criação de aplicações que vão desde tradutores e revisores gramaticais automáticos até a lista de compras do mercado que pedimos para a Alexa5 nos lembrar. 1.1 DEFINIÇÃO DE PLN Algumas definições do PLN podem ser encontradas pelo ACL (Associação para Linguística Computacional): Linguística computacional é a área de estudos científicos da linguagem a partir de uma perspectiva computacional. Os linguistas computacionais são interessados em fornecer modelos computacionais a partir de vários tipos de fenômenos linguísticos. Esses modelos podem ser "baseados em conhecimento" ("feitos à mão") ou "baseados em dados" ("estatísticos" ou "empíricos"). O trabalho da linguística computacional é, em alguns casos, motivado por uma perspectiva científica na medida em que se tenta fornecer uma explicação computacional para um fenômeno linguístico ou psicolinguístico particular; e em outros casos a motivação pode ser mais puramente tecnológica, pois se deseja fornecer um componente funcional de um sistema de fala ou linguagem natural (ACL, 2005, s/p). E também pela autora citada acima, Cláudia Freitas, em conjunto com Helena Caseli e Roberta Viola: O PLN pode ser situado como uma subárea da computação e da linguística (McShane e Nirenburg 2021), onde o objetivo principal é desenvolver modelos computacionais e recursos linguísticos úteis para a automatização do processamento das línguas humanas (CASELI; FREITAS; VIOLA; 2022, p. 1). De maneira sucinta e em nossas próprias palavras, podemos definir o processamento de língua natural como a área da Inteligência Artificial que busca entender as línguas humanas. Ou seja, o PLN visa reproduzir o máximo possível a estrutura das línguas utilizadas por nós, seres humanos, para que seja possível sua reprodução pelas máquinas. Como exemplos temos o inglês, o português, o italiano, o russo, as línguas de sinais, que são naturais do homem, e as línguas fictícias, como o klingon. 1.2 REGEX Existem inúmeras ferramentas à disposição do PLN, mas a escolhida para nos auxiliar na conclusão do objetivo deste trabalho é o RegEx. RegEx vem do inglês “regular expression”, ou, em português, “expressão regular”, e possui esse nome, pois tem como função validar padrões em entradas. 5 Disponível em: amazon.com.br/b?node=19949683011 O RegEx funciona da seguinte maneira: dentro do código será implementado um RegEx pré-definido para combinação. Assim que o RegEx encontrar essa combinação dentro da ação do usuário, ele vai dar início à ação programada por meio do código conforme a Figura 1: Figura 1 - Funcionamento do RegEx. Fonte: Expressões regulares: capturando textos de forma mágica. 6 Exemplos mais palpáveis e comuns desse processo no nosso dia a dia são as identificações de e-mail quando se faz login em alguma página e a validação de e-mail em um site por meio de RegEx. Na figura abaixo temos cinco partes nesse RegEx: ● Rosa: valida qualquer caractere de A a Z, de 0 a 9, com ou sem pontos finais, underlines, mais e menos e sem restrição de quantidade e de capslock. ● Azul: valida o @ 6 Disponível em: https://www.alura.com.br/conteudo/expressoes-regulares. ● Verde: valida qualquer caractere de A a Z, de 0 a 9, sem restrição de quantidade e de capslock até o ponto-final. ● Vermelho: valida o ponto-final. ● Amarelo: valida qualquer caractere de A a Z, de 0 a 9, com ou sem pontos-finais, underlines, mais e menos, sem restrição de quantidade e de capslock. Figura 2 - Exemplo de RegEx para e-mail. Fonte: Email Address Regex Django - Alterações da autora.7 Isso significa que se o usuário der entrada em um e-mail como josebezerra2013@gmail.com ou luquit_18@yahoo.com.br, eles vão ser validados, enquanto mariajose@gmail ou rob2015@bata_ta.br, não. Vale ressaltar que embora um RegEx simples como esse funcione muito bem para o seu propósito em um cenário ideal, ele não é perfeito, pois podem existir cenários em que o usuário tente dar entrada em um e-mail como arroz@batata.com e o RegEx faça a validação, dado que o input corresponde às suas regras. Nesses casos, principalmente quando há validação de dados sensíveis para acessos, o RegEx trabalhará com alguma ferramenta a mais, como uma API de validação que consultará se o e-mail realmente existe no banco de dados. Embora não seja perfeito, RegEx é uma das ferramentas mais conhecidas e utilizadas hoje no mercado de desenvolvimento, inclusive no de chatbots e, portanto, serve devidamente ao objetivo do nosso trabalho, uma vez que nos serve de apoio durante as exemplificações do trabalho. 2. USER EXPERIENCE DESIGN Para entendermos o que é o User Experience Design precisamos, primeiramente, entender como esta área de atuação surgiu. O termo User Experience Design (UX Design), ou Experiência do Usuário, foi criado em meados de 1990 por Donald Norman ao entender que não existia uma 7 Disponível em: https://www.abstractapi.com/guides/email-address-regex-django palavra que englobasse apropriadamente as atribuições do cargo de Tecnologia Avançada, área da qual era vice-presidente na Apple. É importante entender que a atividade do UX Design já existia, mas a terminologia nasceu e se difundiu com Norman. A necessidade de Norman de nomear a “UX Design” veio do vale que existia entre a usabilidade e o design de interfaces. Em suas próprias palavras: Eu inventei o termo, porque achava que interface do usuário e usabilidade eram muito restritos, eu queria cobrir todos os aspectos da experiência de uma pessoa com o sistema, incluindo design industrial, gráficos, a interface, a interação física e o manual (NORMAN, 2008, s/p - tradução nossa).8 O design de interfaces, também conhecido como User Interface (UI), é muito conectado ao universo da programação e criação de softwares, sites e aplicativos. Neste sentido, o design de interfaces é tudo aquilo com que você consegue interagir, o “front-end” da programação. Tudo o que for botão, caixa de texto, scrolls e cliques são interface. Isso também significa que o UI está – ou deveria estar – conectado à usabilidade, que, no contexto de produtos entregáveis, é o grau de facilidade com que os usuários/consumidores utilizam determinado produto, seja ele físico, como uma xícara, ou não, como um aplicativo dentro do seu celular. Para entendermos melhor, vamos utilizar os exemplos citados acima: a xícara e o aplicativo. Você já se perguntou por que a xícara tem uma asa? Em 1750, na Europa, a primeira xícara foi inventada pela necessidade de suprir o problema dos cidadãos que foram apresentados aos chás, mas que não tinham condições de importar as louças dos países asiáticos. Estes cidadãos tomavam o líquido quente em canecas e copos de metal que queimavam seus dedos. Desta forma, para evitar que as pessoas se machucassem ao beber, tigelas com alças foram inventadas.9 Assim como a xícara, todo aplicativo tem um porquê por trás, um objetivo. No contexto de produtos digitais, a usabilidade significa se perguntar “o quão fácil é para o meu usuário fazer aquilo que eu espero que ele faça?”. Por exemplo, de nada vai adiantar eu desenvolver um aplicativo de e-commerce com uma linda interface, de uma marca acolhedora e com ótimas peças à venda se o usuário não souber onde clicar para finalizar a compra, certo? Por isso eu preciso incluir instruções claras de como o usuário deve prosseguir: nesse exemplo, poderia ser incluído um botão grande e chamativo com o texto “finalizar compra”. 9 Disponível em: https://www.mexidodeideias.com.br/mundo-do-cafe/a-historia-da-xicara/ 8 I invented the term because I thought human interface and usability were too narrow. I wanted to cover all aspects of the person’s experience with the system including industrial design graphics, the interface, the physical interaction and the manual. Since then the term has spread widely, so much so that it is starting to lose it’s meaning. Após entender o que são UI e Usabilidade, mencionados por Norman, vamos entender o que é o UX Design. Portanto, o termo que surgiu da lacuna entre o UI e a Usabilidade é a combinação do conteúdo, da arquitetura, do design visual, dos sons e do design de interação e possui o objetivo de projetar e criar um sentimento no usuário. 2.1 A HISTÓRIA DO UX DESIGN O termo UX foi cunhado por Don Norman em meados dos anos 90. Simultaneamente, Jakob Nielsen, cientista da computação, doutor em Interação Humano-Computador (IHC) e futuro cofundador do grupo Nielsen Norman (NNGroup), publicava o texto 10 Usability heuristics for User Interface Design, sobre pesquisa de usuário e as 10 principais heurísticas de usabilidade. São elas: 1. Visibilidade de sistema: o design deve informar seu status de maneira clara, por meio de feedbacks e avisos de tempos em tempos. 2. Correspondência entre o sistema e o mundo real: o design deve ser de fácil leitura – leia-se entendimento – para o usuário, utilizando conceitos familiares a ele. As informações devem seguir uma ordem natural e lógica. 3. Liberdade de controle do usuário: os usuários precisam de um método de saída claro e fácil de ser acessado caso cometam erros ao usar o produto, para que não sejam obrigados a performar uma ação que não queriam. 4. Consistência e padronização: deve-se seguir as convenções com as quais já estamos acostumados, pois o usuário não deve ficar gastando tempo se perguntando qual ação cada botão faz. 5. Prevenção de erros: é importante tomar ações para prevenir que os usuários cometam erros, seja procurando por bugs ou incluindo passos de confirmação antes de ações importantes. 6. Reconhecimento, não memorização: elevamos a experiência dos usuários quando diminuímos sua carga mental. Isto é, quanto menos eles tiverem que pensar para completar uma ação, melhor. Por isso, procurar manter-se no padrão é importante. 7. Flexibilidade e eficiência de uso: permita que usuários “criem” seus próprios caminhos. Um exemplo são os shortcuts, que cada usuário usa da maneira mais efetiva para alcançar seus objetivos. 8. Estética e design minimalista: as interfaces não devem ser sobrecarregadas, principalmente se incluem informações que não são relevantes ao usuário. Lembre-se de que as informações irrelevantes competem com as importantes pela atenção do usuário. 9. Ajude os usuários a reconhecer, diagnosticar e recuperar-se de erros: mensagens de erro devem ser claras. Deve-se partir do princípio que o usuário não entende os códigos, portanto descreva o erro com uma mensagem de texto e inclua uma sugestão que o ajude nos próximos passos. 10. Ajuda e documentação: documente tudo o que for necessário para ajudar o usuário a completar suas tarefas. Alguns anos depois da publicação das heurísticas de usabilidade, em 1998, Don Norman e Jakob Nielsen fundaram o NNGroup. Dois anos depois, os cofundadores saem em turnê mundial com o propósito de propagar e expor esta nova área. Ainda em 2000, Bruce Tognazzini, autor do livro Tog on Interface, publicado em 1992, se junta ao NNGroup, contribuindo para seus objetivos. Assim, de 2000 até os dias de hoje, houve a publicação de vários artigos, livros, pesquisas e a realização de diversos eventos10, – um fato importante no período foi o livro O design do dia a dia, de Don Norman, considerado um dos mais importantes para a história do design, ter atingido a marca de 15 mil citações –, além de palestras em TED Talks sobre design emocional11 e o recebimento do prêmio SIG-CHI Lifetime Practice12. Em 2018, o NNGroup comemorou seus 20 anos de história. 2.2 AS SUB-ÁREAS DO UX DESIGN No tópico acima entendemos um pouco sobre a história do UX design e as principais heurísticas de usabilidade. Além disso, foram introduzidos dois personagens muito importantes para o desenvolvimento da área, Don Norman e Jakob Nielsen. Agora iremos focar nas contribuições de outra grande influência da área: Dan Saffer. 12 Disponível em: https://www.nngroup.com/news/item/jakob-nielsen-lifetime-achievement-award/ 11 Disponível em: https://www.ted.com/talks/don_norman_3_ways_good_design_makes_you_happy?language=pt 10 Artigos sobre diversos assuntos, como E-commerce, Psychology and UX, Research Methods, User Testing, Web Usability e Writing for the Web. Além do “10 Usability Heuristics for User Interface Design”, temos também “Empathy Mapping: The First Step in Design Thinking”, “The Four Dimensions of Tone of Voice”, “Between-Subjects vs. Within-Subjects Study Design”, “Usability 101: Introduction to Usability” e “Usability Testing 101” que podem ser encontrados no site do NNGroup. Dan Saffer atua hoje como Product Design Leader, além de ser autor de obras como Gestural Interfaces (2008), Designing for interaction (2010) e Microinteractions (2013). Saffer trabalha com Design desde 1995, sendo reconhecido pela criação do infográfico de subáreas que compõem o UX design: Figura 3 - Subáreas do UX Design Fonte: Saffer (2009). O infográfico, criado em 2009 por Dan Saffer, engloba, de maneira completa, as áreas que permitem a concepção do UX design. Iniciemos por aquele que antecede tudo e todos, isto é, a Arquitetura de Informação (AI). Nas palavras de Alfram Albuquerque e Mamede Lima-Marques, A Disciplina Arquitetura da Informação é um programa de investigação epistemológica da realidade que busca identificar e relacionar, no mínimo e necessariamente, quatro dimensões no problema tratado: Forma, Contexto, Manifestação e Significado (resumidamente, propriedades FCMS). Pode adotar duas abordagens: orientada para o objeto, quando o propósito é analisar o fenômeno, ou orientada ao produto, quando o propósito é criar um produto para atuar sobre o fenômeno (ALBUQUERQUE, LIMA-MARQUES, 2011, s/p). Por mais que o nome e a definição sejam complexos, a AI é a estruturação de conteúdo de maneira interpretável e que faça sentido para o seu propósito, seja ele orientado ao objeto ou ao produto. Um exemplo prático quando falamos de produto é pensar nas estruturas de sites, como da Figura 4, com suas divisões de páginas e conteúdos, pois não é arbitrário a organização e divisão de materiais e serviços em certas categorias determinadas. Figura 4 - Exemplo de AI para construção de sites Fonte: Os entregáveis da Arquitetura de Informação13 13 Disponível em: https://brasil.uxdesign.cc/os-entreg%C3%A1veis-da-arquitetura-de-informa%C3%A7%C3%A3o-ff03baf3ba 45 Interligado à AI temos o Design Visual, que pode ser definido como o design que se sobrepõe às mídias. O design visual não é centrado como o UX ou o UI e seu significado ainda não é muito palpável, apesar da sua importância no meio midiático. Quando falamos de design visual, falamos da essência de um design. Um logo ou uma marca e suas características são criações do design visual. A memória da Coca-Cola como um item necessário naqueles almoços de domingo em família, quando todos se juntam para comer um belo strogonoff com batata-palha, por exemplo, é resultado do trabalho de criação de marca e voz de um designer visual. Além disso, para que haja uma produção é necessário um conteúdo, podendo ser ele visual, auditivo e/ou textual, isto é: ● uma imagem, um gif (visual); ● uma música, um áudio (auditivo); ● um texto em copywriting, um botão com uma ação escrita (textual). Salientamos que os tipos de conteúdo podem ser combinados para alcançar os objetivos, como um vídeo, que utiliza de recursos auditivos e visuais em sua composição. Também se deve ressaltar a importância do trabalho em conjunto da AI, do conteúdo e do design visual, pois são eles os principais responsáveis pela criação de um produto consistente e coerente. Não adianta expor milhares de imagens em um site se o seu display não está bem arquitetado e se essas imagens não possuem descrições acessíveis. Quando pensamos no usuário de um produto, nada deve ser considerado subentendido. Quanto ao Design Industrial, este é responsável pelo desenvolvimento dos manufaturados das empresas, sejam dispositivos, serviços ou produtos. O design industrial está intrinsecamente ligado a meios de produção em massa. Nas palavras de Angela Dumas: Design Industrial é o termo usado quando uma atividade é colocada em serviço como uma parte formal de um empreendimento dedicado à criação de artefatos como parte da criação de riquezas. Antes da industrialização, indivíduos que realizam a atividade do design eram artesãos, sobre qual podemos especular a experiência e o conhecimento que aqueles ativos em design podem precisar em uma era pós-industrial. [...] Atualmente, no entanto, a atividade de design industrial está generalizadamente ligada ao desenvolvimento de produtos manufaturados. É fator: 1) A criação de produtos que conquistam e extrapolam os estilos. 2) A integração e aplicação de novas tecnologias. 3) Atividades que melhoram ou criam novos mercados. 4) Atividades que melhoram ou protegem marcas. (DUMAS, 2000, p. 2 - tradução nossa).14 14 Industrial Design is the term used when the activity is pressed into service as a formal part of a business enterprise dedicated to creating artifacts as a part of wealth creation. Prior to industrialisation, individuals undertaking design were artisan craftsman, we might speculate on what expertise and knowledge those active in design might need in a future post industrialist age. [...] Currently, though, the activity of industrial design Para finalizar, abordaremos os três últimos, mas não menos importantes compositores do UX: o Design de Interação, a Interação Humano-Máquina (Human-Computer Interaction, HCI, ou IHM, em português) e os Fatores Humanos. O design de interação, em contraste com o design industrial, busca ir muito além do simples desenvolvimento do produto. Nesse tipo de design procura-se entender como se dá a interação dos usuários com os produtos, embora não se voltem para o usuário como o UX, abordando apenas a parte essencial, como demonstrado no infográfico. Por outro lado, assim como o design industrial, o design de interação volta-se para a forma, porém sem deixar de lado o comportamento. Assim como no design de interação, a interação humano-máquina também se baseia no comportamento do seu usuário. O IHM foca em otimizar as interações de humanos e máquinas por meio de interfaces. Hewett define a IHM da seguinte maneira: A interação humano-máquina é uma disciplina preocupada com o design, avaliação e implementação de sistemas interativos de computador para uso humano e com os principais fenômenos que os cercam (tais sistemas) (HEWETT, 1992, p. 5 - tradução nossa).15 É válido acrescentar que o fluxo de trabalho do IHM é de fora para dentro, isto é, tem início no usuário em vez do produto. Isso significa que o IHM entende o usuário como a parte mais importante e, portanto, devem estar envolvidos no processo (MARIZ; BASTOS, 2018). A imagem de Barbosa e Silva (2010), adaptada por Mariz e Bastos (2018), ilustra bem a ideia de fluxos “de dentro para fora” (A) versus “de fora para dentro'' (B). 15 Human-computer interaction is a discipline concerned with the design, evaluation and implementation of interactive computing systems for human use and with the study of major phenomena surrounding them is generally linked to product development in a manufacturing context. It is a factor in the following: 1) The creation of products that attain and reach beyond style. 2) The integration and application of new technology. 3) Activities that enhance or create new markets. 4) Activities that enhance and guard brands Figura 5 – Tipos de fluxo de IHM Fonte: MARIZ, BASTOS (2018) Por fim, é necessário contarmos com os fatores humanos, isto é, com os acontecimentos que advêm de seres humanos, seja por motivação fisiológica ou social, afetando suas interações.16 Em outras palavras, se um usuário precisa de suporte emocional por causa de algum evento em sua vida e procura ajuda em um site de psicólogos online, ele deve encontrar naquele site palavras que acolham ele para que ele possa se sentir aceito e com vontade de continuar ali. É importante tentar antecipar ações causadas tanto por emoções quanto por erros, afinal, todo ser humano está predisposto a ambos. 3. CHATBOTS Sabe-se que chatbots/assistentes virtuais são estigmatizados, pois, afinal de contas, quem nunca teve uma interação ruim com um serviço de respostas automáticas quando você mais 16 Disponível em: https://www.ocimf.org/pt/fatores-humanos#:~:text=Os%20fatores%20humanos%20s%C3%A3o%20caracter %C3%ADsticas,indiv%C3%ADduos%20ou%20equipes%20de%20trabalho. precisava de ajuda com algum produto de uma empresa? Mas por piores que sejam as memórias, é bom sabermos que o mercado de chatbots vem evoluindo grandiosamente, não somente em níveis de produção, mas também na busca por melhor qualidade, implicando, consequentemente, a busca pela melhor experiência ao usuário. Agora que entendemos o que é o PLN e o que é Design de Experiência do Usuário precisamos entender como elas se favorecem quando colocadas para trabalhar em conjunto. Porém, antes de pularmos de cabeça nisso é necessário compreender o que é e como nasceu essa tecnologia. 3.1 HISTÓRIA DOS CHATBOTS A concepção de chatbots nasceu com Alan Turing, conhecido como o pai da ciência da computação e da inteligência artificial. Turing, matemático nascido em Londres no ano de 1912, se suicidou em 1954, aos 41 anos, dois anos após sua condenação por “atos homossexuais”, que, até então, era crime no Reino Unido. Apesar das injustiças sofridas em sua curta vida, Turing fez grandes contribuições para o desenvolvimento da ciência e das novas tecnologias, e uma delas foi o pontapé inicial para o desenvolvimento de IAs: o Turing Test. O Turing Test foi proposto, inicialmente, por um artigo do matemático em 1950, no jornal Mind. Seu artigo inicia com uma pergunta: “máquinas são capazes de pensar?” que logo é parafraseada, uma vez que as ramificações que seriam criadas para poder responder tal questão seriam “absurdas”. Assim, “Máquinas são capazes de pensar?” foi alterada para “O que acontecerá quando uma máquina for capaz de tomar parte de ‘A’ no jogo?”. Para contextualizar, o jogo a que Turing se refere no parágrafo acima é o jogo da imitação, que Tomáš Zemčík explica de maneira simplificada: Para responder essa pergunta, é utilizado uma variação do chamado jogo da imitação. É um jogo em que uma pessoa conduz uma comunicação “cega” com o sujeito a ser testado. Após o término do jogo, a pessoa deve decidir se o sujeito se trata de uma pessoa viva e pensante ou de uma inteligência artificial (IA), um chatbot. Isso significa que neste teste a capacidade de pensar é identificada (ou substituída) pela habilidade de comunicação em tal nível que os participantes tomem o sujeito como um ser pensante (ZEMČÍK, 2019, p. 14 - tradução nossa).17 17 To answer this question, it uses a variation of the so-called Imitation game. It is a game in which a person leads a ‘blind’ communication with the tested subject. After the end of the communication game, the person is supposed to decide whether it was a living thinking person or artificial intelligence (AI), a chatbot. It means that in this test the ability to think is identified (or substituted) with an ability to communicate on such a level so that the participants of the conversation regard it as a thinking being Então, basicamente, passam no teste as máquinas que forem capazes de imitar uma pessoa (daí o nome jogo da imitação) a tal nível que, durante uma conversação entre estas e uma pessoa real, a pessoa real não consiga diferenciar se aquele com quem conversa é uma pessoa ou máquina. A partir do Turing test, ideia que deu origem aos chatbots, nasce a primeira assistente virtual. ELIZA, como foi nomeada, foi desenvolvida em 1966 por Joseph Weizenbaum com o intuito de explicitar o quão superficiais as interações humano/máquina são. ELIZA foi construída para interpretar o papel de uma psicoterapeuta, mas ainda apresentava respostas muito limitadas, baseadas na combinação de padrões simples e vagos, muitas vezes em forma de perguntas. Ela demonstrava um comportamento evasivo quando as perguntas se voltavam às suas características, buscando desviar o usuário sempre para o seu objetivo principal: os tópicos de conversação pré-definidos entre psicoterapeuta e paciente. Porém, apesar das limitações e da falta de entendimento de contexto como um todo, ELIZA provou que Weizenbaum estava errado, pois os usuários logo começaram a criar laços sentimentais com a chatbot, confidenciando-lhe desde histórias pessoais a dados sensíveis e confidenciais (ZEMČÍK, 2019).18 Vale ressaltar aqui que este comportamento de humanização da máquina é algo comum nos usuários, seja uma sentimentalização provocada propositalmente pelas empresas ou não. As figuras abaixo mostram exemplos de interações da ELIZA, a primeira recriada por Norbert Landsteiner, em 2005, e a segunda pela autora19 (ambas imagens estarão seguidas das traduções feitas pela autora). Nessa versão, os exemplos mostram usuários interagindo com o chatbot. A Figura 6 representa o cenário em que o usuário começa a criar um laço sentimental com ele, se abrindo para compartilhar mais sobre sua vida pessoal. A Figura 7 representa o cenário em que as limitações de ELIZA ficam bem-dispostas ao usuário. 19 A interação foi feita pelo site: http://psych.fullerton.edu/mbirnbaum/psych101/eliza.htm 18 It was a surprise that people soon started to anthropomorphised Eliza and confide in her their personal stories, sensitive data and secrets. Figura 6 - Interação bem-sucedida de Eliza. Fonte: Processamento de Linguagem Natural: Histórico e Potencial Atual.20 Bem-vindo a ELIZA Eliza é uma falsa psicoterapeuta Rogeriana. O programa original foi descrito por Joseph Weizenbaum em 1966. Essa implementação foi feita por Norbert Landsteiner em 2005. ELIZA: Tem algo te incomodando? VOCÊ: Homens são todos iguais. ELIZA: Qual você acha que é a conexão? VOCÊ: Eles estão sempre nos chateando por uma coisa ou outra. ELIZA: Você consegue pensar em um exemplo específico? VOCÊ: Bem, meu namorado me fez vir aqui. ELIZA: É importante para você que seu namorado tenha te feito vir aqui? 20 Disponível em: http://www.each.usp.br/petsi/jornal/?p=2577. VOCÊ: Ele diz que eu tenho estado depressivo a maior parte do tempo. ELIZA: Eu sinto muito por ouvir que você está depressivo. VOCÊ: É verdade. Eu estou infeliz. ELIZA: Consegue explicar o que fez você infeliz? VOCÊ: Figura 7 - Interação mal sucedida de Eliza. Fonte: De autoria própria. Pela figura, podemos presumir que este não é o começo da conversação entre o usuário e ELIZA, mas, ainda assim, são evidenciadas as suas limitações. VOCÊ: Sim. ELIZA: Eu vejo. VOCÊ: Sim, o que você vê? ELIZA: Oh… ver? VOCÊ: Você não deveria estar tentando me alegrar? ELIZA: Você não está realmente falando sobre mim, está? VOCÊ: Não, eu estou falando sobre mim. ELIZA: Você está dizendo não só para ser negativo? VOCÊ: Não. ELIZA: Por que não? Para resumir as expectativas sobre ELIZA, Sharma nos fala: Muitos acadêmicos acreditavam que o programa seria capaz de influenciar positivamente a vida de inúmeras pessoas, principalmente daquelas que sofrem de problemas psicológicos e que (esse) poderia auxiliar os médicos ao que tratam esses pacientes. Enquanto ELIZA era capaz de se engajar no discurso, ELIZA não conseguia ter um real entendimento da conversa. Entretanto, muitos dos primeiros usuários estavam convencidos da inteligência e entendimento de ELIZA, apesar da insistência de Weizenbaum sobre o contrário (SHARMA et al., 2017, p. 52 - tradução nossa).21 Dois outros chatbots que deixaram um marco na história dos chatbots são PARRY e SmarterChild.22 PARRY foi apresentado ao público por Kenneth Mark Colby em 1972. Colby deixa claro que seu papel na construção do chatbot não era atuar como um linguista, e sim, como um psiquiatra interessado na área. Juntamente com um grupo de estudantes da área, o desenvolvimento do projeto teve início no departamento de psiquiatria de Stanford. A ideia principal por trás de PARRY batia quase de frente com o desenvolvimento da ELIZA, dadas as vantagens que traria para os estudos e a atuação dela.23 Conjuntamente, dentro da área da psicologia, PARRY representava a persona de um paciente com esquizofrenia paranoica/pensamentos paranoicos com o objetivo de chegar a um diagnóstico por meio das respostas dos usuários. Colby (1999) chamou esse processo de “diagnostic interviewing”, ou, em tradução livre, “entrevista de diagnóstico”. Anos mais tarde, PARRY viria a atuar também em terapias cognitivas. Seguem citações de Colby e Zemčík: O modelo de simulação computacional PARRY passou em vários testes de indistinguibilidade no qual foi entrevistado por diversos profissionais 23 Em janeiro de 1973 foi feito um experimento entre os dois chatbots: ELIZA (DOCTOR) interage com PARRY pela primeira vez. A interação completa está disponível pelo link https://www.rfc-editor.org/rfc/rfc439 22 Importante ressaltar aqui que esses chatbots não foram os únicos a marcar a história, alguns, como ALICE Ractor, Dr. Sbaitso e até mesmo Siri e Alexa podem ser considerados grandes marcos na área. Entretanto, neste trabalho falaremos mais aprofundadamente somente de ELIZA, PARRY e SmarterChild. Para os interessados em saber mais sobre outros chatbots que tiveram seus marcos na história recomendamos a leitura de From Eliza to XiaoIce: challenges and opportunities with social chatbots, de Shum e Li que criaram uma tabela intitulada "Summary of major conversational systems" (Sumário dos maiores sistemas conversacionais). 21 Many academics believed that the program would be able to positively influence the lives of many people, particularly those suffering from psychological issues and that it could aid doctors working on such patients’ treatment. While ELIZA was capable of engaging in discourse, ELIZA could not converse with true understanding. However, many early users were convinced of ELIZA’s intelligence and understanding, despite Weizenbaum’s insistence to the contrary. especializados em saúde mental (psiquiatras, psicólogos, enfermeiros psiquiátricos) que não conseguiram distinguir seu comportamento linguísticos do de reais pacientes paranóicos em níveis estatísticos significativos. PARRY funcionava todas as noites na rede ARPA por muitos anos e as interações, que totalizaram mais 100.000 - que por muitas acabavam sendo só para entretenimento - forneceram uma rica fonte de frases, gírias, etc, para construção de um banco de dados semântico (COLBY, 1999, p. 10 - tradução nossa).24 Ele (PARRY) serviu não apenas como ferramenta didática para jovens psiquiatras aprenderem a se comunicar com pacientes diagnosticados com esquizofrenia paranoica, mas também como um modelo funcional do padrão teórico de paranóia de Colby sobre o processamento de sinais anormal na mente do paciente (ZEMČÍK, 2019, p. 14 - tradução nossa).25 SmarterChild, por outro lado, foge da área da psicologia, sendo um dos principais chatbots concebidos com o objetivo de auxiliar usuários comuns nas atividades do dia a dia. Desenvolvido por ActiveBuddy, SmarterChild nasceu em 2001 e foi disponibilizado em plataformas de mensageria comuns da época, como MSN e AOL. É dito por Usman Haruna et al. (2021) que a interface do SmarterChild era bem amigável, o que permitia uma comunicação mais natural com o chatbot. Entre as capacidades do SmarterChild podemos listar informações sobre classificações nos jogos, notícias do dia, ações na bolsa, filmes em cartaz, como estaria o tempo e até mesmo o que o seu horóscopo dizia para você naquele dia. 25 It did not serve only as a didactic tool for young psychiatrists to learn how to communicate with patients who were diagnosed with paranoid schizophrenia, but also as a functional model of Colby’s theoretical pattern of paranoia functioning as a defective processing of signs in patient’s mind 24 The computer-simulation model PARRY passed several indistinguishability tests in which it was interviewed by expert mental health professionals (psychiatrists, psychologists, psychiatric nurses) who could not distinguish its linguistic behavior from that of paranoid patients at a statistically significant level. PARRY ran nightly on the ARPA network for many years and these interactions, numbering over 100,000 - often just playful or baiting in nature - nonetheless provided us with a rich source of words, phrases, slang, etc. for building a semantic database. Figura 8 - Interação de SmarterChild. Fonte: MOLNÁR, SZÜTS (2018) 3.2 DEFINIÇÃO E TIPOS DE CHATBOT Falamos um pouco sobre a história, agora precisamos entender o que exatamente é um chatbot. Chatbots, chatterbots, assistentes virtuais, assistentes digitais ou assistentes interativos designam sofwares/aplicativos de conversação com língua natural, buscando a naturalização da conversa prevista para que não cause estranheza no usuário que o utiliza. Uma definição comum de chatbot vem de Adamopoulou e Moussiades: É um programa de computador que responde como uma entidade inteligente quando se conversa via texto ou voz e compreende uma ou mais línguas humanas pelo processamento de língua natural (PLN). No léxico, um chatbot é definido como “um programa de computador projetado para simular conversas com usuários humanos, especialmente pela internet” (ADAMOPOULOU; MOUSSIADES, 2020, - tradução nossa). 26 26 It is a computer program, which responds like a smart entity when conversed with through text or voice and understands one or more human languages by Natural Language Processing (NLP). In the lexicon, a Esse software, no entanto, pode ser desenvolvido de duas formas diferentes: baseado em regras ou baseado em IA27 - isso é, limitados pelas regras do programa criado ou que se utiliza das chamadas intenções e entidades para o cálculo de probabilidade, com o propósito de encontrar a resposta que melhor se adeque a vontade do usuário. Sharma et al. explicam: Existem dois tipos principais de chatbots disponíveis, um cujas funções são baseadas em um conjunto de regras e outro que usa inteligência artificial - versão mais avançada. O primeiro tende a ser limitado e sua inteligência depende da complexidade do programa. Quanto maior for a complexidade maior será a inteligência do chatbot. Aquele que usa a inteligência artificial entende a língua não apenas como comandos e torna-se mais inteligente à medida que aprende com as suas interações com pessoas. Um chatbot também pode executar algumas funções como cálculos, configurar lembretes, acionar alarmes, etc (SHARMA et al., 2017, p. 52 - tradução nossa).28 Portanto, muitas são as possibilidades dos chatbots dependendo de sua construção, desenvolvimento e propósito. 3.3 CHATGPT-3 O ChatGPT-3 é um modelo de linguagem criado e treinado pela OpenAI que possui formato conversacional, permitindo que usuários interajam com ele por textos. O modelo foi disponibilizado ao público no final de 2022, portando dados de treinamento limitados até 2021. De acordo com seus criadores, o modelo de linguagem utilizou o método de Aprendizagem por Reforço (um dos tipos de métodos utilizados pelo Aprendizado de Máquina) que se baseia no treinamento de um modelo inicial por fine-tuning, ou ajuste fino, do qual houve dados de humanos em perspectivas de usuários e de assistentes virtuais (OpenAI, 2022 - tradução nossa). Não é sem fundamento a comoção pelo ChatGPT-3, pois este representa de maneira clara e acessível aos leigos os avanços que as áreas da Inteligência Artificial vem gerando. No entanto, o ChatGPT-3 não é perfeito e está longe de ser independente da ação humana, pois para que uma inteligência exista é necessário alguém guiando/treinando-a. 28 There are two main types of chatbots available, one whose functions are based on a set of rules and other is the more advanced version which uses artificial intelligence. The former one tends to be limited and their smartness depends upon the complexity of the program. The more complex the program is, the more is the smartness of the bot. The one that uses artificial intelligence, understands language, not just commands, and continuously gets smarter as it learns from the conversation with the people. A chatbot can also perform some basic functions like calculations, setting-up remainders, alarms etc 27 Para fins desse trabalho, como comentamos anteriormente, falaremos na prática somente do cenário definido por regras. chatbot is defined as “A computer program designed to simulate conversation with human users, especially over the Internet” Em exemplos demonstrado na figura 9, em que há uma clara defasagem gramatical em relação à norma culta do português brasileiro quando lê-se “o lenguagem” ao invés de “a linguagem” - isso é, o correto seria a utilização do artigo feminino “a” no lugar do artigo masculino “o” e a escrita de linguagem com “i” no lugar de “e”. Também observamos essa defasagem quando a resposta do ChatGPT-3 traz verbos no infinitivo, que não concordam com o sujeito da frase (as pessoas adquirir, produzir e compreender). Figura 9 - Interação com ChatGPT-3 1 Fonte: De autoria própria. Até situações como as demonstradas nas figuras 10 e 11, das quais as respostas estão incorretas, mesmo o modelo trazendo um retorno que aparenta confiança. Na figura 10, o correto seria dizer que em 19 de junho de 2008, o Brasil passou a proibir a condução de veículos automotores com concentração de seis miligramas de álcool por litro de sangue pela lei 11.705, popularizada como lei seca. Já na figura 11, o modelo afirma que é uma expressão usada para quando algo é considerado falso ou enganoso. Apesar de realmente ser uma expressão do pt-br, ela possui um caráter político para denominar uma ação de duplo sentido, passando como normal ou despercebido para aqueles que não são seu público alvo. Figura 10 - Interação com ChatGPT-3 2 Fonte: De autoria própria. Figura 11 - Interação com ChatGPT-3 3 Fonte: De autoria própria. De toda maneira, o próprio ChatGPT-3 foi ensinado a responder sobre suas limitações e entende a importância daqueles que o treinam: Figura 12 - Interação com ChatGPT-3 4 Fonte: De autoria própria. Figura 13 - Interação com ChatGPT-3 5 Fonte: De autoria própria. Para concluirmos, o ChatGPT demonstra o grande avanço da área da Inteligência Artificial, incluindo o PLN. No entanto, em suas próprias palavras, ele é um produto do trabalho de seus treinadores, sejam eles desenvolvedores, engenheiros computacionais, engenheiros de machine learning, especialistas em IA ou mesmo linguistas, e que a sua existência depende do nosso trabalho. 3.4 PLN E A EXPERIÊNCIA DO USUÁRIO O processo de desenvolvimento de um chatbot não é tão complexo, mas depreende muito tempo. Há muitos passos a serem seguidos até um chatbot ser implementado, publicado e disponibilizado ao público. Entre esses passos, o principal é entender o objetivo do projeto, saber quais as ações que o chatbot deve performar e quais serão suas limitações, até onde a sua inteligência se estenderá e o quão cognitivo será. Ferramentas, APIs, recursos e tudo mais que for necessário é acordado durante a ideação do projeto, por todos aqueles que participarão da sua criação. O responsável pela parte cognitiva do chatbot, isto é, o linguista ou profissional da língua, fica encarregado de garantir que o usuário e o chatbot sejam capazes de se entender da melhor forma possível, garantindo uma jornada conversacional suave. É comum haver, em projetos de chatbots, ao menos um UX designer, um profissional da língua, um analista de dados e um desenvolvedor. A atuação do linguista começa assim que o UX designer termina de mapear o perfil do usuário, isto é, de entender as ações que o chatbot irá performar, quais as principais características do público que se deseja atingir. Vale ressaltar que esse mapeamento é feito com base em pesquisas de perfil, portanto nem sempre irá condizer com a realidade e, caso condiza, ela pode mudar a qualquer momento, mas é um processo muito importante, principalmente no início do projeto). Como mencionado anteriormente, são muitas as ferramentas à disposição do linguista, tanto dentro quanto fora da construção de chatbots, mas para este trabalho escolhemos o RegEx, por este já ser muito conhecido e utilizado no mercado de desenvolvimento e chatbots. Para entendermos melhor como o PLN age a favor da experiência vamos utilizar dois cenários fictícios diferentes: 1. Alice, assistente virtual de um banco clássico, com mais de 50 anos de atuação; 2. Rob, assistente virtual de um banco virtual. Ambos os cenários pertencem ao setor financeiro, mas seus clientes diferem, principalmente pela idade. A assistente virtual do banco clássico, Alice, deve ter sua linguagem adequada ao seu público, que, de acordo com o UX designer, tem entre 50 e 80 anos, enquanto Rob precisa ter um linguajar mais voltado aos jovens, pois são seu público-alvo. Ambos os assistentes virtuais possuem serviços de consulta de saldo, consulta de extrato, pedidos de transferência, visualização de contratos etc. e devem entender e entregar aquilo que o usuário pede, mas como eles poderiam identificar que uma mensagem como “oi querida, tudo bem? Meu filho passou aí ontem pra depositar um dinheiro pra mim e eu não sei se caiu ainda, consegue ver pra mim se eu estou com o limite disponível?” significa o mesmo que “verificar saldo”? Para dois perfis diferentes são criados dois validadores diferentes. Por exemplo, o RegEx da Alice pode ser validado com: Figura 14 - RegEx 1. Fonte: De autoria própria. Figura 15 - Validação de RegEx 1. Fonte: De autoria própria. Por outro lado, Rob só precisa de: Figura 16 - RegEx 2. Fonte: De autoria própria. Figura 17 - Validação de RegEx 2. Fonte: De autoria própria. Além disso, não é realístico acreditar que o usuário sempre vai usar uma mesma expressão - como no exemplo “verificar saldo”. Muito pelo contrário, o linguista deve ser capaz de mapear todas as possíveis variações linguísticas que um usuário pode usar para tentar chegar ao seu objetivo no fluxo conversacional. Ainda assim, vão existir casos que vão fugir do mapeamento, independente do quão completo tenha sido feito. Dessa maneira, temos possibilidades sintáticas como a da figura abaixo, que devem ser mapeadas: Figura 18 - Possibilidades fraseológicas de “verificar limite”. Fonte: De autoria própria. E possibilidades morfológicas como nos exemplos das figuras 19 e 20: Figura 19 - Possibilidades morfológicas da palavra checar. Fonte: De autoria própria. Figura 20 - Possibilidades morfológicas da palavra constatar. Fonte: De autoria própria. É possível perceber na Figura 20 que algumas variações morfológicas que podem vir a acontecer no ambiente on-line podem gerar, também, ambiguação, afinal a palavra “contatar” é um verbo do português brasileiro que possui um significado não previsto pelo RegEx. Esse tipo de ocorrência exemplifica os limites da ferramenta, pois é quando começa a ser necessário contornar suas barreiras contextuais com a adição de pontos de desambiguação. Em pontos de desambiguação são criados pontos de decisão no chatbot, em que o usuário deverá esclarecer como deseja continuar: caso seu fluxo fosse de constatar o limite ele deverá selecionar o caminho desejado, caso contrário (supondo que haja a opção de contatar a central, por exemplo), seguirá pelo outro caminho. RegEx é uma das ferramentas mais utilizadas e menos complicadas em quesito de ações, mas peca por sua falta de entendimento contextual comparado aos provedores de IA comentados anteriormente, que possuem a habilidade de aprender com seus erros e aprimorá-los para o futuro. Ainda assim, não é possível que uma inteligência artificial trabalhe completamente sozinha, sem interferência humana alguma. Toda ferramenta, incluindo o RegEx e os provedores de IA, estão à disposição daquele que a utiliza, seja pesquisador, linguista ou profissional da língua, para garantia da boa experiência do usuário. CONCLUSÃO Esse trabalho teve como objetivo introduzir e apresentar as atividades da linguística e do PLN na construção de chatbots. Dessa forma, na primeira seção, entendemos a história da linguística computacional juntamente ao significado de PLN, com base no trabalho de Freitas (2020). Em seguida, buscamos entender a área de UX Design, seus pilares e, como um todo, a maneira como funciona. Na terceira seção apresentamos os ideais primórdios da área de chatbots, além de descobrirmos quem foi ELIZA e PARRY, antecessores do, agora famoso, ChatGPT -3. Por fim, demonstramos como linguistas podem utilizar o PLN a favor da experiência do usuário dentro do design conversacional em fluxos de chatbot. Como visto em nosso trabalho, quanto ao que rege a experiência do usuário é simples: o chatbot deve ser capaz de entender a maior quantidade de inputs possível de maneira correta, levando o usuário ao seu objetivo e garantindo-lhe uma jornada feliz. No que se refere à área dos chatbots, o PLN, não somente deve andar de mãos dadas com o UX Design, como também é parte essencial na formação e garantia da boa experiência. Além de que, como comentado ao decorrer do trabalho, o PLN tem várias formas, não se limitando ao exemplo de RegEx usado aqui. Portanto as boas práticas garantem uma cognição mais completa do chatbot, certificando uma inteligência voltada ao uso prático do usuário. Para finalizarmos, em vista da crescente utilização de chatbots durante os últimos anos, acreditamos que o presente trabalho é de extrema importância para mantermos em aberto a discussão científica sobre os avanços do PLN hoje em dia. Esse trabalho mostra-se relevante também como uma introdução para pessoas dentro e fora do mercado de chatbots, que desejam entender mais sobre o uso de PLN e sua relevância, tal como a necessidade de estudos morfossintáticos para garantir uma qualidade para o usuário que vá além dos códigos e fluxos. REFERÊNCIAS ADAMOPOULOU, E.; MOUSSIADES, L. Chatbots: history, technology, and applications. Machine Learning with Applications, v. 2, 2020. DOI: 10.1016/j.mlwa.2020.100006. ALBUQUERQUE, A. R. R.; LIMA-MARQUES, M. Sobre os fundamentos da arquitetura da informação. Perspectivas em Gestão & Conhecimento, v. 1, n. esp., p. 60-72, 2011. ASSOCIATION for Computational Linguistics. Disponível em: https://www.aclweb.org/portal/. Acesso em 27 fev. 2023. BARBOSA, S. D; J; SILVA, B. S. da. Interação Humano-Computador. Rio de Janeiro: Elsevier, 2010. BUDIU, R. Between-subjects vs. within-subjects study design. Nielsen Norman Group, 13 maio 2018. Disponível em: https://www.nngroup.com/articles/between-within-subjects/. Acesso em: 27 fev. 2023. CASELI H.; FREITAS C.; VIOLA, R. Processamento de Linguagem Natural. In: Sociedade Brasileira de Computação, 37, 2022. Búzios, RJ. Short courses of the 37th Brazilian Symposium on Data Bases. [S. l: s. n.], 2022. CHATGPT. OpenAI. Disponível em: https://chat.openai.com/. Acesso em 27 fev. 2023. CHATGPT: Optimizing Language Models for Dialogue. OpenAI. Disponível em: https://openai.com/blog/chatgpt/. Acesso em 27 fev. 2023. COLBY, K. M. Human-computer conversation in a cognitive therapy program. In: WILKS, Y. (org). Machine conversations, [S. l: s. n.], 1999. p. 9-19. CONHEÇA Alexa. Amazon, 2021-2022. Disponível em: amazon.com.br/b?node=19949683011. WatsonAcesso em: 12 de dez. de 2022. DIALOGFLOW. Google Cloud, s.d. Disponível em: https://cloud.google.com/dialogflow?hl=pt-br. Acesso em: 12 de dez. de 2022. DOCUMENTAÇÃO do LUIS (Reconhecimento vocal). Microsoft, 2022. Disponível em: https://learn.microsoft.com/pt-br/azure/cognitive-services/luis/. Acesso em: 12 de dez. de 2022. DUMAS, A. Theory and Practice of Industrial Design. Local: Innoregio Project, 2000. ELIZA, the Rogerian Therapist. Disponível em: http://psych.fullerton.edu/mbirnbaum/psych101/eliza.htm. Acesso em 27 fev. 2023. EXPRESSÕES regulares: capturando textos de forma mágica. Alura. Disponível em: https://www.alura.com.br/conteudo/expressoes-regulares. Acesso em 27 fev. 2023. FATORES humanos. OCIMF, c2021. Disponível em: https://www.ocimf.org/pt/fatores-humanos#:~:text=Os%20fatores%20humanos%20s%C3%A3o%2 0caracter%C3%ADsticas,indiv%C3%ADduos%20ou%20equipes%20de%20trabalho. Acesso em: 12 de dez. de 2022. FERNANDES, D. E-commerce brasileiro cresce 73,88% em 2020, revela Índice MCC-ENET. E-commerce Brasil, 2021. Disponível em: https://www.ecommercebrasil.com.br/noticias/e-commerce-brasileiro-cresce-dezembro/. Acesso em: 26 abr. 2022. FREITAS, C. Linguística Computacional. São Paulo: Parábola, 2022. GASPARINI, C. A história da xícara. Mundo do Café, 2 out. 2015. Disponível em: https://www.mexidodeideias.com.br/mundo-do-cafe/a-historia-da-xicara/. Acesso em: 27 fev. 2023. GIBBONS, S. Usability 101: Introduction to usability. Nielsen Norman Group, 14 jan. 2018. Disponível em: https://www.nngroup.com/articles/empathy-mapping/. Acesso em: 27 fev. 2023. HAENLEIN, M.; KAPLAN, A. A brief history of artificial intelligence: on the past, present and future of artificial intelligence. Local: California management review, 2019. HARUNA, U. et al. Hausa Intelligence Chatbot System. In: MISRA, S.; MUHAMMAD-BELLO, B. (ed.). Information and Communication Technology and Applications. ICTA 2020. Communications in Computer and Information Science, v. 1350. Local: Springer Nature, 2021. p. 206-219. DOI: https://doi.org/10.1007/978-3-030-69143-1_17. HEWETT, T. T. et al. ACM SIGCHI curricula for human-computer interaction. Nova York: ACM, 1992. IBM Watson é IA para negócios mais inteligentes. IBM, s.d. Disponível em: https://www.ibm.com/br-pt/watson. Acesso em: 12 de dez. de 2022. MAPA do Ecossistema Brasileiro de Bots. Mobile Time. Disponível em: https://www.mobiletime.com.br/pesquisas/mapa-do-ecossistema-brasileiro-de-bots-2021/. Acesso em 27 fev. 2023. MARIZ, L. K. P.; BASTOS, H. R. Interfaces e usabilidade: organização de critérios para avaliação. In: CONGRESSO BRASILEIRO DE PESQUISA E DESENVOLVIMENTO EM DESIGN, 13., 2018, Joinville. Anais… São Paulo: Blucher, 2019. p. 5394-5409. MOLNÁR, G.; SZÜTS, Z. The role of chatbots in formal education. In: INTERNATIONAL SYMPOSIUM ON INTELLIGENT SYSTEMS AND INFORMATICS, 16., 2018, Subotica. Cidade: Serbia, IEE, 2018, p. 197-202. DOI: 10.1109/SISY.2018.8524609. MORAN, K. The four dimensions of tone of voice. Nielsen Norman Group, 17 jul. 2016. Disponível em: https://www.nngroup.com/articles/tone-of-voice-dimensions/. Acesso em: 27 fev. 2023. MORAN, K. Usability testing 101. Nielsen Norman Group, 1 dez. 2019. Disponível em: https://www.nngroup.com/articles/usability-testing-101/. Acesso em: 27 fev. 2023. MORIN, H. PARRY Encounters the DOCTOR. RFC, 1999. Disponível em: https://www.rfc-editor.org/rfc/rfc439. Acesso em: 12 de dez. de 2022. NIELSEN, J. 10 usability heuristics for User Interface Design. Nielsen Norman Group, [1994] 2020. Disponível em: https://www.nngroup.com/articles/ten-usability-heuristics/. Acesso em: 12 de dez. de 2022. NIELSEN, J. Usability 101: Introduction to usability. Nielsen Norman Group, 3 jan. 2012. Disponível em: https://www.nngroup.com/articles/usability-101-introduction-to-usability/. Acesso em: 27 fev. 2023. NORMAN, D. Três formas como o design nos faz felizes. TED, 2003. Disponível em: https://www.ted.com/talks/don_norman_3_ways_good_design_makes_you_happy?language=pt. Acesso em: 12 de dez. de 2022. NORMAN, D; A. Design emocional: por que adoramos (ou detestamos) os objetos do dia-a-dia. Rio de Janeiro: Rocco, 2008. NORMAN, D. The design of everyday things. Local: Basic Books, MIT Press, 2013. NUNES, M. G. V. et al. Introdução ao processamento das línguas naturais e algumas aplicações. Notas Didáticas do ICMC, n. 38. São Carlos: NILC - ICMC-USP, jun. 1999. 91 p. PROCESSAMENTO de Linguagem Natural: histórico e potencial atual. Coruja Informa, 2019. Disponível em: http://www.each.usp.br/petsi/jornal/?p=2577. Acesso em: 12 de dez. de 2022. SAFFER, D. Designing gestural interfaces: touchscreens and interactive devices. Local: California, O’Reilly Media, 2008. SAFFER, D. Designing for interaction. 2. ed. Berkeley: New Riders, 2009. SAFFER, D. Designing for interaction: creating innovative applications and devices. Local: New Jersey, New Riders, 2010. SAFFER, D. Microinteractions: designing with details. Local: California, O’Reilly Media, 2013. SHARMA, V.; GOYAL, M.; MALIK, D. An intelligent behaviour shown by chatbot system. International Journal of New Technology and Research, v. 3, n. 4, p. 52-54, abr. 2017. SHIPTON, E. Email Address Regex Django. Abstract API, 12 set. 2022. Disponível em: https://www.abstractapi.com/guides/email-address-regex-django. Acesso em: 27 fev. 2023. TEIXEIRA, F. Os entregáveis da Arquitetura de Informação. UX Collective, 9 jun. 2011. Disponível em: https://brasil.uxdesign.cc/os-entreg%C3%A1veis-da-arquitetura-de-informa%C3%A7%C3%A3o-ff 03baf3ba45. Acesso em: 27 fev. 2023. TEIXEIRA, J. F. O que é inteligência artificial. 3. ed. Local: E-galáxia, 2019. TOGNAZZINI, B. TOG on Interface. Boston: Addison-Wesley Longman Publishing Co., Inc., 1992. TURING, A. Computing Machinery and Intelligence. Local: Springer, Dordrecht, 1950. UX Week 2008 Don Norman | Peter Merholz Speaks with Don Norman, 2008. 1 vídeo (52min29s). Publicado pelo canal Adaptive Path. Disponível em: https://vimeo.com/2963837. Acesso em: 27 fev. 2023. ZEMČÍK, T. A brief history of chatbots. DEStech Transactions on Computer Science and Engineering, 2019. DOI: 10.12783/dtcse/aicae2019/31439.