O futuro das terminologias médicas, por Renato Sabbatini
O uso de padrões de classificação e codificação de terminologias médicas é uma funcionalidade essencial para os sistemas de Registro Eletrônico de Saúde. O uso de texto livre para categorizar um diagnóstico encontrado para um paciente, por exemplo, é altamente inadequado, embora seja muito praticado, ainda. Uma das razões é que, para várias aplicações, vocabulários e terminologias ditas fechadas, são preferíveis ao uso de texto livre.
Existem muitas terminologias diferentes usadas em medicina, tais como a Classificação Estatística de Doenças e Problemas Relacionados de Saúde, mais conhecido como CID, que é amplamente utilizada e de uso obrigatório na maioria dos estados-membro da Organização Mundial de Saúde, a OMS. Ela é de uso obrigatório no Brasil em muitas situações, como a já famosa Declaração de Óbito, que legalmente precisa ser preenchida por médicos. A falta de treinamento em nível adequado leva a muitos erros de codificação, o que, portanto, vai afetar a acurácia das estatísticas.
Temos que reconhecer que existe uma certa ojeriza dos profissionais de saúde em relação à tarefa de codificação de diagnósticos e outras terminologias. É uma tarefa imprecisa, trabalhosa, demorada, e pouco intuitiva, pois são códigos formados de letras e números. Quando ela não é realizada pelo próprio profissional de saúde, ao entrar anotações em um Prontuário do Paciente, seja ele em papel, ou eletrônico, os hospitais são obrigados a empregar um grande número de pessoas especializadas em codificação. No entanto isso sai bastante caro, e sem a agilidade suficiente em muitos casos.
Uma boa solução, portanto, seria utilizar a Inteligência Artificial para realizar essa codificação automaticamente, utilizando uma tecnologia chamada NLP, em inglês, Natural Language Processing, ou Processamento de Linguagem Natural. Esses softwares são capazes de recuperar e entender o texto livre entrado pelos médicos e enfermeiras, e achar a melhor codificação possível.
Esta ajuda da IA está sendo particularmente importante com a mais recente das terminologias adotadas pela medicina, o SNOMED CT. SNOMED quer dizer Systematized Nomenclature of Medicine, e CT quer dizer Clinical Terms, ou seja, um subconjunto voltado mais à codificação de eventos clínicos. A Nomenclatura Sistematizada de Termos Clínicos é um padrão de terminologia de referência clínica que permite a interoperabilidade semântica e dá significado aos dados médicos brutos. Ela foi originalmente desenvolvido pelo College of American Pathologists e foi o resultado da fusão de dois sistemas: SNOMED-RT e Clinical Terms versão 3.2
Em abril de 2007, a International Health Terminology Standards Development Organization (IHTSDO) adquiriu os direitos de propriedade intelectual do SNOMED CT e passou a ser responsável pela sua manutenção e distribuição. SNOMED CT é a terminologia clínica mais abrangente e multilíngue; ele funciona como uma taxonomia para conceitos como sinais e sintomas e inclui aproximadamente 357.000 conceitos clínicos, em um universo de mais de um milhão de termos!
A capacidade de uma terminologia clínica ou de um sistema de classificação em representar e codificar conceitos clínicos pode ser considerada um dos fatores importantes que levariam a uma melhor interoperabilidade entre prontuários eletrônicos de saúde, sem falar de outras aplicações importantes, como representar conceitos clínicos em listas de problemas, por exemplo. Os códigos do SNOMED CT são puramente numéricos e enormes, com até 12 dígitos, e é praticamente impossível serem usados de forma manual, como acontece com os códigos da CID, muito mais simples. Muitos médicos conseguem até decorar os códigos CID que utilizam mais, mas isso não funciona no SNOMED CT. Dessa forma, a ajuda de softwares especializados para a codificação é essencial.
A codificação assistida por computador (CAC) visa melhorar a produtividade operacional e a precisão dos codificadores clínicos. O nível de precisão, especialmente para uma ampla gama de casos clínicos complexos e menos prevalentes, permanece um problema de pesquisa em aberto. Muitas pesquisas em codificação clínica usam uma tecnologia da IA chamada de sistemas de aprendizado de máquina. Infelizmente, até agora, os estudos realizados relataram desempenhos de codificação entre médios a baixos, como, por exemplo de até 89% de relatórios de radiologia, de até 54% de vários documentos de autoria de médicos e de apenas 39,5% de resumos de alta. Esse desempenho é inaceitável para aplicações práticas, pois pode gerar muitos erros, e exigem a supervisão manual do codificador.
O desempenho desses sistemas estava muito abaixo dos codificadores clínicos especializados. Mas já existem vários produtos comerciais no mercado para realizar essas tarefas de NLP. Por exemplo, a Medtex, uma plataforma analítica de texto médico que extrai e analisa informações clínicas importantes em textos médicos tem sido usada para codificar diagnósticos de câncer, de dados de relatórios histopatológicos e de causas de mortes de certidões de óbito usando a CID 10.
A codificação assistida por computador (CAC) pode melhorar a precisão e a produtividade da codificação clínica. O nível de precisão, especialmente para os casos de codificação clínica mais complexos e / ou menos prevalentes em toda a gama de códigos de diagnóstico, permanece uma área aberta de pesquisa, no entanto. O progresso tem sido rápido, mas a interação do software de NLP com o clínico que entrou a informação ainda é essencial.
Outra terminologia que está despontando no futuro será a nova versão da CID, a décima-primeira, que entra em vigor obrigatoriamente para todos os países-membros da Organização Mundial em Saúde em janeiro de 2022. A CID-11 é muito diferente da CID-10, a versão vigente: ela é uma rede, ao invés de uma árvore, e tem muitos eixos de classificação. Os códigos resultantes podem ser estendidos com modificadores, como lateralidade da lesão, cronicidade, faixa etária, órgão, agente etiológico, e vários outros. Em um próximo artigo examinaremos com profundidade a CID-11, cuja implementação em softwares de informação em saúde será muito diferente, também.
Referências
- SNOMED CT: https://www.snomed.org/
- CID 11: https://icd.who.int/en
- MedTex: https://aehrc.com/medical-text-processing/#medtex
** Artigo escrito por Prof. Dr. Renato M.E. Sabbatini, PhD, CPHIMS, FACMI, FIAHSI