Usando a IA para identificar relações causais em conjuntos de dados médicos sobrepostos

IA
Crédito: CC0 Public Domain

Uma equipe combinada de pesquisadores da Babylon Health e University College criou um algoritmo que eles afirmam encontrar relações causais entre informações em conjuntos de dados médicos sobrepostos. Eles escreveram um artigo descrevendo seu algoritmo e o enviaram ao servidor de pré-impressão arXiv. Eles também farão uma apresentação descrevendo suas pesquisas na reunião deste ano da Associação para o Avanço da Inteligência Artificial.

Encontrar uma maneira sistemática de filtrar dados para encontrar a causa de uma determinada condição em uma única pessoa doente é um grande desafio na pesquisa de IA. Se um paciente está espirrando mais do que o normal ultimamente, é porque um alérgeno foi introduzido em seu ambiente? Ou eles pegaram um resfriado? Pior, talvez eles tenham um tumor cancerígeno em seus seios ou cérebro. O sistema atual para procurar a resposta certa em tais cenários é baseado em humanos. Os médicos fazem perguntas e buscam respostas em sua memória. Se não conseguirem encontrar um, podem consultar outros médicos ou estudar livros de medicina ou bancos de dados on-line.

Este sistema tem seus méritos, é claro, sendo o melhor disponível. Mas também tem desvantagens – é limitado pela memória e recursos humanos. Muitos especialistas em computação acreditam que há uma maneira melhor – deixe o computador fazer isso. No momento, isso não é possível, mas os cientistas estão trabalhando nisso. Nesse novo esforço, os pesquisadores introduziram um sistema com um algoritmo que analisa dados de conjuntos de dados díspares e sobrepostos e encontra relações causais.

O algoritmo é baseado no conceito de entropia, no qual qualquer sistema se torna mais desordenado ao longo do tempo. Os pesquisadores propõem que a entropia existe com informações também nos conjuntos de dados, e que as forças causais são mais ordenadas que os dados que descrevem o resultado de seus efeitos. Sendo esse o caso, deve ser possível trabalhar para trás para encontrar a causa – e é exatamente isso que o algoritmo deles faz.

O sistema foi capaz de avaliar corretamente o tamanho e a textura dos tumores de câncer de mama ao comparar conjuntos de dados nos quais as relações causais já eram conhecidas – determinou que eles não tinham um nexo de causalidade , mas ambos eram um indicador de que um tumor era benigno ou maligno.