
A saber: desenvolver tecnologias capazes, claro, de responder a uma questão, mas também de dizer porque chegam a essa resposta e com que grau de certeza. O que os modelos de IA mais proeminentes, como OpenAI, Google, Antrópico ou Meta, não fazem, em parte por razões estratégicas (para não assustar o usuário com falta de certeza).
“Até agora, a Doctolib posicionou-se como uma plataforma para ajudar a gerir práticas médicas, desenvolvendo soluções que poderiam ser descritas como automação de escritório. Mas à medida que gerem cada vez mais dados, isto poderia ser melhorado com ferramentas de apoio à decisão “, observa Adrien Coulet, da equipe do projeto HeKA da Inria, especializada em modelos de saúde.
Doctolib já oferece diversas ferramentas de IA. Como o assistente de consulta, que gera a transcrição e o resumo de uma videoconsulta, permitindo ao profissional se concentrar melhor no paciente sem precisar fazer anotações. O grande projeto em curso é um “acompanhante de saúde” destinado a responder às dúvidas dos pais sobre a saúde dos seus filhos menores de 4 anos. A plataforma também estabeleceu uma colaboração científica em IA com o instituto DFKI, um centro de investigação alemão, com foco na anonimização e nos riscos de reidentificação de dados clínicos.
Leia também“Ter em conta a experiência do paciente é uma prioridade de saúde pública”
Devolva os vários dados à IA de forma rastreável
Mas a parceria com a Inria é mais ampla. As duas organizações estão até a considerar a criação de um laboratório de investigação conjunto a longo prazo. “Vamos trabalhar em métodos de representação do conhecimento médico, explica Nicolas Barascud, “cientista de dados” da Doctolib. Assim que tivermos uma massa de documentos e fontes, alguns em conflito, outros obsoletos, devemos primeiro estruturar tudo isso para que a IA possa explorá-lo de forma eficaz. Mas também devemos ser capazes de restaurar esse conhecimento de forma transparente e rastreável.”
Concretamente, trata-se nada mais e nada menos de reproduzir o raciocínio de um médico num agente conversacional. “Por exemplo, no contexto de um diagnóstico de anemia, se um exame de sangue não foi realizado, ou se os resultados não forem conhecidos, o modelo deve ser capaz de informar que não possui essa informação e recomendar este teste porque precisa observar o nível de hematócrito “, explica Adrien Coulet. Isso vai ainda mais longe. Os dois parceiros estão considerando métodos matemáticos para avaliar uma bolsa inteira. “Ir e voltar com uma IA exige garantir que a conversa siga uma ordem lógica e coerência médica, o que é um desafio maior do que avaliar uma resposta isolada “, acrescenta Nicolas Barascud.
Se o treinamento dos algoritmos será baseado em todo um conjunto de dados públicos, conhecimentos médicos e boas práticas, o Doctolib – este é o ponto forte desta colaboração – traz os seus próprios dados. Aqueles, anonimizados, dos prontuários dos pacientes cadastrados na plataforma, mas também as transcrições do auxiliar de consulta. Um material que se destaca dos dados hospitalares ou de reembolso de saúde com os quais as pesquisas, incluindo o Inria, estão acostumadas a trabalhar. “Se um paciente tem diabetes ou hipertensão, essas doenças são acompanhadas a longo prazo pelo médico local, mas são pouco descritas nos registros hospitalares e difíceis de usar, sublinha Adrien Coulet. Com o Doctolib temos o que acontece fora do hospital. “Eles podem ser usados principalmente para avaliar ferramentas de IA treinadas em outros corpora, mas também para refinar esse treinamento, como fazemos para modelos de linguagem. “A partir de dados já observados num paciente, podemos imaginar dizer a um modelo: ‘Para esta pessoa, essa foi a resposta certa’ “, continua o pesquisador.
Nem tudo dependerá de modelos de linguagem, longe disso, mas estas tecnologias abrem perspectivas inegáveis em termos de previsão. Só que, em vez de prever a próxima palavra de uma frase, o algoritmo aprenderia a prever o próximo passo no percurso do cuidado: consulta, hospitalização, tratamento, reação a ela, etc. “A ideia seria ter uma ferramenta que identificasse riscos com base no histórico do paciente, permitindo uma intervenção personalizada “, especifica Nicolas Barascud. Para uso tanto por médicos quanto por pacientes. A medicina preventiva realmente entrou em uma nova era.
Dados de saúde, um assunto delicado
Todos os dados Doctolib utilizados com o Inria permanecem nos servidores da plataforma, anonimizados, estando cada projeto sujeito à autorização da CNIL (Comissão Nacional de Informática e Liberdades). A situação é mais complicada quando o trabalho utiliza corpora de diversas organizações, hospitais, clínicas, em diferentes regiões ou mesmo países. Os dados podem ser centralizados em algum lugar, com todas as questões inerentes de autorização e controle de acesso.
Mas um método, ele próprio objeto de investigação (no Google como no Inria ou na École nationale supérieure), permite trabalhar deixando os dados localmente com os respetivos detentores: a aprendizagem federada. Nesta abordagem, o cálculo realizado sobre um corpus dá um primeiro resultado intermédio. Este último chega ao próximo corpus, com o qual é calculado um novo resultado, e assim sucessivamente em cada conjunto de dados até que o todo seja agregado.