Em abril de 2026, a FDA emitiu um pedido de informações sobre um programa-piloto proposto para a otimização, com recurso à IA, de ensaios clínicos em fase inicial. É o tipo de sinal que o setor esperava – um convite formal da Agência para definir como deve ser uma IA fiável e de elevado valor na condução de ensaios.
A CRIO respondeu. E como a nossa perspetiva provém de um ponto de vista invulgar – a camada de tecnologia do site onde os dados de origem são criados –, achamos que vale a pena partilhar o que dissemos.
Todos os sistemas de IA que operam com dados de ensaios clínicos dependem da recolha de dados na fonte. O debate sobre a IA não pode ser dissociado do debate sobre a recolha de dados.
Comece pelos casos de utilização que realmente funcionam
A tentação em qualquer estudo piloto de IA é começar pelas aplicações mais ambiciosas – modelação da escalada da dose, estratificação baseada em biomarcadores, avaliação da equidade ao nível da população. Compreendemos o seu encanto. Mas, na nossa resposta à FDA, defendemos uma sequência diferente.
Os primeiros casos de utilização com maior valor e menor risco estão orientados para os fluxos de trabalho: pré-seleção dos participantes e verificação da elegibilidade, monitorização da qualidade dos dados de origem, deteção e triagem de eventos adversos e vigilância de desvios ao protocolo. Estes casos de utilização:
- Gerar valor mensurável em poucos meses, e não em anos
- Não exigem a validação de modelos específicos para cada doença
- Permitem comparações claras entre o antes e o depois, em relação a valores de referência históricos
- Aplicar os princípios de IA fiável que o projeto-piloto se destina a avaliar: validade, transparência e supervisão humana
Casos de utilização de maior risco, como o aumento da dose, têm o seu lugar no projeto-piloto – mas apenas quando a IA funciona como apoio à tomada de decisões, mantendo-se a avaliação humana. Esta não é uma posição conservadora. É assim que se constrói a base de evidências que, ao longo do tempo, permite alargar a autoridade da IA.
A integridade dos dados na fonte é imprescindível
Este foi o argumento que defendemos com mais veemência, porque é aquele que mais frequentemente é ignorado no debate sobre a IA nos ensaios clínicos.
A CRIO gere a camada de recolha de dados em mais de 2 900 centros de investigação em 33 países. O que observamos repetidamente é que as ferramentas de IA falham – não porque os modelos sejam fracos, mas porque os dados subjacentes em que se baseiam são em papel, estão desatualizados ou foram transcritos em vários sistemas. Nenhum modelo de IA consegue compensar isso.
Um estudo recente da Tufts revelou que uma parte significativa dos dados de origem nos locais de investigação continua a ser registada em papel. É essa a verdadeira limitação à preparação para a IA – e não os modelos.
Informámos a FDA de que o projeto-piloto deveria ser concebido tendo em conta esta interdependência. Um projeto-piloto de IA baseado numa recolha de dados de origem de má qualidade produzirá resultados que subestimam o potencial da IA e sobrestimam a sua taxa de falhas. Assegurar primeiro uma base sólida para a recolha de dados não é um desvio na adoção da IA – é a condição prévia para tal.
Temos dados que comprovam isso. Num caso documentado, a Benchmark Research registou uma redução de 40% nos desvios de protocolo após a implementação da plataforma eSource da CRIO em nove centros – antes mesmo da introdução de qualquer IA. Esse é o ponto de partida a partir do qual a IA pode avançar.
Não limite a participação com base no grau de maturidade em IA
Uma das posições mais contrárias ao senso comum que assumimos: a FDA não deveria exigir um elevado nível de maturidade em IA como condição para a participação no projeto-piloto.
Se o projeto-piloto incluir apenas patrocinadores e centros de investigação que já possuam um elevado nível de sofisticação em IA, os resultados serão interessantes, mas limitados. O setor necessita de dados concretos sobre o desempenho da IA em todo o leque de participantes – incluindo pequenos patrocinadores do setor biotecnológico que realizam estudos com seres humanos pela primeira vez, centros de investigação comunitários e centros médicos universitários.
A via de acesso mais realista para os participantes menos experientes é a IA fornecida pelos fornecedores através das plataformas tecnológicas existentes nos centros de estudos – eSource, CTMS, eConsent –, em vez de cada participante ter de desenvolver ou adquirir capacidades de IA a partir do zero. Esta abordagem apresenta também uma vantagem analítica: quando a base de recolha de dados subjacente é uniforme entre os participantes, as diferenças observadas podem ser atribuídas de forma mais clara ao próprio componente de IA.
Propusemos uma estrutura de participação em níveis: um nível básico para os participantes que utilizam IA fornecida por fornecedores através de plataformas existentes e um nível avançado para aqueles que desenvolvem componentes de IA personalizados, com métricas de avaliação comuns a ambos.
Avalie o que as pessoas realmente fazem, não o que dizem
O último tema que permeia a nossa resposta diz respeito à conceção da avaliação. A confiança, o valor percebido e a escalabilidade prevista, tal como relatados em inquéritos, constituem evidências pouco sólidas. Estão sujeitos a efeitos de novidade, a enviesamentos de desejabilidade social e ao simples facto de que as convicções declaradas das pessoas sobre a IA raramente correspondem ao seu comportamento efetivo.
A prova mais convincente vem da própria plataforma:
- Taxas de rejeição e resultados: quando a IA faz uma sugestão, com que frequência os utilizadores a rejeitam? E quando o fazem, estarão certos?
- Taxas de utilização das funcionalidades: os utilizadores estão a utilizar as funcionalidades de IA ou a ignorá-las?
- Tempo gasto na tarefa: a IA torna os coordenadores mais rápidos ou apenas acrescenta uma etapa à revisão?
- Continuação após a fase piloto: depois de a fase piloto terminar e a novidade passar, os sites continuam a utilizar as ferramentas?
- Concordância entre a fonte e o EDC: os dados introduzidos no EDC são mais precisos quando se recorre à captura assistida por IA?
Também destacámos algo que observámos durante a implementação do AI Study Design Builder da própria CRIO: a calibração da confiança leva semanas ou meses de utilização regular. As medições de confiança com exposição curta — um inquérito na segunda semana — subestimam substancialmente a confiança que surge com a utilização prolongada. O período de medição é importante.
Por que é que isto é importante para além do projeto-piloto
O pedido de informações (RFI) da FDA é um ponto de partida, não uma meta. O projeto-piloto nele descrito irá moldar a forma como as entidades reguladoras, os promotores, as CROs e os centros de ensaio encaram a IA na condução de ensaios clínicos durante a próxima década. Os quadros de referência que vierem a ser estabelecidos — em matéria de integridade dos dados, governação, métricas de avaliação e seleção de participantes — irão perdurar para além de qualquer modelo ou tecnologia específica de IA.
A CRIO continua a ser o que é hoje – a base tecnológica dos centros clínicos sobre a qual assenta a condução de ensaios clínicos impulsionados pela IA. Não somos um algoritmo de seleção de doses nem um motor de descoberta de biomarcadores. Somos o sistema que recolhe os dados em que essas ferramentas se baseiam, em mais de 2 900 centros clínicos, em tempo real e em total conformidade regulamentar.
É por isso que respondemos a este pedido de informações. E é por isso que continuaremos a participar nestas discussões – na SCDM, na SCRS, na DIA, na SCOPE e diretamente com a Agência – onde quer que estejam a ser definidas as regras para a IA na investigação clínica.
Contacte-nos ou subscreva a nossa newsletter sobre IA para saber mais sobre a abordagem da CRIO à IA.