(In Portuguese)
LittleBigData: Reconhecimento de padrões em grandes bases de imagens utilizando pequenos conjuntos de dados anotados
Descrição: A área de reconhecimento de padrões em imagens vêm obtendo diversos avanços nos últimos anos. O desenvolvimento de tecnologias como as abordagens baseadas em aprendizado profundo (deep learning) têm estabelecido o estado da arte em diversas aplicações de Visão Computacional. No entanto, essas abordagens necessitam de grandes conjuntos de amostras para treinamento e isso impossibilita seu uso direto para resolver problemas em áreas mais específicas como medicina, forense digital, agricultura ou biodiversidade. A anotação de amostras nas principais aplicações dessas áreas deve ser feita por usuários especialistas (médicos, peritos, pesquisadores, etc). Esse processo geralmente é custoso e até mesmo inviável em diversas ocasiões. Detecção de câncer, por exemplo, depende do diagnóstico e do registro preciso de diversos pacientes ao longo dos anos para a obtenção de um conjunto de amostras representativo. Em aplicações agrícolas e de biodiversidade é comum a necessidade de deslocar equipes de especialistas em áreas de difícil acesso para anotar adequadamente uma determinada espécie de planta. Desse modo, esse projeto propõe o desenvolvimento de novas abordagens para lidar com o reconhecimento de padrões em aplicações que requerem o processamento de grande conjuntos de imagens mas que possuem restrição com relação à quantidade de amostras disponíveis. A pesquisa focará esforços nas seguintes frentes visando mitigar os problemas do aprendizado supervisionado à partir de poucas amostras em grandes bases de imagens: (1) estudo e desenvolvimento de técnicas para transferência de conhecimento de bases préexistentes como forma de enriquecer o conjunto de amostras inicial; (2) estudo de algoritmos e estruturas de indexação de imagens para garantir escalabilidade das abordagens desenvolvidas; e (3) desenvolvimento de abordagens baseadas em aprendizado ativo para auxiliar usuários especialistas na anotação de amostras relevantes.
2018 - Atual
Financiador(es): Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio financeiro.
MultiMaps: Aprendizado de Representações Profundas para Mapeamento Geográfico em Larga Escala
Descrição: A criação de mapas temáticos utilizando Imagens de Sensoriamento Remoto (ISRs) como fonte de dados geralmente é modelada como um problema de classificação supervisionada. Muitos desafios computacionais estão associados à natureza das ISRs em que pode-se ressaltar: (1) são imagens georreferenciadas, ou seja cada pixel possui uma coordenada geográfica associada; (2) geralmente codificam muito mais que informação no espectro visível (R,G,B), o que exige o desenvolvimento de abordagens específicas para descrever padrões; (3) os dados podem variar quanto à resolução espacial alterando o nível de detalhe dos padrões e; (4) muitas aplicações tendem a exigir análise de dados espaço-temporais, com várias imagens do local de estudo ao longo do tempo. Assim, é muito frequente ter imagens obtidas a partir de diferentes sensores, o que pode melhorar a qualidade dos mapas temáticos gerados, mas exige a criação de técnicas capazes de codificar e combinar adequadamente as diferentes propriedades das imagens. Nesse contexto, o desenvolvimento de técnicas baseadas em aprendizado profundo têm sido revolucionário mas tem uma limitação: geralmente requerem muitas amostras para treinamento. A anotação de pixels na maioria das aplicações de ISRs depende de usuários especialistas, é custosa e inviável em algumas situações. Assim, a dificuldade de criação de grandes conjuntos de dados anotados para classificação supervisionada limita o uso da maioria das abordagens do estado da arte em reconhecimento de padrões por meio de aprendizado supervisionado. Desse modo, este projeto visa tratar o problema de reconhecimento de padrões para criação de mapas temáticos via aprendizado supervisionado em grandes conjuntos de imagens a partir de pequenos conjuntos de dados anotados. A pesquisa focará esforços em três frentes principais: (1) novos métodos para aprendizado de características com foco em propriedades de imagens de sensoriamento remoto; (2) algoritmos para transferência de conhecimento para explorar bases de imagens existentes como ponto de partida para reconhecimento de padrões e reduzir a necessidade de novas amostras anotadas por usuários especialistas; e (3) novas abordagens para aprendizado e fusão de representações a partir de múltiplas resoluções no espaço, tempo e espectro eletromagnético.
2018 - Atual
Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
Projeto GeoControle: Automação da Detecção de Padrões de Irregularidades por meio de Sistemas de Inteligência Artificial
Descrição: Esse projeto visa desenvolver as ferramentas necessárias para o Tribunal de Contas da União do Brasil para a automação da detecção de padrões de irregularidades por meio de Sistemas de Inteligência Artificial em relação com o uso de tecnologias de sensoriamento remoto e geoprocessamento. As atividades do projeto incluem: (1) avaliar as técnicas de inteligência artificial para segmentação, detecção, classificação e identificação de padrões de possíveis irregularidades (não conformidades) presentes em imagens de sensoriamento remoto, indicando para o Tribunal os prós e os contras de cada uma delas, de modo que o TCU e a GIZ possam, fundamentadamente, definir qual será a base tecnológica para atender aos requisitos de desenvolvimento, integrado ao sistema ArcGIS; (2) avaliar o uso de imagens de satélite de baixa resolução, seu potencial e limite de evidenciação de potenciais irregularidades, principalmente no que se refere aos padrões de cobertura vegetal que deem suporte à classificação necessária para atendimento à fiscalização do projeto de regularização fundiária na Amazônia, o Projeto Terra Legal, e à aferição dos dados do Cadastro Ambiental Rural, além da avaliação temporal do desenvolvimento das obras da Ferrovia Nova Transnordestina; (3) avaliar o uso de imagens de alta resolução, seu potencial e limite de evidenciação para detecção e documentação de potenciais irregularidades, a partir de imagens coletadas pela constelação de satélites Plêiades já adquiridas pelo Tribunal; (4) Pesquisar e desenvolver técnicas e metodologias de modo a permitir a automação da detecção de padrões de irregularidades com utilização das imagens de sensoriamento remoto nas atividades de Controle Externo e disponibilizá- las por meio de módulos integrados ao sistema ArcGIS.
2018 - 2019
Financiador(es): Deutsche Gesellschaft für Internationale Zusammenarbeit (GIZ) GmbH
Mapeamento Interativo de Regiões Utilizando Abordagens Multi-Escala
Descrição: Usuários especialistas de diversas aplicações (agricultura, planejamento urbano e ambiental, por exemplo) frequentemente utilizam imagens de sensoriamento remoto para criação de mapas temáticos. Essa tarefa requer a identificação de regiões de interesse, que na prática costuma ser feita manual ou automaticamente. A identificação manual consiste na utilização da imagem como referência visual. Nesse caso, o especialista utiliza alguma ferramenta para "desenhar'' os polígonos correspondentes aos objetos de interesse. As abordagens automáticas consistem no uso de algoritmos de classificação supervisionada para aprender e indicar as classes dos pixels de interesse. A primeira abordagem é demorada suficiente para tornar muitos projetos inviáveis. A segunda abordagem é rápida, mas geralmente requer que o resultado seja bastante refinado para alcançar os níveis de qualidade exigidos para elaboração de mapas temáticos. Assim, o objetivo desse projeto de pesquisa é o desenvolvimento de um arcabouço para classificação interativa de imagens de sensoriamento remoto. O desenvolvimento desse arcabouço envolverá o desenvolvimento de algoritmos para aprendizado de máquina e extração de características em múltiplas escalas de segmentação. As abordagens computacionais propostas deverão contribuir com aplicações associadas a áreas de pesquisa realizadas no Estado de Minas Gerais: (1) reconhecimento de padrões fenológicos com impacto em mudanças climáticas; e (2) classificação de áreas de café utilizando dados de múltiplos sensores..
2014 - 2017
Financiador(es): Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio financeiro.
GeoFusion: Criação Automática de Mapas Temáticos Utilizando Dados de Múltiplos Sensores
Descrição: Sistemas de Informação Geográfica (SIGs) são sistemas automatizados cuja finalidade é armazenar, analisar e manipular dados geográficos. Eles auxiliam a tomada de decisões em diversas questões relacionadas a políticas públicas de monitoramento ambiental e urbano. Além disso, são ferramentas importantes em atividades econômicas de agropecuária e extração mineral. Nesse contexto, Imagens de Sensoriamento Remoto (ISRs) têm sido usadas como uma das mais importantes fonte de dados, principalmente com relação à criação de mapas temáticos. Esse processo é geralmente modelado como um problema de classificação supervisionada em que o sistema precisa aprender os padrões de interesse fornecidos pelo usuário e atribuir uma classe ao restante das regiões da imagem. Muitos desafios estão associados à própria natureza das ISRs em que pode-se ressaltar: (1) são imagens georreferenciadas, ou seja cada pixel possui uma coordenada geográfica associada; (2) geralmente codificam muito mais que informação no espectro visível (R,G,B), o que exige o desenvolvimento de algoritmos específicos para descrever padrões; (3) os dados podem variar quanto à resolução espacial alterando o nível de detalhe dos padrões e; (4) muitas aplicações tendem a exigir análise de dados espaço-temporais, com várias imagens do local de estudo ao longo do tempo. Assim, é muito frequente ter imagens obtidas a partir de diferentes sensores, o que poderia melhorar a qualidade dos mapas temáticos gerados. No entanto, isso exige a criação de técnicas capazes de codificar e combinar adequadamente as diferentes propriedades das imagens. Desse modo, esse projeto propõe o desenvolvimento de técnicas robustas para representação de regiões em imagens de sensoriamento remoto que consigam codificar características extraídas de diferentes fontes de dados, como: (1) descritores espaço-temporais; (2) descritores espectro-espaciais; e (3) descritores baseados no contexto. Pretende-se ainda desenvolver um arcabouço capaz de explorar a diversidade desses diferentes tipos de características para alcançar altos graus de acurácia na criação de mapas temáticos.
2014 - 2017
Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.