Entrar | Contactos | Dicionário | FLiP.pt | LegiX.pt | Blogue | Loja

Algoritmos de Classificação Estruturada

Objectivos

Implementar e comparar diferentes algoritmos de classificação estruturada em aplicações de processamento de linguagem natural e/ou visão por computador.

Descrição

Nos últimos anos, muitos algoritmos de aprendizagem estatística têm sido propostos com garantias teóricas de sucesso, por exemplo para classificação binária (regressão logística, support vector machines, etc.). Conceptualmente, qualquer problema de classificação pode ser tratado combinando vários classificadores binários. No entanto, em muitas aplicações práticas este procedimento não é adequado, sendo vantajoso tirar partido da estrutura do problema: por exemplo, em classificação sequencial existe uma correlação em posições vizinhas na sequência que merece ser considerada; o mesmo acontece em classificação de pixels de uma imagem, onde a distribuição de classes tende a ser suave. Ambos os problemas podem ser resolvidos representando a estrutura como um modelo gráfico e usando algoritmos de classificação estruturada como conditional random fields ou SVMs estruturadas. Neste projecto pretende-se aplicar este tipo de algoritmos a problemas de processamento de linguagem natural escrita (por exemplo, shallow parsing, reconhecimento de entidades, etc.) e/ou de reconhecimento de padrões em imagens (por exemplo, discernir entre objectos naturais ou artificiais). Como se tratam de ferramentas muito gerais, é dado mais ênfase ao aspecto teórico e algorítmico do que a aplicação em si (em muitas destas aplicações já existem dados pré-processados pelo que se prevê que a maior parte do tempo seja dedicada a estudar e implementar os algoritmos).

Requisitos

Boa formação base em probabilidades e estatística e álgebra linear.
Experiência em programação (C/C++, Java e/ou MatLab).

Resultado esperado

Implementação e análise de desempenho de algoritmos de classificação estruturada.

Referências

J. Lafferty, Andrew McCallum and Fernando Pereira. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data.

B. Taskar, C. Guestrin and D. Koller. Max-Margin Markov Networks. Neural Information Processing Systems Conference (NIPS03), Vancouver, Canada, December 2003

Links

http://www.cnts.ua.ac.be/conll2000/chunking/
 

 
Sistema de Recomendação
Análise de Sentimentos
Sumarização de notícias
Algoritmos de Classificação Estruturada

Instituto Superior Técnico


Priberam.pt