30 de nov de 2010

Softwares para tratamento de dados em Línguas de Sinais

De volta à publicação dos trabalhos que foram apresentados no CELSUL 2010, hoje quero mostrar o que foi apresentado pela equipe da UFSC sobre softwares para identificação e tradução de línguas de sinais. No congresso, conversei com a Ms. Janine Soares de Oliveira (já havíamos divulgado a dissertação de mestrado dela, a respeito de ed. matemática para surdos aqui), a respeito dos trabalhos, e os achei muito interessantes! 
Janine Soares de Oliveira, com os
pôsteres dos trabalhos
Um dos trabalhos intitula-se "Desenvolvimento de software para Identificação de Sinais na transcrição de vídeos em Libras" e foi apresentado como pôster. Confira o resumo:

Janine Soares de Oliveira (janinemat@gmail.com) – UFSC
Ronice Müller de Quadros – UFSC; Ramon Dutra Miranda – UFSC; Rundesth Sabóia Nobre – UFSC
Desenvolvimento de software para Identificação de Sinais na transcrição de vídeos em Libras
A pesquisa em Aquisição da Língua de Brasileira de Sinais – Libras – requer o tratamento e análise de dados em vídeos. O Grupo de Pesquisa em Aquisição da Língua de Sinais Brasileira da Universidade Federal de Santa Catarina está constituindo um banco de dados com transcrições de vídeos em Libras. Todavia, dadas as especificidades dos dados, observou-se a necessidade de desenvolver um procedimento eficaz para que pesquisadores possam localizar corretamente os sinais. Adotou-se, a padronização nas glosas utilizadas na transcrição, isto é, uma correspondência de um pra um entre sinal e glosa que o identifica em português. O volume de dados revelou ainda a necessidade de criar um sistema de busca específico para estas glosas que identificam os sinais. O software para Identificação de Sinais deverá ser utilizado na composição do corpus da Libras, tendo como objetivos: reunir, organizar e permitir a busca dos sinais e/ou das glosas. A Identificação de Sinais funciona como um sistema de busca que tem como filtros parâmetros da Libras, tais como, configurações de mãos e localização do sinal, além da glosa em português. O sistema, desenvolvido em plataforma php com acesso via web, está em fase de alimentação e por enquanto é acessado somente pelos usuários cadastrados no grupo de pesquisa, mas em breve estará disponível online, sem restrição de acessos para visualização e busca, e os usuários poderão ainda enviar sugestões de sinais com vídeo para os administradores através de ferramenta disponibilizada no próprio sistema.

Software Identificador de Sinais (UFSC)

Não vejo a hora em que o sistema estiver pronto e disponível on-line para todos, não será muito legal? 
Outro trabalho apresentado pela mesma equipe fala do uso de uma ferramenta de anotação multimídia, já conhecida, o ELAN. Veja o resumo do trabalho:

Janine Soares de Oliveira (janinemat@gmail.com) – UFSC
Ronice Müller de Quadros–UFSC; Franz Kafka Porto Domingos–UFSC; Karina Elis Christmann. –UFSC
O software ELAN como ferramenta para transcrição, organização de dados e pesquisa em Aquisição da Língua de Sinais 
Devido aos avanços tecnológicos, pesquisadores da área de linguística têm a possibilidade de reunir e observar um número cada vez maior de dados. Os bancos de dados das línguas orais já se encontram consideravelmente desenvolvidos e em constante expansão, principalmente no que se refere ao registro escrito destas línguas. Com relação às línguas de sinais, em particular, a Língua Brasileira de Sinais – Libras – tem-se como barreiras a carência de materiais e a ausência de ferramentas de busca que atendam às
especificidades da modalidade visual-espacial. Assim, o trabalho do Grupo de Pesquisa em Aquisição da Língua de Sinais Brasileira da Universidade Federal de Santa Catarina está constituindo um banco de dados com transcrições de vídeos em Libras. Esta tarefa é realizada utilizando como ferramenta o software ELAN, uma ferramenta de anotação multimídia desenvolvida pelo Instituto de Psicolinguística Max Planck. O software permite a criação, edição, visualização e busca de anotações através de dados de vídeo e áudio. Além de apresentar o tempo associado aos trechos transcritos permite um número ilimitado de registros, através das trilhas de anotações criadas pelos pesquisadores em função dos objetivos da pesquisa. No caso das línguas de sinais, podem ser visualizados: vídeos em Libras, glosas, traduções das glosas, marcas não-manuais, sons associados aos sinais, contexto, comentários, entre outros. Cada anotação selecionada permite a localização do vídeo e o trecho é reproduzido de maneira sincronizada. Esta ferramenta constitui-se em um grande avanço na investigação da Aquisição da Língua de Sinais.

Eu e Janine no CELSUL


Para quem quiser saber mais sobre o ELAN pode acessar o site do projeto: http://www.lat-mpi.eu/tools/elan/.
Outros softwares citados em trabalhos acadêmicos: ANVIL (Annotation of vídeo and language data)CLAN (Computerized Language Analysis)SIGNSTREAM e TRANSAMA. Em outro post, já havíamos falado um pouco sobre esses softwares, com as devidas referências a alguns trabalhos que o citam.

Obrigada pela atenção, Janine, e parabéns a toda a equipe pelos excelentes trabalhos!

Um comentário:

Janine Oliveira disse...

Oi, Vanessa!
Eu que agradeço pela divulgação do nosso trabalho. Há muito tempo acompanho seu blog e foi uma surpresa e uma honra quando descobri minha dissertação divulgada aqui. O Glossário já avançou desde a última vez que conversarmos. :) Pode deixar que assim que tivermos a primeira versão online você será avisada. Obrigada pelo comprometimento com a comunidade surda e sua simpatia. Bj. Janine