Use este identificador para citar ou linkar para este item: http://repositorio.ufes.br/handle/10/9556
Título: Estudo e comparação de técnicas de segmentação de textos em imagens
Autor(es): Silva, Bruno Légora Souza da
Orientador: Ciarelli, Patrick Marques
Data do documento: 8-Dez-2016
Editor: Universidade Federal do Espírito Santo
Resumo: Localização de texto em imagens do mundo real é um problema muito abordado na atualidade, já que pode ser empregado em diversas aplicações, como geolocalização, indexação de imagens, identificação de produtos através de seus rótulos e auxílio aos deficientes visuais, melhorando a qualidade de vida destes. Atualmente, existem diversas pesquisas nesta área, além de uma competição realizada na International Conference of Document Analysis and Recognition para acompanhar os avanços destas, o que mostra relevância da área. Este trabalho apresenta técnicas de segmentação de texto em imagens do mundo real, onde texto ocorre de diversas formas, orientações e tamanhos. Tais técnicas são baseadas em análise de componentes conectados, utilizando detecção de bordas ou técnicas como as Maximally Stable Extremal Regions ou a técnica FASText, que encontra keypoints baseado no detector FAST, baseadas em janelas deslizantes ou a combinação destas duas abordagens. Uma comparação experimental de três diferentes técnicas de segmentação de texto é feita. Estas possuem um custo computacional reduzido, de modo que não causem um grande impacto no custo computacional de um sistema que as usem. Para esta comparação, três bases de dados são utilizadas: as duas divisões da base de dados da competição ICDAR 2013 e a base KAIST Scene Text, analisando métricas como área de texto extraída, tempo de processamento, número de caracteres sem segmentação e a imprecisão do detector, definida como a razão entre o número de segmentações e a quantidade de caracteres presentes na base de dados. Os resultados obtidos nas bases mostraram que todas as técnicas analisadas obtiveram uma boa segmentação nas bases de dados, quando as imagens apresentavam caracteres bem definidos, sem problemas de iluminação, oclusão ou caracteres muito pequenos. Em imagens que apresentam estes últimos, as técnicas analisadas obtiveram seu desempenho prejudicado.
Text localization in real world images is a problem which has received significant attention in the present days, since it can be used in various applications, such as geolocation, indexing of images, identification of products through their labels and assistance to the visually impaired, improving their quality of life. Currently, there are several researches in this area, where a competition held in the International Conference of Document Analysis and Recognition follows the progress of these researches, and this highlights the relevance of this area. This work presents some techniques of text segmentation in real world images, where text occurs in several forms, orientations and sizes. Such techniques are based on connected component analysis, using edge detection, techniques such as Maximally Stable Extremal Regions, the FASText technique that finds keypoints based on the FAST detector, techniques based on sliding windows or the combination of these two approaches. An experimental comparison of three different text segmentation techniques is done. These have a reduced computational cost, so that they do not have a major impact on the computational cost of a system that uses them. For this comparison, three databases are used: the two divisions of the ICDAR 2013 competition database and the KAIST Scene Text database, analyzing metrics such as extracted text area, processing time, number of characters without segmentation and the imprecision of the detector, defined as the ratio of the number of targets to the number of characters in the database. The results obtained in the databases have shown that all the analyzed techniques obtained a good segmentation ratio in the databases, when the images presented well defined characters, without problems of illumination, occlusion or very small characters. In the images that present the latter, the analyzed techniques obtained impared performances.
URI: http://repositorio.ufes.br/handle/10/9556
Aparece nas coleções:PPGEE - Dissertações de mestrado

Arquivos associados a este item:
Arquivo TamanhoFormato 
tese_10504_Dissertacao_Mestrado_Bruno_Legora.pdf42.09 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.