Documentos digitalizados serão indexados pelo Google

quarta-feira, 5 de novembro de 2008

O Google começará a incluir documentos digitalizados em seus resultados de pesquisa.

Os arquivos digitalizados (os famosos arquivos em PDF) não possuem dados em texto que permitam que os robôs do Google leiam o texto e o indexem. Para poder incluir esse tipo de documento o Google estará usando uma tecnologia de Reconhecimento Óptico de Caracteres. Essa tecnologia, chamada de OCR, converterá os documentos digitalizado em textos.