Google разработал систему распознавания текста

Рубрика: Новости софта 13 Авг 2010

На официальном блоге Google красуется интересная новость: компания разработала собственную систему оптического распознавания текста, что позволяет поисковой системе различать текст на отсканированных изображениях. Так, поисковику вполне по силам распознать текст на PDF-изображениях, но, к сожалению, о дальнейших планах и намерениях ничего не известно.

PDF-файлы уже начали индексироваться системой. Наиболее сложным видится поиск по старым отсканированным документам с ухудшенной читабельностью – например, на документах, загрязненных следами от чашек с кофе, или которые обильно помечены пометками карандашом «от руки». Кроме того, компания сообщила о намерениях по размещению в Сети отсканированных версий старых газет и журналов, которые будут помещаться в новостной архив и предлагаться пользователю в качестве ответов на поисковые запросы.

Это уже не первые попытки расширения функциональности поисковой системы. Напомним, что раньше Гугл экспериментировал с сервисом Google Audio Indexing, который был призван распознавать звуковой ряд в видеоклипах. Звук конвертировался в текст и индексировался поисковой системой.

Посмотрите еще:

Купить натяжные потолки цены на нашем сайте

Информация купить натяжные потолки цены на нашем сайте.

ledi-potolok.com

Ваш отзыв

Последняя версия
Скриншот
Обратная связь
- Загрузка...

Ссылки

Официальный сайт программы
Оригами - поделки из бумаги

Unlocker

Программа для удаления файлов