Google Диск распознаёт документы на русском языке
В начале мая Google расширил возможности оптического распознавания документов, загружаемых пользователями на популярный файловый хостинг Google Диск. Теперь распознавать текст из графических изображений можно не только на английском языке, но и на более чем двухстах языках мира, включая русский.
Для пользователя процесс распознавания максимально прост: достаточно загрузить графический файл с документом на Google Диск, и открыть его с помощью текстового редактора, входящего в онлайн-офис Google Документы. Система письменности и язык документа определяются автоматически, при обработке документа сохраняется основное форматирование текста. Полученный текст также индексируется поисковой системой Google.
Система распознаёт текст из файлов изображений JPG, GIF и PNG размером до двух мегабайт, а также из первых десяти страниц документов в формате PDF.
Разработчики Google рассказывают в своём блоге о текущей работе над улучшением распознавания сложных и некачественно сканированных документов и об амбициозных планах создания системы сканирования, работающей со всеми существующими языками мира.