Google Диск распознаёт документы на русском языке

В начале мая Google расширил возможности оптического распознавания документов, загружаемых пользователями на популярный файловый хостинг Google Диск. Теперь распознавать текст из графических изображений можно не только на английском языке, но и на более чем двухстах языках мира, включая русский.

Распознавание текста на русском языке с дореволюционной орфографией.

Для пользователя процесс распознавания максимально прост: достаточно загрузить графический файл с документом на Google Диск, и открыть его с помощью текстового редактора, входящего в онлайн-офис Google Документы. Система письменности и язык документа определяются автоматически, при обработке документа сохраняется основное форматирование текста. Полученный текст также индексируется поисковой системой Google.

Система распознаёт текст из файлов изображений JPG, GIF и PNG размером до двух мегабайт, а также из первых десяти страниц документов в формате PDF.

Разработчики Google рассказывают в своём блоге о текущей работе над улучшением распознавания сложных и некачественно сканированных документов и об амбициозных планах создания системы сканирования, работающей со всеми существующими языками мира.

URL: https://babr24.com/?ADE=135711

Bytes: 1473 / 1180

Версия для печати

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
newsbabr@gmail.com