Артур Скальский

© Би-Би-Си

ИнтернетМир

2725

19.08.2008, 15:04

Программы против спама помогут "отцифровать" книги

Компьютерные программы, защищающие от спама, сделали возможным с большей точностью перевести в электронную форму старинные книги и другие письменные источники.

Получить доступ ко многим сайтам можно лишь зарегистрировавшись на них, предварительно напечатав в специальном окошке набор символов, представленных в виде причудливой картинки. Владельцы интернет-ресурсов идут на это для противодействия натиску спам-сообщений.

Сейчас многие сайты вместо невнятной абракадабры используют для этих целей тексты из старинных письменных источников, которые были отсканированы и но не распознаны.

Куски текста, которые программы распознавания текста не осилили, как раз и предлагается расшифровать интернет-пользователям.

С учетом того, что около 100 млн. пользователей в день доказывают таким образом, что они не роботы, получается довольно внушительная армия потенциальных дешифровальщиков.

Объем нечитаемых слов в некоторых старинных документах может доходить до 20% из-за пожелтевшей бумаги или выцветших чернил.

Предельная точность

Специалисты из американского университета Карнеги-Меллон разработали систему под названием Recaptcha, которая собирает фрагменты сканированного текста, не поддавшиеся компьютерной программе, и затем рассылает их сайтам, которые подписаны на эту услугу.

Вместе с буквами, которые компьютер не узнал после сканирования, высылается и слово, уже внесенное в систему. Правильно распознав второе слово, пользователь получает доступ к сайту, а расшифровка первого слова дополняет базу данных, после того, как будет получено несколько подтверждающих ответов.

В материале, опубликованном в журнале Science, говорится, что такой подход позволяет добиться почти стопроцентной точности, что превосходит требования архивариусов.

В настоящее время около 40 тыс. сайтов предлагают своим пользователям решить такие простенькие задачки, и получают в день около 4 млн. ответов.

В прошлом году таким образом удалось расшифровать 440 млн. слов и перевести в цифровую форму весь архив газеты New York Times с 1908 года.

Артур Скальский

© Би-Би-Си

ИнтернетМир

2725

19.08.2008, 15:04

URL: https://babr24.net/?ADE=47073

Bytes: 2046 / 2039

Версия для печати

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Последние новости

20.08 00:37
Инсайд. "Таких бы как они не подпускать к Байкалу"

19.08 20:41
В Монголии создали рабочую группу для повышения зарплаты учителей

19.08 19:56
В Новосибирской области арестовали замначальника Главрыбвода

19.08 19:20
В Новосибирске у дома разрушается фасад. Дело на контроле Бастрыкина

19.08 19:08
Молодой парень устроил пожар в гостинице Улан-Удэ с ущербом на миллион рублей

19.08 18:46
В Бурятии забеременела 12-летняя девочка. Возбуждено уголовное дело об изнасиловании

19.08 18:05
В Новосибирске бывший начальник колонии получил условный срок за взятки

19.08 17:15
В Красноярском крае запретили бурый и каменный уголь. Нарушителям грозят штрафы до 500 тысяч рублей

19.08 17:12
В Ачинске семилетний мальчик перевел мошенникам более двух миллионов рублей с карты бабушки

19.08 17:10
1,3 миллиона перевела мошенникам терапевт из Иркутска за «смену домофона»

Лица Сибири

Головков Михаил

Безматерных Павел

Леви Кирилл

Минина Ирита

Фефелов Игорь

Любенков Георгий

Алтарева Валерия

Будуев Николай

Матхеев Василий

Варфоломеев Александр Михайлович