Компания
ABBYY, ведущий мировой разработчик программного обеспечения и поставщик услуг в
области лингвистики, распознавания документов и ввода данных, объявляет о
результатах своего участия в международном проекте IMPACT (IMProving ACcess to Text, «улучшая доступ к тексту») – масштабном
мероприятии, инициированном Европейской комиссией для преобразования
европейского печатного наследия в цифровые ресурсы. ABBYY участвует в проекте с
2008 года, предоставляя программное обеспечение для оптического распознавания
символов (Optical Character Recognition – OCR). За 3 года интенсивной работы
компания получила возможность воплотить накопленный опыт в своих продуктах,
реализуя в них передовые технологии распознавания текста.
Консорциум
IMPACT объединяет 26 организаций, среди которых национальные и региональные
европейские библиотеки, научно-исследовательские институты и технологические
партнеры. В ходе проекта все участники получили возможность делиться друг с
другом своими знаниями и опытом, а ИТ-компании – разрабатывать инновационные
средства для улучшения технологий оптического распознавания символов.
Эти
решения помогают оцифровывать исторические тексты, напечатанные до XX века.
Важно, что электронные копии документов не подвержены старению и, кроме того,
могут быть одновременно доступны для миллионов исследователей и читателей в
любой точке мира, где есть Интернет. Уже к концу 2011 года ожидаются
значительные результаты в открытии доступа к полученным цифровым материалам.
ABBYY
играет в проекте важную роль – программное обеспечение компании используется
для оптического распознавания текста документов, набранных старинными шрифтами.
В процессе работы с важными историческими материалами из коллекции ведущих
европейских библиотек специалисты компании значительно улучшили технологии
предварительной обработки и анализа структуры документов. Это позволило добиться
более точного распознавания символов.
Специалисты
ABBYY в тесном сотрудничестве с участниками других организаций решают технологические задачи, характерные
для таких крупномасштабных проектов, как оцифровка библиотечных фондов.
Благодаря этому взаимодействию национальные библиотеки получают возможность
преобразовывать оригиналы старинных документов в электронный вид, осуществлять
в цифровых копиях поиск по тексту, а также создавать на различных языках мира
собственные электронные словари.
«Раньше нам не
всегда удавалось качественно распознать текст или преобразовать данные в формат
XML, особенно когда приходилось работать со старинными книгами, журналами и
газетами,
– отмечает Али Конте (Aly Conteh),
член Исполнительного совета проекта IMPACT, руководитель программы Британской
национальной библиотеки по преобразованию печатных текстов в цифровой формат. –
Участие в IMPACT открыло нам доступ к
передовым технологиям распознавания, в том числе, предоставляемым компанией
ABBYY. Эти решения позволили нам и другим участникам проекта эффективно
обрабатывать документы, качество которых ранее оставляло желать лучшего».
«Доступность в
Украине накопленного в рамках IMPACT технологического опыта – это шанс для
проектов по сохранению нашего культурного наследия. Это благородная цель и мы
будем рады принять участие в ее достижении», – подчеркнул Михаил Бейрак, руководитель отдела
корпоративных проектов ABBYY Украина.
ABBYY
имеет опыт участия и в других успешных европейских научно-исследовательских
проектах по масштабному преобразованию текстов в цифровой формат. В рамках
проекта METAe компания
разработала FineReader XIX – программу, предназначенную для распознавания
готического шрифта Fraktur, часто встречающегося в текстах 1800-1938-х годов.
Также компания участвует в проекте Digitisation-on-Demand, цель которого
– оцифровка миллионов книг, чтобы сделать их доступными в электронном формате.
Кроме того, немецкий институт
Фраунгофера
использовал ABBYY FineReader SDK с поддержкой старинных шрифтов для оцифровки
архива газеты Neue Z?rcher Zeitung.
Благодаря участию в
проекте IMPACT ABBYY существенно усовершенствовала свои технологии. Многие
новые разработки в области
распознавания специализированных текстов и документов уже нашли применение в продуктах ABBYY
FineReader Engine
и ABBYY
Recognition Server
3.0. Обновленные
решения компании теперь доступны для использования организациями во всем мире.
Продукты
и технологии ABBYY также применяются и в крупнейших библиотеках России: в
Российской государственной библиотеке (РГБ) оцифрован архив Высшей
аттестационной комиссии Минобразования РФ; в Государственной публичной
научно-технической библиотеке России (ГПНТБ России) с помощью ABBYY стал
электронным каталог карточек. А в научной педагогической библиотеке им. К.Д.
Ушинского (НПБ им. К. Д. Ушинского), крупнейшей отраслевой библиотеки России по
педагогике и психологии, технологии ABBYY помогли оцифровать авторефераты и
реализовать полнотекстовый поиск по ним.
Более подробную
информацию о проекте IMPACT смотрите на www.impact-project.eu. Подробнее о
компании ABBYY и ее технологиях можно узнать на www.Abbyy.ua