Компьютерная система Fonopr

Для обработки фонетической информации, получаемой на первичных носителях информации в недавнем прошлом применялся ручной или полуручной подход. Смысл этого подхода заключался в разбиении аудиозаписи на смысловые фрагменты с последующей их расшифровкой. Даже с применением компьютерной техники для хранения записей и их расшифровки, обработка полученной информации является трудным процессом в связи с невозможностью хранить и создавать логические связи как между фрагментами записи, так и фрагментами расшифровки или фонетической записи.

Автоматизировать этот процесс может позволить применение специальных программных средств, ориентированных специально для использования как профессионалами, так и неподготовленными людьми владеющими компьютерной техникой.

Для удовлетворения этой информационной потребности разрабатывается программный комплекс FonOpr, позволяющий выполнять как первичную обработку данных (загрузку аудиоданных, их нарезку и описание), так и выполнять их дальнейшую обработку связанную сегментированием записей, выделением логических речевых слоёв, составлением иерархии фрагментов с их последующим описанием и фонетической и семантической расшифровкой.

Основными информационными единицами в информационной системе являются понятия карточка, секция и слой. Под термином карточка понимается совокупность из аудиозаписи и её описательной информации. Карточки в системе могут выстраиваться в иерархическом порядке. Термин секция обозначает фрагмент аудиозаписи соответствующий какой-то её части, например абзацу, предложению, слову и т.п., и вспомогательной и описательной информации. Информационная система позволяет так же организовывать секции в виде иерархической структуры. Термин слой представляет из себя совокупность секций объединенных вместе по какому либо критерию. Каждая карточка имеет в своем составе хотя бы один слой («по умолчанию»).

Разрабатываемая информационная система условно состоит из трёх основных функциональных компонентов:

  1. Модуль обработки аудиоданных ─ набор инструментальных средств, предназначенных для ввода, хранения, воспроизведения, сохранения и нарезки звуковых данных, помимо этого данный модуль включает средства для первичного описания и классификации данных;
  2. Модуль секционирования ─ набор средств для секционирования аудиоданных, включает в себя инструменты для обозначения границ секций, их редактирования, их текстового и фонетического описания, их фильтрации и сортировки секций информации, а также для управления слоями;
  3. Модуль обработки ─ набор средств, предназначенных для поиска, фильтрации и анализа данных, полученных как в ходе первичного описания, так и в результате последующего сегментирования исходной информации.

Использование того или иного набора инструментов допустимо на любом этапе эксплуатации программы и не требует последовательного использования, но учитывая, что для обработки записи требуется, как минимум, её загрузить, то обычным является следующая последовательность действий её использования:

Загрузка записи в карточку информационной системы.

  1. Описание записи.
  2. Разбиение записи на секции и подсекции.
  3. Описание секций и подсекций.
  4. Выделение секции в отдельную карточку при необходимости.
  5. Поиск и обработка информации в информационной системе.


В данном алгоритме возможен переход к любому пункту из любого другого.

Отдельным компонентом разрабатываемой информационной системы является база данных (БД), предназначенная для хранения как первичных данных, так и данных полученных в результате постобработки. Отдельной особенностью выбранного формата представления данных является иерархическое представление сегментов данных и карточек аудиозаписей. База данных на текуций момент включает в себя пять таблиц:

  1. Audiorecords ─ таблица предназначенная для хранения общей информации об аудиозаписи, как то: имя файла записи (filename), описание (description), название записи (name), формат аудиозаписи (audio_type), колицество редактирований (edit_count), а также служебные поля id и parent_id, являющиеся идентификатором текущей записи и записи из которой эта запись выделена (если такой факт имел место) соответственно.
  2. Sections ─ таблица предназначенная для хранения секций каждой записи. Включает в себя информацию о времени начала секции в секундах (start_time), времени окончания секции (section_stop), типе секции (sec_type), посимвольной расшифровке секции (char_decoding), фонетической расшифровке секции (phon_decoding), описание (description), слой (layer), а также некоторую служебную информацию предназначенную для управлением режимами и порядком отображения секции в информационной системе.
  3. Layers ─ таблица предназначенная для хранения списка слоёв каждой аудиозаписи. Включает в себя информацию о названии слоя (name), принадлежности слоя той или иной записи (rind).
  4. Markers ─ таблица предназначенная для хранения списка маркеров, применяемых для разметки записи на секции.
  5. Section_type ─ таблица содержащую информацию о типах секций.

Интерфейс программы представляет совокупность окон, позволяющих манипулировать данными. При запуске программы пользователю предлагается создать новую карточку или продолжить обработку существующей.

Это окно позволяет создавать, удалять и открывать карточки. После выбора какой либо карточки или создания новой перед пользователем открывается окно обработки аудиозаписи.

Данное окно условно можно разбить на пять областей. В верхней части окна находится панель с осциллограммой аудиозаписи, графическими отображениями секций, маркерами и временной сеткой. Во время воспроизведения записи здесь же отображается индикатор текущей позиции воспроизведения.

Необходимо добавить, что информационная система FonOpr написана на языке Java, и использует в качестве СУБД Firebird 2.1. Всё это делает её кросплатформенным программным продуктом и позволяет использовать её под управлением любой современной операционной системы.

0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.