Основные идеи, лежащие в основе курса

Основные идеи, лежащие в основе курса

...

На современном этапе развития самой разнообразной человеческой деятельности характерно нарастание и даже доминирование неформализуемых или плохо формализуемых проблем, алгоритмического решения которых не существует или не может быть реализовано на базе существующих программно-аппаратных средств. Более того, при попытках реализации некоторых проблем часто приходится сталкиваться с необходимостью взаимодействия с пользователями, не являющимися профессиональными программистами или математиками. Приходится также организовывать их взаимодействие с самого различного рода системами на понятном им языке. Следовательно, нужно знать самые общие закономерности обработки нечисловой информации и организации знаний.
Исходя из этих соображений построен состав учебного материала и цели курса. Они определяются двумя описанными выше факторами – наличием пользователей, не являющимися профессионалами в информатике и других формальных науках, и необходимостью для них тем не менее решать плохо формализуемые проблемы, корректно выражая их решение в виде различного рода знаковых структур.

Практическая деятельность человека чаще всего выражается в его действиях над самыми разными объектами. В процессе интеграции такой деятельности ее принято описывать бизнес процессами, состоящими из бизнес действий над бизнес объектами.
Как правило, проектирование ИС происходит при той или иной форме взаимодействия заказчика, знающего предметную область (ПО), в которой протекает деятельность, которую требуется интегрировать в ИС, и постановщиком (аналитиком). Интерфейс между ними реализуется сначала на словесном уровне и начинается с выяснения набора объектов и действий над ними, которые и составляют эту ПО. Как правило, желательным результатом этого первого этапа создания ИС является процессная схема, представленная в графическом виде в определенной нотации. Существуют программные системы, позволяющие проверить такую нотацию на непротиворечивость и соответствие стандартам (ARIS, BPwin и др.) [1, 4, 5, 6].

На втором этапе приходится расщеплять составленную ранее процессную схему на рутинную и творческую составляющие. Здесь реализуется так называемый принцип рутинного подкрепления творческих процессов принятия решений - процедура проектирования сводится к выделению автоматизируемых бизнес процессов, которые могли бы протекать без вмешательства человека и последующей инкорпорации их в построенную процессную схему, соединение их с творческими, неформализуемыми составляющими ИС. Далее, на третьем этапе, каждый из объектов, определяющих рутинные составляющие, подвергается дальнейшей формализации с целью записи их в БД – т.е. с целью описания их как частей полностью автоматизированного бизнес процесса [1].
В процессе выполнения этих трех этапов ставшей уже классической схемы приходится сталкиваться в той или иной форме с проблемами интеграции в единую ИС совершенно разнородных бизнес объектов. Наиболее проблемным является третий этап – построение формальной модели программно реализованного бизнес процесса, выполняемого без вмешательства человека. В сфере финансовых услуг, где такие процессы используются в наибольшей степени, их называют процессами класса Straight Through Processing (STP) или по-русски это называется «сквозная обработка данных» [4,5].
Следовательно, для того, чтобы спроектировать STP бизнес процесс нужно решить следующие проблемы [3,6,7]:
1. Интегрировать в него необходимые бизнес объекты (БО) – Datasource Integration. Дело в том, что они могут иметь самый разнообразный формат и природу. Это могут быть БД разных систем, сообщения, файлы и многое другое, содержащие, в свою очередь таблицы, документы, транзакции и т.д.
2. Синхронизовать бизнес действия над БО – Event Integration. Действительно, бизнес действия, входящие в состав данного STP бизнес процесса протекают в определенных временных интервалах и находятся зачастую в сложных временных зависимостях. Начало, конец, особые ситуации в процессе выполнения любого действия обозначаются как асинхронные события (business events). Для описания этого существуют уже XML-подобные языки (например, PSL – Process Specification Language).
3. Решить проблему именования. – Vocabulary Integration. Здесь речь идет о компоненте, пока отсутствующей на рынке интеграционных платформ [6,7]. Имется в виду не только управление справочно-нормативной информацией. Одни и те же единицы интеграции разных уровней (поля БД и многое другое) могут иметь разные имена и наоборот – у разных единиц одинаковые имена, в силу того, что они могли создаваться в разное время разными людьми.
Конечно, эти проблемы присутствуют в разной степени и в разном объеме при проектировании ИС. Однако, успешные и достаточно общие подходы к решению этих проблем безусловно повышает скорость и качество проектирования, а также различные параметры производительности уже готовых ИС. Также может быть много подходов к решению этих проблем – в зависимости от многих причин. Так, разработаны форматы метаданных для единообразного описания любых источников данных (CWM), существует технология мэппинга этих метаданных в онтологию, отражающую самые существенные свойства интегрируемых частей. Резко повышает гибкость и опреативность процедур мэппинга технология интеллектуальных многоагентных систем, приобретающую все большую популярность в ИТ [3,4,5,6,7].
Все это в целом позволяет говорить о возможности реализации когнитивной структуры – метаонтологии, представляющей собой динамический образ работающего без вмешательства человека бизнес процесса, формирующейся методом мэппинга из интегрируемых источников данных (бизнес объектов) при помощи технологии интеллектуальных агентов как практически реализуемой в разных формах информационной технологии интеграции разнородных бизнес объектов и бизнес действий в STP бизнес процесс. При необходимости такое онтологическое описание БП может быть преобразовано в более удобные для обработки XML формы (XPDL, BPML, BPEL, RDF/T) [2,5,7] .

...

2 - повторение с развитием

...

На современном этапе развития научно-технического деятельности характерно нарастание и даже доминирование неформализуемых или плохо формализуемых проблем, алгоритмического решения которых не существует или не может быть реализовано на базе существующих программно-аппаратных средств. Более того, при попытках реализации некоторых проблем часто приходится сталкиваться с необходимостью взаимодействия с пользователями, не являющимися профессиональными программистами или математиками. Приходится также организовывать их взаимодействие с самого различного рода системами на понятном им языке. Следовательно, нужно знать самые общие закономерности обработки нечисловой информации и организации знаний. Исходя из этих соображений построен состав учебного материала и цели двух семестровых курсов – «Обработка нечисловой информации» и «Управление знаниями». Они определяются двумя описанными выше факторами – наличием пользователей, не являющимися профессионалами в информатике, и необходимостью решать плохо формализуемые проблемы, корректно выражая их решение в виде различного рода знаковых когнитивных структур.

Настоящее пособие написано по материалам двух семестровых спецкурсов, которые читаются в МФТИ с 1999 года. Эти спецкурсы также являются курсами по выбору кафедры Информатики МФТИ. В эти курсы входят достаточно сложные понятия из разных наук, которые необходимо освоить для успешного построения эффективных информационных систем, удовлетворяющим сформулированным выше принципам. Поэтому изложение, как правило, преследует цель объяснить эти понятия максимально просто, не вдаваясь в ненужные непосвященному читателю подробности. По этой же причине материал пособия содержит достаточно живые примеры, которые приводятся также для того, чтобы облегчить читателю понимание теоретической части курсов.
Тем не менее, в состав курсов входят также лабораторные работы, помогающие на практике освоить излагаемые теоретические основы. Так, лабораторная работа по теории грамматического разбора предложения, построенная на базе программы SENAN, написанной на языке пролог, позволяет студенту самостоятельно сконструировать свою программу грамматического разбора предложения на естественном языке (английском, русском), реализовав и проанализировав простейший диалог с пользователем на естественном языке.. Другая лабораторная работа, построенная на базе прологовской программы GEOBASE, реализует не только интерфейс на естественном языке с самостоятельно построенной базой знаний по любой предметной области, но и обрабатывать сформулированные на выбранном языке информационные запросы. В состав курсов входят также лабораторные работы по построению экспертных систем, описанию знаний на языке высокого уровня, а также самостоятельное описание простейших структур, описывающих знания - онтологий. Завершает курс лабораторная работа по бизнес моделированию.

Основной текст курса - см. на этом сайте

...

E-mail: rykov2000@mail.ru