.RU

8. Компьютерное восприятие - Компьютерной революции

8. Компьютерное восприятие:

философский

взгляд



Задача представления знаний в компьютерных системах решается на трех уровнях. Первый — технический: для реализации сложных программ представления знаний требуются аппараты с чрезвычайно сложной функциональной архитектурой, большим быстродействием, обеспечивающим параллельные вычисления, гарантирующие протекание процесса репрезентации в режиме реального времени, а также с мощными запоминающими устройствами. Второй уровень— программный. Его назначение —обеспечить создание программ, написанных в основном на языках семейства ЛИСП, обеспечивающих выполнение всех алгоритмов и решение всех вычислительных функций, необходимых для представления знаний. Наконец, третий уровень—концептуальный. С философской точки зрения он наиболее важен. Здесь вырабатываются основные теоретические концепции и схемы, образующие методологическое основание программ ИИ. К ним относятся понятия «фрейм», «сценарий», «скетч», «семантическая сеть», «семантический узел» и другие компоненты, способствующие доведению идеологии ИИ до уровня программных решений.

Эти же уровни прослеживаются при обсуждении проблемы возникновения знаний в процессе переработки первообразных или примитивных элементарных Данных. В эпистемическом плане особенно интересно

195

понять, как компьютер распознает образы, или, что то же самое, как осуществляется чувственное восприятие, позволяющее ориентироваться в окружающей среде и конструировать адекватное ей эмпирическое знание. Так как 90% всей эмпирической информации человек получает с помощью зрения, то зрительное восприятие является наиболее подходящим процессом для выяснения существа интересующего нас вопроса. Я постараюсь рассмотреть его в свете гипотезы о вычислительной природе мышления. Разумеется, зрительное восприятие—это не мышление, но связь между тем и другим процессом очень глубока и неразрывна. Недаром еще великие греческие антагонисты Демокрит и Платон уподобляли мышление внутреннему видению, усмотрению сущности вещей.

Сейчас существует несколько достаточно подробно разработанных теорий компьютерного зрения. Некоторые из них уже достигли уровня технической и программной реализации. По ряду причин, объясняемых ниже, я остановлюсь на концепции Д. Марра (1945—1980), изложенной им в книге «Vision»1.

Органом зрения, как известно, является мозг. Грегори2 настойчиво подчеркивал, что глаз, и это вполне подтверждается нейрофизиологическими данными, есть лишь его специализированное образование, осуществляющее лишь часть операций по получению и переработке информации, идущей из внешнего мира. В целом деятельность мозга по получению зрительной информации и конструированию зрительных образов может быть представлена, согласно Марру, в виде набора различных функций и их суперпозиций. Они определяются состояниями входов и выходов. В каждом отдельном случае конечные выходные состояния идентифицируются с данным зрительным образом. Достижением Марра является создание вычислительной теории, описывающей систему уравнений, включающей такие функции и объясняющей, каким образом они могут быть отобраны, установлены, ранжированы и использованы при конструировании соответствующих процессов зрительного восприятия на

1 Man D, Vision: A computational Investigation into the

Human
Representation and Processing of visual Automation//San Francis
co, Freeman, 1982.

2 См.: Грегори Р. Разумный глаз. М., 1972.

компьютерах и с помощью каких алгоритмов они должны вычисляться.

Концептуальную основу построения такой теории составляют некоторые общие, я бы сказал, философ-ско-эпистемологические постулаты и принципы. К числу первых относится утверждение, что нейрофизиологические процессы, реализующие зрение, могут быть описаны соответствующими математическими функциями, но что сам процесс зрения является психологическим, а не нейрофизиологическим. Это означает, что для его объяснения требуется не нейрофизиологическая теория и включенные в нее понятия, а психологические теории и понятия.

В каком-то смысле теория Марра является анти-гештальтистской и, я бы даже сказал, пролокковской. В отличие от гештальтистов, убежденных, что «видение» с самого начала детерминировано заранее заданными гештальтами, Марр полагает, что изначальная зрительная информация может быть представлена как поток данных, обрабатываемых с помощью особых функций, выполняющих роль математических фильтров. Свобода от гештальта, или от предваряющих зрительных гипотез,—первый принцип его теории. Однако свобода от таких гипотез не обозначает свободу от установок. С самого начала необходимы установки, согласно которым зрительно воспринимаемые предметы имеют более четкие очертания, жесткую структуру, некоторую инвариантность отдельных плоскостей и зон по отношению к поворотам, движению и т. д. Это второй принцип. Третий утверждает, что время обработки зрительной информации и формирования образов должно быть кратким, а скорости достаточно высокими, чтобы обеспечить живому организму адаптацию к реальным изменениям. Четвертый принцип утверждает, что зрительный образ, первоначально возникающий при непосредственной обработке исходных данных, является простым, «сырым», плоским, примитивным. Он в значительной степени зависит от выбора вычислительной теории, а превращение его в объемный и стереоскопический—результат последующей обработки, осуществляемой с помощью шаблонов, образцов, моделей объектов внешнего мира, хранящихся в долгосрочной памяти. Лишь на этом этапе, так сказать, с заднего крыльца появляются гештальты. Но они сами—результат предшеству-


196



197

ющих актов восприятия, многократно проверявшихся практикой и откорректированных другими (возможно, незрительными) актами восприятия.

Первый вариант, или первый уровень, зрительного образа является «сырым», серым или черно-белым {цветное зрение Марр вообще не рассматривает). Он зависит от расположения воспринимаемых предметов, яркости и интенсивности освещения образующей его поверхности. Существуют определенные функции, точно фиксирующие данные об изменении освещенности и яркости в каждой точке поверхности. Для получения идентичного серого образа (или первичного скетча) необходимо учитывать континуальность, или резкость, в смене освещений, нарушение непрерывности в последовательности воспринимаемых образов и т. д. Обработка этих данных позволяет выделить острие, точки перегиба, линии, грани и т. п. Первоначальные образы на уровне первичного скетча зависят от позиции видящего, т. е. воспринимающего субъекта. Следующий уровень зрительного восприятия обеспечивает переход к стереоскопичности, объемности; так как третье измерение в действительности задается на двухмерной плоскости, то Марр называет его двухсполовинным скетчем. Такой двухсполовинный скетч также вычисляется с помощью определенных функций, учитывающих, ко всему прочему, компактность распределения воспринимаемых точек, их отношение к линиям, граням и т. д. Нормальный образ, по мнению Марра, задается примерно 10 тысячами точек и 100 миллионами всевозможных связей между ними. Легко понять, что это требует огромных, сложных и сверхскоростных вычислений. На уровне двухсполовинного скетча могут быть зафиксированы различные детали, воспринимаемые именно как детали данного объекта, имеющие определенную смысловую нагрузку. Здесь возникает задача определения взаимоотношения и взаиморасположения объектов, учета перспективы, различных заслонений, перемещений и т. д. Д. Марром и X. Нисихарой ' была доказана специальная теорема, позволявшая определить функцию, необходимую для вычисления передвижений.

1 Marr D., Nishihara H. Representation and recognition of the spatial organisation of three-dimensional shapes // Proseedings of the Royal Society of London. 1978. Vol. 200. P. 269—294.

Наконец, последний, заключительный этап — распознавание зрительных образов - осуществляется с помощью уже упоминавшихся шаблоноз, образцов и моделей распознаваемых объектов, хранящихся в долговременной памяти. Сам процесс распознавания требует многочисленных вычислений, учитывающих различные повороты, изменения в интенсивности освещения, ракурсы и константные характеристики, инвариантные всем этим изменениям. Здесь нет нужды более тщательно рассматривать этапы и процедуры формирования зрительных образов в компьютерных системах. За последние десятилетия появилось немало работ, уточняющих и развивающих идеи Марра, а также представляющих другие подходы. Практические достижения в сфере компьютерного зрения также весьма внушительны. Современные электронные сканирующие устройства позволяют теперь компьютерам прочитывать в режиме реального времени чертежи, рисунки, подписи, читать обычные газеты и книги и т. д. С философской точки зрения важно понять следующее: теоретики компьютерного зрения отдают себе полный отчет в том, что компьютеры видят не так и получают зрительные образы не тем способом, как это делает человек. Но с прагматической точки зрения результаты становятся все более идентичными. Это кардинально меняет наши старые представления об уникальности и невоспроизводимости человеческой системы восприятия. Система последовательных итерационных вычислений, с помощью которой компьютеры приближаются к получению инвариантных зрительных образов и учатся распознавать объекты реального мира, может и будет совершенствоваться. В этом смысле чрезвычайно важно понять, что в споре компьютерных пессимистов и агностиков, с одной стороны, и компьютерных оптимистов, с другой, аргументы, предлагаемые самим технологическим развитием и достижениями инженерного мышления, получают с каждым днем все больше подтверждений. Я не хочу этим сказать, что концепция уникализма окончательно опровергнута или поколеблена. Но у меня есть все основания считать, что процессы, по существу сходные с процессами, процедурами и операциями, осуществляемыми человеческим мозгом, могут быть с достаточно высокой степенью идентичности выполнены мощными современными компьютерами, по


198

199

крайней мере с точки зрения получаемых результатов. Если согласиться с тем, что результативность— если и не критерий истины, то по крайней мере серьезное основание для предпочтения, то точка зрения компьютерного оптимизма кажется мне более предпочтительной.

9. Естественный интеллект versus искусственный интеллект: экспертные системы; технологическая сублимация знаний

Эпистемологические исследования представления знаний и реализация компьютерных восприятий вплотную подводят к вопросу о возможности технологической сублимации знаний. По существу, речь идет о том, можно ли в каком-то смысле «отделить» знания от мозга и реализовать их как действующую работающую систему на вычислительных машинах. В настоящее время большинство специалистов по ИИ склонны к осторожному оптимизму в решении этого вопроса. «Осторожность» связана с тем, что на сегодняшний день мы еще не имеем точного представления и точных знаний о собственных знаниях. «Оптимизм» же—с тем, что имеются реальные результаты, позволяющие реализовать в компьютерных программах экспертные знания, способные в чисто практическом плане решать довольно сложные технические, медицинские, экономические, химические и т. д. задачи. Эти программы под общим названием «экспертные системы» (ЭС) получили за последние два десятилетия значительное распространение и вышли на уровень рыночных продуктов. В настоящее время на рынке информационной технологии существуют несколько сот вполне дееспособных и эффективных ЭС. По данным на середину 1989 г., около 300 ЭС функционируют в промышленности, науке и бизнесе США, около 60—в ФРГ, десятки подобных ЭС действуют в Англии, Франции, Японии и других экономически, технологически и научно развитых странах.

Так как существует обширная литература, посвященная ЭС, а технология их создания получила дисциплинарную форму и превратилась в объект университетского преподавания, то я остановлюсь здесь лишь на тех спецификациях, которые существенны

для анализа философских и эпистемологических проблем взаимоотношения ЕИ и ИИ !.

В самом общем виде знания, которые любой человек, обладающий нормальным естественным интеллектом, использует для принятия решений и сознательного распознавания объектов или постановки диагноза, можно разделить на два фундаментальных блока—стандартизованные, вполне рациональные и нестандартизованные, внерациональные. Я подчеркиваю здесь именно «вне», так как речь идет не о противостоянии или противоположности, а об особом способе сосуществования этих блоков. Стандартизованные знания являются общедоступными. Они излагаются в учебниках, справочниках, энциклопедиях, статьях, книгах и т. п. Поэтому они могут быть с большей или меньшей затратой сил регуляризованы усилиями профессиональных программистов и представлены в виде специальных алгоритмов и программ. Разумеется, такое представление требует высокого уровня компе-тентности не только в программировании, но и в специальной области знаний—например, химии, технологии, медицине, машинной диагностике, экономике и т. п. Но и все эти знания, в свою очередь, могут быть стандартизованными. Действительно, сложная проблема возникает в связи с тем, что в реальных жизненных политических, экономических и научных ситуациях всегда имеется более или менее значительный набор признаков, свойств, отношений, событий, процессов и т. д., не подпадающих под стандартизованные знания. В таких ситуациях любой человек вынужден принимать решения с большим или меньшим риском, опираясь на свою интуицию, жизненный опыт, случайную информацию. Вместе взятые, эти знания образуют то, что принято называть здравым смыслом. Конечно, реальный здравый смысл как феномен, лежащий на перекрестке индивидуального и общественного сознания, не так прост и не сводится лишь к этим трем компонентам. Помимо индивидуальной интуиции и опыта он включает в себя гигантский арсенал знаний, относящихся к культуре в целом, к этно-

1 См.: Построение экспертных систем. М., 1987; Уотермен Д. Руководство по экспертным системам. М., 1989; Попов Э. В. Экспертные системы: решение неформализованных задач в диалоге с ЭВМ. М., 1987; Экспертные системы: состояние и перспективы. М., 1989, и др.


200

201

социальным ценностям и историческому опыту. Но это все лишь осложняет возможность нахождения эффективных решений в условиях, когда стандартизованные знания оказываются недостаточными для достижения намеченных целей. В подобных случаях как раз и возникает необходимость рационализации, а затем и регуляризации таких элементов здравого смысла, как интуитивные знания. ЭС, собственно говоря, и являются сложной программой, в которой оба блока знаний рационализированы, регуляризованы и представлены в виде машинно выполняемых алгоритмов. Особенность таких программ заключается в том, что донором этих интуитивных знаний должны выступать эксперты, профессиональные знания которых, опыт работы и принятия решений позволяют предельно минимизировать риск в условиях довольно значительной неопределенности. Именно это и дает право данным наборам программ называться «экспертными».

Создание ЭС - яркий образец инженеризации знаний. ЭС в буквальном смысле проектируется и конструируется специалистами, получившими название инженеров по знаниям. В настоящее время их готовят в десятках университетов США, стран Западной Европы, Японии, а также в СССР. Деятельность таких инженеров состоит в разработке методик оценки компетентности экспертов, отбора наиболее сведущих из них и «извлечения» экспертных знаний из специалистов, включая знание прецедентов, интуитивно нащупываемых закономерностей, методов анализа, критериев эффективности и предпочтения тех или иных решений в зависимости от наличных ситуаций. Получив такие знания и сконструировав адекватные блок-схемы, инженер по знаниям производит последовательную регуляризацию, выявляет отдельные «белые пятна» и когнитивные лагуны, производит дополнительную закачку экспертных знаний, подбирает соответствующие программные средства для реализации ЭС. Сама работа инженеров по знанию не может быть полностью формализована и требует большого психологического мастерства и, я бы даже сказал, искусства, личного обаяния, умения контактировать с людьми и высокого профессионального уровня системного аналитика.

В философском плане важно понять, что процесс построения ЭС дает возможность нового подхода к

202

исследованию знаний и их понимания. Дело в том, что отчуждение знаний отнюдь не новый процесс. Знание — продукт индивидуальной деятельности, «индивидуальной головы», как говорил Ницше. Но уже на стадии первобытного общества формирование общественного сознания как сознания, функционирующего над индивидуальным слоем, есть несомненный факт такого отчуждения. Оно зафиксировано в отчетливой форме уже Сократом. Создание письменности позволяет фиксировать отчужденное, сублимированное от индивида знание не просто в языке и устной речи, но в письменном тексте, поддающемся многократному прочтению и относительно легкой временной и пространственной трансляции. Такое знание может быть многократно «прочитано», интерпретировано, переинтерпретировано, проанализировано, реконструировано и дополнено не тем, кто его создал, а тем, кто им располагает и умеет пользоваться. Возникновение полиграфической промышленности, основанной на изобретении печатного станка, тысячекратно усиливает этот эффект. Компьютерная же революция делает еще один не просто гигантский, но радикально новый шаг, который был невозможен на предыдущем уровне развития ИТ.

Дело в том, что выявление экспертных знаний и даже регуляризация их в принципе были возможны не только десятилетия назад, но даже и столетия. Однако обозрение тысяч и десятков тысяч правил, получаемых в процессе регуляризации, проверка их на совместимость, различные виды тестирования и приведение в соответствие с быстро меняющейся ситуацией, отображаемой в базе данных без применения современных компьютеров, неосуществимо. Более того, ЭС—это не просто сублимирование знания экспертов, превращенные в набор программ, но, что особенно важно, это — знания, способные «автономно» работать в режиме реального времени и даже обрабатывать гигантские массивы данных, необходимых для принятия; адекватных решений с минимальным риском быстрее, чем это способен делать эксперт-человек.

Первые поколения ЭС были, так сказать, замкнутыми. Они имели относительно небольшой набор правил и не обладали способностью к саморазвитию. Второе поколение отличалось способностью к расширению и лучшей адаптацией к быстро увеличивающейся базе

203

данных. В этом смысле удобным оказалось различение баз знаний, т. е. систем правил, образующих ЭС, и баз данных, на основании которых эти алгоритмизированные правила подготавливали решения, ставили диагноз, проводили тестирование и т. д. Третье поколение ЭС характеризуется еще большей гибкостью, проявляющейся в способности к самообучению и эффективной реадаптации. Конечно, способности ЭС в этом отношении не следует переоценивать, и радужные надежды, с которыми были связаны появление первых ЭС в последние несколько лет, заметно поубавились, и, к утешению компьютерных пессимистов, стало ясно, что угроза замены человека ЭС либо вообще нереальна, либо приобретет какие-то реальные очертания лишь в далеком будущем. На международной конференции по дизайну информационных систем, основанных на знаниях (Берлин, июль 1989г.),высказывались мнения о том, что ЭС вообще непригодны для принятия решения в ответственных нестереотипных ситуациях, например в качестве пилотов самолетов, диспетчеров АЭС и т. д. Однако скептицизм этот подрывается объективным быстрым процессом распространения ЭС'. В настоящее время мощные ЭС насчитывают от 5—6 до 10 и более тысяч правил. С их помощью они не только способны решать основные задачи, но и совершать целый ряд процедур и операций, облегчающих общение с пользователем и делающих это общение дружественным.

Важнейшая отличительная черта ЭС состоит в том, что все системы этого класса обладают способностью к объяснению своих действий. Они в состоянии объяснить пользователю, или абоненту, как и почему, на каком основании они пришли к тому или иному выводу, рекомендации, решению или диагнозу. Эта «открытость» для скептического контроля и анализа дает возможность проследить за правильностью логических рассуждений ЭС и оценить уровень доказательности аргументов. ЭС способна также задавать уточняющие

1 К сожалению, в этом вопросе, как и в подавляющем большинстве других проблем, наша страна существенно отстает. По данным, имеющимся на конец 1989 г., у нас существует около 19 ЭС отечественного происхождения, но и они сделаны преимущественно на модификациях зарубежных оболочек и к тому же не представляют собой конкурентоспособной продукции на международном рынке ИТ.

204

вопросы, определять, каких данных и знаний ей не хватает, уточнять смысл поставленной задачи и т. д. Создание ЭС и закачка в них экспертных знаний — трудоемкий и дорогостоящий процесс. Необходимость тиражировать ЭС и особенно применять их в различных ситуациях и в различных предметных областях заставили по-новому осмыслить саму их логическую структуру. Оказалось, что в ЭС можно выделить своего рода каркас, образованный целой системой логических блоков, связанных различными механизмами логического вывода. Внутри этих блоков и в отношениях между ними могут применяться классические и неклассические, модальные, статистические, немонотонные и другие логики. Самым интересным результатом анализа этих логических оболочек явилось понимание того, что их можно использовать как базисную модель для конструирования содержательно различных ЭС. Сублимация человеческих знаний, таким образом, отчетливо выявила их многослойность. Первый шаг в этом направлении был сделан еще Аристотелем и мегарскими стоиками, исследовавшими простейшие логические формы рассуждения. Оболочки ЭС - это не просто формы рассуждения, а скорее каркасы, или скелеты, гигантских интеллектуальных машин, реализуемых на компьютерах. Они имеют иерархическое строение. Их глубинное основание составляют семантические сети и сложные фреймы, сами имеющие иерархическое строение. Их верхние слои могут быть представлены как структурированные базы данных, через которые осуществляется адаптация системы к окружающей среде. Оболочки, взятые, так сказать, в обособленном виде, представляют собой, если угодно, динамические функционирующие модели реального экспертного знания. В этом смысле их можно уподобить платоновским идеям, которые могут быть интерпретированы как модели феноменов и процессов реального мира. И над этим следовало бы задуматься любителям простых и категорических опровержений идеализма. Во всяком случае, ясно, что, препарируя знания для превращения их в компьютерные ЭС, мы получили мощные возможности и инструменты для исследований когнитивных механизмов человеческого разума. И эти механизмы все в большей мере демонстрируют свою сложную, нетривиальную, но тем не менее информационно-машинную природу.

205

Мощная современная ЭС может и должна аккумулировать в себе знания не одного, а нескольких экспертов. Это создает определенные социальные и социально-психологические проблемы. «Выжатый» эксперт расстается не только со стандартизованными, но и со своими интимными знаниями, с индивидуальным опытом и интуицией, которые дались ему нелегкой ценой и приобретены иногда в процессе всей творческой жизни. То, на что эксперт потратил годы и десятилетия, компьютер, реализующий ЭС, может израсходовать за считанные минуты, обесценивая тем самым статус и 2010-07-19 18:44 Читать похожую статью
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • Контрольная работа
  • © Помощь студентам
    Образовательные документы для студентов.