+7 (985) 905 09 22
veselovskiy1@gmail.com


Разработан метод создания системы межнационального текстового общения (СМТО) на основе стохастического семиотико-семантического точного переводчика с обеспечением контроля и коррекции ошибок в текстах, переведенных существующими компьютерными переводчиками (НОУ-ХАУ). Программный макет.

 

ОПИСАНИЕ ПРОГРАММНО-АППАРАТНОГО МАКЕТА

 

     Разработанный макет представляет собой программно-технический комплекс поисковых систем и переводчиков, обеспечивающих:

 

- возможность формирования запросов путем семиотико-семантического перевода текстов с русского языка на английский, немецкий, французский, испанский,  итальянский языки для получения точных по смыслу ответов из Интернет  на указанных языках;

 

- перевод произвольного запроса (предложения) пользователя по общей тематике (классический словарь русского языка, 135 тысяч слов), не содержащегося в Интернет, с русского на английский язык с использованием семиотико-семантического метода;

 

- создание системы передачи и перевода на английский,  немецкий, французский, испанский,  итальянский языки формализованных текстов в рамках СМТО из базы знаний;

 

-возможность создания системы, которая позволяет на основе автоматического реферирования, определения семантики контролировать  содержание текстов, а именно: патентов (в рамках PCT),  диссертаций, монографий, проектов и др. для защиты от плагиата и формирования баз знаний с известными решениями по заданным тематикам.


 

Многоязычная интеллектуальная поисковая система на основе межнационального текстового общения (СМТО) и стохастического точного семиотико-семантического перевода вопросов и ответов на любой язык для получения интегральных знаний, извлекаемых из текстовых источников. В результате становятся доступными накопленные цивилизацией знания на различных языках мира (НОУ-ХАУ).


 

 

 

 

 

МЕТОД СЕМАНТИЧЕСКОЙ СВЯЗИ ТЕКСТА С ТРЕХМЕРНОЙ ГРАФИКОЙ – М.:Прометей, 2007. – 27 с.

 

                           Авторы: Насыпный В.В., Насыпная Г.А.

 

 

 

     Книга посвящена актуальной проблеме семантической связи текста с трехмерной графикой. Раскрываются назначение, основные моменты реализации  совмещения текста с визуальным изображением, применение трехмерной графики при создании образно-смысловых переводчиков и интеллектуальных вопросно-ответных систем с извлечением знаний из текста.

 

    

 

 

 

1. Основное назначение семантической связи текста с трехмерной графикой

 

    

 

     Создание методов извлечения знаний из текстов для поисковых систем, выполнение аналитических функций было тесно связано с разработкой основ компьютерной семантики. Эта разработка обеспечивает в автоматическом режиме понимание поисковой системой смысла текста, прежде всего значений отдельных слов, словосочетаний, обособленных конструкций путем их классификации и сведения к обобщенным понятиям. Указанные обобщенные понятия могут отражать значения типов объектов, подклассов и классов. Здесь решается проблема понимания семантической тождественности предложений независимо от синтаксических форм их представления. Раскрываются вопросы эквивалентных преобразований предложений, абзацев с использованием логического вывода и извлечения знаний, релевантных запросу пользователя.

 

     Все это позволяет перейти к решению задачи образной интерпретации текстовой информации путем введения семиотико- семантической связи текстов с трехмерной графикой, автоматического построения анимаций, достаточно точно интерпретирующих смысл отдельных словосочетаний, высказываний, предложений, абзацев и в целом законченных текстовых документов. Это стало возможным на основе новейших достижений в области создания мультимедийных систем современных компьютеров, включая построения трехмерной графики, которые в реальном времени изображают различные объекты, процессы, сцены, связанные с деятельностью человека.

 

     Отсюда следует, что создание компьютерной семантики и семиотики, позволяющей в обобщенном виде выделять смысл текстов, дает возможность непосредственной связи обобщенных понятий объектов и действий с анимационными образами, их отображающими. В результате, как будет показано ниже, обеспечивается автоматическое создание анимационных роликов [5], в реальном времени отображающих содержание текстовых сообщений или документов. При этом, разумеется, в контекст анимаций могут включаться отдельные слова, словосочетания, фразы, описывающие субъекты, объекты и производимые действия, которые достаточно трудно или нецелесообразно представлять в виде трехмерной графики.

 

     Трехмерная графика настолько прочно вошла в нашу жизнь, что мы сталкиваемся с ней, порой даже не замечая ее. Область применения 3D-графики необычайно широка: от рекламы и киноиндустрии до дизайна интерьера и производства компьютерных игр. Для создания трехмерной графики используются специальные программы, которые называются редакторами трехмерной графики (или 3D-редакторами). Например, программа 3ds max 7 является одним из таких редакторов [5].

 

     Результатом работы в любом редакторе трехмерной графики является анимационный ролик или динамическое изображение, просчитанное программой. Чтобы получить изображение трехмерного объекта необходимо создать в программе его объемную модель. При этом анимация позволяет  показать любое перемещение данного объекта в трехмерном пространстве [5].

 

     Семантическая связь интеллектуальных систем, обеспечивающих извлечение знаний из текстов с программами  3D-графики, может осуществляться через специально разработанную интеллектуальную систему визуализации, которая будет представлена ниже.      

 

     Основное назначение метода семантической связи текста с трехмерной графикой – способствовать лучшему усвоению и запоминанию прочитанного текста, особенно, если в нем есть процессы, заведомо представляющие собой некоторую последовательность действий, которые читателю затем предстоит выполнить. Например, инструкции по пользованию различными видами бытовой техники, управление сложными техническими средствами на производстве, освоение различных спортивных упражнений и т.д. При этом в отличие от рисунков разного рода инструкций, фрагментарно иллюстрирующих тот или иной процесс, с помощью трехмерной графики можно воспроизвести содержание процесса в его непрерывности и целостности.

 

    Вторая важнейшая область применения данного метода - интеллектуальные вопросно-ответные системы, где он способствует лучшему пониманию пользователем корректности заданного вопроса и релевантности полученного ответа. Одновременно этот метод может быть использован для повышения интереса к сайту или порталу данной поисковой системы, для повышения его посещаемости, а также как новое средство для технологии контекстной рекламы, образность которой напрямую связана с запросом пользователя. Все это повысит эффективность данной поисковой системы и коммерческую отдачу при ее использовании.

 

     Третьим назначением предлагаемого метода может быть  совершенствование компьютерных обучающих систем с целью повышения эффективности постижения различных сфер знаний за счет подключения аппарата образного мышления. Особенно это относится к процессу изучения иностранных языков, в котором представления различных предметов, субъектов, действий и т.д., семантически связанных с текстом, играют существенную роль.

 

     Четвертым значительным направлением может стать создание универсального словаря-разговорника. Этот разговорник  независимо от языка, которым владеет пользователь, переводит его вопросы и ответы на язык, семантически связанных с содержанием информации  изображений. Образное представление диалога легко понимается человеком, не владеющим данным языком. При этом в случае наличия аналогичных (мобильных) компьютерных систем у двух собеседников возможен образный диалог непосредственно между ними в объеме знаний, содержащихся в разговорнике. Это позволит решить проблему языкового барьера в ходе туристических поездок в различные страны мира.

 

     В перспективе данный метод позволяет перейти к созданию надежного семиотико-семантического (образно-смыслового) переводчика и системы межнационального текстового общения.

 

     Данный метод может быть широко применен в робототехнике для связи образного отображения внешнего мира, полученного с помощью сенсорики, с его текстовым описанием, которое содержится в интеллектуальном процессоре, с целью более эффективного решения поставленных задач.

 

      Масштабным, перспективным направлением данного метода может явиться создание в компьютере своего рода авторского кино с использованием статических и анимационных форм изображений. При этом с помощью средств визуализации возможно будет интерпретировать читаемые книги, то есть создавать зрительные образы героев, пейзажи, где происходит развитие сюжета, процессы  действий, поступков. В случае необходимости к изображениям будут выдаваться текстовые комментарии, а также будут озвучиваться диалоги, произносимые героями данного литературного произведения. Могут быть привлечены фрагменты музыкальных произведений в качестве  музыкального оформление изображений. Данный материал, несомненно, окажет позитивное воздействие на развитие творческих способностей, воображения человека, соприкасающегося с  ним и, возможно, станет новым направлением искусства.

 

     В настоящей статье подробно рассмотрена технология автоматического создания анимаций для интеллектуальных вопросно-ответных поисковых систем. Здесь используются представленные в предыдущих работах [1, 3, 4] методы синтаксического, семантического анализа текстов, запросов пользователя и релевантных ответов, выдаваемых ему системой. Описывается взаимодействие вопросно-ответных поисковых систем с уже созданными компьютерными анимационными системами. Формулируются требования к перспективным системам трехмерной графики, обеспечивающим взаимодействие с интеллектуальными поисковыми системами. Дальнейшее направление развития данного метода планируется представить в последующих работах, посвященных указанной тематике.

 

 

 

2. Реализация семантической связи текста с изображением и анимацией в трехмерной графике

 

    

 

     Одной из основных функций системы извлечения знаний из текстов является создание «картины мира».    

 

     Концептуальное описание предметной области текста, который индексируется системой извлечения знаний и образуется из предикатов, содержащих типы и классы объектов, а также отношения между ними называют «картиной мира» [2]. 

 

    Типом объекта является его наименование в предметной области текста. Подчеркнем, что здесь одушевленные объекты приведены без имен собственных, а неодушевленные – без названий и идентификаторов, их определяющих [2].  Понятия «классы», «подклассы» в рассматриваемом аспекте связаны прежде всего с классификацией, как системой  объектов предметной области текста в определенном соподчинении (по критерию «род-вид» или «часть-целое»). 

 

     Таким образом, в «картине мира» определены типы и классы реальных субъектов и объектов, описанных в данном тексте, а также виды отношений между ними (в том числе «род - вид» или «часть - целое»). При этом виды отношений создаются глаголами, которые описывают движение, конкретные действия, местонахождение, мыслительно-речевые процессы и другие виды взаимодействий между объектами.

 

     Предметная область текста создается после индексации текстов с использованием морфологического, синтаксического, семантического анализа предложений, а также аналитических функций дедукции и индукции для типизации и классификации конкретных субъектов и объектов. Эти функции системы извлечения знаний реализуются автоматически и подробно описаны в работе [2].     

 

    Основная идея семиотико-семантической связи текста с трехмерной графикой заключается в создании визуальной «картины мира», которая соответствует исходной текстовой «картине мира».

 

     С этой целью используются 3ds-редакторы, с помощью которых сначала воспроизводится изображение типов объектов соответствующих классов, входящих в предикаты текстовой «картины мира» (в статической форме), а затем анимация, представляющая взаимодействие этих объектов. Как известно, предикат - это отношения между объектами предметной области текста. Обычно он включает подлежащее, сказуемое, дополнение (обстоятельство). Иногда используют предикативную основу предложения текста, состоящую из подлежащего и сказуемого [1]. Анимацией называется перемещение объектов в трехмерном пространстве, их связь с какими-либо конкретными действиями и другими видами отношений [5].

 

      Если отношения между объектами не поддаются анимационному изображению и процесс анимации является достаточно трудоемким, то связь между изображениями соответствующих объектов описывается с помощью слов или словосочетаний  «картины мира» исходного текста. Это же относится и к типам объектов, которые также достаточно сложно поддаются визуализации.

 

     Отметим, что работа создания визуальной «картины мира» является весьма сложной на данном этапе развития 3D-редакторов и требует сравнительно много времени. Один из путей решения данной проблемы связан с вводом результатов видеосъемки в систему трехмерной графики, которая содержит в цифровом виде изображения данных объектов или действий и получена студийным образом с помощью видеокамер. Возможно также  использование отснятых фрагментов видеофильмов, включающих изображения конкретных объектов и процессов. Однако этот путь – вспомогательный.   

 

     Основным путем является изображение различных объектов, фрагментов анимационных роликов, связанных с этими объектами и происходящими между ними действиями, в полуавтоматическом режиме, с участием человека - оператора системы 3ds.

 

      Как было отмечено выше, при формировании текстовой «картины мира» вопросы  реализации ряда сложных функций в автоматическом режиме уже решены.

 

     Один из них - сведение некоторого множества предикатов, имеющих разную синтаксическую структуру, но одинаковое семантическое значение, к единому типовому предикату, в котором после эквивалентных преобразований отображается любой из вышеназванных предикатов. При этом очевидно, что указанная группа предикатов имеет одинаковый смысл с полученным предикатом «картины мира».

 

     Второй вопрос, который решается в ходе формирования «картины мира» - это многозначность слов и выбор того значения, которое соответствует классу рассматриваемого слова. Для этого используется семантика отношений данного типа объекта с другими типами объектов, позволяющая определить  его значение, а далее - правильно связывать объекты текстовой «картины мира» с соответствующими объектами визуальной «картины мира».

 

     Третий важный вопрос, который решается с помощью текстовой «картины мира» и соответствующей ей классификации объектов предметной области текста – определение подкласса, визуальное изображение которого с необходимой точностью представляет данный объект и делает его узнаваемым для пользователя. Это сокращает количество объектов, которые необходимо использовать в визуальной «картине мира».

 

     После завершения описанных процессов создания текстовой «картины мира» и семантически связанной с ней визуальной «картины мира» можно перейти к формированию анимационного ролика в автоматическом режиме.

 

     Теперь рассмотрим процесс отображения текста через призму трехмерной графики с использованием описанных выше текстовой и визуальной «картин мира».

 

     Формирование трехмерного изображения предварительно проиндексированного текста происходит в реальном времени, начиная с первого его предложения.

 

     Как было отмечено выше, после индексации каждое предложение текста представляется в виде совокупности предикатов, которые его составляют. Указанные предикаты логически связаны с помощью параллельной и последовательной связей типа «тема-рема».  Деление предложений на предикаты позволяет соотнести эти предикаты с семантически связанными  предикатами текстовой «картины мира», а после этого (при условии соответствия) перевести рассматриваемое предложение в совокупность логически связанных предикатов «картины мира».

 

     Затем по каждому предикату исходного текста поочередно производят вызов необходимого фрагмента анимационного ролика из визуальной «картины мира». При этом последовательность развертывания зрительных образов соответствует логической связи предикатов в исходном тексте и адекватно передает его смысл.       

 

     Далее аналогичным порядком переводят в визуальный образ следующее предложение абзаца, логически связанное с предыдущим предложением. После завершения отображения последовательности событий, описанных в предложениях очередного абзаца, которые, как правило, имеют вполне определенную семантическую завершенность, переходят к обработке следующего абзаца и т.д.

 

     В результате перед пользователем в реальном масштабе времени развертывается процесс зрительного представления объектов, семантически связанный с исходным текстом. При этом между визуальными объектами поддерживаются те же самые логические связи типа «тема-рема», что и в исходном тексте.

 

     Так обеспечивается автоматический режим  формирования («монтажа») собственно анимационного ролика из фрагментов,   передающих  визуально объекты, а также процессы их взаимодействия, которые тесно связаны с семантикой и логикой исходного текста. 

 

     Таким образом, вышеизложенное описание отображения текста в  семантически коррелированном с ним трехмерном анимационном ролике показывает принципиальную возможность связи логической и образной сфер представления событий, имеющихся в тексте и создаваемых средствами визуализации. При этом, если первый процесс (извлечения знаний из текстов) реализуется автоматически, что подробно описано в [1], то второй процесс (перевода предикатов исходного текста в визуальные фрагменты), как отмечалось выше, реализуется в полуавтоматическом режиме, с использованием программ редакторов 3D и, соответственно, требует участия специалистов.  Поэтому данный процесс в дальнейшем нужно изучать и совершенствовать с целью перевода его также в автоматический режим.

 

     Однако здесь встречается целый комплекс нерешенных проблем. Первая из них связана с тем, что часто предикаты «картины мира»,   не имеют описания всех объектов, которые должны содержаться в соответствующем визуальном фрагменте, поскольку «это и так понятно». Например, имеем исходный предикат текстовой «картины мира»: «Мальчик садится за стол». Очевидно, что в рассматриваемом предикате два объекта – мальчик и стол. В соответствующем анимационном представлении данного предиката должно быть три объекта – добавляется стул, на который садится мальчик, чтобы сесть за стол. Этот объект подразумевается в самой ситуации и базируется на более широкой «картине мира», которая содержится в сознании человека. Таких примеров можно привести бесчисленное множество.

 

 

 

3. Применение трехмерной графики в вопросно-ответных системах с извлечением знаний из текста

 

     

 

     Рассмотрим метод извлечения знаний из текстовых документов для поисковых систем, описанный в работе [1].

 

     В основу метода положена стохастическая интеллектуальная информационная технология, которая обеспечивает проведение в реальном масштабе времени морфологического, синтаксического и семантического анализа  больших объемов текстовой информации. Главными  достоинствами указанного метода по сравнению с методами, реализованными в современных поисковых системах, являются:

 

- обработка запросов пользователя на естественном языке;

 

- поиск и выдача документов, достоверно содержащих полную информацию, релевантную запросу пользователя;

 

- выделение фрагментов текста, содержащих сведения и знания по различным предметным областям, которые необходимы для решения конкретных задач пользователя ;

 

- автоматическое формирования знаний путем извлечения их из текстовых документов для заполнения баз знаний и выдачи конкретного ответа пользователю;

 

- автоматический анализ новых слов и обновление словарей;

 

- эквивалентные преобразования запросов пользователя и предложений текстовых документов, обеспечивающие  повышение эффективности извлечения знаний;

 

- самообучение указанных систем правилам грамматического и семантического анализа.

 

     Данный метод реализован в интеллектуальной вопросно-ответной системе, обеспечивающей обработку запроса пользователя и текстовой информации, на основе которой ему выдается ответ.

 

     Поиск ответа производится по предварительно подготовленной текстовой информации. Подготовка включает  стохастическую индексацию текста, его морфологический, синтаксический и семантический анализ.

 

     В процессе стохастической индексации каждое слово, словосочетание, предикат, предложение, абзац текста получают своего рода «имя» – индекс.

 

    Как известно, стохастический индекс – это хэш-значение, некий отличительный знак, полученный после стохастического преобразования текстовых структур, «сжатия» и отображения слов, словосочетаний, предикатов, предложений, абзацев и др.  в уникальный стохастический код, который имеет заданное число бит и используется для эффективного поиска [2].

 

     Результатом стохастического преобразования и индексирования символьной информации является формирование таблиц индексов текста, таблиц индексов классификатора, таблиц базы знаний «картины мира» (предметной области текста).

 

     В таблицу индексов текста для облегчения поисковых функций рассматриваемый текстовый документ помещается в проиндексированном виде. Затем осуществляется деление стохастически индексированного текста  на предложения-предикаты. Эти небольшие лексические единицы являются основой в дальнейших процессах предварительного и полного формирования таблиц базы знаний «картины мира», играют важную роль в классификации, непосредственно в формировании ответа пользователю.

 

     В ходе обработки запроса пользователя вопросно-ответная система реализует эквивалентные преобразования    вопросительного предложения запроса в повествовательное предложение предполагаемого ответа, разделение простых и сложных предложений на совокупность логически связанных предложений-предикатов. Здесь используются правила продукций для выполнения аналитических функций.  Происходит обращение к таблицам классификатора,  базы знаний «картины мира», затем к индексированной текстовой информации. С помощью правил продукций и метода логического вывода осуществляется сборка из частных предикатов ответа полного ответа.

 

        Осуществление эквивалентного преобразования стохастически индексированных предложений является одной из основных функций вопросно-ответной системы при  поиске точного ответа на запрос пользователя, представленного в виде вопросительного предложения. Эквивалентное преобразование – это замена определенных  языковых единиц  на другие, выражающие то же смысловое содержание в рамках семантической структуры одного предложения или нескольких предложений текста [2]. Эквивалентные преобразования выполняют  прежде всего при переводе вопросительного предложения запроса в повествовательное предложение предполагаемого ответа. При этом производят замену вопросительного слова или словосочетания на предполагаемый краткий ответ с соответствующими синтаксическими и семантическими характеристиками.

 

     Важнейшей функцией вопросно-ответной системы является функция, связанная с разделением повествовательного предложения запроса пользователя или полученного ответа в виде предложений текста на совокупность  простых предложений, являющихся предикатами. Как было отмечено выше, эти предложения-предикаты включают словосочетания подлежащего, сказуемого и дополнения (обстоятельства). Разделение на предложения-предикаты производят для того, чтобы при поиске ответа на запрос облегчить обработку сложных предложений, сводя их к совокупности простых предложений.

 

     На основе предложений-предикатов, построенных из запроса пользователя, формируют дополнительные запросы к системе для получения частных ответов.  При этом полный ответ  выстраивают на базе аналитической функции синтеза - логической сборки частных ответов в эквивалентный полный ответ на запрос пользователя.

 

       Сущность логической сборки, основанной на функции синтеза, заключается в формировании предложений-предикатов, а затем и всего предложения в целом – полного ответа, релевантного запросу  пользователя. Под релевантностью подразумевается мера, определяющая, насколько полно тот или иной документ отвечает критериям, указанным в запросе пользователя [2].

 

     Поясним это на примере. Полный ответ «Белый пароход прибыл с туристами поздно вечером в Одессу» может быть получен на основе следующих вопросительных предложений запроса: Когда белый пароход прибыл с туристами в Одессу? Куда белый пароход прибыл с туристами? Какой пароход прибыл с туристами поздно вечером в Одессу? С кем прибыл белый пароход поздно вечером в Одессу? и др. На основе этого ответа,

 

где «белый пароход» - словосочетание, содержащее подлежащее;

 

«прибыл» – сказуемое;

 

«с туристами» - дополнение;

 

«поздно вечером» - словосочетание с обстоятельством времени;

 

«в Одессу» - обстоятельство места

 

можно получить три предложения-предиката. С этой целью представим указанное предложение в виде набора словосочетаний:

 

(Белый пароход),

 

(пароход прибыл),

 

(прибыл с туристами),

 

(прибыл поздно вечером),

 

(прибыл в Одессу).

 

     Учитывая, что логические связи между  словосочетаниями реализуются за счет идентичных слов, входящих в соответствующие словосочетания, получим следующие логические цепочки словосочетаний данного предложения:

 

(Белый пароход) –> (пароход прибыл) –> (прибыл с туристами).

 

(Белый пароход) –> (пароход прибыл) –> (прибыл поздно вечером).

 

(Белый пароход) –> (пароход прибыл) –> (прибыл в Одессу).

 

      Получив логические цепочки, связывающие запрос с релевантным ответом, формируют следующие предложения-предикаты:

 

«Белый пароход прибыл с туристами».

 

«Белый пароход прибыл поздно вечером».

 

«Белый пароход прибыл в Одессу».

 

     Указанные логические преобразования производят по критерию «тема-рема». Тема и рема являются базовыми понятиями при определении семантической или логической связи между предложениями фрагмента текста. Обычно тема выражается подлежащим или словосочетаниями, связанными с подлежащим. Она определяет то понятие или смысл, которое раскрывается в данном предложении. В простом предложении к теме относятся все словосочетания подлежащего, находящиеся до сказуемого. Рема логически связана с темой через сказуемое. К реме в простом предложении относятся все словосочетания, находящиеся после сказуемого. Она обычно представляется обстоятельством (дополнением) или словосочетаниями, связанными с этими членами предложения. Рема описывает то новое, что сообщается в предложении относительно его темы. С помощью темы и ремы предложений реализуется цепная или параллельная связь между предикатами предложения или предложениями данного абзаца [2].   

 

      В рассмотренном выше примере сформированные предложения-предикаты связаны параллельной схемой «тема-рема». Параллельная связь обеспечивается повторением темы в нескольких предложениях-предикатах, при этом используются разные ремы, обеспечивающие раскрытие новых свойств одной и той же темы.     

 

     Поскольку, как было показано выше, предикативная основа (подлежащее и сказуемое) приведенных предложений-предикатов идентична, можно выполнять как «прямые» (разделение предложений на предикаты), так и «обратные» преобразования (объединение предикатов в одно предложение и  тем самым возвращение к исходному виду):

 

«Белый пароход прибыл с туристами поздно вечером в Одессу».

 

       Под цепной (последовательной) связью понимается такая логическая связь, при которой рема начального предложения, связанная с его темой, переходит в тему следующего за ним предложения, где она раскрывается с использованием новой ремы и т.д., до тех пор пока не завершается общая последовательность изложения данного абзаца. При этом в качестве темы очередного предложения может быть использовано синонимичное или близкое по смыслу значение ремы предыдущего предложения. Часто вместо имени темы последующего предложения применяется местоимение, либо указательное местоимение, связанное с именем предыдущей ремы. Рассматриваемые варианты взаимосвязи двух рядом стоящих предложений называются анафорой, которая требует доказательства  синонимичности или семантической близости отмеченных лексических единиц указанных предложений [2].

 

        Рассмотрим пример: «Белый пароход прибыл с туристами  в Одессу, где начинался фестиваль». Это предложение может быть разделено на совокупность следующих предложений-предикатов:

 

«Белый пароход прибыл с туристами».

 

«Белый пароход прибыл в Одессу».

 

«В Одессе начинался фестиваль».

 

     Здесь первое и второе предложения связаны параллельной связью через тему «Белый пароход», второе и третье предложения имеют цепную (последовательную) связь, в которой рема «Одесса» второго предложения связана с темой «Одесса» третьего предложения. При этом подлежащее «Одесса» после эквивалентных преобразований заменило союзное слово «где».

 

     Если полученные предложения-предикаты представляют собой частные ответы, то из них может быть образовано исходное сложноподчиненное предложение. При этом обстоятельство третьего предложения заменяется на союзное слово «где».

 

     Указанные «прямые» и «обратные» преобразования справедливы для сложных предложений любого вида.

 

     Как будет показано ниже, представление предложений текста в виде совокупности предикатов является необходимой функцией для автоматического создания «картины мира». Вместе с тем (или в свою очередь), для построения «картины мира»  важной функцией является также классификация понятий и терминов, относящихся к заданной предметной области текста.

 

     В рассматриваемом аспекте классификация – это процесс установления соподчинения понятий (классов, подклассов, объектов) «картины мира» (предметной области текста) по критерию «род-вид» и «часть-целое».

 

     Решение задачи классификации осуществляется с использованием аналитических функций определения, дедукции и индукции, с помощью метода логического вывода, путем автоматической классификации понятий и терминов на основе таблиц индексов толковых словарей (общего пользования и по заданным предметным областям текста).       

 

     В основу системы классификации положена подсистема логического вывода, базирующаяся на стохастическом преобразовании информации. Как известно, логический вывод – это метод обработки знаний, имитирующий процесс рассуждений человека, который позволяет отдельные языковые единицы синтезировать в семантическую структуру с определенным смысловым содержанием [2]. Указанная подсистема  обеспечивает реализацию логического вывода на основе таблиц индексов текста (толковых словарей).

 

     В процессе логического вывода реализуется произвольный доступ по полученным стохастическим индексам Ixi(u) к  семантически связанным  статьям и дефинициям словаря. Это обеспечивает построение лексических деревьев классов, множеств и подмножеств понятий толкового словаря в масштабе реального времени.

 

     В ходе классификации на базе толковых словарей создаются классификаторы толковых словарей общего пользования и тематические классификаторы различного назначения. Классификатор  обеспечивает связь индекса каждого понятия с соответствующими ему индексами подклассов и классов, в которые входит данное понятие. Классификатор представлен в виде таблицы, входом в которую являются индексы понятий (слов), а строчки содержат связанные с ним индексы подклассов и классов.    

 

     Классификатор обеспечивает повышение точности семантического анализа при обработке запроса пользователя, а также при формировании базы знаний «картины мира».

 

     База знаний «картины мира» является важнейшей составляющей в поисковой вопросно-ответной системе.

 

     Все таблицы этой базы знаний формируются автоматически в режиме самообучения. Здесь используются функции деления предложений на предикаты, взаимодействия с классификатором (выделения типов объектов и отношений предикатов, а также их классификация), с  базой правил продукций, с базой индексов текстов для эффективного поиска релевантного ответа на запрос пользователя. Основную роль в процессе формирования данной базы знаний играет логический вывод на текстовых структурах. Применяется произвольный доступ по стохастическим индексам слов, словосочетаний и предикатов к таблицам индексов текстов и соответствующих баз знаний.

 

     Различают этапы предварительного (до классификации) и полного формирования таблиц базы знаний «картины мира». Эти этапы соотносятся между собой как часть и целое. Предварительное формирование таблиц базы знаний «картины мира» производится по таблице индексов текста и связано с типизацией субъектов и объектов, которые имеются в данном тексте. При этом осуществляется перевод имен собственных в нарицательные, определяются связи типизированного субъекта или объекта  с другими объектами. Полное формирование таблиц базы знаний «картины мира» происходит на основе этапа предварительного формирования таблиц базы знаний «картины мира». При этом типы субъектов, объектов и связей между ними заменяют  классами.

 

     После завершения формирования «картины мира» в текстовом виде, содержащей таблицы с базовыми словосочетаниями и предикатами предметной области текста, переходят к формированию визуальной «картины мира».

 

     Как было показано выше, визуальная «картина мира» - это множество файлов трехмерной графики, которые содержат фрагменты визуального статического или анимационного изображения, соответствующие определенному предикату текстовой «картины мира». При этом каждый указанный файл поименован стохастическим индексом текстового предиката, который с ним семантически связан. Это обеспечивает прямой доступ от любого предиката текстовой «картины мира» к соответствующему файлу трехмерной графики, отображающему данный предикат или словосочетание в визуальном анимационном виде.

 

     Как отмечалось, формирование файлов трехмерной графики производится в полуавтоматическом режиме с целью обеспечения наиболее адекватного  отображения каждого предиката в визуальной форме, с соблюдением всех семантических связей текста и изображения. При этом, как отмечалось выше, некоторые визуальные объекты,  семантически входящие в данный визуальный образ, могут быть явно не указаны в текстовом предикате. Их наличие в визуальной сцене обусловлено семантикой внешнего мира, которая гораздо шире, чем сформированная база знаний «картины мира».

 

      Вспомним пример с предикатом «Мальчик садится за стол»: визуализация данного предиката предполагает ввод объекта, не упоминаемого в тексте,  – стула, на который садится мальчик.

 

     Данный пример говорит о том, что существует множество текстовых предикатов,  в которых определенные объекты присутствуют по умолчанию, но должны быть непременно в явном виде представлены в визуальном изображении рассматриваемого предиката. Позже с помощью режима самообучения база знаний «картины мира» существенно расширится, до объема полномасштабной, в которой можно будет найти любой требуемый объект [2]. В настоящее же время, при ее формировании в визуальной форме, необходимо (как уже отмечалось) участие специалиста по трехмерной графике, который бы создавал семантически корректные изображения с вводом в сцены объектов, явно не названных в исходном текстовом предикате.

 

      Если говорить о применении технологии искусственного интеллекта, то это возможно уже сейчас, на этапе создания базы знаний визуальной «картины мира».  С помощью этой технологии, базирующейся на логическом выводе и классификации объектов, решают задачу построения связанного с текстом трехмерного анимационного изображения в автоматическом режиме.    

 

      Для реализации указанной задачи  создается специальная интеллектуальная система визуализации, которая позволяет на основе семантических связей баз знаний текстовой и визуальной «картин мира», а также логического вывода на изображаемом тексте по критерию «тема-рема» сформировать трехмерное визуальное анимационное изображение, семантически достаточно точно связанное с исходным текстом.

 

     Рассмотрим работу данной системы на примере визуального отображения предложения, приведенного выше: «Белый пароход прибыл с туристами поздно вечером в Одессу». В базе знаний текстовой «картины мира» это предложение будет отображено в виде трех предикатов:

 

«Белый пароход прибыл с туристами».

 

«Белый пароход прибыл поздно вечером».

 

«Белый пароход прибыл в Одессу».

 

     Отметим, что в базе знаний «картины мира» может содержаться множество других предикатов, которые связаны с образом белого парохода, входящим в другие предложения. Как отмечалось выше, все эти представленные с помощью трехмерной графики предикаты,  имеются  в базе знаний визуальной «картины мира» как фрагменты различных визуальных изображений - сцен, видеороликов.

 

     Для отображения указанного выше предложения нам необходимо только три описанных предиката. С помощью логического вывода по критерию «тема-рема» эти предикаты приводят к форме представленного выше предложения: «Белый пароход прибыл с туристами поздно вечером в Одессу».

 

     Отметим, что в данном примере все предикаты объединены по критерию единого пространства или места – порт Одесса.

 

     Напомним, что логический вывод в этом предложении производят по параллельной схеме «тема-рема».

 

     Перейдем к визуальному отображению данной текстовой информации. Согласно последовательности действий рассматриваемого процесса, визуальные образы указанных предикатов были созданы на этапе формирования базы знаний визуальной «картины мира». Каждый предикат в отдельности нужно считать по индексам предикатов из названной базы знаний.

 

     Далее интеллектуальная система визуализации должна произвести  необходимую обработку изображений считанных предикатов, подобно произведенной в текстовом документе (т.е. по параллельной схеме «тема-рема»). Важно отметить, что визуальные образы указанных текстовых предикатов должны быть представлены в совмещении в одной визуальной сцене, отображающей прибытие белого парохода с туристами на борту в ночное время в порт Одесса. Иными словами, присутствующие в исходных фрагментах анимаций три картины, содержащие образы трех рассмотренных предложений-предикатов (парохода с туристами на борту, парохода, прибывающего поздно вечером, и парохода, прибывающего в Одессу), следует объединить и отобразить в единстве. При этом  местоположение вечернего неба над пароходом, морских волн под ним, туристов на борту парохода должно соответствовать реальной картине мире, что обеспечивается специальной интеллектуальной системой визуализации. 

 

     Это выдвигает новые требования к трехмерной графике по созданию интегральных сцен, семантически корректно представляющих все объекты исходных предикатов.       

 

     Теперь рассмотрим интеграцию текста и изображения предикатов при наличии между ними цепной (последовательной) связи «тема-рема» на примере  представленного выше сложноподчиненного предложения «Белый пароход прибыл с туристами  в Одессу, где начинался фестиваль».

 

     Здесь кроме предикатов «Белый пароход прибыл в Одессу» и «Белый пароход прибыл с туристами» имеется предикат «В Одессе начинался фестиваль», который связан с первыми предикатами последовательной связью. Поэтому первая анимационная сцена, представляющая образные фрагменты прибытия белого парохода в Одессу и прибытие белого парохода с туристами, должна быть продолжена семантически связанным с этой сценой визуальным фрагментом-сценой, изображающим начало фестиваля в городе Одесса.     

 

     Отметим, что эти визуальные образы связаны не только отношением «тема-рема», не только пространственной, но и временной зависимостью, поскольку сначала изображается сцена прибытия белого парохода с туристами на борту в Одессу, а затем следует сцена начала фестиваля в городе Одесса.

 

     О временной зависимости в данном примере позволяет говорить и грамматическая особенность – разные  действия, выраженные, соответственно, разными глаголами-сказуемыми. Подчеркнем, что эта особенность, характеризующая разные типы предложений (сложноподчиненные, сложносочиненные, простые с однородными сказуемыми), является выражением процессуальности и в визуальном представлении всегда связана со  сменой образных фрагментов.

 

       Из сказанного следует, что при создании семантически корректного изображения текста с анимацией необходимо с помощью классификатора и логики расположения предикатов определять тип связи между ними по критерию «параллельная-цепная» и последовательность развертывания отдельных сцен по критерию «место-время».

 

      Рассмотрим пример. Если следом за предложением «Мальчик сидит за столом» следуют предложения «Мальчик встает из-за стола», «Мальчик подходит к окну», «Мальчик открывает окно в комнате», то  их объединяет  единое место для данной сцены (не указанное в тексте, но подразумеваемое) – комната.

 

     Сначала по классификатору определяется то, что стол, стул и окно связаны с понятием «комната», при этом связаны как часть и целое, следовательно, находятся в пространстве комнаты. По классификатору также определяется отношение понятия «комната» к классу «место». Первый глагол («сидит») относится к классу глаголов местоположения, следующие глаголы («встает, подходит») - к классу движения. Глагол «открывает» является глаголом конкретного действия. Данные классифицированные глаголы в сочетании с отмеченными  классифицированными и определенными как часть комнаты существительными (предикаты) также указывают на то, что все действия мальчика происходят в пространстве комнаты.  Поэтому интеллектуальная система должна представить визуальную анимацию, состоящую из  четырех последовательных сцен, действие которых происходит в комнате с предметами, находящимися в ней.  

 

     Если бы далее текст содержал предложения «Мальчик выходит из комнаты» и «Мальчик идет в школу», то опять-таки по классификатору нужно было бы определить, что субъект покидает место трех предыдущих сцен – комнату. После этого должна последовать сцена  с другим пространственным изображением - движения мальчика по улице в школу.

 

      Таким образом, специальная интеллектуальная система визуализации, которая основана на логической обработке текста и его изображения, обеспечит семантически корректную последовательность визуальных сцен, раскрывающих исходный текст.

 

     Конечно, представленная в теоретическом плане система визуализации, основой которой является технология искусственного интеллекта, будет реализована лишь в перспективе, на основе методов, описанных в работе [2]. Пока указанные подходы можно использовать в интеллектуальных вопросно-ответных поисковых системах для решения задачи визуализации запросов пользователя и полученных релевантных ответов.

 

     В поисковых системах метод семантической связи текста с трехмерной графикой может быть применен для лучшего понимания пользователем корректности заданного им вопроса и  релевантности полученного ответа. Данный метод позволяет более глубоко и емко постичь содержание полученного ответа. Этот метод может также привнести в процесс познания элементы занимательности, разрядки, тем самым обеспечить необходимые на определенном этапе умственной работы моменты расслабления и отдыха.

 

     Подчеркнем, что образная сфера, основу которой составляет трехмерная графика и анимация, является неотъемлемой частью познавательного процесса вообще. Поэтому подключение ее к рационально-логической составляющей (текст) не только органично, естественно, но и предполагается как необходимое действие, качественно повышающее эффективность результата названного процесса.

 

     Рассмотрим возможности применения предлагаемого метода  на этапе формирования запроса пользователя.

 

     Пользуясь достижениями трехмерной графики и анимации можно «нарисовать» сказочное  существо - всезнающего помощника-архивариуса, который будет движениями, жестами, мимикой выражать семантику вопросительных слов, а в дальнейшем и озвучивать эти слова или весь запрос. Например, при появлении запроса с вопросительным словом «где» помощник-архивариус смотрит в бинокль, символизируя тем самым поиск обозначенного в запросе субъекта или объекта. В соответствии с семантикой слова «когда» он смотрит на часы. При слове «как» в запросе «сомневающийся» помощник-архивариус разводит руками в стороны - так выражается им шутливо-лукавое «незнание». Выражая вопросительное слово «сколько», помощник-архивариус считает на пальцах. При появлении слова «какой» он поднимает пальчик вверх – еще один жест с семантикой мыслительного действия. Сидящий за столом, размышляющий помощник-архивариус, подпирает голову правой или левой руками, что выражает семантику слов, соответственно, «кто» или «что». Эти движения символизируют в первом случае высшее, мыслящее творение природы – человека, во втором, - творения его рук.

 

     Еще более разнообразно и богато с помощью средств визуализации можно выразить семантику релевантного ответа.    

 

     Приведем примеры.

 

     Полученный в текстовом виде  ответ на запрос «Где находится Дом-музей Чайковского П.И.?» визуально может быть представлен изображениями достопримечательностей  города Клина, в котором жил великий композитор, экспонатов музея (рояль, нотный текст музыкальных произведений и др.). Ответ может сопровождаться звучащей музыкой Чайковского П.И., созданной в период его жизни в этом доме.

 

     Визуализация ответа на запрос «Сколько сказок создал Андерсен Х.К?» открывает большие возможности в плане проявления творческого воображения и фантазии.  Произведения писателя признаны классикой в жанре литературной сказки. Любимые герои и незабываемые ситуации этих произведений могут быть ярко представлены с помощью статического и анимационного изображений.  

 

 

 

 

 

                                                                  

 

                                        ЛИТЕРАТУРА

 

1.Насыпный В.В., Насыпная Г.А. «Способ синтеза самообучающейся системы извлечения знаний из текстовых документов для поисковых систем», патент  РФ №2273879, приоритет от 28 мая 2002 г., номер международной заявки РСT/RU2002/000258, дата подачи 28 мая 2002.

 

2.Насыпный В.В., Насыпная Г.А. «Способ синтеза самообучающейся аналитической вопросно-ответной системы с извлечением знаний из текстов», заявка на патент №2007120344/09 от 06.08.2007.

 

3.Насыпный В.В., Насыпная Г.А. Построение интеллектуальной информационно-поисковой системы. М.: Прометей, 2001. – 27с.

 

4.Насыпный В.В., Насыпная Г.А. Поисковая машина для карманных компьютеров //Мир ПК, 2006, №3.

 

5. Бондаренко С.В., Бондаренко М.Ю. 3ds max. Легкий старт.- СПб.: Питер, 2005. -  128 с.

 

 

 

 

СПОСОБ СИНТЕЗА САМООБУЧАЮЩЕЙСЯ СИСТЕМЫ   ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ ТЕКСТОВЫХ ДОКУМЕНТОВ ДЛЯ ПОИСКОВЫХ СИСТЕМ

Патент

Авторы: Насыпный В.В., Насыпная Г.А.

Патент РФ № 2273879, 28.05.2002 г. "Способ синтеза самообучающейся системы извлечения знаний из текстовых документов для поисковых систем", международная заявка № PCT/RU2002/000258, 28.05.2002 г.,

 

Область техники

           Изобретение относится к области вычислительной техники, информационно-поисковых и интеллектуальных  систем.

           Изобретение предназначено для использования при создании информационно-поисковых и других информационных и интеллектуальных систем, работающих на базе Internet.

           Предшествующий уровень техники

           В настоящее время в системе Internet накоплен огромный объем информации по различным предметным областям и темам. В этой информации содержатся и постоянно обновляются всеобъемлющие сведения и знания. Однако доступ к ним со стороны многомиллионной пользовательской аудитории затруднен. Это обусловлено недостаточной эффективностью современных способов извлечения информации для поисковых систем. Известны способы извлечения информации для поисковых систем Yandex, Yahoo, Rambler. Известные способы обеспечивают выдачу текстовых документов по запросам пользователя из системы Internet.

           Основными недостатками известных способов извлечения информации названных систем являются:

- сложность формализованных языков запросов;

- отсутствие аппарата семантического анализа содержания текстовых документов и их соответствия задаваемым вопросам;

- невозможность точного определения наличия в поисковом документе информации,  указанной в запросе пользователя, а также выделения из объемных информационных источников конкретных сведений и знаний, необходимых пользователю.

            В силу указанных недостатков при реализации информационно-поисковых процедур  наряду с полезной передается много лишней, «шумовой» информации, которая плохо селектируется современными поисковыми системами. Это существенно повышает время поиска нужной информации, загружает каналы и серверы системы передачей и обработкой поискового шума.

            Главная проблема состоит в том, что при этом и пользователь, задав запрос системе, получает большие объемы информации, часто не содержащей нужных сведений. Возникает необходимость ознакомиться с каждым полученным документом для определения наличия в нем требуемых данных. Это приводит к неоправданным временным и интеллектуальным затратам. Невозможность получения в реальном масштабе времени из огромных массивов  Internet конкретных сведений и знаний, нужных пользователю для решения проблем различного характера, существенно снижает как ценность информации, так и эффективность работающих с ней поисковых систем.

           Известен способ извлечения знаний и сведений по запросам пользователя из баз знаний, который реализован в интеллектуальной информационно-логической вычислительной системе, описанной в монографии: Насыпный В.В. Развитие теории построения открытых систем на основе информационной технологии искусственного интеллекта. М., 1994. - 248 с. (С.85-112). Указанный способ, основанный на стохастической информационной технологии, обеспечивает возможность эффективного поиска знаний и их обработки с использованием логического вывода в реальном масштабе времени. Это обусловлено тем, что в отличие от существующих способов обработки знаний, которые применяются в современных системах искусственного интеллекта, данный способ обеспечивает линейную зависимость времени поиска и логической обработки от объема  знаний, необходимых для формирования ответа. Однако этот способ не дает возможности извлечения знаний из текстовых документов, что объясняется его ориентацией на обработку формализованной информации баз знаний, осуществляемой  экспертами и инженерами по знаниям. Это делает невозможным использование данного способа для извлечения знаний из текстовых документов современных информационно-поисковых систем.

           Известен также способ извлечения знаний из текстовых  документов, описанный в работе: Насыпный В.В., Насыпная Г.А. Построение интеллектуальной информационно-поисковой системы. М.: Прометей, 2001. - 27 с.  В основу способа положена стохастическая интеллектуальная информационная технология, которая обеспечивает проведение в реальном масштабе времени морфологического, синтаксического и семантического анализа  больших объемов текстовой информации. Данная система может функционировать совместно с существующими информационно-поисковыми системами в качестве интеллектуальной надстройки над ними, а также создавать поисковые системы нового поколения со своими стандартами стохастической индексации текстовых документов, протоколами информационного обмена и обработки запросов пользователя. Главными  достоинствами указанного способа по сравнению со способами, реализованными в современных поисковых системах, являются:

- обработка запросов пользователя на естественном языке;

- поиск и выдача документов, достоверно содержащих полную информацию, релевантную запросу пользователя;

- выделение фрагментов текста в соответствии с запросом пользователя, содержащих сведения и знания по различным предметным областям, необходимым для решения конкретных проблем. 

           Основным недостатком данного способа является то, что наполнение баз знаний интеллектуальных систем, предназначенных для проведения морфологического, синтаксического, семантического анализа текста производится экспертами и требует длительных временных и технологических затрат. Поэтому создание подобных систем  извлечения знаний из текстовых документов в интересах пользователей развитых стран, которые имеют национальные подсистемы в Internet с информацией на языке данной страны, требуют длительного времени. Вследствие этого указанный способ не может быть использован  для создания на базе Internet  многоязычных систем извлечения знаний из текстов. Это существенно затрудняет переход к индустрии знаний, которая бы основывалась на текстовой информации национальных поисковых систем и обеспечивала бы качественно новый информационный сервис в различных сферах – производственной, научной, образовательной, культурной и бытовой деятельности человека с учетом современных требований цивилизованного общества.

 К другим недостаткам указанного способа можно отнести отсутствие возможности автоматического анализа новых слов, не входящих в состав словарей. В случае  их появления в текстовых документах требуется участие экспертов при определении, к какой части речи относится новое слово, и его морфологических характеристик. Это делает невозможным автоматическое настраивание системы извлечения знаний на обработку текстовых документов по заданным новым темам. Отметим также, что для обеспечения эффективности извлечения знаний требуется комплексная обработка фрагментов текста из различных документов, основанная на анализе семантических связей с помощью логического вывода между указанными фрагментами, а также на эквивалентных преобразованиях предложения данного текста. Эта функция также не реализована в рассматриваемом способе.

                                             Формула изобретения

1. Способ синтеза самообучающейся системы извлечения знаний на заданном языке из текстовых документов поисковых систем, при котором:

           обеспечивают механизм самообучения в виде стохастически индексированной  системы искусственного интеллекта, основанной на применении уникальных комбинаций  двоичных сигналов стохастических индексов информации,

            обеспечивают автоматическое обучение системы правилам грамматического и семантического анализа путем применения эквивалентных  преобразований стохастически индексированных фрагментов текста, логического вывода и формирования из них связанных семантических структур и стохастического индексирования  для  представления  в формате  правил продукций,

            производят морфологический анализ и стохастическое индексирование лингвистических текстов в электронном виде с одновременным автоматическим обучением системы правилам морфологического анализа,

            производят морфологический и синтаксический анализ, а также стохастическое индексирование  текстовых документов по заданной теме в электронном виде на заданном языке с одновременным  автоматическим обучением системы правилам синтаксического анализа,

            производят семантический анализ стохастически индексированных текстовых документов по заданной теме в электронном виде с одновременным автоматическим обучением системы правилам семантического анализа,

            формируют запрос пользователя на естественном заданном языке и представляют его в  электроном виде  после стохастического индексирования в форме  вопросительного предложения,

            преобразуют запрос пользователя в стохастически индексированном виде во множество новых запросов,  эквивалентных исходному запросу,

           в соответствии с запросом пользователя осуществляют  предварительный выбор стохастически индексированных фрагментов текстовых документов в электронном виде, содержащих в совокупности все словосочетания преобразованного  запроса,

            формируют стохастически индексированную семантическую структуру с использованием указанных фрагментов текстовых документов,

            на основе указанной структуры с помощью логического вывода, обеспечивающего связь стохастически индексированных элементов различных текстов,  и  эквивалентного преобразования текста формируют краткий ответ системы,

            проверяют релевантность полученного краткого ответа системы запросу путем  формирования на его основе вопросительного предложения, сравнения полученного вопросительного предложения  с запросом,

            при идентичности полученного вопросительного предложения и запроса принимают решение о релевантности краткого ответа системы запросу и представляют его на заданном языке.

2. Способ синтеза самообучающейся системы извлечения знаний на любом из заданных иностранных языках из текстовых документов поисковых систем, при котором:

            обеспечивают механизм самообучения в виде стохастически индексированной  системы искусственного интеллекта, основанной на применении уникальных комбинаций  двоичных сигналов стохастических индексов информации  для стохастической индексации и поиска фрагментов  лингвистических текстов на заданном базовом языке, содержащих описание процедур грамматического и семантического анализа,  и автоматического обучения системы правилам грамматического и семантического анализа путем эквивалентных  преобразований стохастически индексированных фрагментов текста, логического вывода и формирования из них связанных семантических структур, их стохастического индексирования  для  представления  в формате  правил продукций,

производят морфологический анализ и стохастическое индексирование лингвистических текстов на заданном базовом языке в электронном виде с одновременным автоматическим обучением системы правилам морфологического анализа, формированием базы данных  стохастически индексированных словарей и формированием таблиц индексов лингвистических текстов для каждого из заданных иностранных языков, а также базы знаний морфологического анализа, содержащей полученные правила продукций для заданного базового языка и каждого из заданных иностранных языков,

производят морфологический и синтаксический анализ, а также стохастическое индексирование  текстовых документов по заданной теме  на каждом из заданных  иностранных языков  в электронном виде из поисковой системы с представлением их в виде таблиц индексов  текстовых документов по заданной теме и записью в базы стохастически индексированных текстов с одновременным  автоматическим обучением системы правилам синтаксического анализа с использованием стохастически индексированных лингвистических текстов на заданном базовом языке и формированием базы знаний  синтаксического анализа для  базового языка и каждого из заданных   иностранных языков,

производят семантический анализ стохастически индексированных текстовых документов по заданной теме  на заданном базовом языке в электронном виде с одновременным автоматическим обучением системы правилам семантического анализа и формированием базы знаний семантического анализа для  базового языка и каждого из  заданных  иностранных языков,

формируют запрос пользователя на естественном заданном иностранном языке  и представляют его в  электроном виде  после стохастического индексирования в форме  вопросительного предложения, включающего вопросительное  словосочетание и словосочетания, которые определяют семантику запроса,

преобразуют запрос пользователя в стохастически индексированном виде во множество новых запросов,  эквивалентных исходному запросу на заданном  иностранном языке,

в соответствии с запросом пользователя осуществляют  предварительный выбор стохастически индексированных фрагментов текстовых документов на заданном иностранном языке в электронном виде, содержащих в совокупности все словосочетания преобразованного  запроса,

           формируют стохастически индексированную семантическую структуру на основе указанных фрагментов текстовых документов,

на основе сформированной стохастически индексированной семантической структуры с помощью логического вывода, обеспечивающего связь стохастически индексированных элементов различных текстов,  и  эквивалентного преобразования текста формируют краткий ответ системы, содержащий словосочетания в стохастически индексированном виде, которые определяют семантику запроса, а также группу слов ответа, соответствующую вопросительному словосочетанию запроса,

проверяют релевантность полученного краткого ответа системы запросу путем замены группы слов ответа на соответствующее  вопросительное словосочетание в стохастически индексированном виде, получения стохастически индексированного вопросительного предложения, сравнения полученного вопросительного предложения  с запросом   и   при идентичности полученного вопросительного предложения и запроса принимают решение о релевантности краткого ответа системы запросу и представляют  его на заданном  иностранном языке.

          3. Способ по п.1 или 2, отличающийся тем, что при неудачной попытке сформировать вопросительное предложение, идентичное запросу пользователя, запрашивают новые текстовые документы из  поисковой системы для поиска ответа, релевантного запросу пользователя,

           4. Способ по п.1 или 2, отличающийся тем, что  дополнительно по запросу пользователя формируют полный ответ, содержащий более подробную информацию или совокупность конкретных знаний, при этом используют логический вывод для образования стохастически индексированной семантической структуры и необходимые эквивалентные преобразования указанной совокупности фрагментов текстов для получения  стохастически индексированного нового текста, раскрывающего с возможной детализацией содержание полученного ранее краткого ответа. 

5. Способ по п. 1,2  отличающийся тем, что  автоматическое обучение системы правилам морфологического анализа производят путем выделения в стохастически индексируемом тексте определенного набора словоформ каждого слова, получения стохастических индексов основы слова и заданного набора его окончаний или предлогов, произвольного доступа по указанным индексам к  стохастически индексированным лингвистическим текстам, выделения из них фрагментов, связывающих  указанный набор окончаний слова или предлогов с соответствующей данному слову частью речи, а также с полным набором окончаний или предлогов, получаемых при склонении или спряжении, преобразования данных фрагментов в формат правил продукций путем  их стохастического индексирования, обеспечивая  при этом корректность каждого правила путем независимого его формирования на основе нескольких фрагментов из соответствующих лингвистических текстов,   и получения  таблицы индексов правил продукций  для базы знаний морфологического анализа.

6. Способ по п.п.1-5, отличающийся тем, что при стохастическом индексировании лингвистических текстов после определения  части речи каждого слова с помощью правил базы знаний морфологического анализа заполняют базу данных стохастически индексированного  словаря стохастическими  индексами  основы каждого очередного слова и полного набора его окончаний или предлогов.

7. Способ по п.п. 1,2,5,6, отличающийся тем, что   для  формирования таблиц индексов  текстов осуществляют стохастическое преобразование  информации  и получение уникальных двоичных комбинаций индексов основ слов, их окончаний, предлогов, предложений, абзацев и названий текстов, которые помещают в таблицы индексов базы стохастически индексированных текстов  с обеспечением связности между указанными индексами, определенной в исходном тексте и обеспечивающей его восстановление по таблице индекса.

8. Способ по п.1,2 отличающийся тем, что автоматическое обучение системы правилам синтаксического анализа осуществляют путем поиска в стохастически индексированных лингвистических текстах фрагментов, описывающих порядок синтаксического разбора предложений, при этом реализуется логический вывод для получения  стохастически индексированной семантической структуры, определяющей  связь синтаксических элементов и структур с заданными  частями речи слов, и формирования правил продукций, определяющих синтаксический разбор предложений по морфологическим характеристикам слов, обеспечивая  при этом корректность каждого правила путем независимого его формирования на основе нескольких фрагментов из соответствующих лингвистических текстов, полученные правила заносят в базу знаний синтаксического анализа, по мере заполнения которой осуществляют  ее стохастическое индексирование и представление в виде таблицы индексов.

9. Способ по п.1, 2, отличающийся тем, что автоматическое обучение системы правилам семантического анализа текста осуществляют путем формирования запроса к таблицам индексов лингвистических текстов  по стохастическим индексам основ слов и частей речи, не точно определенных членов предложения, и получения ответа в виде фрагмента текста, описывающего семантические характеристики, которыми должны обладать слова для их соответствия данному конкретному члену предложения, и по полученному ответу, используя стохастический индекс основы данного слова и требуемые семантические характеристики, обращаются к таблицам индексов толковых словарей и энциклопедий общего и тематического назначения, при этом с помощью логического вывода   делают попытку образовать стохастически индексированную семантическую структуру, связывающую данное слово и требуемые семантические характеристики, в положительном случае считают, что указанный член предложения определен точно, а фрагмент текста, релевантный запросу,  преобразуют в правило продукций, обеспечивая  при этом корректность каждого правила путем независимого его формирования на основе нескольких фрагментов из соответсвующих лингвистических текстов, которое включают в базу знаний семантического анализа,  стохастически индексируют данную базу, представляют в виде таблицы индексов и применяют при семантическом анализе слов, как членов предложения, и отношений между словами, выраженных словосочетаниями.

10. Способ по п.п.1-9, отличающийся тем, что  после образования таблицы индексов каждого текста и завершения его морфологического, синтаксического и семантического анализа формируют стохастические индексы   наименований частей речи, членов предложения  и вопросов к ним, которые соответствуют каждому слову в составе предложений, и записывают  указанные индексы в ячейки таблицы индексов данного текста, что позволяет при поиске фрагментов текста автоматически определять, к какой части речи,  члену предложения относится каждое слово, и формировать вопросы к нему.  

11. Способ по п.п.1-10, отличающийся тем, что после получения всех таблиц индексов текстов формируют таблицу индексов текстов по данной теме, строки которой поименованы неповторяющимися стохастическими индексами основ слов, а каждый столбец соответствует стохастическому индексу конкретного текста, при этом в ячейки таблицы записывают стохастические индексы абзацев, в которых в данном тексте  содержится слово с соответствующим индексом основы, полученную таблицу индексов по данной теме применяют для предварительного поиска фрагментов, содержащих определенную совокупность словосочетаний запроса.

12. Способ по п.п.1-11, отличающийся тем, что эквивалентные преобразования исходного запроса пользователя осуществляют с использованием синонимов, близких по смыслу слов, а также замены частей речи и членов предложения с сохранением смыслового содержания исходного запроса на основе применения стохастически  индексированных правил   морфологического, синтаксического и семантического анализа для получения эквивалентных структур словосочетаний вопросительного предложения запроса и сохранения семантической связи между ними.

           13. Способ по п.п.1-12, отличающийся тем, что совокупность семантически связанных фрагментов текста, содержащих все слова запроса пользователя,  формируют путем обращения по стохастическим индексам указанных основ слов к таблице индексов текстов по заданной теме, выбора стохастических индексов абзацев и соответствующих им текстов, содержащих в совокупности все словосочетания  запроса,  обращения по указанным индексам  к таблице индексов каждого из выбранных  текстов, логического вывода по таблицам индексов  и эквивалентных преобразований текстов для образования  стохастически индексированной семантической структуры, связывающей индексы группы слов ответа, соответствующего вопросительному словосочетанию запроса, а также все словосочетания запроса, определяющие семантику запроса и входящие в предварительно выбранные абзацы.

14. Способ по п.13, отличающийся тем, что успешно сформированная в процессе логического вывода  стохастически индексированная семантическая структура, соответствующая запросу пользователя, принимается в качестве основы для формирования с использованием полученной совокупности фрагментов текста вопросительного предложения, идентичного запросу пользователя, которое образуют путем эквивалентного преобразования стохастических индексов основ слов запроса и их окончаний с помощью правил баз знаний для обеспечения требуемых семантических характеристик  каждого словосочетания текстового фрагмента, входящего в состав запроса, а также с использованием логического вывода на транзитивных зависимостях между словосочетниями для объединения их в единое вопросительное предложение, идентичное запросу пользователя, которое содержит группу слов ответа, соответствующую вопросительному словосочетанию запроса.

15. Способ по п.п. 1-14, отличающийся тем, что  корректность краткого ответа  обеспечивают путем формирования нескольких идентичных стохастически индексированных семантических структур  упомянутого ответа на основе различных, предварительно выбранных стохастически индексированных фрагментов текстовых документов.

 16. Способ по п.п. 1-15, отличающийся тем, что в процессе поиска и формирования ответа  с использованием таблиц индексов текстовых документов самообучение системы осуществляют путем формирования индексированных текстовых элементов, связывающих запрос и релевантный краткий ответ, для получения базы знаний, содержащей элементы типа «запрос – ответ», которую стохастически индексируют, представляют в виде таблицы индексов и применяют при грамматическом и семантическом анализе предложений текста, а также при формировании ответов на повторяющиеся запросы пользователей, содержащиеся в указанной индексированной базе знаний.

17. Способ по п.п. 1, 2, 4 отличающийся тем, что для формирования полного ответа, содержащего знания, релевантные запросу пользователя, на основе краткого ответа с помощью логического вывода по таблицам индексов, использованных при получении фрагмента текста, формируют стохастически индексированную семантическую структуру, связывающую группу слов ответа со стохастическими индексами основ слов предложений, поддерживающих транзитивную зависимость, обеспечивающую в своей совокупности полное раскрытие содержания краткого ответа в рамках сформированного фрагмента текста, затем с помощью эквивалентных преобразований предложений на основе указанной стохастически индексированной семантической структуры получают единый связанный текст полного ответа.

18. Способ по п.п. 1-17, отличающийся тем, что эквивалентное преобразование стохастически индексированных фрагментов текста производят путем представления каждого предложения в виде совокупности стохастически индексированных словосочетаний, которые  преобразуют с использования правил баз знаний морфологического, синтаксического и семантического анализа путем  эквивалентного преобразования стохастических индексов основ однокоренных слов, их окончаний и предлогов для образования новых частей речи или членов предложения с обеспечением неизменности связи указанных словосочетаний в рамках стохастически индексированной семантической структуры каждого предложения и согласования указанных предложений между собой при образовании из них нового фрагмента текста.

19. Способ  по п. 1-18, отличающийся тем, что  при появлении  в процессе стохастического индексирования  текстовых документов в индексируемом тексте нового слова, не содержащегося в словаре стохастически индексированных слов и в лингвистических текстах, находят в данном словаре однокоренное слово с указанным новым словом, а в базе знаний морфологического анализа находят правила для эквивалентного преобразования найденного в словаре однокоренного слова в новое слово, при этом по виду эквивалентного преобразования определяют часть речи, к которой  относится новое слово и все его словоформы, получаемые при склонении или спряжении, а при отсутствии однокоренных слов в словаре выбирают из текста определенный набор словоформ нового слова, по предлогам или окончаниям которых с помощью стохастически индексированного словаря или правил продукций морфологического анализа определяют часть речи, к которой оно относится, и полный набор его словоформ, получаемых при склонении или спряжении.

20. Способ по п. 2, отличающийся тем, что для одновременного извлечения знаний из текстовых документов на заданных иностранных  языках сначала осуществляют автоматическое обучение системы правилам морфологического, синтаксического, семантического анализа для заданного базового языка,  производят формирование базы стохастически индексированного словаря и баз знаний морфологического, синтаксического, семантического анализа с использованием стохастически индексированных лингвистических текстов на заданном базовом языке, с помощью сформированных баз осуществляют автоматическое формирование запросов для автоматического обучения системы любому из заданных иностранных языков, при этом  производят предварительный выбор  по автоматически сформированным  запросам  фрагментов лингвистических текстов на базовом языке, содержащих знания, необходимые для изучения заданного иностранного языка, эквивалентные преобразования указанных текстов, формирование стохастически индексируемых семантических структур и логический вывод на заданных структурах для формирования ответов, релевантных автоматическим запросам, которые используют для формирования баз знаний морфологического, синтаксического и семантического анализа для любого из заданных иностранных языков, обеспечивающих извлечение знаний из текстовых документов на заданном  иностранном языке.

 

                                                     Реферат

Изобретение относится к области вычислительной техники, информационно-поисковых и интеллектуальных  систем и может быть использовано при создании информационно-поисковых и других информационных и интеллектуальных систем, работающих на базе Internet. Достигаемым  техническим результатом является возможность автоматического формирования знаний путем извлечения их из текстовых документов, представленных на различных языках в электронном виде, и интеллектуальная обработка текстовой информации и запросов пользователей  с целью извлечения знаний на любом иностранном языке.    В заявленном способе обеспечивают механизм самообучения в виде стохастически индексированной  системы искусственного интеллекта, обеспечивающей автоматическое обучение системы правилам грамматического и семантического анализа. Формируют базы данных  стохастически индексированных словарей и таблицы индексов лингвистических текстов, базы знаний морфологического анализа. Производят морфологический и синтаксический анализ, а также стохастическое индексирование  текстовых документов по заданной теме из поисковой системы на заданном языке и формируют базы знаний  синтаксического анализа. Производят семантический анализ стохастически индексированных текстовых документов по заданной теме и формируют базы знаний семантического анализа. Формируют запрос пользователя и  преобразуют его в стохастически индексированном виде во множество новых запросов,  эквивалентных исходному запросу, и  осуществляют выбор стохастически индексированных фрагментов текстовых документов, содержащих в совокупности все словосочетания преобразованного  запроса, из которых формируют стохастически индексированную семантическую структуру, на основе которой с помощью логического вывода формируют краткий ответ системы. Проверяют релевантность полученного краткого ответа системы запросу путем формирования на его основе   вопросительного предложения и сравнения его с запросом.  При идентичности запроса пользователя полученному вопросительному предложению принимают решение о релевантности краткого ответа системы запросу и представляют его пользователю на заданном языке.

 

 

 

Лев Николаевич Толстой

Война и мир. Том 1

 

Война и мир – 1

 

Лев Николаевич Толстой

ВОЙНА И МИР  

Том 1

 

ЧАСТЬ ПЕРВАЯ

 

I

 

– Еh bien, mon prince. Genes et Lucques ne sont plus que des apanages, des поместья, de la famille Buonaparte. Non, je vous previens, que si vous ne me dites pas, que nous avons la guerre, si vous vous permettez encore de pallier toutes les infamies, toutes les atrocites de cet Antichrist (ma parole, j'y crois) – je ne vous connais plus, vous n'etes plus mon ami, vous n'etes plus мой верный раб, comme vous dites. [  Ну, что, князь, Генуа и Лукка стали не больше, как поместьями фамилии Бонапарте. Нет, я вас предупреждаю, если вы мне не скажете, что у нас война, если вы еще позволите себе защищать все гадости, все ужасы этого Антихриста (право, я верю, что он Антихрист) – я вас больше не знаю, вы уж не друг мой, вы уж не мой верный раб, как вы говорите.]   Ну, здравствуйте, здравствуйте. Je vois que je vous fais peur, [  Я вижу, что я вас пугаю,]   садитесь и рассказывайте.

Так говорила в июле 1805 года известная Анна Павловна Шерер, фрейлина и приближенная императрицы Марии Феодоровны, встречая важного и чиновного князя Василия, первого приехавшего на ее вечер. Анна Павловна кашляла несколько дней, у нее был грипп , как она говорила (грипп  был тогда новое слово, употреблявшееся только редкими). В записочках, разосланных утром с красным лакеем, было написано без различия во всех:

«Si vous n'avez rien de mieux a faire, M. le comte (или mon prince), et si la perspective de passer la soiree chez une pauvre malade ne vous effraye pas trop, je serai charmee de vous voir chez moi entre 7 et 10 heures. Annette Scherer».

[  Если y вас, граф (или князь), нет в виду ничего лучшего и если перспектива вечера у бедной больной не слишком вас пугает, то я буду очень рада видеть вас нынче у себя между семью и десятью часами. Анна Шерер.]  

– Dieu, quelle virulente sortie [  О! какое жестокое нападение!]   – отвечал, нисколько не смутясь такою встречей, вошедший князь, в придворном, шитом мундире, в чулках, башмаках, при звездах, с светлым выражением плоского лица. Он говорил на том изысканном французском языке, на котором не только говорили, но и думали наши деды, и с теми тихими, покровительственными интонациями, которые свойственны состаревшемуся в свете и при дворе значительному человеку. Он подошел к Анне Павловне, поцеловал ее руку, подставив ей свою надушенную и сияющую лысину, и покойно уселся на диване.

– Avant tout dites moi, comment vous allez, chere amie? [  Прежде всего скажите, как ваше здоровье?]   Успокойте друга, – сказал он, не изменяя голоса и тоном, в котором из?за приличия и участия просвечивало равнодушие и даже насмешка.

– Как можно быть здоровой… когда нравственно страдаешь? Разве можно оставаться спокойною в наше время, когда есть у человека чувство? – сказала Анна Павловна. – Вы весь вечер у меня, надеюсь?

– А праздник английского посланника? Нынче середа. Мне надо показаться там, – сказал князь. – Дочь заедет за мной и повезет меня.

– Я думала, что нынешний праздник отменен. Je vous avoue que toutes ces fetes et tous ces feux d'artifice commencent a devenir insipides. [  Признаюсь, все эти праздники и фейерверки становятся несносны.]  

– Ежели бы знали, что вы этого хотите, праздник бы отменили, – сказал князь, по привычке, как заведенные часы, говоря вещи, которым он и не хотел, чтобы верили.

– Ne me tourmentez pas. Eh bien, qu'a?t?on decide par rapport a la depeche de Novosiizoff? Vous savez tout. [  Не мучьте меня. Ну, что же решили по случаю депеши Новосильцова? Вы все знаете.]  

– Как вам сказать? – сказал князь холодным, скучающим тоном. – Qu'a?t?on decide? On a decide que Buonaparte a brule ses vaisseaux, et je crois que nous sommes en train de bruler les notres. [  Что решили? Решили, что Бонапарте сжег свои корабли; и мы тоже, кажется, готовы сжечь наши.]   – Князь Василий говорил всегда лениво, как актер говорит роль старой пиесы. Анна Павловна Шерер, напротив, несмотря на свои сорок лет, была преисполнена оживления и порывов.

Быть энтузиасткой сделалось ее общественным положением, и иногда, когда ей даже того не хотелось, она, чтобы не обмануть ожиданий людей, знавших ее, делалась энтузиасткой. Сдержанная улыбка, игравшая постоянно на лице Анны Павловны, хотя и не шла к ее отжившим чертам, выражала, как у избалованных детей, постоянное сознание своего милого недостатка, от которого она не хочет, не может и не находит нужным исправляться.

В середине разговора про политические действия Анна Павловна разгорячилась.

– Ах, не говорите мне про Австрию! Я ничего не понимаю, может быть, но Австрия никогда не хотела и не хочет войны. Она предает нас. Россия одна должна быть спасительницей Европы. Наш благодетель знает свое высокое призвание и будет верен ему. Вот одно, во что я верю. Нашему доброму и чудному государю предстоит величайшая роль в мире, и он так добродетелен и хорош, что Бог не оставит его, и он исполнит свое призвание задавить гидру революции, которая теперь еще ужаснее в лице этого убийцы и злодея. Мы одни должны искупить кровь праведника… На кого нам надеяться, я вас спрашиваю?… Англия с своим коммерческим духом не поймет и не может понять всю высоту души императора Александра. Она отказалась очистить Мальту. Она хочет видеть, ищет заднюю мысль наших действий. Что они сказали Новосильцову?… Ничего. Они не поняли, они не могут понять самоотвержения нашего императора, который ничего не хочет для себя и всё хочет для блага мира. И что они обещали? Ничего. И что обещали, и того не будет! Пруссия уж объявила, что Бонапарте непобедим и что вся Европа ничего не может против него… И я не верю ни в одном слове ни Гарденбергу, ни Гаугвицу. Cette fameuse neutralite prussienne, ce n'est qu'un piege. [  Этот пресловутый нейтралитет Пруссии – только западня.]   Я верю в одного Бога и в высокую судьбу нашего милого императора. Он спасет Европу!… – Она вдруг остановилась с улыбкою насмешки над своею горячностью.

– Я думаю, – сказал князь улыбаясь, – что ежели бы вас послали вместо нашего милого Винценгероде, вы бы взяли приступом согласие прусского короля. Вы так красноречивы. Вы дадите мне чаю?

– Сейчас. A propos, – прибавила она, опять успокоиваясь, – нынче у меня два очень интересные человека, le vicomte de MorteMariet, il est allie aux Montmorency par les Rohans, [  Кстати, – виконт Мортемар,]   он в родстве с Монморанси чрез Роганов,]   одна из лучших фамилий Франции. Это один из хороших эмигрантов, из настоящих. И потом l'abbe Morio: [  аббат Морио:]   вы знаете этот глубокий ум? Он был принят государем. Вы знаете?

– А! Я очень рад буду, – сказал князь. – Скажите, – прибавил он, как будто только что вспомнив что?то и особенно?небрежно, тогда как то, о чем он спрашивал, было главною целью его посещения, – правда, что l'imperatrice?mere [  императрица?мать]   желает назначения барона Функе первым секретарем в Вену? C'est un pauvre sire, ce baron, a ce qu'il parait. [  Этот барон, кажется, ничтожная личность.]   – Князь Василий желал определить сына на это место, которое через императрицу Марию Феодоровну старались доставить барону.

Анна Павловна почти закрыла глаза в знак того, что ни она, ни кто другой не могут судить про то, что угодно или нравится императрице.

– Monsieur le baron de Funke a ete recommande a l'imperatrice?mere par sa soeur, [  Барон Функе рекомендован императрице?матери ее сестрою,]   – только сказала она грустным, сухим тоном. В то время, как Анна Павловна назвала императрицу, лицо ее вдруг представило глубокое и искреннее выражение преданности и уважения, соединенное с грустью, что с ней бывало каждый раз, когда она в разговоре упоминала о своей высокой покровительнице. Она сказала, что ее величество изволила оказать барону Функе beaucoup d'estime, [  много уважения,]   и опять взгляд ее подернулся грустью.

Князь равнодушно замолк. Анна Павловна, с свойственною ей придворною и женскою ловкостью и быстротою такта, захотела и щелконуть князя за то, что он дерзнул так отозваться о лице, рекомендованном императрице, и в то же время утешить его.

– Mais a propos de votre famille,[  Кстати о вашей семье,]   – сказала она, – знаете ли, что ваша дочь с тех пор, как выезжает, fait les delices de tout le monde. On la trouve belle, comme le jour. [  составляет восторг всего общества. Ее находят прекрасною, как день.]  

Князь наклонился в знак уважения и признательности.

– Я часто думаю, – продолжала Анна Павловна после минутного молчания, подвигаясь к князю и ласково улыбаясь ему, как будто выказывая этим, что политические и светские разговоры кончены и теперь начинается задушевный, – я часто думаю, как иногда несправедливо распределяется счастие жизни. За что вам судьба дала таких двух славных детей (исключая Анатоля, вашего меньшого, я его не люблю, – вставила она безапелляционно, приподняв брови) – таких прелестных детей? А вы, право, менее всех цените их и потому их не стоите.

И она улыбнулась своею восторженною улыбкой.

– Que voulez?vous? Lafater aurait dit que je n'ai pas la bosse de la paterienite, [  Чего вы хотите? Лафатер сказал бы, что у меня нет шишки родительской любви,]   – сказал князь.

– Перестаньте шутить. Я хотела серьезно поговорить с вами. Знаете, я недовольна вашим меньшим сыном. Между нами будь сказано (лицо ее приняло грустное выражение), о нем говорили у ее величества и жалеют вас…

Князь не отвечал, но она молча, значительно глядя на него, ждала ответа. Князь Василий поморщился.

– Что вы хотите, чтоб я делал! – сказал он наконец. – Вы знаете, я сделал для их воспитания все, что может отец, и оба вышли des imbeciles. [  дураки.]   Ипполит, по крайней мере, покойный дурак, а Анатоль – беспокойный. Вот одно различие, – сказал он, улыбаясь более неестественно и одушевленно, чем обыкновенно, и при этом особенно резко выказывая в сложившихся около его рта морщинах что?то неожиданно?грубое и неприятное.

– И зачем родятся дети у таких людей, как вы? Ежели бы вы не были отец, я бы ни в чем не могла упрекнуть вас, – сказала Анна Павловна, задумчиво поднимая глаза.

– Je suis votre [  Я ваш]   верный раб, et a vous seule je puis l'avouer. Мои дети – ce sont les entraves de mon existence. [  вам одним могу признаться. Мои дети – обуза моего существования.]   – Он помолчал, выражая жестом свою покорность жестокой судьбе.

Анна Павловна задумалась.

– Вы никогда не думали о том, чтобы женить вашего блудного сына Анатоля? Говорят, – сказала она, – что старые девицы ont la manie des Marieiages. [  имеют манию женить.]   Я еще не чувствую за собою этой слабости, но у меня есть одна petite personne [  маленькая особа]  , которая очень несчастлива с отцом, une parente a nous, une princesse [  наша родственница, княжна]   Болконская. – Князь Василий не отвечал, хотя с свойственною светским людям быстротой соображения и памяти показал движением головы, что он принял к соображению эти сведения.

– Нет, вы знаете ли, что этот Анатоль мне стоит 40.000 в год, – сказал он, видимо, не в силах удерживать печальный ход своих мыслей. Он помолчал.

– Что будет через пять лет, если это пойдет так? Voila l'avantage d'etre pere. [  Вот выгода быть отцом.]   Она богата, ваша княжна?

– Отец очень богат и скуп. Он живет в деревне. Знаете, этот известный князь Болконский, отставленный еще при покойном императоре и прозванный прусским королем. Он очень умный человек, но со странностями и тяжелый. La pauvre petite est malheureuse, comme les pierres. [  Бедняжка несчастлива, как камни.]   У нее брат, вот что недавно женился на Lise Мейнен, адъютант Кутузова. Он будет нынче у меня.

– Ecoutez, chere Annette, [  Послушайте, милая Аннет,]   – сказал князь, взяв вдруг свою собеседницу за руку и пригибая ее почему?то книзу. – Arrangez?moi cette affaire et je suis votre [  Устройте мне это дело, и я навсегда ваш]   вернейший раб a tout jamais pan , comme mon староста m'ecrit des [  как пишет мне мой староста]   донесенья: покой?ер?п!. Она хорошей фамилии и богата. Всё, что мне нужно.

И он с теми свободными и фамильярными, грациозными движениями, которые его отличали, взял за руку фрейлину, поцеловал ее и, поцеловав, помахал фрейлинскою рукой, развалившись на креслах и глядя в сторону.

– Attendez [  Подождите]  , – сказала Анна Павловна, соображая. – Я нынче же поговорю Lise (la femme du jeune Болконский). [  с Лизой (женой молодого Болконского).]   И, может быть, это уладится. Ce sera dans votre famille, que je ferai mon apprentissage de vieille fille. [  Я в вашем семействе начну обучаться ремеслу старой девки.]  

 

 

 

II

 

Гостиная Анны Павловны начала понемногу наполняться. Приехала высшая знать Петербурга, люди самые разнородные по возрастам и характерам, но одинаковые по обществу, в каком все жили; приехала дочь князя Василия, красавица Элен, заехавшая за отцом, чтобы с ним вместе ехать на праздник посланника. Она была в шифре и бальном платье. Приехала и известная, как la femme la plus seduisante de Petersbourg [  самая обворожительная женщина в Петербурге,]  , молодая, маленькая княгиня Болконская, прошлую зиму вышедшая замуж и теперь не выезжавшая в большой  свет по причине своей беременности, но ездившая еще на небольшие вечера. Приехал князь Ипполит, сын князя Василия, с Мортемаром, которого он представил; приехал и аббат Морио и многие другие.

– Вы не видали еще? или: – вы не знакомы с ma tante [  с моей тетушкой]  ? – говорила Анна Павловна приезжавшим гостям и весьма серьезно подводила их к маленькой старушке в высоких бантах, выплывшей из другой комнаты, как скоро стали приезжать гости, называла их по имени, медленно переводя глаза с гостя на ma tante [  тетушку]  , и потом отходила.

Все гости совершали обряд приветствования никому неизвестной, никому неинтересной и ненужной тетушки. Анна Павловна с грустным, торжественным участием следила за их приветствиями, молчаливо одобряя их. Ma tante каждому говорила в одних и тех же выражениях о его здоровье, о своем здоровье и о здоровье ее величества, которое нынче было, слава Богу, лучше. Все подходившие, из приличия не выказывая поспешности, с чувством облегчения исполненной тяжелой обязанности отходили от старушки, чтобы уж весь вечер ни разу не подойти к ней.

Молодая княгиня Болконская приехала с работой в шитом золотом бархатном мешке. Ее хорошенькая, с чуть черневшимися усиками верхняя губка была коротка по зубам, но тем милее она открывалась и тем еще милее вытягивалась иногда и опускалась на нижнюю. Как это всегда бывает у вполне?привлекательных женщин, недостаток ее – короткость губы и полуоткрытый рот – казались ее особенною, собственно ее красотой. Всем было весело смотреть на эту, полную здоровья и живости, хорошенькую будущую мать, так легко переносившую свое положение. Старикам и скучающим, мрачным молодым людям, смотревшим на нее, казалось, что они сами делаются похожи на нее, побыв и поговорив несколько времени с ней. Кто говорил с ней и видел при каждом слове ее светлую улыбочку и блестящие белые зубы, которые виднелись беспрестанно, тот думал, что он особенно нынче любезен. И это думал каждый.

Маленькая княгиня, переваливаясь, маленькими быстрыми шажками обошла стол с рабочею сумочкою на руке и, весело оправляя платье, села на диван, около серебряного самовара, как будто всё, что она ни делала, было part de plaisir [  развлечением]   для нее и для всех ее окружавших.

– J'ai apporte mon ouvrage [  Я захватила работу]  , – сказала она, развертывая свой ридикюль и обращаясь ко всем вместе.

– Смотрите, Annette, ne me jouez pas un mauvais tour, – обратилась она к хозяйке. – Vous m'avez ecrit, que c'etait une toute petite soiree; voyez, comme je suis attifee. [  Не сыграйте со мной дурной шутки; вы мне писали, что у вас совсем маленький вечер. Видите, как я одета дурно.]  

И она развела руками, чтобы показать свое, в кружевах, серенькое изящное платье, немного ниже грудей опоясанное широкою лентой.

– Soyez tranquille, Lise, vous serez toujours la plus jolie [  Будьте спокойны, вы всё будете лучше всех]  , – отвечала Анна Павловна.

– Vous savez, mon mari m'abandonne, – продолжала она тем же тоном, обращаясь к генералу, – il va se faire tuer. Dites moi, pourquoi cette vilaine guerre, [  Вы знаете, мой муж покидает меня. Идет на смерть. Скажите, зачем эта гадкая война,]   – сказала она князю Василию и, не дожидаясь ответа, обратилась к дочери князя Василия, к красивой Элен.

– Quelle delicieuse personne, que cette petite princesse! [  Что за прелестная особа эта маленькая княгиня!]   – сказал князь Василий тихо Анне Павловне.

Вскоре после маленькой княгини вошел массивный, толстый молодой человек с стриженою головой, в очках, светлых панталонах по тогдашней моде, с высоким жабо и в коричневом фраке. Этот толстый молодой человек был незаконный сын знаменитого Екатерининского вельможи, графа Безухого, умиравшего теперь в Москве. Он нигде не служил еще, только что приехал из?за границы, где он воспитывался, и был в первый раз в обществе. Анна Павловна приветствовала его поклоном, относящимся к людям самой низшей иерархии в ее салоне. Но, несмотря на это низшее по своему сорту приветствие, при виде вошедшего Пьера в лице Анны Павловны изобразилось беспокойство и страх, подобный тому, который выражается при виде чего?нибудь слишком огромного и несвойственного месту. Хотя, действительно, Пьер был несколько больше других мужчин в комнате, но этот страх мог относиться только к тому умному и вместе робкому, наблюдательному и естественному взгляду, отличавшему его от всех в этой гостиной.

– C'est bien aimable a vous, monsieur Pierre , d'etre venu voir une pauvre malade, [  Очень любезно с вашей стороны, Пьер, что вы пришли навестить бедную больную,]   – сказала ему Анна Павловна, испуганно переглядываясь с тетушкой, к которой она подводила его. Пьер пробурлил что?то непонятное и продолжал отыскивать что?то глазами. Он радостно, весело улыбнулся, кланяясь маленькой княгине, как близкой знакомой, и подошел к тетушке. Страх Анны Павловны был не напрасен, потому что Пьер, не дослушав речи тетушки о здоровье ее величества, отошел от нее. Анна Павловна испуганно остановила его словами:

– Вы не знаете аббата Морио? он очень интересный человек… – сказала она.

– Да, я слышал про его план вечного мира, и это очень интересно, но едва ли возможно…

– Вы думаете?… – сказала Анна Павловна, чтобы сказать что?нибудь и вновь обратиться к своим занятиям хозяйки дома, но Пьер сделал обратную неучтивость. Прежде он, не дослушав слов собеседницы, ушел; теперь он остановил своим разговором собеседницу, которой нужно было от него уйти. Он, нагнув голову и расставив большие ноги, стал доказывать Анне Павловне, почему он полагал, что план аббата был химера.

– Мы после поговорим, – сказала Анна Павловна, улыбаясь.

И, отделавшись от молодого человека, не умеющего жить, она возвратилась к своим занятиям хозяйки дома и продолжала прислушиваться и приглядываться, готовая подать помощь на тот пункт, где ослабевал разговор. Как хозяин прядильной мастерской, посадив работников по местам, прохаживается по заведению, замечая неподвижность или непривычный, скрипящий, слишком громкий звук веретена, торопливо идет, сдерживает или пускает его в надлежащий ход, так и Анна Павловна, прохаживаясь по своей гостиной, подходила к замолкнувшему или слишком много говорившему кружку и одним словом или перемещением опять заводила равномерную, приличную разговорную машину. Но среди этих забот всё виден был в ней особенный страх за Пьера. Она заботливо поглядывала на него в то время, как он подошел послушать то, что говорилось около Мортемара, и отошел к другому кружку, где говорил аббат. Для Пьера, воспитанного за границей, этот вечер Анны Павловны был первый, который он видел в России. Он знал, что тут собрана вся интеллигенция Петербурга, и у него, как у ребенка в игрушечной лавке, разбегались глаза. Он всё боялся пропустить умные разговоры, которые он может услыхать. Глядя на уверенные и изящные выражения лиц, собранных здесь, он всё ждал чего?нибудь особенно умного. Наконец, он подошел к Морио. Разговор показался ему интересен, и он остановился, ожидая случая высказать свои мысли, как это любят молодые люди.

 

 

 

III

 

Вечер Анны Павловны был пущен. Веретена с разных сторон равномерно и не умолкая шумели. Кроме ma tante, около которой сидела только одна пожилая дама с исплаканным, худым лицом, несколько чужая в этом блестящем обществе, общество разбилось на три кружка. В одном, более мужском, центром был аббат; в другом, молодом, красавица?княжна Элен, дочь князя Василия, и хорошенькая, румяная, слишком полная по своей молодости, маленькая княгиня Болконская. В третьем Мортемар и Анна Павловна.

Виконт был миловидный, с мягкими чертами и приемами, молодой человек, очевидно считавший себя знаменитостью, но, по благовоспитанности, скромно предоставлявший пользоваться собой тому обществу, в котором он находился. Анна Павловна, очевидно, угощала им своих гостей. Как хороший метрд`отель подает как нечто сверхъестественно?прекрасное тот кусок говядины, который есть не захочется, если увидать его в грязной кухне, так в нынешний вечер Анна Павловна сервировала своим гостям сначала виконта, потом аббата, как что?то сверхъестественно утонченное. В кружке Мортемара заговорили тотчас об убиении герцога Энгиенского. Виконт сказал, что герцог Энгиенский погиб от своего великодушия, и что были особенные причины озлобления Бонапарта.

– Ah! voyons. Contez?nous cela, vicomte, [  Расскажите нам это, виконт,]   – сказала Анна Павловна, с радостью чувствуя, как чем?то a la Louis XV [  в стиле Людовика XV]   отзывалась эта фраза, – contez?nous cela, vicomte.

Виконт поклонился в знак покорности и учтиво улыбнулся. Анна Павловна сделала круг около виконта и пригласила всех слушать его рассказ.

– Le vicomte a ete personnellement connu de monseigneur, [  Виконт был лично знаком с герцогом,]   – шепнула Анна Павловна одному. – Le vicomte est un parfait conteur [  Bиконт удивительный мастер рассказывать]  , – проговорила она другому. – Comme on voit l'homme de la bonne compagnie [  Как сейчас виден человек хорошего общества]  , – сказала она третьему; и виконт был подан обществу в самом изящном и выгодном для него свете, как ростбиф на горячем блюде, посыпанный зеленью.

Виконт хотел уже начать свой рассказ и тонко улыбнулся.

– Переходите сюда, chere Helene, [  милая Элен,]   – сказала Анна Павловна красавице?княжне, которая сидела поодаль, составляя центр другого кружка.

Княжна Элен улыбалась; она поднялась с тою же неизменяющеюся улыбкой вполне красивой женщины, с которою она вошла в гостиную. Слегка шумя своею белою бальною робой, убранною плющем и мохом, и блестя белизною плеч, глянцем волос и брильянтов, она прошла между расступившимися мужчинами и прямо, не глядя ни на кого, но всем улыбаясь и как бы любезно предоставляя каждому право любоваться красотою своего стана, полных плеч, очень открытой, по тогдашней моде, груди и спины, и как будто внося с собою блеск бала, подошла к Анне Павловне. Элен была так хороша, что не только не было в ней заметно и тени кокетства, но, напротив, ей как будто совестно было за свою несомненную и слишком сильно и победительно?действующую красоту. Она как будто желала и не могла умалить действие своей красоты. Quelle belle personne! [  Какая красавица!]   – говорил каждый, кто ее видел.

Как будто пораженный чем?то необычайным, виконт пожал плечами и о опустил глаза в то время, как она усаживалась перед ним и освещала и его всё тою же неизменною улыбкой.

– Madame, je crains pour mes moyens devant un pareil auditoire, [  Я, право, опасаюсь за свои способности перед такой публикой,]   сказал он, наклоняя с улыбкой голову.

Княжна облокотила свою открытую полную руку на столик и не нашла нужным что?либо сказать. Она улыбаясь ждала. Во все время рассказа она сидела прямо, посматривая изредка то на свою полную красивую руку, которая от давления на стол изменила свою форму, то на еще более красивую грудь, на которой она поправляла брильянтовое ожерелье; поправляла несколько раз складки своего платья и, когда рассказ производил впечатление, оглядывалась на Анну Павловну и тотчас же принимала то самое выражение, которое было на лице фрейлины, и потом опять успокоивалась в сияющей улыбке. Вслед за Элен перешла и маленькая княгиня от чайного стола.

– Attendez moi, je vais prendre mon ouvrage, [  Подождите, я возьму мою работу,]   – проговорила она. – Voyons, a quoi pensez?vous? – обратилась она к князю Ипполиту: – apportez?moi mon ridicule. [  О чем вы думаете? Принесите мой ридикюль.]  

Княгиня, улыбаясь и говоря со всеми, вдруг произвела перестановку и, усевшись, весело оправилась.

– Теперь мне хорошо, – приговаривала она и, попросив начинать, принялась за работу.

Князь Ипполит перенес ей ридикюль, перешел за нею и, близко придвинув к ней кресло, сел подле нее.

Le charmant Hippolyte [  Очаровательный Ипполит]   поражал своим необыкновенным сходством с сестрою?красавицей и еще более тем, что, несмотря на сходство, он был поразительно дурен собой. Черты его лица были те же, как и у сестры, но у той все освещалось жизнерадостною, самодовольною, молодою, неизменною улыбкой жизни и необычайною, античною красотой тела; у брата, напротив, то же лицо было отуманено идиотизмом и неизменно выражало самоуверенную брюзгливость, а тело было худощаво и слабо. Глаза, нос, рот – все сжималось как будто в одну неопределенную и скучную гримасу, а руки и ноги всегда принимали неестественное положение.

– Ce n'est pas une histoire de revenants? [  Это не история о привидениях?]   – сказал он, усевшись подле княгини и торопливо пристроив к глазам свой лорнет, как будто без этого инструмента он не мог начать говорить.

– Mais non, mon cher, [  Вовсе нет,]   – пожимая плечами, сказал удивленный рассказчик.

– C'est que je deteste les histoires de revenants, [  Дело в том, что я терпеть не могу историй о привидениях,]   – сказал он таким тоном, что видно было, – он сказал эти слова, а потом уже понял, что они значили.

Из?за самоуверенности, с которой он говорил, никто не мог понять, очень ли умно или очень глупо то, что он сказал. Он был в темнозеленом фраке, в панталонах цвета cuisse de nymphe effrayee, [  бедра испуганной нимфы,]   как он сам говорил, в чулках и башмаках.

Vicomte [  Виконт]   рассказал очень мило о том ходившем тогда анекдоте, что герцог Энгиенский тайно ездил в Париж для свидания с m?lle George, [  мадмуазель Жорж,]   и что там он встретился с Бонапарте, пользовавшимся тоже милостями знаменитой актрисы, и что там, встретившись с герцогом, Наполеон случайно упал в тот обморок, которому он был подвержен, и находился во власти герцога, которой герцог не воспользовался, но что Бонапарте впоследствии за это?то великодушие и отмстил смертью герцогу.

Рассказ был очень мил и интересен, особенно в том месте, где соперники вдруг узнают друг друга, и дамы, казалось, были в волнении.

– Charmant, [  Очаровательно,]   – сказала Анна Павловна, оглядываясь вопросительно на маленькую княгиню.

– Charmant, – прошептала маленькая княгиня, втыкая иголку в работу, как будто в знак того, что интерес и прелесть рассказа мешают ей продолжать работу.

Виконт оценил эту молчаливую похвалу и, благодарно улыбнувшись, стал продолжать; но в это время Анна Павловна, все поглядывавшая на страшного для нее молодого человека, заметила, что он что?то слишком горячо и громко говорит с аббатом, и поспешила на помощь к опасному месту. Действительно, Пьеру удалось завязать с аббатом разговор о политическом равновесии, и аббат, видимо заинтересованный простодушной горячностью молодого человека, развивал перед ним свою любимую идею. Оба слишком оживленно и естественно слушали и говорили, и это?то не понравилось Анне Павловне.

– Средство – Европейское равновесие и droit des gens [  международное право]  , – говорил аббат. – Стоит одному могущественному государству, как Россия, прославленному за варварство, стать бескорыстно во главе союза, имеющего целью равновесие Европы, – и она спасет мир!

– Как же вы найдете такое равновесие? – начал было Пьер; но в это время подошла Анна Павловна и, строго взглянув на Пьера, спросила итальянца о том, как он переносит здешний климат. Лицо итальянца вдруг изменилось и приняло оскорбительно притворно?сладкое выражение, которое, видимо, было привычно ему в разговоре с женщинами.

– Я так очарован прелестями ума и образования общества, в особенности женского, в которое я имел счастье быть принят, что не успел еще подумать о климате, – сказал он.

Не выпуская уже аббата и Пьера, Анна Павловна для удобства наблюдения присоединила их к общему кружку.

 

 

   
stochastica-intell.ru Адрес: Москва
Тел.: +7 (985) 905 09 22
E-mail:
создание сайтов
IT-ГРУППА “Цитрон”