+7 (985) 905 09 22
veselovskiy1@gmail.com

Логика

Стохастика как технология индуктивного логического вывода


     Стохастика позволила адаптировать вычислительную среду современных компьютеров к обработке знаний и реализовать индуктивный вывод с использованием новых, непереборных методов обработки информации [4 - 6].
      В основу предложенного метода положена единая процедура  стохастического  преобразования  алфавитно-цифровой информации,  описывающей семантическую сеть, которая включает фреймы и правила продукций. При этом обеспечивается непосредственное отображение семантической сети и правил продукций в вычислительную среду компьютера. Информационные  единицы  и  связи  будут  взаимно  однозначно поименованы стохастическими индексами и физически представлены в памяти компьютера  стохастическими кодами. Достигается возможность эффективной реализации на базе сформированных индексов и кодов как процедур произвольного доступа к информации, так  и логических  операций на сети.  
     Это обеспечивает соответствие между произвольной символьной конструкцией и ее стохастическим индексом. Полученные уникальные индексы имеют двойственный характер: с одной стороны, они являются именем указанных символьных конструкций, с другой, - они определяют адрес, по которому необходимо произвести обращение к другим элементам знаний, логически (семантически) связанным  с исходной символьной конструкцией [4].
     При этом в процессе формирования индекса с помощью стохастической хэш-функции отображаются имеющиеся между символьными элементами связи типа «часть-целое», «род-вид», «причины-следствия», «условия-заключения», «определения» и др. Так, например, при создании индекса словосочетаний используется индекс отдельных слов. Формирование стохастического индекса предиката производится на основе входящих в него индексов словосочетаний.
 Индекс предложения реализуется с использованием стохастических индексов словосочетаний, предикатов, входящих в данное предложение и т.д.
       На основе информации о составных элементах каждого индекса автоматически формируются новые знания о том, в какие индексы по критерию «часть-целое» и «род-вид» входит каждый элемент. Это позволяет в режиме активизации индексной информации путем реализации функций самообучения и автоматического формирования новых знаний описывать в индексной форме все возможные прямые логические связи исходного элемента с другими элементами на множестве пространства поиска [4].
      В качестве этих элементов могут быть слова, словосочетания, предикаты, предложения, правила продукций и другие формы представления знаний.
     Таким образом, после реализации описанного режима самообучения и автоматического получения индексных форм и логических связей над множеством элементов семантической сети или правил продукций формируется уровень метазнаний [4].   
     Указанный уровень метазнаний в виде некоего виртуального информационного поля определяет все возможные траектории логического вывода на каждом его шаге, отбирая только семантически связанные символьные конструкции (слова, словосочетания, предикаты, правила продукций и др.) и элементы знаний.
     За счет этого устраняется  необходимость полного перебора на каждом шаге логического вывода и снимается проблема «комбинаторного взрыва». Каждая траектория логического вывода содержит в качестве своих элементов только неповторяющиеся символьные конструкции знаний. Повторение символьных конструкций приводит к образованию циклов, что свидетельствует о необходимости корректировки баз знаний с целью  устранения указанных повторов [4].
     При реализации логического вывода на множестве N элементов знаний любой его  траектории требуется обработать не более M < N символьных элементов знаний, представленных уникальными стохастическими индексами. Следовательно, время логического вывода при использовании описанного метода, основанного на стохастической информационной технологии, будет линейно зависеть от числа M логически или семантически связанных символьных конструкций (слов, словосочетаний, предикатов, элементов семантической сети или правил продукций) [4].
     Количество M элементов, применяемых в процессе построения любой траектории логического вывода будет значительно ниже, чем максимальное число N этих элементов в пространстве поиска требуемых символьных конструкций.
     Отметим, что предложенные методы логического вывода на основе стохастической информационной технологии позволяют выбрать минимально допустимую и наиболее вероятную траекторию логического вывода на любом множестве семантически связанных символьных конструкций и построить метаправила для обеспечения обработки знаний в заданное время. Это позволяет создать на базе существующих компьютеров эффективные  интеллектуальные системы, работающие в любом поисковом пространстве без сужения множества возможных гипотез лингвистического анализа и смыслового поиска в реальном масштабе времени. Указанные системы описаны в патентах [5, 6].
      Кроме этого предложенный метод логического вывода позволяет реализовать новые технологии распознавания речевых сообщений и изображений, основанные на семантическом анализе и логической обработке знаний. Эти методы являются универсальными. Они дают возможность  синтезировать более эффективные и достоверные технологии распознавания речевых сообщений от неизвестного диктора на неограниченном объеме словаря. При этом пиксельное представление речевого сигнала преобразуется в семантические образы, которые с помощью знаний описываются как понятия, связанные с артикуляционной и акустической классификацией сигнала. Это позволяет с высокой достоверностью, приближающейся к 100%, распознавать звуки, фонемы, слоги и слова, то есть реализовывать эффективный фонетический анализ речи и перевести звуковые образы в достоверные лексические элементы [3].
    При распознавании видеоинформации методы, основанные на знаниях и семантическом анализе изображений, позволяют эффективно обрабатывать информацию на всех трех уровнях представления изображений: пиксельном, пиксельно-контурном и уровне символьного описания полученного изображения.
    После этого как для речевых сообщений, так и для изображений включаются уровни лингвистического и семантического анализа с использованием методов индуктивного логического вывода и обработки смысловых конструкций. В результате осуществляется семантическая классификация понятий и формирования концептуального описания («картины мира»), которые представлены выше. Впервые достигается возможность достоверного распознавания слитных речевых сообщений от неизвестного диктора и различных видеоизображений (двухмерных, трехмерных), включая видеосъемку, в реальном времени.
     При этом ввод и обработка семантики поступающих в систему текстов речевых сообщений или изображений активизирует специальную процедуру логического вывода, позволяющую извлекать знания (в том числе новые), проверять их корректность и органично вписывать в состав опорной базы знаний.



Литература


1.Черняк Л. Большие Данные — новая теория и практика // Открытые системы №10, 2011.
2. Насыпный В.В. Защищенные стохастические системы // Открытые системы №3, 2004.
3. Насыпный В.В. Распознавание и понимание смысла речи на основе стохастики в шумах. М.: Прометей, 2010. – 139 с.
4. Насыпный В.В. Развитие теории построения открытых систем на основе информационной технологии искусственного интеллекта. М.: Воениздат, 1994. - 248с.
5. Насыпный В.В., Насыпная Г.А. Способ синтеза самообучающейся системы извлечения знаний из текстовых документов для поисковых систем. Патент  РФ №2273879,  номер международной заявки РСT/RU02/00258, дата подачи 28 мая 2002.
6. Насыпный В.В., Насыпная Г.А. Способ синтеза самообучающейся аналитической вопросно-ответной системы с извлечением знаний из текстов, заявка на патент №2007120344/09 от 06.08.2007. Получено решение на выдачу патента на изобретение от 21.07.2008.
7. Насыпный В.В. Система с абсолютной стойкостью // Открытые системы №9, 2005.
8. Насыпный В.В., Насыпная Г.А. Система распознавания, понимания смысла, анимационного моделирования и синтеза речи на основе стохастической информационной технологии. М.: Прометей, 2008. – 76 с.
9. Искусственный интеллект. Справочник. Кн. 2. Модели и методы. Под ред. Поспелова Д.А. М.: Радио и связь, 1990. - 303 с.
10. Halsall F. Data communications computer networks and osi. Addison-wesley publishing company, 1988. - 973 c.
11. Насыпный В.В. Способ комплексной защиты распределенной обработки информации в компьютерных системах и система для осуществления способа. Патент  РФ №2259639, номер международной заявки РСT/RU /00272, дата подачи 28.10.2003г.
12. Насыпный В.В., Насыпная Г.А. Метод семантической связи текста с трехмерной графикой. – М.: Прометей, 2007. – 27с.




 

   
stochastica-intell.ru Адрес: Москва
Тел.: +7 (985) 905 09 22
E-mail:
создание сайтов
IT-ГРУППА “Цитрон”