+7 (985) 905 09 22
veselovskiy1@gmail.com

Защита поиска


Зашифрованные интеллектуальные поисковые системы


     Со­вре­мен­ные по­ис­ко­вые си­сте­мы ста­но­вят­ся все более ин­тел­лек­ту­аль­ны­ми, что, од­на­ко, не долж­но ослаб­лять без­опас­но­сти до­сту­па к ин­фор­ма­ции. Ис­поль­зо­ва­ние сто­ха­сти­че­ской ин­фор­ма­ци­он­ной тех­но­ло­гии [1] поз­во­ля­ет ком­плекс­но по­вы­сить «ин­тел­лект» по­ис­ко­вой си­сте­мы без ослаб­ле­ния ее за­щи­щен­но­сти. Это стало воз­мож­но за счет слу­чай­но­го ко­ди­ро­ва­ния и хэ­ши­ро­ва­ния сим­воль­ной ин­фор­ма­ции с целью ее адап­та­ции к кон­крет­ной ком­пью­тер­ной среде. В за­яв­ке на изоб­ре­те­ние № РСТ/RU 02/00258 от 28.05.2002 «Спо­соб син­те­за са­мо­обу­ча­ю­щей­ся си­сте­мы из­вле­че­ния зна­ний из тек­сто­вых до­ку­мен­тов для по­ис­ко­вых си­стем» было до­ка­за­но, что име­ет­ся воз­мож­ность со­зда­ния на ос­но­ве новой тех­но­ло­гии ин­тел­лек­ту­аль­ных си­стем точ­но­го по­ис­ка, ре­а­ли­зу­ю­ще­го функ­ции из­вле­че­ния зна­ний из тек­стов и фор­ми­ро­ва­ния от­ве­тов, ре­ле­вант­ных за­про­сам поль­зо­ва­те­лей. Вме­сте с тем, при­ме­не­ние сто­ха­сти­че­ской ин­фор­ма­ци­он­ной тех­но­ло­гии поз­во­ля­ет ре­шить и дру­гую за­да­чу — обес­пе­че­ние без­опас­но­сти по­ис­ка за­шиф­ро­ван­ной тек­сто­вой ин­фор­ма­ции раз­лич­но­го уров­ня кон­фи­ден­ци­аль­но­сти. При этом со­зда­ет­ся за­мкну­тый без­опас­ный по­ис­ко­вый кон­тур. За­прос, по­сту­пив­ший от поль­зо­ва­те­ля, шиф­ру­ет­ся и пе­ре­да­ет­ся в по­ис­ко­вую ма­ши­ну, где, не рас­шиф­ро­вы­ва­ясь, под­вер­га­ет­ся до­пол­ни­тель­но­му шиф­ро­ва­нию. Это обес­пе­чи­ва­ет ре­а­ли­за­цию про­це­ду­ры ин­тел­лек­ту­аль­но­го по­ис­ка на за­шиф­ро­ван­ных тек­сто­вых до­ку­мен­тах, без рас­кры­тия их со­дер­жа­ния. По­лу­чен­ный ответ, ре­ле­вант­ный за­про­су, также будет за­шиф­ро­ван, пе­ре­дан по линии связи и рас­шиф­ро­ван на ра­бо­чем месте поль­зо­ва­те­ля. Таким об­ра­зом, ис­клю­ча­ет­ся воз­мож­ность до­сту­па к ин­фор­ма­ции, хра­ня­щей­ся в тек­сто­вых до­ку­мен­тах по­ис­ко­вой си­сте­мы, а также до­ступ к со­дер­жа­нию во­про­сов и от­ве­тов, пе­ре­да­ва­е­мых по сети. Это от­кры­ва­ет новые воз­мож­но­сти в об­ла­сти со­зда­ния без­опас­ных по­ис­ко­вых си­стем, ра­бо­та­ю­щих с кон­фи­ден­ци­аль­ной информацией.
      При­ме­не­ние сто­ха­сти­че­ской ин­фор­ма­ци­он­ной тех­но­ло­гии поз­во­ля­ет ком­плекс­но ре­шать про­бле­му ре­а­ли­за­ции точ­но­го по­ис­ка и обес­пе­че­ния без­опас­но­сти ин­фор­ма­ции. Под точ­ным по­ис­ком по­ни­ма­ет­ся на­хож­де­ние си­сте­мой от­ве­та, ре­ле­вант­но­го за­про­су поль­зо­ва­те­ля. При этом за­прос фор­му­ли­ру­ет­ся на есте­ствен­ном языке в виде во­про­си­тель­но­го пред­ло­же­ния. Точ­ный поиск пред­по­ла­га­ет на­хож­де­ние от­ве­та с мак­си­маль­но воз­мож­ной ре­ле­вант­но­стью — мерой, опре­де­ля­ю­щей, на­сколь­ко полно тот или иной до­ку­мент от­ве­ча­ет кри­те­ри­ям, ука­зан­ным в за­про­се. Точ­ный поиск может быть по­лу­чен в виде од­но­го пред­ло­же­ния тек­ста (крат­кий ответ) или груп­пы пред­ло­же­ний (по­дроб­ный ответ). При этом кри­те­ри­ем ре­ле­вант­но­сти яв­ля­ет­ся воз­мож­ность эк­ви­ва­лент­но­го пре­об­ра­зо­ва­ния с по­мо­щью ин­тел­лек­ту­аль­ной об­ра­бот­ки по­лу­чен­но­го от­ве­та к виду за­про­са. Если такое пре­об­ра­зо­ва­ние воз­мож­но, то по­лу­чен­ный ответ счи­та­ет­ся в пол­ной мере ре­ле­вант­ным за­про­су или точ­ным. В про­тив­ном слу­чае про­из­во­дит­ся по­пыт­ка по­втор­но­го фор­ми­ро­ва­ния от­ве­та с ис­поль­зо­ва­ни­ем до­пол­ни­тель­ной тек­сто­вой ин­фор­ма­ции. Если по­лу­че­ние ука­зан­но­го от­ве­та на предо­став­лен­ном объ­е­ме тек­сто­вой ин­фор­ма­ции невоз­мож­но, то счи­та­ет­ся, что в дан­ном слу­чае точ­ный ответ не может быть получен.
      Точ­ный ответ либо непо­сред­ствен­но со­дер­жит­ся в тек­сто­вой ин­фор­ма­ции в виде од­но­го или несколь­ких пред­ло­же­ний, либо на ос­но­ве име­ю­щей­ся ин­фор­ма­ции про­ис­хо­дит из­вле­че­ние зна­ний из до­ку­мен­тов и фор­ми­ру­ют­ся новые пред­ло­же­ния, ре­ле­вант­ные за­про­су, ко­то­рых в явном виде в тек­сте нет. Важ­ней­шую роль в этом про­цес­се иг­ра­ют се­ман­ти­че­ский ана­лиз тек­сто­вой ин­фор­ма­ции и ло­ги­че­ская об­ра­бот­ка фраг­мен­тов тек­ста с целью по­лу­че­ния новых, се­ман­ти­че­ски свя­зан­ных тек­сто­вых струк­тур, со­от­вет­ству­ю­щих тре­бо­ва­ни­ям точ­но­го ответа.
      Ос­нов­ные прин­ци­пы по­стро­е­ния и функ­ци­о­ни­ро­ва­ния си­сте­мы точ­но­го по­ис­ка на ос­но­ве сто­ха­сти­че­ской ин­фор­ма­ци­он­ной тех­но­ло­гии опи­са­ны в [1], а в дан­ной ста­тье мы более де­таль­но опи­шем ре­а­ли­за­цию се­ман­ти­че­ско­го ана­ли­за и ло­ги­че­ской об­ра­бот­ки тек­сто­вой ин­фор­ма­ции в за­шиф­ро­ван­ном виде с целью фор­ми­ро­ва­ния точ­но­го ответа.
     В общем слу­чае за­шиф­ро­ван­ная си­сте­ма точ­но­го по­ис­ка вклю­ча­ет базу за­шиф­ро­ван­ных тек­сто­вых до­ку­мен­тов и крип­то­гра­фи­че­ски за­щи­щен­ные сред­ства ее ин­тел­лек­ту­аль­ной об­ра­бот­ки: сто­ха­сти­че­ски ин­дек­си­ро­ван­ные базы зна­ний грам­ма­ти­че­ско­го и се­ман­ти­че­ско­го ана­ли­за, базы зна­ний, опре­де­ля­ю­щие пра­ви­ла эк­ви­ва­лент­но­го пре­об­ра­зо­ва­ния, под­си­сте­му ло­ги­че­ско­го вы­во­да и биб­лио­те­ку при­клад­ных за­шиф­ро­ван­ных про­грамм, непо­сред­ствен­но ре­а­ли­зу­ю­щие функ­ции по­ис­ка и об­ра­бот­ки сто­ха­сти­че­ски пре­об­ра­зо­ван­ной ин­фор­ма­ции. Вы­пол­не­ние про­грамм также осу­ществ­ля­ет­ся в за­шиф­ро­ван­ном виде, что в со­че­та­нии с за­шиф­ро­ван­ной об­ра­бот­кой ин­фор­ма­ции со­зда­ет ком­плекс­ную за­щи­ту си­сте­мы от ха­ке­ров, про­грамм­ных за­кла­док и вирусов.
     При фор­ми­ро­ва­нии базы тек­сто­вых до­ку­мен­тов по­ис­ко­вой си­сте­мы про­из­во­дит­ся сто­ха­сти­че­ское ко­ди­ро­ва­ние сим­воль­ной ин­фор­ма­ции. Сто­ха­сти­че­ское ин­дек­си­ро­ва­ние вы­пол­ня­ет­ся с ис­поль­зо­ва­ни­ем спе­ци­аль­ной хэш-функ­ции, ко­то­рая обес­пе­чит пре­об­ра­зо­ва­ние раз­лич­ных эле­мен­тов тек­сто­вой ин­фор­ма­ции в их хэш-зна­че­ния, пред­став­лен­ные в виде дво­ич­ной ком­би­на­ции за­дан­ной длины, ко­то­рые при­ни­ма­ют­ся в ка­че­стве сто­ха­сти­че­ских ин­дек­сов. За счет свойств хэш-функ­ции и вы­бо­ра длины ком­би­на­ции ин­дек­са до­сти­га­ет­ся их га­ран­ти­ро­ван­ная уни­каль­ность для раз­лич­ных эле­мен­тов тек­ста со сколь угод­но малой за­дан­ной ве­ро­ят­но­стью кол­ли­зий [1]. При этом сна­ча­ла фор­ми­ру­ют­ся сто­ха­сти­че­ские ин­дек­сы от­дель­ных слов (их основ), ко­то­рые затем ис­поль­зу­ют­ся для по­лу­че­ния ин­дек­сов сло­во­со­че­та­ний, вхо­дя­щих в пред­ло­же­ния тек­ста, и самих пред­ло­же­ний. На ос­но­ве сто­ха­сти­че­ских ин­дек­сов пред­ло­же­ний по­лу­ча­ют ин­дек­сы аб­за­цев. На­зва­ния глав, раз­де­лов и самих тек­сто­вых до­ку­мен­тов также пре­об­ра­зу­ют в со­от­вет­ству­ю­щие сто­ха­сти­че­ские индексы.
     По­лу­чен­ные ин­дек­сы обес­пе­чи­ва­ют про­из­воль­ный до­ступ к со­от­вет­ству­ю­щим эле­мен­там и струк­ту­рам тек­сто­вой ин­фор­ма­ции, ко­то­рые при этом сто­ха­сти­че­ски ко­ди­ру­ют­ся с ис­поль­зо­ва­ни­ем од­но­ра­зо­вой си­сте­мы шиф­ро­ва­ния с от­кры­той пе­ре­да­чей клю­чей. Ключи, при­ме­ня­е­мые при шиф­ро­ва­нии тек­стов, за­пи­сы­ва­ют­ся в конце каж­до­го за­шиф­ро­ван­но­го пред­ло­же­ния. Для пе­ре­во­да слов или сло­во­со­че­та­ний из одной си­сте­мы шиф­ро­ва­ния в дру­гую ис­поль­зу­ют­ся про­цес­сы пе­ре­ко­ди­ро­ва­ния сим­воль­ной ин­фор­ма­ции без рас­кры­тия ее со­дер­жа­ния. Для рас­ко­ди­ро­ва­ния тек­сто­вой ин­фор­ма­ции име­ют­ся со­от­вет­ству­ю­щие де­ко­де­ры. При этом си­сте­ма фор­ми­ро­ва­ния и пе­ре­да­чи од­но­ра­зо­вых от­кры­тых клю­чей обес­пе­чи­ва­ет ре­а­ли­за­цию в ре­аль­ном вре­ме­ни опи­сан­ных функ­ций ко­ди­ро­ва­ния, пе­ре­ко­ди­ро­ва­ния и де­ко­ди­ро­ва­ния тек­сто­вой ин­фор­ма­ции. От­ме­тим, что после каж­до­го об­ра­ще­ния к со­от­вет­ству­ю­ще­му мас­си­ву за­шиф­ро­ван­но­го тек­ста про­ис­хо­дит его пе­ре­шиф­ров­ка с ис­поль­зо­ва­ни­ем но­во­го от­кры­то­го ключа.
     В пред­ло­жен­ной си­сте­ме сто­ха­сти­че­ской ин­дек­са­ции фор­ми­ро­ва­ние ин­дек­сов непо­сред­ствен­но на ос­но­ве самих сим­воль­ных объ­ек­тов обес­пе­чи­ва­ет воз­мож­ность ввода новых, ис­клю­че­ния ста­рых объ­ек­тов, из­ме­не­ния по­ряд­ка их сле­до­ва­ния, а также мо­ди­фи­ка­цию се­те­вых струк­тур баз зна­ний в ре­аль­ном мас­шта­бе вре­ме­ни. При этом про­ис­хо­дит ав­то­ма­ти­че­ская мо­ди­фи­ка­ция толь­ко тех струк­тур, ко­то­рые непо­сред­ствен­но свя­за­ны с вновь вво­ди­мы­ми или ис­клю­ча­е­мы­ми объ­ек­та­ми, без из­ме­не­ний всей ин­декс­ной си­сте­мы. В этом прин­ци­пи­аль­ное от­ли­чие сто­ха­сти­че­ско­го ин­дек­си­ро­ва­ния от ре­гу­ляр­но­го ин­дек­си­ро­ва­ния тек­сто­вых до­ку­мен­тов, при ко­то­ром любое из­ме­не­ние со­ста­ва сим­воль­ных объ­ек­тов или их свя­зей тре­бу­ет пол­ной ре­струк­ту­ри­за­ции си­сте­мы. По­лу­чен­ная сто­ха­сти­че­ская ин­декс­ная си­сте­ма яв­ля­ет­ся от­кры­той к из­ме­не­нию со­ста­ва и со­дер­жа­ния по­ис­ко­вой си­сте­мы в про­цес­се ее функ­ци­о­ни­ро­ва­ния, что де­ла­ет воз­мож­ным при­ме­не­ние ши­ро­кой адап­та­ции ин­дек­си­ро­ва­ния к про­цес­сам по­ис­ка для по­вы­ше­ния ско­ро­сти об­ра­бот­ки при про­ве­де­нии се­ман­ти­че­ско­го ана­ли­за тек­стов. На­при­мер, в ходе ана­ли­за часто воз­ни­ка­ет необ­хо­ди­мость по­ис­ка со­от­вет­ству­ю­щих фраг­мен­тов тек­ста не толь­ко по от­дель­ным сло­вам, но и по сло­во­со­че­та­ни­ям, опре­де­ля­ю­щим раз­лич­ные тер­ми­ны, по­ня­тия, пре­ди­ка­тив­ную ос­но­ву, а также дру­гие типы от­но­ше­ний в пред­ло­же­нии. Для этого в си­сте­ме ре­а­ли­зо­ва­на воз­мож­ность быст­ро­го пе­ре­хо­да от ин­дек­сов от­дель­ных слов к ин­дек­сам ука­зан­ных сло­во­со­че­та­ний. В ре­зуль­та­те, обес­пе­чи­ва­ет­ся про­из­воль­ный до­ступ к тек­сто­вой ин­фор­ма­ции с целью на­хож­де­ния нуж­ных пред­ло­же­ний, а также вы­пол­не­ние функ­ций ло­ги­че­ско­го вы­во­да, клас­си­фи­ка­ции и руб­ри­ка­ции тек­стов. Ин­декс­ные таб­ли­цы ав­то­ма­ти­че­ски мо­ди­фи­ци­ру­ют­ся для вклю­че­ния строк, свя­зы­ва­ю­щих ин­дек­сы от­ме­чен­ных сло­во­со­че­та­ний с ин­дек­са­ми со­от­вет­ству­ю­щих пред­ло­же­ний аб­за­цев и тек­стов. За счет этого по­вы­ша­ет­ся ско­рость ре­а­ли­за­ции се­ман­ти­че­ско­го анализа.
     Все пе­ре­чис­лен­ное от­но­сит­ся также к по­стро­е­нию и функ­ци­о­ни­ро­ва­нию баз зна­ний, ос­но­ван­ных на сто­ха­сти­че­ски ин­дек­си­ро­ван­ных пра­ви­лах про­дук­ций. При­ме­не­ние сто­ха­сти­че­ских ин­дек­сов пре­ди­ка­тов, про­це­дур и пра­вил поз­во­ля­ет об­ра­зо­вы­вать се­те­вые струк­ту­ры, в ко­то­рых время ло­ги­че­ско­го вы­во­да ли­ней­но за­ви­сит от числа ис­поль­зу­е­мых пра­вил про­дук­ций. При этом пол­но­стью сни­ма­ет­ся про­бле­ма «ком­би­на­тор­но­го взры­ва», ха­рак­тер­но­го для су­ще­ству­ю­щих про­дук­ци­он­ных си­стем, и обес­пе­чи­ва­ет­ся ре­аль­ное время ло­ги­че­ской об­ра­бот­ки неза­ви­си­мо от объ­е­ма базы зна­ний. Об­ра­зо­ван­ная се­те­вая струк­ту­ра пра­вил про­дук­ций яв­ля­ет­ся от­кры­той к из­ме­не­нию их со­ста­ва и со­дер­жа­ния. Часто ис­поль­зу­е­мые це­поч­ки пра­вил могут быть пре­об­ра­зо­ва­ны в одно пра­ви­ло путем их аг­ре­га­ции, что по­вы­ша­ет ско­рость об­ра­бот­ки ин­фор­ма­ции тек­стов при се­ман­ти­че­ском ана­ли­зе и по­ис­ке. От­ме­тим, что по­стро­е­ние пра­вил про­дук­ций на ос­но­ве сто­ха­сти­че­ских ин­дек­сов апри­о­ри шиф­ру­ет со­дер­жа­ние пра­вил и ло­ги­ку их обработки.
     Как из­вест­но, цель се­ман­ти­че­ско­го ана­ли­за — ана­лиз смыс­ла со­став­ных ча­стей каж­до­го пред­ло­же­ния. Для этого в опи­сы­ва­е­мой ин­тел­лек­ту­аль­ной по­ис­ко­вой си­сте­ме ис­поль­зу­ет­ся про­цесс из­вле­че­ния зна­ний из линг­ви­сти­че­ской ли­те­ра­ту­ры. При­ме­ня­ют­ся сто­ха­сти­че­ски ин­дек­си­ро­ван­ные тол­ко­вые и се­ман­ти­че­ские сло­ва­ри, про­блем­но-ори­ен­ти­ро­ван­ные сло­ва­ри тер­ми­нов и опре­де­ле­ний, эн­цик­ло­пе­дии, спра­воч­ни­ки, учеб­ные по­со­бия и др. За счет этого ре­а­ли­зу­ет­ся режим са­мо­обу­че­ния по­ис­ко­вой си­сте­мы с ис­поль­зо­ва­ни­ем ло­ги­че­ско­го вы­во­да в ука­зан­ных текстах, с ав­то­ма­ти­че­ским на­коп­ле­ни­ем зна­ний для про­ве­де­ния грам­ма­ти­че­ско­го и се­ман­ти­че­ско­го ана­ли­за. Сфор­ми­ро­ван­ные базы зна­ний со­дер­жат как про­це­дур­ные зна­ния в виде пра­вил про­дук­ций, так и се­ман­ти­че­ские сети, вклю­ча­ю­щие тер­ми­ны и на­име­но­ва­ния объ­ек­тов пред­мет­ной об­ла­сти, пре­ди­ка­тив­ные ос­но­вы пред­ло­же­ний тек­ста, а также сло­во­со­че­та­ния, опи­сы­ва­ю­щие типы от­но­ше­ний в каж­дом предложении.
За­прос, об­ра­бот­ка тек­ста, ответ
     Для ил­лю­стра­ции пред­ста­вим за­прос, сфор­ми­ро­ван­ный поль­зо­ва­те­лем, пред­ва­ри­тель­но вы­бран­ный абзац в про­цес­се ана­ли­за тек­ста и по­лу­чен­ный точ­ный ответ в от­кры­том виде.
ЗА­ПРОС: Какие устрой­ства пер­со­наль­но­го ком­пью­те­ра на­зы­ва­ют­ся периферийными?
ПРЕД­ВА­РИ­ТЕЛЬ­НО ВЫ­БРАН­НЫЙ АБЗАЦ: Пер­со­наль­ный ком­пью­тер пред­на­зна­чен для со­зда­ния, хра­не­ния, об­ра­бот­ки и пе­ре­да­чи дан­ных. Он со­сто­ит из раз­лич­ных бло­ков и устройств. При этом устрой­ства, рас­по­ло­жен­ные внут­ри си­стем­но­го блока, на­зы­ва­ют­ся внут­рен­ни­ми. Устрой­ства, рас­по­ло­жен­ные сна­ру­жи — внеш­ни­ми. До­пол­ни­тель­ные под­клю­ча­е­мые внеш­ние устрой­ства от­но­сят­ся к пе­ри­фе­рий­ным устрой­ствам. Прин­тер для пе­ча­ти ин­фор­ма­ции на бу­ма­ге — при­мер пе­ри­фе­рий­но­го устройства.
ТОЧ­НЫЙ ОТВЕТ: До­пол­ни­тель­ные под­клю­ча­е­мые внеш­ние устрой­ства пер­со­наль­но­го ком­пью­те­ра (на­при­мер, прин­тер для пе­ча­ти ин­фор­ма­ции) на­зы­ва­ют­ся периферийными.
     В про­цес­се фор­ми­ро­ва­ния точ­но­го от­ве­та в ка­че­стве ба­зо­во­го было вы­бра­но сле­ду­ю­щее пред­ло­же­ние: «До­пол­ни­тель­ные под­клю­ча­е­мые внеш­ние устрой­ства от­но­сят­ся к пе­ри­фе­рий­ным устрой­ствам». Затем, ис­поль­зуя от­но­ше­ния «часть — целое», в него было вве­де­но сло­во­со­че­та­ние «пер­со­наль­ный ком­пью­тер» из пер­во­го пред­ло­же­ния аб­за­ца в со­от­вет­ству­ю­щем па­де­же (внеш­ние устрой­ства — часть ком­пью­те­ра). После этого, при­ме­няя от­но­ше­ния «род — вид», в ба­зо­вое пред­ло­же­ние вклю­че­но сло­во­со­че­та­ние «прин­тер для пе­ча­ти ин­фор­ма­ции» из по­след­не­го пред­ло­же­ния аб­за­ца (прин­тер для пе­ча­ти ин­фор­ма­ции от­но­сит­ся к клас­су пе­ри­фе­рий­ных устройств). К этому сло­во­со­че­та­нию было до­бав­ле­но ввод­ное слово «на­при­мер». По­лу­чен­ная груп­па слов «(на­при­мер, прин­тер для пе­ча­ти ин­фор­ма­ции)» пред­став­ле­на в ба­зо­вом пред­ло­же­нии как встав­ная кон­струк­ция и, со­от­вет­ствен­но, вы­де­ле­на скоб­ка­ми. Сло­во­со­че­та­ние «от­но­сят­ся к пе­ри­фе­рий­ным устрой­ствам» за­ме­ня­ет­ся на близ­кое по смыс­лу сло­во­со­че­та­ние «на­зы­ва­ют­ся пе­ри­фе­рий­ны­ми устрой­ства­ми». В итоге вы­пол­нен­но­го се­ман­ти­че­ско­го ана­ли­за и ло­ги­че­ской об­ра­бот­ки тек­ста фор­ми­ру­ет­ся точ­ный ответ.
     Для кон­тро­ля ре­ле­вант­но­сти по­лу­чен­но­го от­ве­та пре­об­ра­зу­ем его к виду за­про­са. При этом груп­па слов опре­де­ле­ния «До­пол­ни­тель­ные под­клю­ча­е­мые внеш­ние» за­ме­не­на на во­про­си­тель­ное слово «какие». Также была ис­клю­че­на встав­ная кон­струк­ция, ко­то­рая имеет уточ­ня­ю­щее зна­че­ние. В ре­зуль­та­те из сфор­ми­ро­ван­но­го от­ве­та по­лу­че­но во­про­си­тель­ное пред­ло­же­ние «Какие устрой­ства пер­со­наль­но­го ком­пью­те­ра на­зы­ва­ют­ся пе­ри­фе­рий­ны­ми?», ко­то­рое иден­тич­но за­про­су. Это до­ка­зы­ва­ет ре­ле­вант­ность по­лу­чен­но­го точ­но­го от­ве­та за­про­су пользователя.
     Для шиф­ро­ва­ния ис­поль­зу­ет­ся од­но­ра­зо­вый мно­го­ал­фа­вит­ный кодер. За­шиф­ро­ван­ная ин­фор­ма­ция будет иметь сле­ду­ю­щий вид (с неко­то­ры­ми со­кра­ще­ни­я­ми ввиду ил­лю­стра­тив­но­го зна­че­ния дан­но­го примера):
ЗА­ПРОС: ЖЛIUЪ­ЗЬ­NLQТ­ПWК­НЕMRA­ФЮ­FOЗР­ТGDSА­Щ­ГВWFZИ БОД­СESVHВРЙ­IYKУ­И­ГДFDZКРЮФД­ТVQS
ПРЕД­ВА­РИ­ТЕЛЬ­НО ВЫ­БРАН­НЫЙ АБЗАЦ: WFRСКТ­Щ­ГOQN­ЩИ­БSDVИВЙ­Ь­VGYЯХ­МЪ­YD­ЖЕ­ГFOЯЧ МЦZEKДВЩ­ЮZHY­ЖТГ­БIQFBХШЧ­НWSHЪ­ЖИД­БVZRКН ВЮMXTС­ФЯ­УKWQЪ­СЮ­А­ЦWLU­ЩСТ­КQMSH­ФЗЬ­ЦLREWЖ ФНЮ­А­ЩDZXОРЙ­ЧZYBHЯ­БАТNWMЪФГ ЙFQJК­НЮ­ШOG CЖ­Э­ВЫ­VPSЪ­ДЬ­AKP
ТОЧ­НЫЙ ОТВЕТ: КРА­ЦAIFД­БМ­ТHJMВ­Л­ГЙ­CKOЕН­Щ­ФDBPLУРЗЪ­UWIЖ ЫШTRGЯЬИ­ЭZS­Ю­ХОСNQVЧAEJ­Ю­ЦЕ­КHYXОЗБШSMOGМ­ТЯ
Имен­но в таком виде ин­фор­ма­ция может по­пасть к зло­умыш­лен­ни­ку при по­пыт­ке несанк­ци­о­ни­ро­ван­но­го до­сту­па к системе.
     От­ме­тим, что поль­зо­ва­тель имеет до­ступ к со­дер­жа­нию за­про­са (до его ко­ди­ро­ва­ния с целью пе­ре­да­чи в по­ис­ко­вую си­сте­му), а также по­лу­чен­но­го точ­но­го от­ве­та (после его де­ко­ди­ро­ва­ния). Вся тек­сто­вая база си­сте­мы, вклю­чая при­ве­ден­ный пред­ва­ри­тель­но вы­бран­ный абзац, яв­ля­ет­ся для поль­зо­ва­те­ля зашифрованной.
     Де­ко­ди­ро­ва­ние от­ве­та осу­ществ­ля­ет­ся в ком­пью­те­ре поль­зо­ва­те­ля, вы­дав­ше­го ис­ход­ный за­прос. При этом пе­ре­да­ча по линии связи также осу­ществ­ля­ет­ся в за­шиф­ро­ван­ном виде после необ­хо­ди­мо­го пе­ре­ко­ди­ро­ва­ния за­шиф­ро­ван­но­го во­про­са или ответа.


***


     В пред­ла­га­е­мой си­сте­ме ре­а­ли­зу­ет­ся пол­но­стью за­мкну­тый за­шиф­ро­ван­ный кон­тур точ­но­го по­ис­ка ин­фор­ма­ции с вы­пол­не­ни­ем функ­ций ин­тел­лек­ту­аль­ной об­ра­бот­ки тек­стов, вклю­ча­ю­щих необ­хо­ди­мые эле­мен­ты се­ман­ти­че­ско­го ана­ли­за. Если смот­реть на эту про­бле­му шире, то со­зда­ние по­доб­ных си­стем га­ран­ти­ру­ет лю­бо­му поль­зо­ва­те­лю пол­ную кон­фи­ден­ци­аль­ность диа­ло­га. Это, в рам­ках су­ще­ству­ю­щих за­ко­нов, обес­пе­чи­ва­ет права каж­до­го на за­щи­ту его лич­ной ин­фор­ма­ции.


Ли­те­ра­ту­ра


1. На­сып­ный В.В. Раз­ви­тие тео­рии по­стро­е­ния от­кры­тых си­стем на ос­но­ве ин­фор­ма­ци­он­ной тех­но­ло­гии ис­кус­ствен­но­го ин­тел­лек­та. М.: Во­е­н­из­дат, 1994. — 248 с.

   
stochastica-intell.ru Адрес: Москва
Тел.: +7 (985) 905 09 22
E-mail:
создание сайтов
IT-ГРУППА “Цитрон”