Microsoft Indexing Service — IFilter и русификация

MS Indexing Service – встроенная в систему служба полнотекстового поиска по документам. Для того что бы расширить возможности MS Indexing Service и увеличить количество форматов, можно подключить модули — IFilter. Для того что бы искать по документам MS Office или Acrobat Reader, необходимо установить оба этих продукта. Немного извратившись, и при наличии желания, можно изготовить набор из библиотек и командных файлов, что бы не устанавливать каждый раз полностью оба пакета. Для поиска по файлам CHM, HLP, MHTML, а так же внутри архивов CAB, RAR, ZIP (включая самораспаковывающиеся), необходимо скачать соответствующие IFilters с сайта — www.citeknet.com. Для того что бы просмотреть установленные в системе IFIlters можно воспользоваться IFilterExplorer.

Естественно, потдержка русского языка отсутствует. Для того что бы научить MS Indexing Service русскому языку, необходимо несколько файликов из дистрибутива MS SQL Server, это rusdict.lex, ruslr.dll и noiseRUS.txt или скачать. Копируем файлы и создаем два файла setup.cmd и setup.reg

Содержимое setup.cmd:
@echo off
net stop cisvc
copy /y noiseRUS.txt %systemroot%\system32
copy /y rusdict.lex %systemroot%\system32
copy /y ruslr.dll %systemroot%\system32
regsvr32 /s %systemroot%\system32\ruslr.dll
regedit /s setup.reg
net start cisvc

Содержимое setup.reg:

Windows Registry Editor Version 5.00 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\ContentIndex\Language\Russian_Russian]
«ISAPIIDQErrorFile»=»/iissamples/issamples/IDQError.htx»
«ISAPIHTXErrorFile»=»/iissamples/issamples/HTXError.htx»
«ISAPIRestrictionErrorFile»=»/iissamples/issamples/ResError.htx»
«ISAPIDefaultErrorFile»=»/iissamples/issamples/DefError.htx»
«Locale»=dword:00000419
«NoiseFile»=»noiseRUS.txt»
«StemmerClass»=»{20036414-F1AF-11D2-A57F-006052076F32}»
«WBreakerClass»=»{20036404-F1AF-11D2-A57F-006052076F32}»

Что бы произвести установку запустите setup.cmd

Leave a Reply

Ваш адрес email не будет опубликован.

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>