Please see my reply inline below<br><br><div class="gmail_quote">On Fri, Jul 4, 2008 at 5:29 AM, Ralph Angenendt <<a href="mailto:ra%2Bcentos@br-online.de">ra+centos@br-online.de</a>> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d">Amitava Shee wrote:<br>
> How do I get utf-8 support with PCRE?<br>
><br>
> I am having problems building lucene index using Zend_Lucene. I get the<br>
> following error<br>
><br>
><br>
> PHP Notice:  iconv(): Detected an illegal character in input string in<br>
> /var/www/ZendFramework-1.5.2/library/Zend/Search/Lucene/Analysis/Analyzer/Common/Text.php<br>
> on line 56<br>
<br>
</div>a) What does that have to do with pcre? (which can do UTF-8)</blockquote><div> </div><div>[Shee] Zend lucene search engine uses pcre and requires pcre to be compiled with --enable-utf8. Please see <a href="http://framework.zend.com/manual/en/zend.search.lucene.charset.html#zend.search.lucene.charset.utf_analyzer">http://framework.zend.com/manual/en/zend.search.lucene.charset.html#zend.search.lucene.charset.utf_analyzer</a><br>
<br>UTF-8 support can either be compiled into PCRE at build time or supported via shared library. But shared library support is included/excluded based on the distro. I believe, upstream RedHat does not include it. I was hoping to find a way in CentOS. I have no idea if other distro's support it. That's a research item for me.<br>
</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
b) What is on line 56 in that file? Looks like iconv is choking on that.</blockquote><div>[Shee] Framework code - don't know much there <br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>
<br>
So try to process that file with iconv on the command line.<br>
<font color="#888888"><br>
Ralph<br>
</font><br>_______________________________________________<br>
CentOS mailing list<br>
<a href="mailto:CentOS@centos.org">CentOS@centos.org</a><br>
<a href="http://lists.centos.org/mailman/listinfo/centos" target="_blank">http://lists.centos.org/mailman/listinfo/centos</a><br>
<br></blockquote></div><br>