Как угадать язык текста
Возникла задача определения языка текста. В качестве инструмента была выбрана библиотека libexttextcat (http://www.freedesktop.org/wiki/Software/libexttextcat/), производная от проекта TextCat, который использует т.н. N-граммы (N-Gram) для анализа текста. Установка: [orca@blizzard ~]$ cd /store/Install/ [orca@blizzard Install]$ git clone git://anongit.freedesktop.org/git/libreoffice/libexttextcat/ [orca@blizzard Install]$ cd libexttextcat [orca@blizzard libexttextcat]$ ./autogen.sh [orca@blizzard libexttextcat]$ ./configure [orca@blizzard libexttextcat]$ make [orca@blizzard libexttextcat]$ make check [orca@blizzard libexttextcat]$ sudoЧитать больше проКак угадать язык текста[…]