<?xml version="1.0"?>
<?xml-stylesheet type="text/css" href="http://wiki.linuxformat.ru/wiki/skins/common/feed.css?303"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://wiki.linuxformat.ru/wiki/index.php?action=history&amp;feed=atom&amp;title=LXF133%3AReview5</id>
		<title>LXF133:Review5 - История изменений</title>
		<link rel="self" type="application/atom+xml" href="http://wiki.linuxformat.ru/wiki/index.php?action=history&amp;feed=atom&amp;title=LXF133%3AReview5"/>
		<link rel="alternate" type="text/html" href="http://wiki.linuxformat.ru/wiki/index.php?title=LXF133:Review5&amp;action=history"/>
		<updated>2026-05-13T17:49:29Z</updated>
		<subtitle>История изменений этой страницы в вики</subtitle>
		<generator>MediaWiki 1.19.20+dfsg-0+deb7u3</generator>

	<entry>
		<id>http://wiki.linuxformat.ru/wiki/index.php?title=LXF133:Review5&amp;diff=12445&amp;oldid=prev</id>
		<title>Crazy Rebel: викификация, оформление, иллюстрация</title>
		<link rel="alternate" type="text/html" href="http://wiki.linuxformat.ru/wiki/index.php?title=LXF133:Review5&amp;diff=12445&amp;oldid=prev"/>
				<updated>2011-07-21T10:58:05Z</updated>
		
		<summary type="html">&lt;p&gt;викификация, оформление, иллюстрация&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;==''FineReader 8 CLI''==&lt;br /&gt;
&lt;br /&gt;
{{Сравнение&lt;br /&gt;
|кратко=OCR-па­кет, распо­знаю­щий тексты на мно­гих язы­ках, с вы­водом в раз­лич­ные фор­ма­ты.&lt;br /&gt;
|также=''Tesseract''&lt;br /&gt;
|изображение=LXF133_12_1.jpg&lt;br /&gt;
|подпись=В це­лом ка­че­ст­во рас­по­зна­ва­ния пре­вос­ход­ное, а вы­вод в раз­лич­ные фор­ма­ты весь­ма по­ле­зен, осо­бен­но для HTML и PDF.&lt;br /&gt;
|разработчик=Abbyy&lt;br /&gt;
|сайт=http://www.ocr4linux.com&lt;br /&gt;
|цена=€149 за 12 000 стра­ниц в год&lt;br /&gt;
|параметр1=Функциональность&lt;br /&gt;
|оценка1=7&lt;br /&gt;
|параметр2=Производительность&lt;br /&gt;
|оценка2=9&lt;br /&gt;
|параметр3=Простота использования&lt;br /&gt;
|оценка3=6&lt;br /&gt;
|параметр4=Опривданность цены&lt;br /&gt;
|оценка4=8&lt;br /&gt;
|итог=Бы­ст­рая ра­бо­та, точ­ные ре­зуль­та­ты рас­по­зна­ва­ния тек­ста на мно­гих языках. До­ку­мен­та­ция и удоб­ст­во ис­пользо­ва­ния ра­ду­ют мень­ше.&lt;br /&gt;
|рейтинг=8&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
: Одо­ле­ли бу­ма­ги? Оциф­руй­те ар­хи­вы при со­дей­ствии '''Ника Вей­ча''', по­средством OCR-ин­ст­ру­мен­та команд­ной стро­ки от Abbyy.&lt;br /&gt;
&lt;br /&gt;
Некогда вся ци­ви­ли­за­ция дер­жалась на бу­ма­ге. Все че­ло­ве­че­ские знания хранились в ви­де записей. Но ныне всё боль­ше до­ку­мен­тов суще­ству­ет исклю­чи­тель­но в ком­пь­ю­те­рах. Слож­но­сти возника­ют, когда мы пробу­ем со­вместить два этих ми­ра. Хранение от­сканиро­ван­ных до­ку­мен­тов неэффек­тив­но. И не толь­ко по­то­му, что ска­ны занима­ют мно­го места, но и по­то­му, что сло­ва внут­ри та­ких до­ку­мен­тов мерт­ве­ют, ста­но­вят­ся недоступ­ны­ми для мощ­ных по­иско­вых ал­го­рит­мов.&lt;br /&gt;
&lt;br /&gt;
ПО для оп­ти­че­ско­го рас­по­зна­вания сим­во­лов (OCR) су­ще­ству­ет со вре­мени по­яв­ления пер­вых сканеров, и мож­но наде­ять­ся, что про­гресс всё это вре­мя не стоял на месте. Уж ко­ли бри­тан­ская по­ли­ция в со­стоянии ав­то­ма­ти­че­ски счи­ты­вать номе­ра мил­лио­нов дви­жу­щих­ся ав­то­мо­билей, неу­же­ли так труд­но рас­по­знать чёт­кие ти­по­граф­ские строч­ки? Ком­пания Abbyy занима­ет­ся этим во­про­сом дав­но, на­ко­пила из­ряд­ный опыт, а её про­дук­ция сла­вится вы­со­кой про­из­во­ди­тель­но­стью.&lt;br /&gt;
&lt;br /&gt;
Уста­нов­ка вполне про­ста, хо­тя по­на­добит­ся неко­то­рое зна­ком­ство с команд­ной стро­кой. Но раз уж это при­ло­жение команд­ной стро­ки, ин­стал­ля­ция мо­жет быть не самой глав­ной слож­но­стью. На на­шей тестовой ма­шине един­ствен­ной неувяз­кой был кон­фликт с SELinux – ну, с кем не бы­ва­ет...&lt;br /&gt;
&lt;br /&gt;
Кро­ме про­сто­го тек­ста, вы­вод возмо­жен и в дру­гие фор­ма­ты, вклю­чая PDF и HTML. В по­следнем слу­чае де­ла­ет­ся попыт­ка ими­ти­ро­вать ори­ги­нал: ко­лон­ки тек­ста и да­же изо­бра­жения со­хра­ня­ют­ся на местах. Хо­тя са­мое важ­ное – это все же рас­по­знать сло­ва, струк­ту­ра до­ку­мен­та – вещь то­же по­лез­ная. Для од­но­го толь­ко HTML име­ет­ся 16 раз­лич­ных па­ра­мет­ров на­строй­ки, вклю­чая та­бу­ля­цию, раз­мещение изо­бра­жений и со­от­вет­ствие различ­ным стан­дар­там. Под­держ­ка PDF «упа­ко­ва­на» ана­ло­гич­но. Несмот­ря да­же на то, что в на­ших тестах бы­ли рас­по­зна­ны не все сим­во­лы, ком­по­нов­ка пол­но­стью со­хранилась.&lt;br /&gt;
&lt;br /&gt;
===По­ли­глот===&lt;br /&gt;
&lt;br /&gt;
Точ­ность рас­по­зна­вания в це­лом очень хо­ро­шая. Как и у всех OCR-приложений, осложнение соз­да­ют тек­сты, пе­ре­кры­тые гра­фи­кой, и мно­го­ко­ло­ноч­ные страницы. По­хо­же, что про­грам­ма стре­мит­ся искать пра­виль­ные, пря­мо­уголь­ные бло­ки тек­ста; но, по сча­стью, не силь­но оби­жа­ет­ся на пе­ре­кос до­ку­мен­та в сканере. Тести­рова­ли мы и ино­стран­ные до­ку­мен­ты, коль ско­ро за­яв­ле­на под­держ­ка аж 190 языков. Немец­кий и фран­цуз­ский про­шли на ура, а надпи­сей на суа­хи­ли у нас под рукой не бы­ло. На бо­нус пред­ла­га­ет­ся чтение язы­ков про­грам­ми­ро­вания, вклю­чая ''C/C++'' и ''Java'', а так­же неувя­даю­ще­го ''Fortran''.&lt;br /&gt;
&lt;br /&gt;
Бо­лее все­го уди­ви­ла до­ку­мен­тация: HTML-страницы скуд­ны при­ме­ра­ми, за­то пе­ст­рят ор­фо­гра­фи­че­ски­ми ошибка­ми. Это про­сти­тель­но для бес­платно­го ПО, но не для ком­мер­че­ской програм­мы. HTML-страницы пред­став­ле­ны в man-сти­ле и со­дер­жат уй­му под­роб­ностей, но непри­ят­но ма­ло по­лез­ных при­меров. Нет и объ­яснений, как ис­поль­зо­вать команд­ную стро­ку для па­кет­ной об­ра­бот­ки ма­те­риа­лов.&lt;br /&gt;
&lt;br /&gt;
Что­бы оп­рав­дать стои­мость го­до­вой ли­цен­зии – 149 ев­ро – нуж­но пе­ре­ло­па­тить нема­ло страниц, хо­тя в про­мыш­лен­ных мас­шта­бах это до смешного недо­ро­го.&lt;br /&gt;
&lt;br /&gt;
===Свойства навскидку===&lt;br /&gt;
&lt;br /&gt;
* '''Штрих-ко­ды'''&lt;br /&gt;
: Вме­сте с тек­стом мож­но расшиф­ро­вы­вать и штрих-ко­ды рас­про­стра­нён­ных ти­пов.&lt;br /&gt;
* '''PDF'''&lt;br /&gt;
: Вы­во­ди­те от­ска­ни­ро­ван­ные до­ку­мен­ты из ''FineReader'' в фор­ма­те PDF.&lt;/div&gt;</summary>
		<author><name>Crazy Rebel</name></author>	</entry>

	</feed>