<?xml version="1.0" encoding="UTF-8"?> <rss
version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
> <channel><title>knallisworld &#187; pdf</title> <atom:link href="http://www.knallisworld.de/blog/tag/pdf/feed/" rel="self" type="application/rss+xml" /><link>http://www.knallisworld.de/blog</link> <description>Where is the beef?</description> <lastBuildDate>Thu, 02 Feb 2012 23:10:07 +0000</lastBuildDate> <language>en</language> <sy:updatePeriod>hourly</sy:updatePeriod> <sy:updateFrequency>1</sy:updateFrequency> <item><title>Google, OCR, PDF</title><link>http://www.knallisworld.de/blog/2008/11/01/google-ocr-pdf/</link> <comments>http://www.knallisworld.de/blog/2008/11/01/google-ocr-pdf/#comments</comments> <pubDate>Fri, 31 Oct 2008 23:31:54 +0000</pubDate> <dc:creator>knalli</dc:creator> <category><![CDATA[Aktuelles]]></category> <category><![CDATA[Google]]></category> <category><![CDATA[Technologie/IT]]></category> <category><![CDATA[ars]]></category> <category><![CDATA[ocr]]></category> <category><![CDATA[pdf]]></category> <guid
isPermaLink="false">http://www.knallisworld.de/blog/?p=554</guid> <description><![CDATA[Google scannt nun PDFs &#8211; mit OCR. Das Indexieren &#8220;normaler&#8221; PDFs ist heute kein Novum mehr. Etwas anderes ist es aber, wenn es um Scan-PDFs geht, also um Scans, deren Bilder in PDFs publiziert werden als Form der &#8220;Digitalisierung&#8221;. Diese ließen sich bisher sowohl schlecht lesen als auch erst recht nicht durchsuchen. Man munkelt schon [...]]]></description> <content:encoded><![CDATA[<p>Google scannt nun PDFs &#8211; mit OCR. Das Indexieren &#8220;normaler&#8221; PDFs ist heute kein Novum mehr. Etwas anderes ist es aber, wenn es um Scan-PDFs geht, also um Scans, deren Bilder in PDFs publiziert werden als Form der &#8220;Digitalisierung&#8221;. Diese ließen sich bisher sowohl schlecht lesen als auch erst recht nicht durchsuchen. Man munkelt schon länger, dass Google an entsprechender Software arbeitet, nun haben sie dieses Feature offiziell verkündet und aktiviert.</p><p>Das Beispiel <a
href="http://www.google.com/search?q=repairing+aluminum+wiring">repairing+aluminum+wiring</a> zeigt eindrucksvoll, wie es funktioniert. Beim ersten Suchergebnis einfach mal PDF (Original) und HTML-Ansicht wählen, um die OCR-Qualität zu sehen. Wenn man nun bedenkt, das auch solche PDFs (und vielleicht sogar noch schlechtere) im Index landen, wird die Anzahl in die Höhe steigen.</p><p>Ein Schritt mehr, etwas mehr im Deep Internet zu suchen..</p><p>[via <a
href="http://arstechnica.com/news.ars/post/20081031-google-turns-on-ocr-for-scanned-pdfs.html">ars</a>]</p> ]]></content:encoded> <wfw:commentRss>http://www.knallisworld.de/blog/2008/11/01/google-ocr-pdf/feed/</wfw:commentRss> <slash:comments>0</slash:comments> </item> <item><title>Firefox 3 Mac OS X Inline PDF!</title><link>http://www.knallisworld.de/blog/2008/07/10/firefox-3-mac-os-x-inline-pdf/</link> <comments>http://www.knallisworld.de/blog/2008/07/10/firefox-3-mac-os-x-inline-pdf/#comments</comments> <pubDate>Thu, 10 Jul 2008 20:40:11 +0000</pubDate> <dc:creator>knalli</dc:creator> <category><![CDATA[Allgemeines]]></category> <category><![CDATA[MacOS X]]></category> <category><![CDATA[Technologie/IT]]></category> <category><![CDATA[Tipps]]></category> <category><![CDATA[Was ich schon immer mal wissen wollte..]]></category> <category><![CDATA[Web]]></category> <category><![CDATA[download]]></category> <category><![CDATA[firefox]]></category> <category><![CDATA[macosx]]></category> <category><![CDATA[pdf]]></category> <guid
isPermaLink="false">http://www.knallisworld.de/blog/?p=443</guid> <description><![CDATA[Na endlich &#8211; mit diesem Plugin kann man PDFs nun auch im Firefox sofort im Browser angucken.]]></description> <content:encoded><![CDATA[<p>Na endlich &#8211; mit diesem <a
href="http://code.google.com/p/firefox-mac-pdf/">Plugin</a> kann man PDFs nun auch im <a
href="http://www.getfirefox.com">Firefox</a> sofort im Browser angucken.</p> ]]></content:encoded> <wfw:commentRss>http://www.knallisworld.de/blog/2008/07/10/firefox-3-mac-os-x-inline-pdf/feed/</wfw:commentRss> <slash:comments>0</slash:comments> </item> </channel> </rss>
