当前位置: 王朝网络 >> 数码 >> 谷歌搜索引擎增加新技术可搜索PDF文件

谷歌搜索引擎增加新技术可搜索PDF文件

王朝数码·作者佚名 2008-11-03

11月2日消息，谷歌很少在自己的搜索结果中包含扫描的文件，因为它没有办法确定这个内容的性质。但是，这种情况将发生变化。谷歌称，它将使用光学字符识别（OCR）软件让网络浏览者搜索以Adobe系统公司开发的PDF文件格式存储的任何文件。

谷歌产品经理Evin Levey说，谷歌将利用这种技术把扫描的文件转换为文本文件。这样就可以对文件进行搜索、索引和返回为谷歌搜索查询的答案。这是我们要让全球的信息都能够访问和利用迈出的一小步，但是也是重要的一步。

谷歌针对网络的这种OCR蛮力应用程序预计还能够帮助谷歌的图书搜索。这是谷歌2004年在法兰克福图书博览会上发布的一个雄心勃勃的和有争议的计划。从那以后，谷歌以每天3000本图书的速度扫描全球主要图书馆中的图书。

虽然这个计划最初引起了版权的担心。但是，谷歌刚刚与美国作家协会和美国出版商协会就这个问题达成了和解。谷歌将能够在美国扩大在线访问数百万有版权的图书和其它书面内容。这个和解协议解决了挑战谷歌数字化、搜索和显示有版权的图书中的部分内容的法律诉讼问题。允许谷歌在没有版权拥有者批准的情况下与图书馆共享数字版本的图书。

然而，由于网络内容继续成倍的增长，当前搜索引擎技术基于文本的性质显然是不充分的。这是因为目前这一代搜索引擎只能找到有文本注释的多媒体文件。文本注释是一种费力的和耗费时间的过程。内容制作者经常忽略这个问题。

Adobe副总裁David Wadhwani解释说，我们正在初步地与谷歌和雅虎合作以显著改善网络上丰富内容的搜索。我们打算扩大这种能力的应用，使所有的出版商、开发商和最终用户受益。

点击展开全文

上一篇：联手打击僵尸网络或禁止带毒PC上网

下一篇：中国电信与青海省政府签协议部署信息化战略

免责声明：本文为网络用户发布，其观点仅代表作者个人观点，与本站无关，本站仅提供信息存储服务。文中陈述内容未经本站证实，其真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

没有找到您想要的？点此查看更多相关文章
相关文章▶

2023年上半年GDP全球前十五强
百态 2023-10-24

美众议院议长启动对拜登的弹劾调查
百态 2023-09-13

上海、济南、武汉等多地出现不明坠落物
探索 2023-09-06

印度或要将国名改为“巴拉特”
百态 2023-09-06

男子为女友送行，买票不登机被捕
百态 2023-08-20