《数字出版教程》课件第九章 数字出版编辑中的网络信息获取与鉴别.pptx

时间:2023-1-22 作者:791650988

幼儿园庆祝中秋节主题班会模板.pptx

中秋节快乐,月圆中秋夜,天涯共此时,幼儿园庆祝中秋节主题班会,认识我们的节日,一起来听故事,大家一起做手工,认识我们的节日,月圆中秋夜,天涯共此时,小朋友,你知道中秋节是农历的几月几日,中国农历八月在秋季中间,称为,仲秋,而八月十五又在,仲,

《《数字出版教程》课件第九章 数字出版编辑中的网络信息获取与鉴别.pptx》由会员分享,可在线阅读,更多相关《《数字出版教程》课件第九章 数字出版编辑中的网络信息获取与鉴别.pptx(41页珍藏版)》请在上搜索。

1、第四单元数字出版的编辑第九章 数字出版编辑中的网络信息获取与鉴别,本章概要,1、重点掌握搜索引擎的使用技巧2、重点掌握网络虚假信息及谣言的辨别方法。,第九章 数字出版编辑中的网络信息获取与鉴别,第一节 搜索引擎第二节 门户网站 第三节 网络虚假信息及谣言辨别,第一节 搜索引擎,一、搜索引擎的定义,搜索引擎(Search Engine)是指在互联网环境中的信息检索系统。,第一节 搜索引擎,二、搜索引擎的原理,搜索引擎的原理,可以看作三步:从互联网上抓取网页建立索引数据库在索引数据库中搜索排序。,第一节 搜索引擎,三、搜索引擎的类型,(一)按查询类型划分,搜索引擎按查询类型分为分类型搜索引擎(即范

2、畴层次搜索引擎,List-based Search Engine)和词语型搜索引擎(Words-based Search Engine)两大类。,(二)按覆盖范围划分搜索引擎按覆盖范围可分为通用搜索引擎和专业搜索引擎两大类。(三)按引擎功能划分搜索引擎按引擎功能可分为常规搜索引擎和多元搜索引擎(Meta Search Engine)两大类。常规搜索引擎是单一引擎;多元搜索引擎是多个单一引擎的组合,对同一个查询可同时在多个搜索引擎上进行,或组合指定的搜索引擎查询,或在单一搜索引擎上查询,可综合输出查询结果,也可分别输出每个搜索引擎的查询结果。,第一节 搜索引擎,四、搜索引擎尚待解决的问题,(一)

3、缺乏检索词汇控制,网络检索工具大都采用自然语言标引和检索,其必然结果是同义词得不到控制,词语间相互关系得不到揭示,最终影响检索效果。而网络信息的数量大、变化大、涉及面广,现有的受控语言难以适应网络信息标引和检索的需要。,(二)自动标引有局限性自动标引不可能像人工标引那样进行甄别和选择,而主要依赖关键词词频等标准判断网络文件的价值。为了弥补自动标引所带来的不足,大多数网络检索工具都先后增加了“评论”栏目,由专门的雇员选评各行业和各学科的最佳网络信息。如雅虎的“Cool Sites”,Excite的“Site Reviews”和Lycos的“Top 5%Sites”等都属于这类评论。,第一节 搜索

4、引擎,(三)缺乏检索专业信息的能力网络检索工具不根据专业划分检索范围,这与传统的检索工具截然不同。每个学科都有自己独特的词汇和用语,因此特定的专业检索工具应该使用与之相应的标引和检索语言,而这一点是包罗万象的网络检索工具难以做到的,所以,需要研制专业网络检索工具。(四)“把关人”缺失由于网络信息的发布存在“把关人”缺失问题,网络上的信息良莠不齐,因此,通过搜索引擎获得的信息,从整体上看缺乏准确性、权威性、科学性,需要用户对信息内容进行甄别。,第一节 搜索引擎,五、互联网信息检索策略,(一)基本检索策略:布尔逻辑检索,几乎所有的检索系统都具有布尔检索功能,布尔运算符包括AND、NOT、OR。,用

5、“A AND B”进行查询的结果是既包含查询词A又包含查询词B的文章。用“A OR B”进行查询的结果是至少包含A和B中一个查询词的文章。用“A NOT B”进行查询的结果是包含查询词A而不包含查询词B的文章。,第一节 搜索引擎,(二)范围限定二次检索:对于再次检索,可以重新开始,在整个索引中检索,也可限定在前次检索结果内,优化检索。时间范围(时间限制):雅虎系统设定检索时间范围为最近三年,用户也可在一天到三年的时间范围内进行选择。语言限制:AltaVista可以查询基于25种语言的信息,其中包括英语、日语、汉语、德语等。但是查询时不能用含有双字节的字符(如汉语、日语等)进行查找。如果查找汉语

6、信息,可用英语查找,并将结果限定在汉语中。,第一节 搜索引擎,(三)智能检索/概念检索,Excite使用“智能概念检索”(Intelligent Concept Extraction)技术,通过发现词与概念间存在的关系,会自动加入一些检索词。如我们输入“elderly people financial concerns”,Excite除找出精确匹配这些词的文献外,还会找出有关“economic status of retired people”、“the financial concerns of senior citizens”等节点。,第一节 搜索引擎,(四)字段限定字段限定指限定词语在文献中出现的部位。大部分系统都可进行字段限定,但是字段的数目和表示方法稍有不同。(五)词语检索在一串词的前后加双引号(“”)或用连字符连接,可限定检索结果中的词语必须以同样的顺序出现且相邻,如“China economic development”。(六)其他字母大小写:有些系统区分字母大小写,如AltaVista、Infoseek;有些系统不区分大小写,如雅虎。名词检索:有些系统对名词检索有特殊规

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:791650988@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。