高中信息技术《获取文本信息》课件

时间:2020-4-15 作者:791650988

规则输入汉字的方法。英文字符只有26个,对应着键盘上的26个字符键,因此英文字符的输入、内部处理、存储和输出都可以使用同一代码,不存在什么输入法。但汉字字数繁多,常用的汉字就有6000多个,而且汉字字形复杂,编码比较困难。为了适当降低编码难度,提高计算机处理效率,目前,在用计算机处理汉字的不同环节,需要采用不同的编码方式。这些编码分为3种类型:输入码、机内码、输出码。

其中,输入码是指用键盘输入汉字时使用的编码,也就是人们常说的输入法。由于汉字和键盘上的字符键没有明显的对应关系,为了能在计算机中输入汉字,人们根据汉字的读音、字形等,把汉字拆分成更小的部件,并把它们与键盘上的键产生联系,从而使我们能够通过键盘按照某种规律输入汉字。

利用键盘输入汉字时,首先用一种输入法输入汉字的输入码,然后通过相应的转换程序,把输入码转换成计算机能识别、存储、处理的机内码,最后转换为输出码显示出来。例如,使用全拼输入法输入汉字“中学生”,对应的过程可以简化为下图。

结合人们习惯通过汉字的读音和字形来记忆汉字的事实,研究人员发明了很多种输入法,便于快速输入汉字。汉字输入法主要可以分为以下3类。

音码输入法。按照字的读音进行汉字编码,如智能ABC输入法、微软拼音输入法、全拼输入法、搜狗拼音输入法等。例如,选择智能ABC输入法后,依次敲回入键,选字框中出现一些备选字,再敲“好”字对应的数字键,就可以输入这个字。

形码输入法。以笔画、字根为字的部件,按照部件的形状进行汉字编码,如五笔字型、智能五笔和郑码输入法等。例如,选择五笔字型输入法,敲VB键,可以输入“好”字。

音形码输入法。采用音、形结合的方式,以字的读音为主,辅以部件的读音或形状进行汉字编码,如一码输入法、二笔输入法和自然码等。

把搜集到的报刊和资料中的文章用键盘输入到计算机中,对打字速度慢的人来说,会耗费大量的时间。如果用扫描仪把资料扫描下来,再用OCR(0ptical Character Recognition,光学字符识别)软件识别出文字,可以加快输入速度。

扫描仪是计算机的输入设备之一,可以扫描图片、文档、报纸和杂志等。用扫描仪扫描印刷品上的文字时,得到的是一幅图片,其中的文字无法编辑、排版。利用OCR软件把图片里的文字转换成计算机能识别的文本信息后,就可以用记事本、写字板、金山文字、Word等字处理软件编辑了。

扫描仪的种类很多,形状也不同,但使用方法基本类似。

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:791650988@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。