跨媒体信息传播原理与技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

二、跨媒体传播中的文字

1.文字

文字是不同媒体间传播的最基本的对象。文字要想在不同媒体中有效地传播,文字的编码标准是一个很重要的问题。中文的编码以往经常使用GB 2312(国家标准),这种编码标准只包含7000多个汉字,后来扩充的GBK则含有20000多个汉字,我国台湾地区使用Big5编码标准,而国际上Unicode标准包含了6万个以上的汉字。Unicode在网络上传输时采用UTF-8编码标准。文字在不同的媒体上有可能采用不同的标准,跨媒体传播时就要准确地对其进行传换。目前,我国在网络上使用的文字大多已采用UTF-8编码标准,统一了标准,给文字的跨媒体传播减少了很多的麻烦。

文字的跨媒体传播还有一个很重要的问题就是语言问题。过去一篇在英文媒体上发布的文章要传播到中文媒体上只能采用人工翻译,但现在由于海量的信息,采用人工翻译成本太高,所以在不同语言媒体上传播时,通常采用机器翻译,很多浏览器都设计了网页自动翻译功能。

2.结构化的文字

小说类文字的跨媒体传播最简单,就是把整本书的文字放上去,不需要太多技术处理,只要注意收费的方式就可以了。

但是旅游、汽车、电脑配件等资讯类的文字,如果像小说那样整本放上去,就不会有多少人喜欢去读。人们更需要的是在想用的时候,可以方便地查询、对比、分类。这样的资讯就应在放到数据库中时,做成不同的资讯工具产品,才能让人方便使用。

像论文这类文章在跨媒体传播时一般以文章为单位,如果像小说那样一篇文章一个文本,这对于文章内容的分析、处理十分不便。把一篇文章拆分出标题、作者、关键字、正文,甚至把正文进一步拆分成更小的单元的过程称为碎片化。碎片化的文章可以存入数据库,这样我们就可以很方便地分别对文章的标题、作者等进行分析。这种文字不是散乱的文字,是一种结构化的文字。

在跨媒体传播文字的时候,最常见的一种结构化的文字就是XML,关于XML,后面有专门的章节进行讲解。