3.1.1 网络媒体信息
网络媒体信息是指传统意义上的互联网网站公开发布的信息,网络用户通常可以基于通用网络浏览器(如Microsoft的Internet Explorer、Netscape的Navigator、Mozilla的Mozilla Firefox等)获得互联网公开发布的信息。
由于本书针对这类信息拥有统一的信息获取方法,因此将其统称为网络媒体信息。宏观意义上的网络媒体信息涉及面广,可以通过网络媒体形态、发布信息类型、媒体发布方式、网页具体形态与信息交互协议等多种划分方法,进一步细分网络媒体信息的组成。
1.网络媒体形态
按照网络媒体的具体形态,网络媒体可以分为广播式媒体与交互式媒体两类。其中,传统的广播式媒体主要包含新闻网站、论坛(BBS)、博客(Blog)等形态;新兴的交互式媒体涵盖搜索引擎、多媒体(音/视频)点播、网上交友、网上招聘与电子商务(网络购物)等不同形态。每种形态的网络媒体都以各自的方式向互联网用户推送其公开发布的信息。
2.发布信息类型
从公开发布信息的具体类型上看,网络媒体信息可以细分为文本信息、图像信息、音频信息与视频信息四种类型,其中文本信息始终是网络媒体信息中占比最大的信息类型。
3.媒体发布方式
按照网络媒体所选择的信息发布方式,网络媒体信息还可以分成可直接匿名浏览的公开发布信息,以及需进行身份认证才可进一步阅读的网络媒体发布信息。
4.网页具体形态
《中国互联网网络发展状况统计报告》根据网页超链接网络地址(统一资源定位符,URL)的组成,将网页分成URL中不含“?”或输入参数的静态网页,以及URL中含“?”或输入参数的动态网页两类。
针对网页内容的具体构成形态,网络媒体信息中的静态网页与动态网页还可以进行更加明确的区分。网页主体内容以文本形式,网页内嵌链接信息以超链接网络地址的方式存在于网页源文件中,这一类网页属于静态网页,如图3-1所示。网页主体内容或网页内嵌链接信息完全封装于网页源文件中的脚本语言片段内,这一类网页属于动态网页,如图3-2所示。
图3-1 静态网页实例
图3-2 早期动态网页实例
从网页内容的构成形态不难发现,动态网页无法和静态网页一样,使用传统的基于HTML标记匹配的网页解析方法来提取网页主体内容及其内嵌链接对应的地址。不过,当前网络媒体信息的网页多为静态网页,鲜有以动态网页形态发布的网络媒体信息。
5.信息交互协议
按照所使用的信息交互协议的不同,网络媒体信息可以分为HTTP(S)信息、FTP信息、MMS信息、RTSP信息与已经不多见的Gopher信息等。其中,MMS信息与RTSP信息属于音/视频点播协议。当互联网用户通过网络浏览器浏览MMS或RTSP协议信息时,浏览器会通过操作系统调用该协议来解析所对应的默认应用程序,实现互联网用户请求的音/视频片段播放。