内容定位分组技术

发布时间:2011-03-23 作者:李幼平 阅读量:

1 分担互联网的流量
    当前互联网的“流量剧增、内容难管、耗电过大”问题,原因是社会应用与技术结构脱节。社会应用己经改变互联网的数学性质由泊松分布的随机网络改变为幂律分布的无尺度网络。流量的80%属于“一点对极多点”传播的公共内容,而技术结构仍停留于“点对点”的个案投递。增添“一点对极多点”的内容分发结构,大比例旁路不堪重负的“点对点”流量,是解决上述问题的办法。数字广播,尤其是无线电广播,本身是“一点对极多点”的内容分发结构,只需引入按内容管理的存储环节,有可能成为分担互联网流量的全新结构。


    数字广播分担互联网部份流量,是中国政府三网融合的一项举措。为了实施三网融合,广电行业制订了下一代广播(NGB)的发展战略。NGB当前处于初级阶段,IP多播、双向点播、推送播存等3种模式独立生存。NGB的下一步,可以用内容分组技术整合这3种模式,形成大比例分担互联网流量的全新生产力。


    自2010年1月以来,中国各地兴建CDN、ACR、P2Pcache、互动电视等文化共享工程,策略都是“就近大规模分发内容”,为分担互联网热门内容铺垫了物质基础。无独有偶,2010年8月,美国国家科学基会批淮NDN(Named Data Networking)作为未来互联网的可能架构。科学家们用不同方式,表达对内容分组技术的关切,希望以内容为核心价值,营造新的网络,改革当今的互联网。


2 内容分组技术
    本文建议,用内容分组(UCL Packet)承载各种各样以内容为核心价值的信息。UCL是统一内容定位的英文缩写。内容分组是一种按内容属性定位的IP分组,可两栖游走于IP通信网和数字广播网,可拆分、可积累,可激活、可繁殖,可搜索、可阅读。总之,可以用规模化生产方式,满足个性化的文化需求。


    UCL由内容代码与内容属性两个字段组成:内容代码定长,8字节,嵌入IP报头的Option段;内容属性非定长,一千多字节,嵌在文件内容的前端,含内容代码、URL代码、文件标题、小于140字中文摘要、内容数字指纹、分类域名、行业域名、作者、价位等元数据。


    在存储环节帮助下,内容定位技术分别赋予广播和多播“各取所需”的大批量分发能力,赋予互联网整合广播网与电信网的机会:


    (1)广播网供应个性化内容
    UCL借助内容分组交换,提升广播的推送能力。单频点可推送上千种媒体,实现中国热门内容的一体化大聚合,直接向全体人民提供没有路由、没有拥堵的“播存服务”。


    UCL个性化过滤下载内容,实现“网页主动寻找网民”。


    (2)通信网旁路热门流量
    UCL使得附加内容存储能力的路由器或服务器具备大规模分发能力,把热门流量拦截于网络边缘。
在IP网内,相同内容被避免重覆传输,大幅节省带宽耗费,保证全网低碳运行。


    (3)互联网通过内容管理整合广播网与电信网
    把内容数字指纹当成是监管部门核淮该内容广为传播的印记,赋以互联网内容管控能力。
统一的内容监管指纹,促使电信网、广播网双双成为未来互联网的基础设施,落实三网融合的国家目标。


3 内容分组的社会应用
    作为社会应用的实例,下面讨论如何运用UCL技术,完成公共文化内容的大规模分发。


    按内容属性承接网络服务是三网融合的技术基础。在2015年前,按内容属性承接网络服务可以帮助国家建成公共文化服务平台;在2020年前,按内容属性承接网络服务可以帮助国家找到“积极利用与有效管理互联网”的具体办法,并最终形成中国全新的互联网。


    分发有3个层次,即在保留传输控制协议/网间协议(TCP/IP)个案分发基础上,增添“主流内容主动到户”的个人库分发和“热门内容本地获取”的本地库分发。公共文化内容的分发如图1所示。

 



    (1)主流内容主动到户——广播方式形成0跳个人库
    UCL数据包把无连接概念植入广播,入库时序随信源的忙闲灵活变化。作者可以在任意时刻投入内容,用户可以在任意时刻享用内容,广播的推送能力因此获得极大提升。单个40 Mb/s的卫星转发,每天可推送超过400 GB的内容,赋以全民无拥堵获取上千种报刊、网站和数万分钟视频的平等权力,以及主流内容实现公益性、基本性、均等性、方便性的文化服务。


    当然,个人库并非万全方案。由于库成本需由个人承担,容量不可能很大,不可能满足个人的所有兴趣,因此还需要营造存储更丰富内容的本地库。


    (2)热门内容本地获取——组播、广播共建本地库
    ACR大规模汇聚路由器和P2Pcache本地服务器是中国自主创新的两种异步多播分发系统。由于网民群体的即兴拉动,形成容量巨大、内容极其丰富的本地库。第一位网民的访问内容暂存起来,第二、第三位……相同兴趣的访问内容不需重复收存,以后只需很少的跳数即可从库中获取。当然,本地库也接受来自广播的主流内容。多元拉动与主流推送机会均等,先入为主(完全相同的内容只需收存一次)。按库闲时间长短吐故纳新,保证热门内容得以按民意自然繁衍,而不计较它的具体来源。


    (3)先问库、后上路的3层服务
    身边个人库里有的,就近取用;个人库没有,上本地库索取;本地库仍然没有,通过TCP/IP到网站中查找索取。


    单播的通信线路不限内容品种,承载“各献所知”的多元文化。广播的个人库不限用户数目,通过UCL过滤实现各取所需,弘扬主流文化。多播的本地库,繁荣多元和弘扬主流两不耽误。三者珠联璧合,自然融合。


    尽管库与路各自都不尽完美,但互补相助,依然可以融合成为相对完美的公共文化平台。


    单独的广播网与电信网也不尽完美,但两者互补相助,可以组成相对完美的全新互联网。


4 结束语
    实践证明,引导广电、电信比拼带宽大、服务全,会导致两大行业关系紧张。内容分组技术与此相反,提倡各有侧重、互补相助,将最大可能地简约社会资源的总体耗费。电信尽力传输,广电尽力存储,促使两种不尽完美行业“尽力而为”,融合成为相对完美的未来互联网。

 

收稿日期:2011-02-02

[摘要] 互联网由于按主机地址分组运行,目前存在“流量剧增、内容难管、耗能过大”等问题。文章提出增添按内容属性分组的运行机制,并把广播网与电信网都看成是未来互联网的基础设施。文章认为这样将使问题迎刃而解。

[关键词] 内容定位分组;播存;多播

[Abstract] The Internet operates in groups according to the host address, but it still has some problems including: increasing traffic, uncontrollable content, large consumption and so on. In this paper, adding an operating mechanism in groups according to content property is considered, and both the broadcast network and telecommunication network are regarded as the infrastructure of the future Internet. Under the guidance of these ideas, many problems can be resolved.

[Keywords] content location packet; broad-store; multicast