关键词:信息采集 生产发布 数据挖掘 优质服务 伴随着中国广电行业的快速发展,各电视台、传媒机构业务流程的转变,以及各生产厂家激烈竞争带来的技术革命,电视台生产网络的各个环节都发生了巨大变化:节目制作系统、新闻制作系统、播出系统、媒资系统等,无一例外。令人欣喜的是,所有的变化都是进步地、积极地,让广电人为之自豪。但在这个生产链中,有一个环节往往被大家忽略,那就是收录,本文将主要就收录环节的问题同大家展开探讨。 收录,顾名思义,收集录制。它是电视台进行节目生产的最前端,负责广泛的接收基带信号、IP信号等,为电视台其它生产系统提供数字化节目源。在广电行业的技术革命进程中,收录系统也在不断的变化、进步。 一 、收录系统的发展历程回顾 到目前为止,收录系统在国内发展的历程大概经历了三个阶段。 第一个阶段:1999~2003年,在这一阶段,第一代非线性编辑网络系统刚刚诞生,电视台的生产网络由线性制作向非线性制作转变,并产生了把磁带转化成文件的需求。为满足这一需求,用户最开始使用非线性编辑系统自身的上载功能来进行信号上载,后来又由功能单一、性能稳定、成本低廉的上载工作站所代替。这一时期,收录还谈不上是一个独立的系统,而只是制作网络中的一个工作站点。 第二个阶段:2003~2008年,此时,各个电视台的数字化改造进程进入了一定阶段,产生了集中全台信号资源、集中收录、统一分发、集中管理的需求,收录中心系统的概念在这样的背景下应运而生。该系统由控制服务器和视频服务器共同组成一个业务网络,实现全自动化的信号收录功能,具备自动控制、无人值守等特点。在这一阶段,收录已经成为一个独立的系统。 这一时期,大洋公司承建了多个大型收录系统的建设,如广东南方电视台、北京电视台、安徽电视台等,而南方电视台收录系统更是以复杂的信号路由调度控制(信号最高路由经过三级矩阵调度)技术的应用而一举奠定了大洋收录系统在业界的领先地位。 实现了自动控制功能的收录系统整合了电视台的信号资源,符合这一时期电视台的业务需求,给电视台的管理提供了便利,推动了各电视台制播业务的发展,但这一时期的收录系统的功能仅限于信号采集。 第三个阶段是当下。步入2009年以来,电视台的生产部门对支撑部门提出了越来越高的要求,除了对传统信号的需求外,对记者远程回传的素材、稿件、线索等,都需要在一个整合的平台上集中展现。 通过对市场形式、业务流程进行综合细致的分析之后,大洋公司打造出了第三代收录系统——信息采集发布平台。 二、信息采集发布平台的定义 大洋信息采集发布平台是一个信息采集系统,它突破了传统信号采集的范畴,涵盖了IP数据采集、远程FTP回传、文稿、线索上传,甚至是短信、彩信、外电等一切支撑电视台制作业务的源数据采集,集中了最广泛的采集渠道;它是一个支持发布的系统,整个系统的展现是BS结构,各种数据源信息分类展现;它是电视台全台信息交流平台,各个业务系统都可以在这个平台上挑选下载自己所需的内容。 信息采集发布平台的结构如下图所示: 它主要分为三个层面: 业务应用层:最前端的用户体验和应用,包括信号收录、IP信息交流、编辑预处理、统计发布等等。 业务支撑层:该层由一系列中间件和服务构成,采用透明化方式为上层应用提供后台支撑。 基础网络层:基础网络层由网络和AV设备支撑构成,是应用层和中间层的运行平台。 统一监控:统一监控不只是传统的网络设备监控和流程监控,还包含收录系统特有的收录任务监控、AV设备和矩阵路由监控等,贯穿于整个系统的各层应用。 
三、信息采集发布平台能给用户带来什么? 1. 多渠道的快速资源收集 (1) 素材或稿件的远程回传: 通过信息采集发布平台,地方台的记者或出差在外的记者可以利用已经铺成的省际电信网络传输链路以及遍布全球的Internet通讯渠道,实现远程线索、稿件、素材等资源的快速回传。资源一旦在页面上挂接,后续传输完全由网络和后台设备自动完成,包括页面信息的写入、资源文件的远程FTP回传以及最终在IE页面上的展现。远程资源上传,有效解决了原来依赖信号回传以及介质回寄的不便。 (2)针对热心群众的线索上传: 在信息采集发布平台中,热心群众通过注册即可获得报料权利,实现页面文字、短信、邮件等线索内容的上传;相关线索经过审核后,将发布在信息采集发布平台的报料库中,供记者选择,从而大大拓展了资源收集渠道。 (3)外电的收集: 通过外电机构的接口,可以收集到外电媒体发来的通联素材。 (4)传统信号收录: 在信息采集发布这个大平台中,传统的信号收录系统变成了它的一个子集,这个子集当然也可以独立运行。 记者通过平台的IE界面提交信号收录申请,平台收到申请后,将通知信号收录控制软件,由信号收录控制软件对多级矩阵、卫星接收机、收录服务器集群、应急录像机等多种设备实现自动调度与控制,完成各类信号(HD SDI、SD SDI、ASI)的高低码流采集,并将采集的结果发布到平台上,供约稿记者领用。 在记者进行收录任务单的编辑时,信息采集发布平台还提供各卫星频道的节目单以及各个卫视收视率信息供记者参考。 在信号收录系统进行调度控制时,系统会提供有效的任务自动策略判断服务,完成相同信号在时间段上重叠时的任务合并工作,充分利用每台SDI和ASI收录服务器,节省系统的网络开销、人力开销,减少资源浪费。 信息采集发布平台突破了原有的传统信号收录的范畴,实现了多渠道的资源收集,为电视台用户提供了更为便捷的服务。 2. 统一的资源发布和交流门户 
(1) 基于单点SSO登陆 上图为信息采集发布平台的主界面(以浙江台项目为例),它采用统一信息门户和单点登陆的技术架构:系统采用一个用户名和密码进行唯一登陆,统一认证,分散授权,用户根据权限不同,可以使用相应的功能模块;具体的身份角色包括普通报料人、特约线人、电视台内记者、地方台用户、频道负责人、集团领导、管理员等,这些用户登陆统一地址,但又有各自不同的工作界面。 (2)提供便捷的资源展现和查询页面,充分共享资源 通过各种渠道收集的资源,将在信息采集发布平台上统一展现,并且各类资源均拥有明确的标题、关键字、来源、接受方、上传时间等标识字段。此外,点击查看针对信号任务收录的稿件、视音频素材等不同类型的资源时,系统将出现不同的展现界面:如针对新闻稿件,系统将展现基本信息、稿件内容、视音频素材(可选)等信息;针对视音频素材,系统采用直观的流媒体窗口,支持Play、Seek、打点等多种灵活应用。 所有的资源并不是不加区别的完全共享,针对具体的资源,系统将设置不同的权限和共享开放度,以保证部分资源的优先利用,避免资源抢占,造成不必要的争执,这些可由管理员根据各台的实际情况进行设置和管理。 (3)充分的信息交流及下载 进入信息采集发布平台后,具有权限的用户能够在Internet可以触及的任何角落,登陆系统,进行资源浏览或查询。 各种角色可以领用线索、预约收录任务、指定人员上传资源或把资源提交给其他人员(可以配置是否需要审核)、检索查询对应资源,提交下载申请。系统收到申请后,后台将自动读取资源存放位置(如信号收录存储或IP信息交换缓存),根据申请自动转码或不转码,然后根据申请下载的目的地自动进行FTP推送发布,推送到达目的地后,系统自动根据消息交互完成后续自动导入过程。 信息采集发布平台基于BS架构实现了统一的资源收集和发布,可以为所有具备权限的帐户提供数据支撑服务。 3. 提供其它优质服务 信息采集发布平台还可通过对数据的深度挖掘,为用户提供其它优质服务:如统计和报表展现。在平台上工作的每个角色都有自己的心理预期:报料者希望知道自己的报料被利用情况;地方台希望了解自己上传的素材被采用情况;管理员希望了解系统的运行状态和资源紧张度量化报表;集团领导希望了解各个频道或个人对系统的使用情况以及费用统计等信息,针对以上需求,平台可根据不同角色的不同心理预期,分别提供相应的统计服务: 
(1) 资源价值排行数据挖掘 任务预约排行榜:把一段时间以来各频道用户预约的节目类型进行统计,作为这一时期热点关注情况的一个参考。 素材下载排行榜:把一段时间以来素材的被下载次数进行排行,客观体现某个或某类资源的价值。 素材浏览排行榜:体现素材的受关注程度。外栏目收视率发布:根据接口定义,从收视率统计机构导入收视率数据,方便编导学习和研究优秀栏目的节目形态。 信号源节目单发布:根据接口定义,从合作伙伴处导入各个卫视未来几天的节目单,为信号收录人员编辑收录任务单提供参考。 其它排行信息...... 上述各类信息方便了台里各类用户的信息交流——便于编辑记者挑选热点素材,方便编导和各级领导挑选热点节目进行学习,方便收录人员进行节目单编辑工作。 (2) 设备信息统计挖掘 设备故障率统计:根据系统网络监控运行日志,统计出某段时间各设备的故障情况,以及故障类别分类情况,为运营过程中的设备维护提供依据。 设备紧张度统计:根据各个时段设备占用程度的甘特图以及任务设备调度和排选过程中的冲突信息,我们可以分析卫星接收机、收录服务器、存储空间等是否缺乏,以及哪些时段资源占用较为紧张,为调配人力物力资源以及将来的升级扩容提供数据指导。 以上各类信息使得网络管理员和决策层对当前网络的资源利用情况、设备紧张程度一目了然,也为设备的更换和增添提供参考。 (3) 各种费用统计挖掘 地方台上传采用统计:统计各个地方台一段时间内上传的资源数和被采用的资源数,并计算出总费用,便于集团评价各个地方台的公告价值,为后续结算提供数字支持,并支持打印和统计结果的导出。 
栏目约传统计:统计出某一段时间内各个频道/栏目/用户对收录系统资源的占用情况,如总时长、总任务条目、发生的费用总计等,便于集团内部的管理核算工作,同样也支持打印和统计结果导出。 栏目下载统计:统计各个单位/个人在信息采集发布平台上下载使用资源的情况,包括下载次数、下载总时长、总费用等等。 频道浏览统计:统计各个频道/栏目/个人在信息采集发布平台上浏览资源的情况。 通过以上各种类型的费用和数据统计,既对整个系统的价值做了全面、正确的评估,也帮助管理层了解了当前系统的运作形式,解决了各个部门的内部费用核算问题,同时也调动了报料上传人的工作积极性,这使得信息采集发布平台不但发挥了信息采集、发布、交流的作用,还可以转变成一个有运营能力的运营平台,非常契合各电视台的整体利益和长远发展方向。 四、信息采集发布平台的安全性 1. 网络层层隔离与防护 首先,针对B/S网页交互、流媒体浏览、FTP传输、短信和邮件内容的交互等各种安全隐患,系统提供具有VPN、硬件防火墙、病毒扫描与防护等功能于一身的硬件防毒墙设备,保障信息采集发布平台的安全,并按照远程回传和流媒体访问等网络交互流量需求,进行合理的端口开放与设置。 2. Linux异构对外交互服务器 在信息采集发布平台的各种对外交互设备上,如Web代理服务器、FTP远程传输服务器、流媒体服务器、生产下载FTP服务器等,系统采用异构的Linux操作系统,避免Windows病毒对内网造成的威胁。 3. 媒体数据安全——多重备份设计 在媒体文件的安全设计上,平台采用XRAID三重立体数据备份模式,实现收录服务器单机本地、主备网络存储的三重数据备份,这样,任意存储故障都不影响收录内容的导出与利用。考虑到素材库存储对正常的收录与发布起决定作用,平台采用完全备份的双存储架构,利用完全一样的双EMC高稳定存储,使得站点在读写访问时按照双写入方式进行数据实时备份、读取时按照负载均衡的方式平衡双存储读取性能。当某一存储发生故障时,实现无缝0秒切换,确保应用透明和系统运行的无间断。 4. 节目质量安全 节目质量安全体现在大洋自动技审技术和传输过程中的MD5校验技术。自动技审技术按照专业示波仪的底层视音频指标分析原理,能够在内容采集、节目制作、转码传输的各环节,通过后台方式对素材内容进行自动技术审核,在不符合发表标准的地方提出警示,为人工审核和后续节目修改提供定位。 在信息传递过程中,数据如果被恶意篡改,就会造成播出事故。为规避这一风险,平台对数据传输执行严格的MD5校验,对前后MD5码不一的节目反馈传输失败,从而启动再传行动,避免错误内容的播出。 五、和其它生产网络的接口 本系统可以和台内其它应用系统保持松耦合互联,如果台内没有全台网架构,那么用户将下载资源写入生产网对应FTP服务器,根据各网接口开发程度选择自动插入资源管理器或手动导入方式。 在全台网建成后,可以遵循集团主干厂商接入协议和标准,通过ESB/EMB或者其它方式进行资源交换工作。 这样的结构模式设计不但可以保持本系统的独立性,在安全、维护上有保证,而且也使互联的逻辑和工程改造工作变得简单易行。 小结 通过对现行收录系统存在的问题进行全面、深入的思考之后,大洋公司推出了新一代收录系统——信息采集发布平台,这标志着大洋的收录系统建设理念已经打破了原有的信号自动控制采集思路,提高到了信息采集发布平台的高度,而大洋公司中标浙江广播电视集团电视收录网络系统项目,也表明这一理念得到了用户的认可,今后,我们希望大洋新一代收录系统可以为更多的用户朋友提供有益的参考。
|