论坛 产品库 视频 专题 CIO俱乐部 Windows8 实验室 CMO俱乐部 案例

如何利用智能计算技术优化网络媒体编辑结构

发布时间:2012-01-12 14:30:00 来源:比特网 作者:海量
关键字:编辑 海量 海纳 网络媒体 智能计算

  随着互联网的飞速发展,我们已经身处一个海量信息的时代,自 2003 年开始,中国的网页规模基本保持翻番增长,2010 年网页数量更是达到 600 亿个。可以预见的是未来几年,互联网仍将保持这种迅猛的发展势头,这将对网络媒体的生产方式带来巨大的冲击。如何在海量的信息中快速发现、梳理有价值的新闻资讯?如何使自己编辑的内容从海量信息中脱颖而出?这些都是广大网络媒体编辑人员所面临的巨大挑战。

  在网络媒体发展初期,互联网上的新闻资讯量还不是很大,网络编辑人员主要依靠手工的方式完成资讯的查找、转载与编辑加工。由于转载工作耗费的人力成本最大,因此那时候的网络编辑甚至被称为“网络搬运工”,虽然身为知识工作者,却大部分时候从事着繁重的体力劳动。当时网络媒体的编辑结构普遍是大量人力投入在基础的资讯转载工作中,只有少部分编辑从事原创和专题策划等高级编辑工作。

  然而,在日益激烈的竞争和爆发式增长的资讯数据面前,急剧上升的人力成本迫使网络媒体对新闻采编业务的工作模式进行革新,应用智能计算技术来解放编辑生产力成为了时代的必然。

  工具的使用是反映经济发展水平的主要标识,蒸汽机的出现为第一次工业革命提供了经济基础和工具基础。蒸汽机极大的提升了所在地的劳动生产率,推动了当地的经济发展,改变了人们的思考方式,促进了人们的更深层次的思考,使他们有相对更多的时间去研究周围和未知的世界,并为探索未知的世界提供了前所未有的动力。

  如今,智能计算技术的应用水平也在某种程度上决定着网络媒体行业的发展水平。经过十余年的商业应用,从中文分词到命名实体,从篇章到句子,智能计算技术已经全面应用到网络媒体的编辑流程中。具有确定逻辑的机械、繁琐的信息处理工作都可以由具备智能计算技术的机器所完成,编辑人员的工作内容不断升级,逐渐回归到思考和创作的知识工作中。

  下面,我们就具体来看一下应用智能计算技术的互联网智能采编平台是如何改进网络媒体的生产方式,如何优化编辑的结构。

  网络编辑的主要工作有三个方面:发资讯、排首页、精编/专题。这其中发资讯是基础工作,是速度与规模的竞争。排首页则体现了不同网络媒体的业务思想,是媒体气质的体现。精编/专题等高级编辑工作则体现了网络媒体的实力。

  发资讯又由“找、转、编、发”四个环节构成。在“找”的环节网络编辑需要能够及时发现最新、最热的新闻资讯,依靠编辑人员频繁刷新浏览器去发现更新的内容已经远远不能满足如今激烈的时效性竞争。通过智能计算技术的互联网智能采编平台一方面可以对编辑设定的固定信源进行自动监控,另一方面也可以通过对新闻、论坛、微博的监控与挖掘,实现热点事件的主动发现,第一时间通知编辑人员进行后续操作。

  当编辑发现有价值的新闻资讯后就需要立即“转”到自身的网站,在缺乏工具辅助的情况下只能依靠手工拷贝粘贴,这种模式不仅效率低下也极大的降低了编辑人员的成就感。目前,也有一些通过从HTML标签中配置正则表达式来提取资讯内容的采集器软件,然而此类软件由于缺乏智能识别的能力,在纷繁复杂、动态变化的互联网信息面前显得力不从心,增加了大量的技术维护成本。现在,智能计算技术的发展已经可以动态还原网页的版式,基于视觉特征进行智能的内容提取,实现了准确、灵活的资讯转载模式。在这方面应用较好的网络媒体已经取消了传统意义上负责转载工作的编辑岗位,资讯转载工作完全交由互联网智能采编平台完成,每天上万篇的基础发稿工作全自动完成,编辑团队全部投入到本地新闻的原创和精编工作中,竞争力得到了大幅提升。

  虽然网络媒体每天发布的内容大部分要依靠转载,然而对资讯的编辑加工工作也必不可少。就拿关键词、摘要来说就是网络资讯非常重要的一个部分,网络资讯的关键词、摘要主要用于在网页源代码中标识,辅助搜索引擎识别资讯的内容,,以便在网民搜索时更好的匹配。关键词、摘要的编写需要编辑人员仔细阅读正文内容,进行复杂的思考,耗费大量的精力。现在,中文智能计算技术在语义分析上已经非常成熟,能够自动提取文章的关键词、摘要,而且由于搜索引擎也是应用智能计算技术进行网络资讯的采集与识别,因此从某种程度上说利用智能计算技术自动生成的关键词、摘要会更加适合搜索引擎的识别。再此基础上,再结合一些搜索风云榜和新闻热点进行提取,就可以达到非常理想的搜索引擎优化效果。

  在完成资讯的编辑加工工作后就到了“发”的环节,这个时候主要进行的是内容的审核流程,编辑人员每天处理大量的资讯,对于隐藏在资讯中的各类有害信息难免有所疏漏。而智能计算技术则可以实现全面、准确的信息安全过滤,对于各类违法不良信息和敏感信息进行自动化的识别与提醒,帮助编辑人员实现安全发布。

  在我们应用智能计算技术将编辑人员从基础的发资讯工作中解放出来后,我们就可以调整编辑的结构,让我们的网络编辑进行更多有价值的高级编辑工作,这其中精编和专题是最能体现网络媒体实力的工作。如今,微博的广泛流行使新闻的第一落点已经不再被传统的网络媒体所掌握,这时网络媒体之间比拼的就是对解释力的把握和对价值观的评说。

  因此,网络编辑的工作重心也将逐步迁移到对内容的精编上,经过编辑挑选上到首页的文章应该都进行精编,需要通过编辑人员对散乱的、碎片化信息的梳理,为读者还原一种结构,呈现一种逻辑。这些工作主要包括对丰富文章内容和结构化的组织各类句子级素材。在海量信息面前,人脑的自我保护机制时刻在发生着作用,网民对网页资讯的阅读行为呈现一种点读式的浅阅读状态。结构化的句子级内容更适合网民的快速阅读,因此编辑人员就需要收集整理大量的句子级素材,并以时间、空间等维度进行结构化的展现。依靠人力从海量的信息中抽取有价值的句子级素材几乎是不可能完成的任务,只有依靠智能计算技术将大量篇章级的内容打散,以段落、句子、命名实体的颗粒度进行存储,才可以快速获得编辑需要的素材。同时,对于时间、空间的自动识别也可以大幅提升编辑人员对内容组织的效率。相信随着此类智能计算技术的深入应用,网络媒体之间的内容同质化现象将逐渐消失,每个编辑人员都可以轻松组织符合自己编辑思想的素材,创作出独特的内容。

说明: C:\2010\X5\精确导航.png

  专题是网络媒体特有的形式,也是传统模式上编辑成本耗费最多的工作,很多网络媒体受限于编辑力量,每天发布的专题数量非常有限。然而无论从业务还是经营的角度,专题都具有着显著的价值。

  专题制作除了要选取恰达的主题之外,大量耗费人力的工作就是各类素材的搜集、整理以及更新。这些工作其实都可以由智能计算技术辅助,大幅提高专题的制作效率。首先,应用智能计算技术可以帮助我们及时发现新闻、论坛、微博中的热点,辅助编辑进行选题。其次,在素材搜集方面通过对主题词的设定,可以瞬间完成各类素材的初始搜集工作,编辑人员在常用的专题模板结构下只需进行快速的内容筛选即可完成专题内容的构建。当专题发布后,最新的相关资讯也会及时自动提醒,专题维护的工作量也大幅减轻。在深入应用智能计算技术的网络媒体中,经测算,通过互联网智能采编平台辅助专题制作可以提高效率一倍以上,网站影响力得到了显著提升。

  以上是应用智能计算技术改进网络媒体生产方式的一些实践,如今网络编辑的工作中都已经或多或少的应用着智能计算技术,然而在以技术驱动的互联网发展进程中,对于智能计算技术的应用程度将决定着网络媒体的竞争力。

  相信智能计算技术应用的不断深化将不断改进网络媒体的生产方式,优化网络编辑的结构,尽可能减少在信息采集、转载等初级信息处理方面的人力投入,从而让更多的网络编辑投入到精编、专题等高级编辑工作中去,让编辑用心思考,用智慧为网络媒体树立独特的媒体气质。

  未来,随着智能计算技术的发展,具有知识网络利用能力和知识重构能力的智能代理将与人分享共同的信念、动机和愿望,组成效能更高的人机共生环境。所有已知的确定性的逻辑演算都交给机器计算,人类摆脱了繁杂的劳作,回归纯粹的灵性精神世界。


比特微信账号
比特微信账号

微信扫一扫
关注Chinabyte

返回首页 长微博 返回顶部