论坛 产品库 视频 专题 CIO俱乐部 Windows8 实验室 CMO俱乐部 案例

利用数据挖掘提升互联网信息影响力

发布时间:2012-01-12 17:23:00 来源:比特网 作者:佚名
关键字:厂商

  目前,我国网民人数已经达到5亿,互联网已经成为最具影响力的大众媒体,并具有巨大的发展潜力,网络空间对现实生活的影响日益广泛、不断加深。中央外宣办副主任、国家互联网信息办公室副主任钱小芊在“第十一届中国网络媒体论坛”上表示,海量的信息内容、纷繁的文化生态、多元的价值取向,也更加深刻地影响着人们的思想观念、行为方式。

  互联网媒体迅猛发展的同时,互联网技术也面临着转型。互联网技术的应用正在告别早期公共信息传播与私人信息传播的初始形态,完成着从简单到复杂、从单一到多元、从初级到高级的历史演进,释放着它推进社会生活各个领域发生变革的巨大潜能。

  中宣部副部长、中央外宣办、国务院新闻办主任王晨认为互联网技术更新周期越来越短,新业务新业态层出不穷,这将大大拓展网络信息传播渠道,同时也对规范网络传播秩序、确保网络信息安全提出新的挑战。

  面对“海量”信息,如何利用技术手段,让其创造价值已经成为摆在我们面前的重要课题。作为中国网络媒体界最具创新力和影响力的年度盛会,论坛特邀请海量信息技术有限公司(简科:海量公司)与参会嘉宾共同分享如何利用数据挖掘技术提升互联网信息影响力。

  海量信息技术有限公司产品总监陈凯论坛发言

  会上海量公司产品总监陈凯首先对海量的观点进行了介绍。海量公司认为互联网是人机协同的序参量。人本计算产生大量数据,使得系统的不确定性增加,这时我们需要利用智能计算消解系统的不确定性,将人从爆炸的信息中解脱出来,回归纯粹的精神世界。

  陈凯指出:“随着社会化媒体,尤其是微博的发展,媒体的竞争力应体现在对解释力的阐述上。深度的原创内容和专题需要大量的高级编辑人员,然而社区运营、UGC内容急剧增长、监管力度大使得网站内容审核成本压力非常大。针对媒体现状,海量公司推出了‘海纳’和‘保10洁’两款互联网服务解决方案。”

  “海纳互联网智能采编服务”(简称“海纳“)是基于海量信息技术有限公司独创的网页结构化、文本语义分析、图像分析等多项国际领先的智能计算技术,并结全专业人工运营服务。

  陈凯介绍 “海纳“是专为网络编辑定制的咨询、采编服务,能够帮助网络编辑高效的从互联网获取信息,采集转载、编辑加工。实现了资讯网页一键转、页面监控、多页自动合并、关键词摘要自动生成等多项功能,相比手工拷贝方式,效率提高5倍以上。

  统计数据显示,“海纳”采集范围覆盖了1万个新闻资讯类网站,成功应用于数百家的网络媒体;每天约有5万名网络编辑使用海纳处理近百万条新闻资讯。凭借灵活的服务模式的和完善的功能,“海纳”已应用于新浪腾讯搜狐凤凰网人民网新华网等数千家网。

  目前,UGC网站在不良信息过滤方面需求急剧增长,然而人工审核速度慢、成本高,审核人员的主观性非常强,错误在所难免,一些技术手段通过关键词过滤,错删、漏删率高。

  “保10洁互联网净化服务”是国内首创的专业互联网净化服务“云计算”平台,具备提高效率、节约成本、规避风险等方面的特点,能够有效识别和清除垃圾广告,提升用户体验,增加网站粘度。而“保10洁”凭借独创的“中文语义分析、行为分析、版式分析”等多项国际领先的智能计算技术,面向互联网社区论坛,提供网站内容净化服务,对网站互动栏目中的垃圾广告进行自动识别和清除。目前,已有近百家网站及论坛正在使用“保10洁“,每天标引近千万条互动数据,清理近百万条垃圾信息,每天新增的知识达到2000多条。

  最后陈凯表示:“海量公司希望通过智能计算帮助人们从纷杂的数据中解放出来,最终达到人机协同的新工作方式,让人们在互联网上轻松获取知识。”


比特微信账号
比特微信账号

微信扫一扫
关注Chinabyte

返回首页 长微博 返回顶部