2013年3月8日星期五

报告揭秘新浪微博“删帖”内幕

直连本站: http://tiny.cc/meyarw


微博


麻省理工学院《MIT技术评论》杂志刊登一份研究报告,揭露新浪微博的“删帖”内幕 。该报告说,30%的删帖在微博发出5至30分钟内完成,删帖几乎是“实时”进行。


进行这一研究的是美国休斯敦莱斯大学计算机系教授丹·沃勒克(Dan Wallach)和他的同事们,他们收集一些用户发出的帖子,然后进行跟踪观察,看哪些帖子被删除。


中国 的微博用户多达三亿多,当然不可能跟踪每一用户。沃勒克和他的同事们就把目光锁定在曾遭删帖的3500多名用户,于去年对他们进行了为期15天的跟踪观察。


观察期间,这些用户每天有大约4500个帖子被删,占总发帖量的12%。


当然,帖子被删并不全是被当局“审查”的结果,有的是用户自己的删除行为。不过,这二者仍有区别:被管理员删除的微博会显示“此微博不适宜对外公开”,自行删除的则显示“该帖不存在”。沃勒克团队关注的是前一种情况。


实时删帖


结果显示,5%的删帖在微博发出后的8分钟内完成,30%的删帖在30分钟内完成,90%的删帖在24小时内完成。


数据显示,删帖量最高的是在帖子发出的5-10分钟内,这意味着微博管理员的审查“几乎是实时进行的”。


中国微博用户众多,发帖量也巨大,平均每分钟会有7万个微博帖子发出。研究人员说,如果一个审查员平均每分钟浏览50个帖子、按8小时工作日来算,则需要大约4200名监管员来应对每天发出的海量帖子。


即便如此,也需要技术的支持。沃勒克说,一种技术就是锁定“关键字词”,但网民会想法设法地来绕开关键词,让这一技术也面临难题。


此外,当局还特别 关注那些有“被删帖”历史的用户。沃勒克发现,这些用户的帖子的确被删得更快。


沃勒克还观察了一天当中的删帖模式,发现到了晚上七点后趋向平静,到第二天上午或中午,删帖加剧。


被删的究竟是哪类的微博呢?研究人员于2012年8月进行的调查,发现微博中涉及北京、、北京暴雨等字眼的“寿命较短”。


网友评说


针对这一报告,国内不少网民在新浪微博上予以评论。


AlexButton说:后台可以用关键词过滤的,而且关键词会有很醒目的标记,工作量是不小,但不会那么夸张。


王岩52377说:很好地解决了就业问题


独白故事说:没办法,新浪也得生存嘛,必要的支出还是得有的。


AllanZ说:好端端的一个IT企业被做成了悲催的劳动密集型企业。


杂坛-老顾的微博:微博不是中国的创新,但删帖是;搜索 不是中国的创新,但过滤和竞价排名是。


来源: | Email订阅禁闻 | Google Reader RSS全文订阅禁闻


本文标签:, , , , , ,






via 报告揭秘新浪微博“删帖”内幕

没有评论:

发表评论