中国数据产量占全球10.5% 巨量信息催生“算法创新”

发布时间:2024-09-16 05:43:03 来源: sp20240916

  中国数据产量占全球10.5%,巨量信息催生“算法创新”

  网络“大数据”,不只“数据大”(“融”观中国)

  ——透视“算法”系列报道之一

  本报记者 卢泽华

  在各类网络平台上,“算法”成为一项广泛应用的技术。通过数据分析和精准推荐,它改变了过去“人找信息”的搜索模式,逐步实现“信息找人”。

  关于“算法”,人们观点不一。有人认为,它方便了用户,提供了更精准的网络服务;有人认为,它在“算计”用户,造成“信息偏食”等问题;还有人认为,作为一项技术,它并无好坏之分,关键在于如何用正确价值和规范去驾驭。

  自今日起,本版推出“透视‘算法’”系列报道,解读“算法”带来的变化与影响。系列报道第一篇,关注大数据时代网民获取信息习惯的变迁。

  现状

  内容更丰富,平台更多元

  “以前遇到问题,第一反应是打开浏览器搜一下。现在除了搜索网页,也会去微信或短视频平台找答案。”北京市民王瑛向记者展示了一段短视频:“你看,前两天下厨,想做一道鱼香肉丝,抖音一找,教学视频就出来了。”

  王瑛今年36岁,从2000年左右开始接触互联网。最初10多年,她获取信息的方式主要有两种,一是在搜索引擎上检索,二是浏览门户网站。但最近几年,这种习惯开始改变。“现在网上信息太多,让人眼花缭乱,甄别起来比较费力。有时需要特定信息时,在手机软件中更容易找到结果。”她边介绍,边打开手机界面:“比如,想找购物信息,就去淘宝逛逛;想看电影,就去猫眼找找;想了解明星动态,就去微博看看;想获取专业知识,就去知乎搜搜……”

  在王瑛看来,这种改变是不知不觉形成的。每天频繁使用各类手机软件,“顺手搜一下”并不费力。久而久之,就形成了用多个平台搜索信息的习惯。最重要的是,“搜”完之后,手机应用会记住自己的需求,主动推荐感兴趣的信息,省时省力。

  王瑛的用网经历具有一定代表性。记者针对120名用户的搜索行为作了一项小型调研,结果显示:所有人均有使用搜索引擎的习惯,但将其作为唯一选择的仅占15%。多数人表示,自己会在各类手机应用中检索信息,并时常浏览各平台推荐的信息。比如,获取生活经验类信息,很多人都会选择刷短视频,“遇事不决,视频来学”。

  行业数据也印证了这一点。截至2023年6月,中国搜索引擎用户规模已达8.41亿人。但近七成用户也会通过短视频完成搜索,微信“搜一搜”月活跃用户也已超过8亿,几乎与搜索引擎用户总量相当。另一项调查也显示,用户平均每天会在 3.8个平台上搜索信息。

  挑战

  信息杂芜与“平台壁垒”

  虽然网上信息量更大了,获取信息的渠道更多了,但不少用户仍表示“存在使用体验不佳的情况”。

  信息杂芜是原因之一。“现在网上营销信息较多,虽然大多标注了‘广告’字样,但毕竟需要甄别,影响使用效率。”王辉是一名金融分析师,经常需要在网上检索信息,且对信息质量要求较高。但他发现,现在找到一张“纯净的网页”非常困难,这在一定程度上拖慢了他的工作节奏。

  王辉的情况并非个例。记者调查发现,在网上检索信息时,显示结果中很多都是广告链接。比如,搜索“培训”二字,排名最靠前的两个结果均为商业培训机构广告。

  据了解,各大搜索网站也都注意到这个问题,但如何改变行之有年的商业模式,还是个尚待破解的命题。“广告是网站主要盈利来源,目前业界只能尽量优化广告信息,提升用户体验,但要彻底转型,还需一定时间探索。”一家互联网公司的销售经理告诉记者。

  除了信息杂芜,互联网界还不同程度存在“平台壁垒”现象。

  据了解,过去,综合类搜索网站是各类网络平台获取流量的主要入口,通过一个搜索框、一个关键词,用户可以搜到全网各个平台的信息。而随着移动互联时代来临,美食、家居、旅游、短视频等垂直平台用户规模越来越大,每个平台都形成了自己独有的“大数据库”,这个“大数据库”不仅包含海量优质信息,还囊括了用户使用习惯等数据。动辄坐拥上亿用户的网络平台不再需要其他平台“引流”,这些数据便被视为独家资源,不再对外开放。这导致用户很难通过综合类平台搜到所有需要的信息。

  趋势

  向智能化与精准化发展

  如今,中国已经成为数据量最大、数据类型最丰富的国家之一。国家数据局日前发布的信息显示:我国数据产量已占全球数据总量的10.5%。更有研究机构预测,到2025年,中国数据总量或占全球近30%。

  “数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各环节,但目前在发展过程中也存在数据应用潜力释放不够、数据供给质量不高、流通机制不畅等问题。”国家数据局副局长沈竹林表示。

  在这一背景下,仅仅“数据大”已经无法满足社会需要,还要进一步实现“数据精”“数据准”,从而有效降低用户获取信息成本,提供更加个性化、精细化的内容服务。在这种需求驱动下,“算法”技术应运而生。

  “算法”是人工智能技术与大数据技术的关联节点。中国科学院科技战略咨询研究院院长潘教峰认为,人工智能正在科研、贸易、交通、医疗等诸多场景中改变人们沟通的方式。其“活字典”、移动的“大百科全书”的特性,加上越来越接近人类水平的语言理解和生产能力,让其“答复”既有常识性,又呈现出集成创新性。

  因此,在互联网海量数据基础上,“算法”可以通过人工智能技术对用户兴趣偏好和需求进行分析归纳,描绘出用户画像,打上特性“标签”,进而以此为依据,进行精准化、个性化的定制推荐。

  在“算法”技术的调配下,用户每次打开手机应用,都可以收到针对个人需求的信息推送。同时,平台通过不间断收集信息,会变得越来越“懂”用户——打开购物网站,近期想要购买的产品已被推荐到首页;进入短视频平台,接踵而至的都是自己喜欢的视频内容;浏览旅游软件,想去的地方一一列在眼前,连机票购买链接都放好了……这一切,正是凭借日渐成熟的算法技术才得以实现。

  然而,有人担心,“算法”在大数据时代精准调配网络信息、提升服务水准的同时,也带来了“信息偏食”、网络沉迷、数据泄露、技术滥用等隐患。这些问题多大程度存在?又有哪些破解之道?我们将在“透视‘算法’”系列报道第二篇进行解读,请大家持续关注。(人民日报海外版) 【编辑:田博群】

选择用户
全部人员 全选 撤消
谢志刚
李岩
李海涛
谢志强
李亚琴
潘潇潇
杨亚男
高荣新
郑文静
金琳
张银波
张欣
陈曦
刘涛
王长青
高广柱
孙圆
行政专员
付雪枫
张雪莲
张璐
刘相群
张明璇
李静
孙静
王晨
赵夏
马洪亮
张兰
黄莉
李潍伊
常恩宁
侯昭宇
韩岩峰
冯亚红
林洋
陈静
刘婧
魏保国
唐彦秀
张楠
刘瑞萍
付严明
荣伶
马建国
邓爱青
系统管理员