查看: 557|回复: 0

文化数字化60问,文心一言 VS GPT-4谁更懂?

[复制链接]
发表于 2023-3-22 17:13:52|来自:中国广东 来自手机 | 显示全部楼层 |阅读模式
GPT-4惊艳表态,国内厂商正面迎战,对标在所难免。获得百度文心一言和微软Bing内测资格后,文化产业评论(ID:whcypl)精心设计了关于国家文化数字化战略60问,全方位地考察AI的搜索、整合、研判本领和思维深度,同时也通过人机交互对国家文化数字化战略进行深注精解。文心一言与微软Bing之间真的有云泥之别?谁更懂国家文化数字化战略?效果,或许远超你的想象。
作者 | 周旋久(文化产业评论作者、三川汇文旅体研究院研究员)
编审 | 时光
编辑 | 半岛
泉源 | 文化产业评论
这一周,各个圈层都注定回荡着AI狂响曲。
3月14日,Open AI宣布推出GPT-4,并称其为“最先进的系统,能生产更安全和更有效的复兴”。
随后,微软宣布自产业品Bing(必应)已经接入了GPT-4,“确保用户拥有最全面的副驾驶功能”。
3月16日下战书,百度围绕新一代大语言模子、生成式AI产品“文心一言”召开消息发布会,并强调,虽然内测过程难称完美,但将来迭代本领和提升空间却十分可期。


多方入局,硝烟四起,比较、嘲讽、质疑在所难免。百度开放内测邀请,文心一言与GPT-4的正面较量也抬上日程。
有人关注百度股价的跌涨,有人热衷于找bug、寻笑料、编段子,有人就文学创作、贸易文案创作、数理推算、中文理解、多模态生成五大应用场景进行对比……
在AI的秀场,玩法多样,值得探索的另有很多。文化产业评论(ID:whcypl)便决定别开生面地与文心一言和微软Bing来一场文化数字化的深度对话测试,围绕中办国办印发的《关于推进实验国家文化数字化战略的意见》设计了如下的60个问题,看看它们到底谁更懂国家文化数字化战略!
问题清单:
01、国家文化数字化战略你知道吗?
02、国家文化数字化战略相关的政策文件知道吗?
03、可以深入讲讲你对《关于推进实验国家文化数字化战略的意见》的理解吗?
04、文件中涉及了八项重点任务,你认为这些任务之间是怎样的关系呢?
05、文件中提到“中华文化数据库”,可以解释一下吗?
06、中国有哪些已建或在建文化专题数据库呢?
07、另有吗?再举一些在建的例子。
08、这些数据库要怎样关联和共享呢?摆设原则是什么?
09、“物理分布、逻辑关联”原则是什么意思?
10、可以举一些“底层关联服务引擎和应用软件”的例子吗?
11、中国如今有哪些企业可以做底层关联服务引擎和应用软件呢?
12、“夯实文化数字化基础设施”具体指什么设施呢?
13、文件中提到要“建立国家文化大数据体系全国中央”,你认为应该怎样做?
14、建立国家文化大数据体系全国中央的先决条件是什么?
15、你认为如今哪些条件已经具备,哪些还必要加强?
16、中国如今有哪些文化数字化基础设施结果呢?
17、当前中国文化数字化基础设施建立的不敷是什么,将来要怎么做?
18、什么是“建立具备云计算本领和超算本领的文化计算体系”?
19、你知道哪些云计算和超级计算机平台吗?
20、李彦宏在百度文心一言发布会上说,“以后的应用会建立在大模子上,而不是建立在已往的云计算的这些算力大概存储上。”你认可他的说法吗?
21、怎么理解“搭建文化数据服务平台”?
22、文化数据中央要怎么做才能贯通各类文化机构的数据资源呢?
23、中国如今的国家文化专网建立处于一个什么阶段?你有什么发起吗?
24、如今中国各地域有哪些针对建立国家文化专网的政策或办法呢?
25、你能给我介绍一下其他国家或地域的雷同国家文化数字化战略的措施或项目吗?
26、你以为这些项目有什么长处或不敷?
27、什么叫做“数据超市”,有相应的例子吗?
28、文件中提出要“促进文化机构数字化转型升级”,这是什么意思?
29、但是文件中解释的是“推动文化机构将文化资源数据采集、加工、挖掘与数据服务纳入经常性工作,将凝结文化工作者智慧和知识的关联数据转化为可溯源、可量化、可交易的资产,分享文化素材,延展文化数据供应链”,什么叫做“经常性工作”?什么叫做“文化数据供应链”?
30、各类文化机构在接入国家文化专网过程中有哪些问题和拦阻呢?
31、文化资源数据的尺度、格式问题是一个很重要的问题,中国如今做了哪些积极呢?
32、你以为这个尺度体系起到作用了吗?具体应用效果怎样?存在什么不敷呢?
33、能举一些国际上的尺度案例吗?怎样与国际接轨?
34、但国际尺度是否大概不符合中国实际呢?怎样平衡国际化与本土化呢?
35、你以为如今哪些国际尺度比较适合中国参考或采用?
36、怎么理解“发展数字化文化消费新场景”,可以举例阐明一下吗?
37、数字孪生技术是什么?应用场景有哪些呢?
38、你以为中国在这些数字化文化消费新场景上取得了哪些结果?
39、和国外相比呢?有哪些差距?
40、可以具体说说国外如今在数字创意产业上的领先之处吗?举一些例子。
41、可以举一些国内外“使用现有公共文化设施,推进数字化文化体验”的例子吗?
42、那你以为“美术馆、影剧院、新华书店、农家书屋”等公共文化设施要怎么改进,推进数字化文化体验呢?
43、怎么理解文件中的“提升公共文化服务数字化水平”?
44、评价一下中国如今公共文化数字内容的供给本领。
45、“通过数字化手段促进城乡公共文化服务一体化发展”,具体有哪些手段和案例呢?
46、什么是“加快文化产业数字化结构”?
47、当前,图书、报刊、影戏、广播电视、演艺等传统业态都面对着升级转型,你认为这些传统业态分别面对着哪些难题?
48、我对图书数字化很感兴趣,可以说说新型图书产品的案例吗?如果图书多媒体、互动化,那是不是跟广播剧、视频有关系了呢?图书的本质改变了吗?
49、你相识影戏的线上发行吗?你以为这会替换原有线下影院吗?
50、文件指出要“在文化数据采集、加工、交易、分发、呈现等范畴,培育一批新型文化企业”,如今中国有哪些可称为新型文化企业呢?
51、你能举出具体的企业吗?它们都分别在哪一范畴处于前沿,你如今所说的更像是案例。
52、就你看来,第十四届“全国文化企业30强”呈现了什么特点吗?比如范畴会合度?企业属性?这反映出中国新型文化企业的什么问题?
53、为什么在这些企业中,比较少有充实展示“文化+科技”力量的数字文化企业呢?
54、“构建文化数字化管理体系”包罗哪些方面呢?
55、什么是“文化市场综合执法体系”?
56、你认为中国在“构建文化数字化管理体系”上,在哪些方面做得不错,在哪些方面必要加强?
57、推进实验国家文化数字化战略的主要目标是“中华文化全景呈现”,怎么解释?
58、你以为中国到达这个目标面对着哪些挑衅,又有哪些优势?
59、中国将实现目标的时间设置在2035年,你以为这十多年,文化数字化大概会给天下带来怎样的打击与巨变?
60、就当下而言,你认为ChatGPT、文心一言等语言大模子的出现,是否会影响中国国家文化数字化建立进程?
上述问题包罗了名词解释、搜索整理、对比思辨、理解阐释、主观评价、预测展望等多种问答类型,全方位地考察了AI的搜索、整合、研判本领和思维深度。
由于问题数量较多,答复篇幅也较长,因此文化产业评论(ID:whcypl)在此选取一些了具有代表性、对比性和独特性的答复进行展示。
Ai对话录
01、国家文化数字化战略你知道吗?


△微软Bing(搭载GPT-4)


△百度文心一言
文化产业评论:这一问题Bing与文心一言在整合答复上都没有太大问题,但Bing的答复相对来说更加切中要点。这里我们也发现文心一言答复中出现了“传播播体系系”如许的bug,好像在意料之中。
02、国家文化数字化战略相关的政策文件知道吗?




文化产业评论:这一题有关政策搜索。Bing就扣问的内容给了两个相关答案,而文心一言就一个政策进行了内容阐释。总体来说,Bing的答复更符合题中要求。
04、文件中涉及了八项重点任务,你认为这些任务之间是怎样的关系呢?




文化产业评论:这是一个理解阐释型的问题,有关文化数字化战略八大任务之间的内在关系。从答复上来说,两个都答到了相辅相成的核心要点,但显然Bing的答复更能揭示几者之间的内在联系,而文心一言的答复是较为笼统的。
06、中国有哪些已建或在建文化专题数据库呢?




文化产业评论:这一题还是一道搜索型的题目。而这次文心一言的答复明显更胜一筹,针对题目中所说的文化专题数据库,竟然给出了8条相关信息,而且看起来也恰有其事。但缺点也很明显,Bing给出的信息均有索引,而文心一言给出的条目却无法索引,难以判断是真实存在还是胡编乱造。
08、这些数据库要怎样关联和共享呢?摆设原则是什么?




文化产业评论:这一题承接上文,扣问的是数据库关联和摆设原则,从答案上说,Bing的答复更多围绕着政策展开,文心一言的答复则更发散,阐释的内容也更多。不外总体而言,可以说都不专业,并没有真的提现出如今在推进的措施。
14、建立国家文化大数据体系全国中央的先决条件是什么?




文化产业评论:关于建立国家文化大数据体系全国中央的先决条件,虽然都是外貌的内容(甚至片汤话),但Bing与文心一言的答复偏重点不同。Bing偏重于数据展开,而文心一言则是面面俱到式的答复。在下一题“你认为如今哪些条件已经具备,哪些还必要加强?”中,文心一言再次重复了这套论述,Bing则给出了新的答案。这也显示出两者对于关键词抓取和理解还存在一定的差距。
20、李彦宏在百度文心一言发布会上说,“以后的应用会建立在大模子上,而不是建立在已往的云计算的这些算力大概存储上。”你认可他的说法吗?




文化产业评论:这一题涉及到主观评述,Bing的答复相当地精简和相宜,而文心一言虽然稍有啰嗦,但也展现了较强的理解输出本领。
23、中国如今的国家文化专网建立处于一个什么阶段?你有什么发起吗?




文化产业评论:这一题最重要的是对“阶段”这一词的理解,Bing的问题相对更正确,而文心一言则回到了说囫囵话,泛泛而谈的状态。不外,Bing在答复中所引的《关于加快推进广播电视网络融合发展促进5G时代信息消费扩容增效的指导意见》并不存在,这也是GPT始终存在的糅合信息,说瞎话问题。
25、你能给我介绍一下其他国家或地域的雷同国家文化数字化战略的措施或项目吗?




文化产业评论:这一题考察的是AI对海外信息的搜索整合本领。从国家信息泉源可以看到,Bing的信息覆盖范围应该是全球性的,而文心一言提供的信息都出自东亚国家。
29、文件中解释的是“推动文化机构将文化资源数据采集、加工、挖掘与数据服务纳入经常性工作,将凝结文化工作者智慧和知识的关联数据转化为可溯源、可量化、可交易的资产,分享文化素材,延展文化数据供应链”,什么叫做“经常性工作”?什么叫做“文化数据供应链”?




文化产业评论:在上文中考察了两者对“促进文化机构数字化转型升级”的理解,紧接着扣问对两个具体关键词的解释。可以看到,无论是Bing还是文心一言,实在答复得都还不错,没有缺漏。
31、文化资源数据的尺度、格式问题是一个很重要的问题,中国如今做了哪些积极呢?




文化产业评论:这一问题关于国家文化大数据尺度的制定,Bing与文心一言的答复显示出了明显差异。Bing的答复均聚焦于尺度和格式,而文心一言却把重点放到了文化机构数字化转型升级。很明显,我们更想要的是Bing式的答复。而且文心一言提到的《文化数据管理办法》、国家文化云等,如今并不存在。
44、评价一下中国如今公共文化数字内容的供给本领。




文化产业评论:此题关乎主观评价,从答复的完整性来说,文心一言做得更好,既给出了评价、原因,还提出了措施。Bing的答复虽然较为大略,但是更具有特点的概括性。
47、当前,图书、报刊、影戏、广播电视、演艺等传统业态都面对着升级转型,你认为这些传统业态分别面对着哪些难题?




文化产业评论:此题考察的重点仍然是关键词提取——“分别”。很明显,Bing就图书、报刊、影戏、广播电视、演艺等传统业态均进行了评述,而文心一言则遗漏了“分别”,将传统业态放在一起囫囵解释。
48、我对图书数字化很感兴趣,可以说说新型图书产品的案例吗?如果图书多媒体、互动化,那是不是跟广播剧、视频有关系了呢?图书的本质改变了吗?




文化产业评论:这道题的难点在于题目中提出了三个问题,必要对应作答。从答复上看,Bing无疑是完美的,没有遗漏题目中的每一点,甚至还正面答复了颇具刁难度的“本质”问题。而文心一言仅答复了第一个问题,但内容质量还是不错的。
57 推进实验国家文化数字化战略的主要目标是“中华文化全景呈现”,怎么解释?




文化产业评论:此题是对“中华文化全景呈现”核心目标的理解。文心一言一如既往地发挥了长文字长阐释的特点,而Bing仍然以简答为主。至于哪个答复更令人满意,还是要看提问者的应用场景是什么。
58、你以为中国到达这个目标面对着哪些挑衅,又有哪些优势?




文化产业评论:这一问题的要点在于要对中国文化数字化建立进行整体的评判,从对话感来看,Bing的答复虽然大略,但更像是一个人在跟你做交流,而文心一言则像是一个口试者,分点答复问题。
59、中国将实现目标的时间设置在2035年,你以为这十多年,文化数字化大概会给天下带来怎样的打击与巨变?




文化产业评论:“这是一个很有前瞻性的问题”,Bing如是评价道。这个问题Bing与文心一言都各有长处,差距并不大。
60、就当下而言,你认为chatgpt、文心一言等语言大模子的出现,是否会影响中国国家文化数字化建立进程?




文化产业评论:此题是一个预测理解型问题,文心一言从积极的方面进行阐述,而Bing则从正反两面都进行了阐述,从视角的多元性来说更胜一筹。
总结
文心一言发布前后,网络上流传着一些梗图,比如:


百度CEO李彦宏更是在发布会上直言,“大家的期望值是要对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的。”
发布会期间,百度港股股价甚至一度下跌10%至120.1港元。
这统统迹象好像都在阐明,文心一言真的——不太行。
而百度开放内测,也进一步激发了大家对标和证实的兴趣。
有趣的是,内测开放后,一夜之间,外界的态度就开始分化。不少试用者说“远超预期”,资源市场也给出了正向反馈,百度股价开始回升。
从文化数字化战略60问的测试中也不丢脸出,文心一言与GPT-4之间,虽然存在不小的差距,但并没有云泥之别,天悬地殊。从关键词的抓住、理解,机动表达而言,微软Bing无疑是更具优势,在应对多个问题时也能做到条理清晰。但文心一言在搜索整合信息时,明显更有中文语料的优势,可以获取到多段信息,很多阐述也相对完整。从缺点来说,微软Bing最大的问题是大概会提供较多虚伪信息,造成信息污染,而文心一言的缺点则是对问题还缺乏全面的理解,会遗漏要点,表达时也经常泛化冗长,信息凝结力不强。
但正如李彦宏所说,“大语言模子这种产品一旦发布出来,就会获得真实的用户反馈,有了用户的反馈,它的迭代速度、本领提升就会非常快。”作为中国首个AI大语言模子,文心一言既是百度将来战略中的重磅武器,也是承载中国科技荣光的智能产品,面对真实的应用场景和强盛的对标对手,它固然另有很长的路要走。但是,只要在向前奔行,就不会甜睡无声。

来源:https://view.inews.qq.com/k/20230322A06PTD00
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

联系客服 关注微信 下载APP 返回顶部 返回列表