老牌工具书如何焕发新活力?昨天,备受瞩目的聚典数据开放平台在上海发布2.0版,由上海世纪出版集团规划设计、上海辞书出版社研发运营。
这款基于传统工具书的创新型互联网数据服务产品,自2020年8月运行以来,已与学习强国、微信读书、百度百科、掌阅、起点读书等40多个应用开展深度合作,累计为4000多万用户提供超10亿次知识查检服务,其中海外用户500多万。
“2.0版进一步提升用户体验、提升查得率、拓展数据类型、提升对接效率,更好地满足了各类数字阅读场景下的知识查检需求。”上海辞书出版社党委书记、社长秦志华说。
对430多万条工具书数据进行系统梳理重组
“屏幕取词查检,释义即刻呈现”——聚典这一服务方式,解决了用户在线阅读即时知识查检的需求,开创了传统工具书数字化转型新模式。
据透露,2.0版运用最新人工智能技术,对430多万条工具书数据进行系统梳理和重组,从内容端大幅扩充词条数量;梳理用户行为,应用智能技术,实现查检词条与库藏知识的智能关联,自动识别取词差错并更正推送;完善自动化对接流程,从初期API调用到SDK包,再到如今加入智能推荐,实现数据分发的技术升级。
此次迭代升级拓展了数据类型,增加了诗文库。“中国文学鉴赏辞典是上海辞书出版社一大核心资源,该系列编纂出版历时30余年,开创了中国文学鉴赏出版之先河,陆续形成20多个品种。”秦志华透露,新推出的“诗文库”从“诗文篇名、朝代、作者、作者小传、诗文原文、注释、译文、赏析、赏析作者”九大维度对内容进行输出,极大地满足用户对权威诗文内容查询与鉴赏需求,助力合作伙伴打造富有中华优秀传统文化特征的特色栏目与服务。
聚典“开放、赋能”的数据服务模式受到上下游企业认可,先后入选全国新闻出版深度融合发展创新案例、国家新闻出版署数字出版优质平台遴选计划。发布会现场,多位运营方代表分享了与聚典数据开放平台合作的案例。“七猫2022年接入聚典数据开放平台至今,为阅读用户提供了近2000万次查询服务,平均每天有10万余用户有查词典的需求,读者可即查即用,释义直接在阅读页面显示,不需要跳转别的应用,极大满足用户对知识查验的需求、也提升了读者的数字阅读体验。”上海七猫文化传媒有限公司公共事务部邹芹谈到,其应用模式及运行逻辑正是以读者用户为中心,营造了良性知识服务产业生态。
得到电子书业务负责人张璐莎坦言,此前也同其他搜索平台合作提供简单的词典服务,“但提供的信息来源于网络,不全面,也不太可靠,用户体验并不好。为了优化体验,经多方调研后,发现聚典收录了《辞海》《汉语大辞典》《英汉大词典》等多种工具书,内容丰富可靠,技术实现方便,可直接提供接口调用。”
搜索榜单系统折射数字时代知识需求
继2023年世界读书日发布“聚典知识搜索榜”后,本次发布会还基于海外用户4000多万次查询数据,发布了“聚典知识搜索榜”海外榜。榜单形成了汉语单字、词语、中国作品、外国作品、中国人物、外国人物这六大分类榜,每个分类榜选取查检频次最高的前30名,以系统反映数字时代的知识需求。
统计表明,Top30海外榜单和国内榜单基本重合,这也说明以华人为主的海外用户汉语水平与国内用户大体相近,主要查检的是非常用的汉字和文言词。比如,搜索排行前30的词语包括“饕餮”“氤氲”“尤物”“觊觎”“龃龉”“耄耋”“桎梏”“揶揄”等。
Top20中国作品与国内榜单有所不同,工具书《辞海》《新华字典》进入,反映海外用户对权威汉语辞书的重视关注。同样强调经典性,但海外用户对耳熟能详、相对普及的传统文本,如《千字文》《三字经》《唐诗三百首》等也有明显需求。“这些都应该与日渐兴起的汉语学习、了解中华传统文化的热潮相关。”秦志华分析道。
前20部作品与国内榜单大多数重合,这些作品反映了人类文明精华。印度文化有《薄伽梵歌》《梨俱吠陀》在列,且都有数千次查检量。
上海世纪出版集团党委委员、副总裁毛文涛表示,世纪出版将继续大力推进聚典数据开放平台创新发展,使聚典继续坚守“数据服务”产品定位、坚持“为阅读赋能、为学习赋能、为搜索赋能”使命追求,不断拓展应用场景、创新应用模式,朝着“成为数字时代的文化基础设施”努力。
作者:许旸
编辑:王雪瑛
责任编辑:邢晓芳
*文汇独家稿件,转载请注明出处。